ETL
Processus visant à
1. Extraire les données de leur source originale
2. Transformer les données en les dupliquant, en les combinant et en assurant leur qualité, pour ensuite
3. Charger les données dans la base de données cible.
L’étape de nettoyage et de transformation de données (2) est cruciale car les données ne sont souvent pas initialement collectées dans le but de l’utilisation qu’on veut en faire (pensons par exemple à des données de transactions qui sont d’abord collectées à des fins opérationnelles, et qui pourraient ensuite être utilisées pour prédire des ventes). Cela est d’autant plus vrai aujourd’hui avec le Big Data. Bien qu’apportant peu de valeur, cette étape représente souvent 70% du temps accordé à un travail de valorisation de données.