Consiste en capturar datos de fuentes heterogéneas y homogéneas. Las herramientas de extracción que se utilizan en esta etapa soportan múltiples formatos de almacenamiento de datos.
Aplica un conjunto de reglas de unificación de datos básicos para transformar los datos desde el origen al destino. Esto incluye la conversión de los datos medidos a la misma dimensión, usando las mismas unidades, para que más adelante se puedan unificar. Una vez transformados los datos, es necesario realizar una serie de operaciones de depuración. Esta etapa es una de las más importantes, ya que garantiza la calidad de los datos por tratar.
Es necesario garantizar que esta operación se realiza correctamente y empleando el menor número de recursos posible.