La coexistencia de almacenes de datos y Hadoop juntos en una arquitectura de datos es la tendencia predominante, y no tiene sentido para la mayoría de las organizaciones intentar reemplazar su DW con Hadoop / NoSQL. En particular, los almacenes de datos siguen siendo una gran fuente de información confiable y controlada que está lista para que los analistas de negocios accedan a través de informes / visualización, y como se indica en otras respuestas: SQL tiene sus ventajas (¡y es un conjunto de habilidades ampliamente adoptado!). Si bien Hadoop ha sido un gran lugar para el procesamiento escalable de datos, a la mayoría de las empresas se les desaconsejaría permitir que grandes grupos de analistas de negocios tengan acceso analítico directo a él (a través de SQL en las herramientas de Hadoop) debido a las preocupaciones sobre la gobernanza, el rendimiento y la información general. complejidad.
Un patrón de caso de uso que puede proporcionar lo mejor de ambos mundos es la Refinería de datos optimizados de Pentaho, que aprovecha la velocidad / escalabilidad de Hadoop, pero automatiza un proceso que combina y procesa datos en Hadoop y luego entrega un conjunto de datos modelado y gobernado a un almacén de datos o base de datos analítica para acceso interactivo de BI. Vea aquí para más detalles: Refinería de datos optimizada