Los datos de Tableau: ¿Data warehouse? ¿en vivo? ¿extracto?

matrix_db_question-150x150

Los datos de Tableau: ¿Data warehouse? ¿en vivo? ¿extracto?

En nuestras actividades de preventa y presentaciones de Tableau siempre surge la pregunta:

¿Y el datawarehouse? 

La verdad, hay una concepción conservadora respecto a dónde residirán los datos que las organizaciones necesitan analizar. Tradicionalmente, los datos han sido movidos desde los sistemas transaccionales hasta bases donde los datos se estructuran para analizarlos (Data Warehouse). Este tipo de modelos persiguen tres objetivos: 1) integrar datos heterogéneos que puedan provenir de diferentes fuentes, 2) aislar los datos del manejador transaccional para no degradar su desempeño y 3) estructurar los datos de manera adecuada para su análisis. Para el transporte de los datos de una base de datos a la otra se utiliza una herramienta de extracción, transformación y carga de datos o ETL por sus siglas en inglés:

captura-de-pantalla-2016-10-23-15-00-58

Por su parte, Tableau permite la conexión directa a diferentes fuentes de datos e incluso la combinación de datos entre estas diversas fuentes a través de su funcionalidad de “data blending”, esto se puede hacerse en modalidad de conexión en vivo o, a través de un extracto, resultante de la copia de datos que hace Tableau desde las fuentes a una estructura de datos local. Este extracto ofrece la importante ventaja de ser un arreglo óptimo para la consulta y análisis (véase: formato columnar) y que cuantiosas cantidades de registros, puedan copiarse a archivos locales de extractos comprimidos que ocupan muy poco espacio:

captura-de-pantalla-2016-10-23-15-01-10

En algunas implantaciones es aún requerido el desarrollo de ETLs para poder consolidar los datos a analizar, esto debido a la complejidad de las fuentes, reglas de negocio más elaboradas o necesidades particulares de planificiación para la lectura, transformación y carga de los datos. En este caso, el data warehouse será la fuente de datos principal de Tableau y por supuesto, podemos seguir tomando ventaja del extracto que nos povee alto rendimiento y data offline:

captura-de-pantalla-2016-10-23-15-01-21

Cuando el volumen de datos que maneja la organización es muy elevado, se hace necesaria la incoporación de una base de datos columnar (analítica) en la arquitectura de la solución. Esto optimiza la estructura de datos a nivel de servidor y mejora el rendimiento de Tableau. En este caso, la conexión de Tableau será en vivo hacia la base de datos analítica porque allí ya se encuentran los datos en formato columnar, sin embargo, aun es opción el tomar el extracto de datos si se desea disponer de estos tras la desconexión de la fuente (data offline):

captura-de-pantalla-2016-10-23-15-01-35

¿Y Tableau Server? 

¡Claro!, la buena noticia es que todos estos escenarios aplican a Tableau Server. Tanto las conexiones en vivo como por extracto pueden funcionar para las diferentes visualizaciones y contenidos, con lo cual se abre una interesante gama de opciones, por cierto no necesariamente excluyentes. El negocio podría contar en algunos casos con visualizaciones Tableau conectadas en vivo porque desean ver el comportamiento de la organización en tiempo real y en otros casos con fuentes de datos ya estructuradas para el análisis que provean mejor rendimiento y mayores capacidades en término de volumen de datos manejado

El siguiente gráfico presenta cuatro escenarios que pueden ser válidos en su organización. Todo dependerá del modelo de datos que desee analizar y de consideraciones esenciales como el volumen de sus datos y el balance entre las necesidades del negocio y el desempeño óptimo de su solución de inteligencia de negocios:

captura-de-pantalla-2016-10-23-15-02-06

El siguiente flujograma presenta una guía práctica de cómo decidir cuál es el escenario óptimo para cada uno de los modelos de datos que la organización requiera analizar. Evidentemente,existirán casos que ameriten consideraciones especiales, pero en términos generales le permitirá entender sus alternativas y aprovechar las ventajas de Tableau:

captura-de-pantalla-2016-10-23-15-02-25

Recuerde, lo más importante para que pueda dar el salto al mundo de la inteligencia empresarial es aprovechar las innovadoras y poderosas ventajas de tecnologías actuales como la de Tableau y empezar ahora mismo.

Deje de pelear con sus datos y analícelos de una vez.

Leonardo Astudillo

Ingeniero de Sistemas egresado de la UNEXPO​ ​​”​Antonio José de Sucre” con más de 15 años de experiencia en el desarrollo e implantación de proyectos de soluciones informáticas, bases de datos relacionales y columnares, plataformas de datos compartidos, aplicación de procesos bajo el marco de trabajo de ITIL, proyectos de Inteligencia de Negocios, facilitación y adiestramiento. Posee múltiples certificaciones en habilitadores tecnológicos y marcos metodológicos de Microsoft, CA, ITIL, Tableau y Pentaho entre otras. Leonardo Astudillo comparte su pasión entre la tecnología y la música, es cantante lírico y cursa estudios de clarinete. Actualmente se desempeña como Consultor Líder de Business Intelligence en Matrix CPM Solutions.

Share this post

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *