¿Por qué el open source se ha convertido en una referencia para analítica de datos?

¿Por qué el open source se ha convertido en una referencia para analítica de datos?
Hay diversas soluciones de analítica de datos, para los más variados perfiles de público.Marcelo Sales, director de Productos y Soluciones de Hitachi Vantara LATAM

Existen etapas claves antes de comenzar cualquier proyecto, como la ingestión, transformación y analítica de datos, además de una buena integración con las necesidades del negocio.

Una de las soluciones más recordadas cuando se habla de Big Data es Hadoop. Con gran antigüedad, es la primera tecnología que se viene a la mente cuando se trata de analítica y ciencia de datos. Ya existe un ecosistema basado en esta solución de código abierto escalable, de alto rendimiento, confiable y flexible.

Pero, la aplicación espanta a los analistas y a los responsables de toma de decisiones, debido a la importancia y complejidad. Un estudio de Gartner muestra que la mayoría de las implementaciones de Hadoop no cumplen con los objetivos iniciales de reducción de costos y generación de ingresos debido a los desafíos de integración.

Para reducir las dificultades de una implementación tan compleja como Hadoop, a continuación, se indican algunas etapas claves a tener en cuenta antes de comenzar cualquier proyecto de analítica de datos.

Ingestión, transformación y analítica de datos, así como un checklist para elegir las integraciones de software con las soluciones disponibles en el mercado; todo esto es necesario para estar al mando de la situación y hacer un recorrido de datos lo más beneficioso posible.

Ingestión de datos

El primer paso para una implementación exitosa es saber qué datos están disponibles, qué se ingestionará, fusionará y analizará. Esta etapa es fundamental para que la analítica tenga coherencia de principio a fin y que la información esencial no se quede aislada en silos en la empresa. 

Transformación de datos

Una vez que los datos existentes ya se han recopilado, el segundo paso consta en dibujar cómo se llevará a cabo el proceso de transformación. La idea aquí es integrar las bases de datos disponibles con los desarrolladores y analistas de datos de ETL. Teniendo en cuenta que el desafío es no aumentar significativamente los costos de infraestructura, ya sea una nube pública o privada. Aquí, el uso de herramientas avanzadas como Pentaho PDI puede ahorrar tu tiempo de forma considerable.

Analítica de datos

Esta es la parte más importante del proceso. Si los pasos anteriores se cumplen efectivamente, ahora la empresa realizará un estudio o analítica exhaustiva que generará los conocimientos transformadores del tu negocio.

También, es recomendable pensar en las personas que analizarán los datos, su nivel de participación en los procesos comerciales y el software utilizado para la visualización. Dentro de la misma compañía hay diferentes grados de sofisticación y comprensión de la información. Un gerente de ventas puede querer un panel fácil de entender, mientras que un analista de datos puede necesitar programar sus demandas en R o Python.

Soluciones de analítica de datos

Cerrando el ciclo, en esta parte, el CIO enfrentará el desafío de encontrar las herramientas más apropiadas (y rentables) para satisfacer las diversas demandas que generarán los datos dentro de la empresa.

Hay diversas soluciones de analítica de datos, para los más variados perfiles de público. También hay decisiones importantes, como definir la arquitectura de datos, qué hardware elegir o cómo optimizar la analítica en función de las necesidades específicas.

Una buena práctica en cualquier proyecto es dividir esta etapa en pequeñas fases para que el equipo esté más motivado. Esto facilitará la capacitación y agilizará el soporte proporcionado por la TI. 

Hay mucho de qué hablar y discutir sobre cada uno de estos pasos, para que la implementación de la analítica sea estratégica y no un dolor de cabeza para los gerentes y los CIO.

Quizá, a primera vista, el gerente tenga más preguntas que respuestas. Pero, la estructura anterior ofrece un conjunto de mejores prácticas que, al igual que todo lo relacionado con Analítica de Datos, siempre es fascinante.

Ultimas Noticias

Dejar su comentario sobre esta nota

Su direccion de correo no se publica. Los datos obligatorios se encuentran identificados con un asterisco (*)