Del big data al machine learning

Del big data al machine learning
Con machine learning las organizaciones pasarán de ser reactivas a proactivas.María Elena Barros, presidente de Semperti

La creación y almacenamiento masivo de datos no es exclusiva de una industria ni tampoco de los seres humanos.

La inmensa acumulación de datos enfrentó al mundo con la problemática del volumen de información en cantidades nunca antes vistas. Así nació el big data, como una solución para capturar, gestionar, procesar y analizar combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) no pueden ser manejadas por herramientas tradicionales tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización dentro del tiempo necesario para que sean útiles.

Se estima que si toda la información producida por los seres humanos en el mundo se guardara en CDs se formaría una montaña tan alta que llegaría desde la Tierra hasta la Luna y volvería. En este contexto, entender qué es big data y la importancia que su correcta gestión produce en las empresas se convierte en un hito central para el crecimiento del revenue en los balances de negocio.

Las compañías privadas de diversos sectores, e incluso el sector público, mantienen grandes cantidades de datos transaccionales reuniendo información sobre clientes, proveedores y operaciones, datos de censo de población, registros médicos, impuestos, transacciones financieras realizadas en línea o por dispositivos móviles, análisis de redes sociales y ubicación geográfica mediante coordenadas GPS, por mencionar algunas.

Pero, como dije al principio, no sólo los seres humanos contribuimos a este crecimiento enorme de información, existe también la comunicación denominada máquina a máquina (M2M machine-to-machine) cuyo valor en la creación de grandes cantidades de datos también es muy importante: sensores digitales instalados en contenedores para determinar la ruta generada, sensores en medidores eléctricos para determinar el consumo de energía a intervalos regulares, entre otros.

En la Argentina, una de las primeras industrias en las que la explosión de información disponible vivió las consecuencias de buscar una aguja en un pajar fueron las compañías telefónicas con los análisis de los CDR (Call Detail Record), es decir, todos los datos que genera cada línea de celular.

Cuando, por ejemplo, un edicto judicial pedía el historial de una línea, implicaba un reporte que se tenía que sacar de un repositorio de CDRs en los que se tenía que consultar registro por registro hasta recuperar todo lo solicitado.

Esta actividad llevaba muchísimo tiempo e involucraba aún más recursos. Por lo que hubo que encontrar una solución eficiente. Esta solución vino de la mano de aplicar técnicas de big data como almacenamiento de datos distribuidos y algoritmos de map-reduce para el recupero de los datos.

El siguiente nivel en manejo de volúmenes de datos consistirá en contar con la capacidad de predecir la conducta. machine learning, disciplina científica del ámbito de la inteligencia artificial, crea sistemas que aprenden automáticamente, lo que significa identificar patrones complejos en millones de datos.

En pocas palabras, con machine learning las organizaciones pasarán de ser reactivas a proactivas. Por ejemplo, podrían utilizarse este tipo de técnicas para hacer un análisis previo de las tomografías para que un sistema informático le indique al radiólogo cuales imágenes merecen particular atención en función de la presencia de anomalías.

En Semperti, con el objeto de acompañar a nuestros clientes en la transformación digital de sus negocios, hemos formado una práctica profesional en big data para ayudar a las empresas a integrar grandes volúmenes de datos, adquirir nuevas habilidades tecnológicas y vincular los silos de información para que puedan gestionar complejas transformaciones de datos garantizando la entrega de información de valor para el negocio en tiempo real.

Ultimas Noticias

Dejar su comentario sobre esta nota

Su direccion de correo no se publica. Los datos obligatorios se encuentran identificados con un asterisco (*)