Blog

NUEVA CATEGORÍA BI: SELF-SERVICE DATA PREPARATION


Según la definición de Gartner son herramientas interactivas orientadas al negocio que permiten preparar los datos y potenciar las capacidades de descubrimiento, exploración, estructuración y consumo analítico de la información. Tienen como objetivo reducir el tiempo y la complejidad de preparar los datos y mejorar la productividad analítica.

Características a destacar:

– Aceleran las capacidades analíticas de Data Discovery y de Advanced Analytics.
– Contribuyen al Data Governance incorporando técnicas de calidad de datos y soporte de metadatos pero no reemplazan los programas formales de Data Governance con las estructuras clásicas.
– Flexibilizan el proceso del workflow de integración pero no reemplazan los procesos tradicionales de extracción, transformación y carga de datos corporativos.

El siguiente diagrama muestra el workflow y espacio de trabajo de estas herramientas:

Se pueden categorizar en tres segmentos distintos:

– Stand Alone Data Preparation
– Integradas como parte de una plataforma analítica de data science/advanced analytics
– Integradas como parte de una plataforma de BI/data discovery/analytics

El crecimiento sin precedentes en los datos multi-estructurados (por ejemplo, XML, AVRO, JSON) han contribuido a un mayor esfuerzo necesario en la preparación de los datos para apoyar los procesos de toma de decisiones.

Por otra parte, la preparación de datos es una de las tareas más difíciles y que requieren mucho tiempo para usuarios de BI y herramientas de descubrimiento de datos, así como científicos de datos.

Self Services Data Preparation hacen frente a estos desafíos a través de capacidades tales como datos Data Lineage, Data Cataloging/inventorying, Data Discovery, Data Exploration, Data Transformation, Data Structuring, detección de patrones y de anomalías

Además están ampliando sus capacidades para incluir una gama más amplia de capacidades tales como:

El apoyo a las fuentes de datos adicionales.
Capacidades inteligentes mediante el aprovechamiento de las técnicas estadísticas y de machine learning.
Mejora de la experiencia de colaboración de usuario.
Capacidades de descubrimiento de datos mejorada.
Capacidades de calidad de datos mejorada.

Gartner prevé que, dentro de 5 años, muchas de las ofertas de los proveedores independientes o bien se ampliarán para ofrecer plataformas analíticas end to end, o se integrarán con proveedores de BI/Analytics que quieren incluir capacidades de preparación de datos como parte de sus plataformas de análisis.

El siguiente cuadro muestra algunas de las herramientas consideradas por Gartner como herramientas de Self Service Data Preparation:

 

Fuente: Gartner– Agosto 2015

Volver

Machine Learning And Artificial Intelligence


La Analogía entre ML y AI
Esto ha sido un tema sensible entre nosotros que, si quiere marcar diferencias entre do

Ampliar

Tendencias Big Data y analítica 2018


Evolución técnica notable

Muchos expertos coinciden que 2018 será el año en que el Big Data logrará una evol

Ampliar

¿Será la Visualización la nueva y gran V de Big Data?


El efecto de superioridad de imagen (picture superiority effect) se refiere al fenómeno en el que las imágenes son más propensas a

Ampliar
developed by Avilasoto