Blog

NUEVA CATEGORÍA BI: SELF-SERVICE DATA PREPARATION


Según la definición de Gartner son herramientas interactivas orientadas al negocio que permiten preparar los datos y potenciar las capacidades de descubrimiento, exploración, estructuración y consumo analítico de la información. Tienen como objetivo reducir el tiempo y la complejidad de preparar los datos y mejorar la productividad analítica.

Características a destacar:

– Aceleran las capacidades analíticas de Data Discovery y de Advanced Analytics.
– Contribuyen al Data Governance incorporando técnicas de calidad de datos y soporte de metadatos pero no reemplazan los programas formales de Data Governance con las estructuras clásicas.
– Flexibilizan el proceso del workflow de integración pero no reemplazan los procesos tradicionales de extracción, transformación y carga de datos corporativos.

El siguiente diagrama muestra el workflow y espacio de trabajo de estas herramientas:

Se pueden categorizar en tres segmentos distintos:

– Stand Alone Data Preparation
– Integradas como parte de una plataforma analítica de data science/advanced analytics
– Integradas como parte de una plataforma de BI/data discovery/analytics

El crecimiento sin precedentes en los datos multi-estructurados (por ejemplo, XML, AVRO, JSON) han contribuido a un mayor esfuerzo necesario en la preparación de los datos para apoyar los procesos de toma de decisiones.

Por otra parte, la preparación de datos es una de las tareas más difíciles y que requieren mucho tiempo para usuarios de BI y herramientas de descubrimiento de datos, así como científicos de datos.

Self Services Data Preparation hacen frente a estos desafíos a través de capacidades tales como datos Data Lineage, Data Cataloging/inventorying, Data Discovery, Data Exploration, Data Transformation, Data Structuring, detección de patrones y de anomalías

Además están ampliando sus capacidades para incluir una gama más amplia de capacidades tales como:

■ El apoyo a las fuentes de datos adicionales.
■ Capacidades inteligentes mediante el aprovechamiento de las técnicas estadísticas y de machine learning.
■ Mejora de la experiencia de colaboración de usuario.
■ Capacidades de descubrimiento de datos mejorada.
■ Capacidades de calidad de datos mejorada.

Gartner prevé que, dentro de 5 años, muchas de las ofertas de los proveedores independientes o bien se ampliarán para ofrecer plataformas analíticas end to end, o se integrarán con proveedores de BI/Analytics que quieren incluir capacidades de preparación de datos como parte de sus plataformas de análisis.

El siguiente cuadro muestra algunas de las herramientas consideradas por Gartner como herramientas de Self Service Data Preparation:

 

Fuente: Gartner– Agosto 2015

Volver

The 10 Best Data Analytics And BI Platforms And Tools In 2020


Cloud ecosystems empowered with AI have matured greatly in recent years. Smart, augmented prediction and decision-making tools are at a s

Ampliar

Four Steps to Prepare Your Enterprise for Machine Learning


Implementation of machine learning (ML) is often misunderstood, but knowledge of the technological tools and processes that facilitate th

Ampliar

10 Invisible Secrets of Data Scientists


In 2010, it was 200qn bytes which grew up to 410000qn in Feb 2020. (1qn byte is 10^18 bytes on a short scale and one million million mill

Ampliar
developed by Avilasoto