Cómo la analítica aumentada ya está cambiando nuestro futuro


COVID-19 ha cambiado las preguntas. Los paneles creados sobre supuestos anteriores ya no eran válidos. En cambio, los responsables de la toma de decisiones y los líderes empresariales estaban examinando los datos operativos y de recursos humanos para comprender su situación actual.

En un informe reciente, “Las 10 principales tendencias en datos y análisis, 2020”, Gartner predijo que esto ha dado lugar a la adopción de análisis. No solo la versión simple de vainilla, sino la variedad aumentada.

La analítica aumentada reunió mundos de datos y analítica previamente separados en una sola plataforma. Los proveedores como SAS ofrecen flujos de trabajo de un extremo a otro para impulsar la analítica aumentada y difuminar la distinción entre estos dos mercados.

Esta es una buena noticia para los científicos de datos. La llamada “colisión de datos y análisis” aumentará la interacción y la colaboración entre los roles de análisis y datos históricamente separados. Gartner señaló que esto afecta no solo a las tecnologías y capacidades proporcionadas, sino también a las personas y los procesos que las respaldan y usan.

Remco den Heijer, vicepresidente de ASEAN en SAS, dijo que la analítica aumentada ya está ayudando a muchas empresas a optimizar la toma de decisiones, ya que los conocimientos de los datos estaban “disponibles en una fracción del tiempo en comparación con los enfoques manuales”.

Pronto, la analítica aumentada mejorará los pronósticos de la demanda, identificará posibles interrupciones en la cadena de suministro, preparará servicios de soporte para los trabajadores en riesgo y determinará la efectividad de las estrategias de intervención en crisis, son algunos de ellos.

Repensar la preparación de datos

Los datos son el elemento vital de una organización. Los datos incorrectos también pueden provocarle un ataque cardíaco. Y muchas empresas, hambrientas de conocimientos, lo están aprendiendo por las malas.

No es una preocupación nueva y los científicos de datos conocen demasiado bien. “La preocupación por la calidad de los datos no es nada nuevo. Durante el tiempo que las organizaciones han estado recopilando y utilizando datos, ha habido preocupaciones sobre si se han registrado y procesado correctamente. Los buenos datos cuestan dinero y requieren un tiempo y un esfuerzo considerables ”, observó den Heijer.

Pero dado que las empresas dependen más de la información analítica, el riesgo de conjuntos de datos incorrectos o con sesgos inherentes es mayor. Y a medida que las empresas exploran nuevas fuentes de datos para comprender mejor un mercado en rápida evolución, también necesitan una mejor manera de verificar las fuentes de datos rápidamente.

A su vez, esto ha puesto de relieve el etiquetado y la limpieza de datos. “Y los incentivos para el etiquetado y la limpieza adecuados de los datos deben vincularse directamente a los encargados de su creación”, dijo den Heijer.

En lugar de considerar el etiquetado y la limpieza de datos como procesos separados, argumentó que las empresas deben verlo como parte de la producción de información y monitorear y ajustar continuamente según sea necesario. “Las empresas deben sopesar los beneficios de hacerlo y gastar más tiempo y dinero en obtener fuentes de datos limpias”.

La virtualización de datos también puede simplificar la complejidad de acceder a datos altamente distribuidos al tiempo que ofrece un entorno analítico centralizado, flexible y de alto rendimiento.

“Aplica funciones de calidad de datos como el análisis, la coincidencia y el análisis de género o identificación en tiempo real a medida que se genera la vista. Al proporcionar una capa de virtualización de datos, ayuda a las organizaciones a acceder a fuentes de datos subyacentes como Hadoop, Netezza, SAP HANA, etc. No es necesario crear estrategias de acceso independientes para cada fuente de datos ”, dijo den Heijer.

Inteligencia artificial y gestión de datos aumentada

COVID-19 ha acortado el viaje a la IA. Esta es la razón por la que Gartner cree en su informe que “para fines de 2024, el 75% de las organizaciones pasarán de realizar pruebas piloto a poner en funcionamiento la IA”.

Antes, muchos de los casos eran proyectos de Narrow AI (por ejemplo, chatbots). Hoy en día, las empresas están explorando técnicas de aprendizaje profundo para mejorar su toma de decisiones en toda la organización y buscar implementaciones de IA más amplias.

Pero den Heijer advirtió contra subirse al tren de la IA demasiado rápido. En cambio, recomendó establecer primero un marco de gobierno de datos sólido. Y una forma de crear uno es integrar capacidades de gestión de datos que permitan a los científicos de datos acceder e integrar fácilmente datos de otras fuentes.

La integración de la gestión de datos es lo que Gartner llama gestión de datos aumentada. En el informe, la firma de analistas lo definió como uno que “utiliza técnicas de aprendizaje automático e inteligencia artificial para optimizar y mejorar las operaciones [de datos]”. También puede convertir los metadatos para que no se utilicen en auditoría, linaje y generación de informes a “impulsar sistemas dinámicos”.

Los beneficios clave de la gestión de datos aumentada son la capacidad de analizar grandes extensiones de datos operativos, incluidas consultas reales, datos de rendimiento y esquemas. Con el uso de datos existentes y la carga de trabajo, un motor aumentado puede ajustar las operaciones y optimizar la configuración, la seguridad y el rendimiento.

“Un motor de sugerencias puede simplificar la preparación de datos. La gobernanza de datos rastrea los datos y el linaje del modelo, por lo que si los datos cambian, sabrá qué modelos necesitan reentrenamiento ”, dijo den Heijer.

Poner en funcionamiento la democracia de la IA

SAS ve un futuro en el que los científicos de datos ciudadanos desempeñen un papel más crucial en la toma de decisiones. Tiene que suceder a medida que las empresas se enfrentan continuamente a la escasez de talento de IA.

Den Heijer cree que las empresas deben cambiar primero su forma de pensar sobre los científicos de datos ciudadanos. “Las organizaciones en Asia no están completamente preparadas para esta transición con los científicos de datos ciudadanos tomando decisiones comerciales por su cuenta. Actualmente, su función se centra en interpretar y gestionar datos para resolver problemas complejos. En este punto, las estructuras organizativas se interpondrán en el camino de los científicos de datos ciudadanos ”, dijo.

Un científico de datos jefe, que participó en una encuesta reciente de SAS, dijo que el mejor escenario para adoptar la IA y generar un impacto positivo a largo plazo requiere “equilibrar el apoyo del liderazgo y el entusiasmo de base”.

“Entendemos las aprensiones de las organizaciones cuando se trata de adoptar el concepto de científicos de datos ciudadanos. Con la ayuda del motor de análisis en memoria habilitado para la nube de SAS Viya, hemos aprovechado la tecnología de contenedores y nube para facilitar la consumerización de la tecnología “.

Por Winston Thomas