7 lecciones para garantizar proyectos exitosos de aprendizaje automático


Por qué es importante
Todas las organizaciones tienen oportunidades de aprendizaje automático, pero encontrar el equipo adecuado y los usos adecuados puede ser un desafío.

Cuando Michelle K. Lee, ’88, SM ’89, prestó juramento como directora de la Agencia de Patentes y Marcas de EE. UU. En 2015, vio una oportunidad. La agencia estaba un poco atrasada en la transformación digital y la adopción de cosas como la computación en la nube y la inteligencia artificial, pero la organización tenía montañas de datos, como más de 10 millones de patentes que la oficina ha emitido desde su apertura en 1802, y 600,000 solicitudes de patentes recibidas cada año.

Lee dirigió un proyecto para utilizar datos y análisis para modernizar la agencia, como implementar soluciones de inteligencia artificial para mejorar las búsquedas de patentes y la velocidad y calidad de las patentes emitidas. Al recopilar datos sobre cómo toman decisiones los examinadores de patentes y determinar el comportamiento atípico, la oficina también podría identificar áreas en las que los examinadores se beneficiarían de una formación específica.

“Si la Oficina de Patentes y Marcas Registradas de EE. UU., Una agencia gubernamental de más de 200 años, tiene una oportunidad de aprendizaje automático, también la tienen todas las organizaciones”, dijo Lee durante una presentación en EmTech Digital, organizada por MIT Technology Review. “El desafío es identificar esas oportunidades y tener un equipo y un plan para implementarlas”.

Lee, quien ahora es vicepresidenta de aprendizaje automático en Amazon Web Services y miembro a tiempo completo de MIT Corporation, dijo que ha visto empresas en una amplia gama de industrias utilizando con éxito el aprendizaje automático. También ha visto algunos obstáculos comunes, como empresas que luchan por encontrar los mejores casos de uso para el aprendizaje automático, empresas que no tienen fácil acceso a sus datos y empresas que carecen del talento técnico y la experiencia necesarios.

Estas son sus ideas sobre cómo garantizar proyectos exitosos de aprendizaje automático:

1.Asegúrese de tener fácil acceso a los datos necesarios y una estrategia de datos integral

Las soluciones de aprendizaje automático exitosas comienzan con una sólida estrategia de datos. “Su modelo de aprendizaje automático es tan bueno como los datos en los que está entrenado, y los datos a menudo se citan como el desafío número uno para adoptar el aprendizaje automático”, dijo Lee.

Si hay problemas con los datos, los científicos de aprendizaje automático terminarán gastando su tiempo en la limpieza y administración de datos, o se sentirán frustrados porque no tienen los datos que necesitan, dijo.

Las empresas deben asegurarse de tener los tres sellos distintivos de una estrategia de datos sólida:

– Los datos se consideran un activo organizativo, no propiedad de los departamentos individuales que crearon o recopilaron los datos.
– Los datos se democratizan, lo que significa que están disponibles de forma fácil, segura y de conformidad con los requisitos legales y reglamentarios. Muchas empresas enfrentan obstáculos para acceder a los datos que ya tienen, dijo Lee. Algunos de los modelos de aprendizaje automático más potentes se extraen de una combinación de conjuntos de datos dispares.
– Los datos se ponen a trabajar a través de análisis y aprendizaje automático para tomar mejores decisiones, crear eficiencias e impulsar nuevas innovaciones.

Además, Lee sugirió cuatro preguntas para hacer al comenzar proyectos de aprendizaje automático:

– ¿Qué datos tengo a mi disposición hoy?

– ¿Qué datos no están del todo disponibles, pero con un esfuerzo modesto podrían estar disponibles?

– ¿Qué datos no tengo hoy, pero es posible que desee tenerlos en seis meses o un año, y qué pasos puedo tomar para comenzar a recopilar esos datos?

– ¿Existe algún sesgo potencial en mis datos y fuentes de datos?

2. Seleccione cuidadosamente los casos de uso de aprendizaje automático y establezca métricas de éxito.

Las empresas deben comenzar por definir sus problemas comerciales, ver cuáles podrían resolverse con el aprendizaje automático y esbozar métricas claras para medir el éxito, dijo Lee. Los aspectos a tener en cuenta incluyen la preparación de los datos, el impacto empresarial y la aplicabilidad del aprendizaje automático. Un caso de uso empresarial de alto impacto, sin muchos datos o aplicabilidad de aprendizaje automático, resultará en científicos de datos frustrados. Es probable que no se adopte un caso de uso con una gran cantidad de datos y una alta aplicabilidad de aprendizaje automático, pero un bajo impacto comercial. Las métricas de éxito podrían incluir el impacto en los ingresos y la eficiencia.

“Toda empresa tiene una oportunidad de aprendizaje automático”, dijo Lee. “No todos los problemas se pueden resolver mediante el aprendizaje automático”.

3.Asegúrese de que los expertos técnicos y los expertos en dominios trabajen codo con codo

El equipo adecuado es fundamental para elegir el caso de uso adecuado para el aprendizaje automático y para asegurarse de que el proyecto se implemente con éxito. Esto también ayuda a cerrar las brechas culturales, dijo Lee: si las partes interesadas relevantes son parte de todo el proceso, es más probable que todos acepten, adopten e implementen la solución. Cuando los científicos de datos trabajan en silos, los modelos de aprendizaje automático que crean rara vez se implementan.

4. Garantizar el patrocinio ejecutivo y una cultura de experimentación.

“La orientación y la priorización de alto nivel son realmente críticas”, dijo Lee: si no hubiera liderado el proyecto de transformación digital en la Oficina de Patentes y Marcas de EE. UU. Como líder principal de la organización, no habría tenido éxito. En Amazon, dijo, a cada líder empresarial dentro de la organización se le preguntó hace unos 10 años cómo planeaban aprovechar el aprendizaje automático, lo que obligó a todos a trabajar juntos y responder la pregunta.

La cultura adecuada también es importante. “El aprendizaje automático puede ser difícil y lleva tiempo”, dijo Lee. Si una organización trata el fracaso como algo que debe evitarse a toda costa y no como una experiencia de aprendizaje, eso será una barrera. En cambio, las organizaciones deben adoptar una visión a más largo plazo, entendiendo que los modelos a menudo no funcionan de inmediato.

5. Evaluar y abordar las lagunas de habilidades

Muchas organizaciones no tienen todos los científicos de datos que necesitan y es posible que no puedan encontrar o pagar a esos empleados. Las empresas deben enfocarse en capacitar a la fuerza laboral existente además de contratar. Por ejemplo, Amazon desarrolló un programa de Machine Learning University para capacitar ingenieros (el contenido está disponible de forma gratuita) y los cursos también están disponibles a través de plataformas en línea como Coursera.

Los líderes empresariales también deben recibir capacitación para que puedan comenzar a buscar oportunidades comerciales a través de una lente de aprendizaje automático, dijo Lee.

6. Libere a su equipo de cargas pesadas innecesarias e invierta en la infraestructura adecuada

Las empresas deben centrarse en crear una infraestructura de aprendizaje automático que funcione para los empleados independientemente de su nivel de conocimiento, dijo Lee, y aprovechar las herramientas existentes en lugar de reinventar la rueda. Los empleados deben liberarse del trabajo pesado indiferenciado, es decir, del trabajo duro que no necesariamente agrega valor. Por ejemplo, Amazon Web Services ofrece conjuntos de herramientas de aprendizaje automático que pueden ser utilizadas por empresas y empleados en diferentes niveles de conocimiento.

“Enfoque los esfuerzos de su equipo donde puedan agregar el mayor valor, a menudo en el ámbito empresarial”, dijo.

7. Planifique a largo plazo

La adopción del aprendizaje automático no es un proyecto de “uno y listo”, dijo Lee. Los modelos de aprendizaje automático deben actualizarse, volver a capacitarse y mantenerse a medida que cambian los datos. Las empresas no deben pensar en implementar todo a la vez, sino comenzar con un proyecto pequeño, mostrar resultados, obtener aceptación y trabajar hacia objetivos más amplios.

Los líderes también deben establecer las expectativas correctas y comenzar de inmediato. “Es una inversión a largo plazo y sea tolerante con el bajo rendimiento inicial porque puede producir mejores resultados para usted al final”, dijo Lee. “Dado que el aprendizaje automático requiere recopilación, limpieza y preparación de datos, dado que el aprendizaje automático requiere experimentación y un horizonte a más largo plazo … el momento de comenzar es ahora”.

Fuente: Sara Brown