Superando la parálisis de datos al prepararse para la IA
Febrero 4, 2019
Febrero 4, 2019
Los proyectos de IA necesitan datos. No debe ser perfecto, pero debe tener suficiente calidad y consistencia para que emerjan patrones útiles. Sin embargo, muchas empresas están abrumadas por el volumen, la velocidad y la variedad de sus datos y se encuentran imposibilitados para acceder al real valor de sus datos. ¿Cómo deberíamos pensar la estrategia sobre la preparación de los datos para evitar potenciales parálisis por datos o exceso de ambición en proyectos de IA?
Mientras mejor son los datos, mejor es la IA. Pero para muchas empresas existe un problema:. 85% de sus datos son redundantes, obsoletos o triviales.
No es siempre fácil determinar dónde se encontrará el valor, pero para incluso entender el escenario, los datos deben estar limpios e integrados con el negocio. Es fundamental asegurar que los datos tengan una estructura y formato que permita obtener los datos necesarios para los modelos de IA.
Reestructurar los datos es una tarea que puede ser tanto mundana como enorme. Los números de teléfono, por ejemplo, deben estar formateados consistentemente, con espacios en los mismos lugares. O considera las direcciones: si una persona ha entregado su ciudad como “New York”, otra persona como “New-York”, y un tercero ha entregado “NYC”. Los modelos de IA presentarán éstas como tres entidades independientes a menos hayan sido entrenados para asociarlas.
Los líderes saben que deben usar sus datos para mantenerse competitivos, pero también saben que enfrentan una tarea monumental para limpiar los datos. Esto consume tiempo y recursos, y en muchos casos, no saben la mejor forma de enfrentarlo – lo que puede hacerlos sentir paralizados.
Poner a los data scientists en esta tarea no es siempre la mejor solución. Cuando son destinados a este propósito, su valioso talento suele quedar atrapado en “el calabozo de los datos” – destinando mucho tiempo en tareas tediosas para la preparaciones de datos y muchas veces sintiéndose paralizados por el volumen de datos que deben ser limpiados. Luego, muy poco tiempo es destinado para descubrir poderosos descubrimientos que pueden transformar sus negocios, crear nuevas experiencias de cliente, y mucho más – lo que, finalmente, es su principal objetivo.
Poner a los data scientists en esta tarea no es siempre la mejor solución. Cuando son destinados a este propósito, su valioso talento suele quedar atrapado en “el calabozo de los datos”.
Para obtener el mayor impacto desde los datos y buscar una transformación impulsada por éstos, las empresas querrán evitar esta parálisis y descubrir formas para avanzar en la agenda de la IA. Sin embargo, las empresas también necesitan considerar el riesgo de estrategias muy ambiciosas, que puede ser tan dañino como la parálisis de datos, como vemos en el siguiente ejemplo:
Las empresas también necesitan considerar el riesgo de estrategias muy ambiciosas, que puede ser tan dañino como la parálisis de datos.
Mi recomendación es evaluar lo que debe hacerse con sus datos a través de las funciones de negocio, pero luego aislar una pequeña área que sea una prioridad para la organización. Acá es donde puedes hacer un inicio valioso y enfocado y ganar impulso, con una mirada que expanda gradualmente o replique el enfoque a lo largo del tiempo.
Un negocio podría comenzar eligiendo, por ejemplo, los diez puntos críticos que deben ser mejorados, luego ordenarlos por ranking y descubrir que si se enfoca en sólo los dos primeros, puede lograr una mejora sustancial en una métrica clave. Encuentra un ejemplo como este en tu negocio y concéntrate en éste antes de moverse al siguiente punto crítico. De esta forma, aseguras éxitos tangibles en IA, con la confianza de los actores clave y estableces métodos que se pueden replicar y escalar.