“Los cuatro ejes para decidir qué caso de uso será el siguiente (o el primero) en mi aventura con el Machine Learning”

La experiencia de estos años abordando proyectos de Minería de Datos primero y Machine Learning en la actualidad, nos han proporcionado una idea clara de cuales son los principales ejes que deben de tenerse en cuenta para intentar que la aproximación a Machine Learning sea lo más productiva posible para nuestros clientes. Podemos resumir esos ejes, en cuatro fundamentales: Selección de caos de uso, definición de objetivos de negocio, evaluación de la calidad de datos y nivel de madurez en el análisis.

 

RECETA 1. Selecciona adecuadamente el caso de uso a implementar.

Si estás empezando, o quieres empezar, implementando soluciones basadas en Machine Learning y que estas se integren dentro de los procesos de negocio, debes de tener en cuenta lo obvio. No todos los casos de uso serán igualmente complejos de implementar, dificultad que, en este mundo, no siempre está directamente relacionada con el impacto en el negocio que esas soluciones pueden proporcionar. Establece una lista de los casos de uso susceptibles de implementar, y clasifícalos en dos ejes, por un lado, su complejidad técnica, y por otro el impacto en el negocio que puedan suponer. Con esa matriz, tendrás un criterio de decisión más acertado para saber por donde empezar.

 

RECETA 2. Define objetivos de negocio para tus proyectos.

Del punto anterior, será más o menos sencillo clasificar los casos de uso según su menor o mayor complejidad técnica, pero es probable que no sea sencillo clasificarlos según su posible impacto en el negocio. Es por ello, que es imprescindible definir cuales son los objetivos de negocio que buscamos mejorar o conseguir. Y volvemos a lo obvio, debemos de poder medir esos objetivos. Es muy común, que la primera reacción del usuario de negocio sea “quiero reducir el tiempo medio del proceso X”, o lo que acto seguido nuestra pregunta sería…. “¿estás midiendo ahora mismo el tiempo que se tarda en ejecutar ese proceso?” Os sorprendería la cantidad de veces que la respuesta a esa pregunta es No, pero lo haremos a partir de ahora. A partir de ahora, es una unidad de tiempo similar al “un huevo” como unidad de medida de mi amigo Miguel Egea, pero es que, además, ya no tendremos mucho con lo que comparar, ¿no?

 

RECETA 3. Calidad de los datos.

Es habitual que no se le presta la atención que merece, a la calidad de los datos que almacenamos. En la mayoría de los casos, porque tenemos la falsa creencia de que esos datos tienen la calidad suficiente. De que tenemos los controles necesarios en nuestras aplicaciones de negocio para garantizar esa calidad, pero eso rara vez sucede. Sin embargo, es habitual que esos sistemas transaccionales de origen tengan excepciones agregadas a lo largo del tiempo, que permitan que, para determinados casos concretos, sea posible saltarse alguna regla de validación. Esas excepciones, a lo largo de los años, acaban generando un conjunto de datos con una calidad que hace complicado su análisis, y la automatización de ese análisis. Evaluar esa calidad, es una de las primeras tareas que deben de abordarse, y en caso de poder decidir, decidirnos siempre por el conjunto de datos que mejor calidad tenga.

 

RECETA 4. Nivel de madurez en el análisis de datos.

Es importante hacer este viaje paso a paso. Es habitual que se quieran acortar plazos, y dar saltos al vacío, pasando de un reporte tradicional a querer proyectos de Machine Learning para realizar predicciones de cualquier tipo. Y es un error. Fundamentalmente porque nadie conoce el negocio mejor que el usuario, y esos diferentes niveles de madurez en el análisis ayudan mucho en dos aspectos fundamentales. El primero de ellos, para que el usuario sepa realmente lo que necesita para impactar realmente en su negocio, lo que facilitará la elección del caso de uso a desarrollar. Por otro lado, porque esos indicadores que se analicen en esos pasos intermedios, son, con toda probabilidad, las mejores características de entrada para cualquier proyecto de Machine Learning. Sin ellas, estaremos ante un caso muy básico y genérico, que probablemente no proporcione el valor esperado al proyecto. Son esas métricas las que llevan embebida la filosofía del negocio.

Estos cuatro ejes son los que analizamos en nuestros Ideation Workshops, en donde nos sentamos con nuestros clientes e intentamos definir cual es el mejor mapa de ruta en cuanto a analítica avanzada y proyectos de Machine Learning a desarrollar.