Para los especialistas de la organización FICO el aprendizaje automatizado no solo será crítico para mejorar la precisión de los modelos de datos, sino también para mejorar la eficiencia de los datos.
A medida que los datos —tanto tradicionales como nuevos— comienzan a apilarse, muchas empresas tienen dificultad para iniciar los proyectos. Siempre hemos dicho que el 80% del trabajo consiste en preparar los datos —el 80% del trabajo y la parte más tediosa—. ¿Acaso esta tarea se ha convertido ahora en el 95% del trabajo? La generación rápida de valor es un criterio importante para mantenerse competitivo. El problema es que las metas de eficiencia y las métricas de productividad no son los objetivos más motivantes para los equipos analíticos.
Trabajar en problemas empresariales interesantes y desafiantes y continuar desarrollando las habilidades técnicas propias, por ejemplo, en aprendizaje automatizado, son aspectos muy motivantes para un equipo de trabajo. Los ejecutivos actualmente exigen que sus equipos comiencen a desarrollar modelos de aprendizaje automatizado, pues ha surgido interés en torno a este tema; como lo demuestra el hecho de que este término genere una cantidad cada vez mayor de consultas en Google y los términos como “analítica” estén comenzando a disminuir.
El aprendizaje automatizado es crítico para resolver el problema práctico que enfrentan las empresas al preparar los datos para la creación de modelos. De hecho, el aprendizaje automatizado es relevante desde la transformación de los datos sin procesar hasta la validación de los modelos.
El aprendizaje automatizado ayuda a convertir los datos sin procesar en datos organizados, resumidos y enriquecidos, listos para utilizarse en una variedad de tareas analíticas, incluyendo el desarrollo de modelos. De esta forma, automatiza y aumenta lo que pueden hacer los expertos humanos. Al comparar millones y millones de piezas de historial transaccional, de manera automatizada al generar miles de características y luego hacer emerger sólo las 200 características más importantes para que un analista las observe con más detalle, ahorra semanas o meses de tiempo.
Otros tipos de herramientas de “Machine Learning” hacen lo que no pueden hacer los humanos. Esto incluye encontrar interacciones complejas entre diferentes variedades de datos. Un ejemplo es una herramienta de análisis de redes, que detecta las relaciones entre entidades con características comunes (tales como misma dirección, conocidos mutuos o transacciones de comercio electrónico). Pero las interacciones son difíciles de entender, por lo que las herramientas de visualización son importantes para presentar estas interrelaciones a los analistas/expertos humanos. Todas estas técnicas de aprendizaje automátizado se aplican para mecanizar, buscar extensamente y descubrir lo que está oculto en los datos —¡y todo antes de que el analista comience a desarrollar un modelo! —.
Trabajar con los volúmenes y variedades de Big Data toma mucho tiempo a los analistas. Adoptar el Machine Learning para mejorar no sólo la precisión de los modelos sino también aumentar la eficiencia es crítico para amplificar un activo clave —el equipo analítico— y mantenerse competitivo.