Traduciremos Machine Learning como Aprendizaje Automático. Es la capacidad de una máquina para aprender. Queremos que las máquinas aprendan para ayudarnos en múltiples situaciones. Algunas de las más conocidas son:
- Coches que se conducen solos.
- Detección de fraude.
- Diagnósticos médicos.
- Traducciones automáticas de idiomas.
Estos ejemplos presentan desafíos que dependen de la situación. Las soluciones dependen de los datos y del caso particular. No hay una solución explícita. Machine Learning permite a la máquina aprender, adaptarse y decidir en función de los datos disponibles.
La siguiente imagen presenta un ejemplo más sencillo. Para nosotros los humanos es fácil identificar patrones o clasificar elementos. De un vistazo identificamos los cuadrados grandes y los pequeños. La máquina necesita aprender y su forma de pensar es diferente a la nuestra.
¿Qué necesitamos saber para aplicar Machine Learning?
Estadística: vital para entender los datos y distribuciones. Es también importante identificar muestras adecuadas pues procesar todos los datos disponibles puede ser imposible en tiempo y recursos. Identificar la correlación y significancia de las dimensiones de los datos.
Matemáticas: representar los desafíos con expresiones matemáticas. Construir modelos que representen los retos.
Preparar los datos: una de las tareas que más tiempo requieren. Saber reorganizar los datos para el análisis. Limpiar o transformar los datos interpretados como inválidos o inexistentes. Aumentar la calidad de los datos disponibles.
Intuición para los datos: saber identificar qué es importante. Definir objetivos específicos y relevantes alcanzables con los datos disponibles. Conocer las posibilidades de los datos.
Visualización de los datos: ser capaz de comunicar los resultados y alcanzar conclusiones. Es muy importante adaptar la visualización a la audiencia para proporcionar conclusiones valiosas que permitan tomar decisiones.
Conocimiento del dominio: una de las formas de entender los datos disponibles. Un experto en el campo de aplicación puede facilitar decisiones informadas para operar los datos y permitir alcanzar los objetivos.
Programación: la herramienta que permite utilizar la máquina para procesar los datos y llegar a las conclusiones. Python, R y Matlab son ejemplos comunes con librerías útiles para Machine Learning. Hojas de cálculo también pueden ayudar a visualizar y procesar los datos.
En la próxima entrada sobre Machine Learning
Compararemos los dos enfoques principales para Machine Learning: el Aprendizaje Supervisado y el Aprendizaje No Supervisado. Pondremos ejemplos para ambos tipos de Aprendizaje Automático.