El aprendizaje automático se ocupa de la cuestión de cómo los ordenadores pueden aprender a dominar tareas complejas

El aprendizaje automático (Machine Learning, ML) y la inteligencia artificial (IA) son indispensables en el mundo actual. Como tecnología, encuentra contenido importante para nosotros en Internet, nos guía a través del tráfico, nos reconoce en imágenes y comprende nuestros comandos hablados. En nuestro blog queremos explicar no solo proyectos de investigación y aplicaciones, sino también los fundamentos de esta nueva tecnología. Entonces, primero averigüemos cómo aprenden las máquinas.

El concepto de aprendizaje ya nos resulta familiar a los humanos: un ser humano aprende desde que nace, y la capacidad de aprender ha permitido a la humanidad desarrollar su nivel actual de conocimiento, tecnología y valores comunitarios. El aprendizaje es una de las condiciones básicas para poder adaptarse al entorno propio: cuando aprendemos, cambiamos nuestro comportamiento o pensamiento sobre la base de la experiencia o de nuevos conocimientos. En este sentido, el aprendizaje es también un requisito fundamental para la vida inteligente. Pero, ¿cómo se puede transferir la capacidad de aprender a una máquina, a un sistema artificial? Entonces, ¿cómo se puede crear la inteligencia artificial?

Poder de cómputo

“Sistema artificial” aquí significa un ordenador, es decir, una máquina que almacena y procesa datos, por ejemplo, realizando cálculos. Los ordenadores ahora son una parte importante de nuestras vidas: nuestro teléfono inteligente sirve como medio de comunicación, las pantallas se han vuelto indispensables en las oficinas, y la logística global y la industria se digitalizan en todos los ámbitos. El poder de cómputo y almacenamiento de los ordenadores modernos es inmenso: una persona tardaría algunas semanas en calcular millones de números diferentes; un teléfono inteligente puede hacerlo en una fracción de segundo.

Durante mucho tiempo, los ordenadores solo ejecutaban instrucciones dadas por los humanos y no tenían la capacidad de abstraer o incluso aprender de forma autónoma. Por lo tanto, los ordenadores solo podían resolver tareas que podían describirse usando instrucciones simples, como pasos aritméticos. Así, la investigación sobre el aprendizaje automático se ocupa de la cuestión de cómo los ordenadores pueden aprender a dominar tareas complejas. Ha habido muchos avances aquí en los últimos años, de modo que algunas tareas aparentemente complejas, como el reconocimiento facial o de voz, ahora son resueltas de manera casi confiable por ordenadores. Pero, ¿cómo puede aprender un ordenador?

Los datos como base del aprendizaje

Las máquinas también aprenden a través de la experiencia. Entonces, la dificultad es, en primer lugar, representar esta experiencia en forma de datos para ordenadores. Según nosotros, los humanos, la mayoría de los procesos de aprendizaje automático se llevan a cabo utilizando ejemplos concretos. Sin embargo, estos no solo deben ser memorizados por el ordenador, sino que también debe reconocer y comprender patrones y relaciones complejas en los datos. Por lo general, hay una cantidad o propiedad específica medida en los datos que se supone que el sistema debe predecir, la llamada etiqueta. Sin embargo, también se han desarrollado formas especiales de aprendizaje automático para tratar con diferentes tipos de datos. Estos permiten, por ejemplo, aprender de datos sin etiquetas o consultar activamente los datos durante el proceso de aprendizaje.

Un ejemplo simple: se va a diseñar un sistema que, basado en una serie de propiedades, identifique a un animal como un perro o un gato. Hay algunos ejemplos, pero por supuesto también debe ser posible distinguir animales que se desvían de estos ejemplos.

Para la predicción, la información disponible se procesa matemática y estadísticamente en el ordenador. En el aprendizaje automático, estos procesos de cálculo se diseñan de forma flexible para que el sistema pueda adaptarse a los datos existentes. Los tornillos de ajuste de estos procesos del sistema se denominan parámetros. Por entrenamiento se entiende entonces el cambio paso a paso de los parámetros con el objetivo de que el sistema pueda resolver cada vez mejor la tarea. Para el entrenamiento se utilizan algoritmos, es decir, ciertas secuencias de pasos de cálculo. La totalidad de los parámetros y sus relaciones a menudo se denominan modelo, ya que modela los datos de entrenamiento hasta cierto punto. Hay muchas clases diferentes de modelos, cada uno con sus propios algoritmos de entrenamiento. Los métodos más conocidos incluyen regresiones, árboles de decisión, bosques aleatorios, máquinas de vectores de soporte, redes neuronales artificiales y modelos gráficos probabilísticos, especialmente porque son relativamente fáciles de usar.

Por ejemplo, en nuestro ejemplo adjunto, un parámetro podría controlar que los animales que pesan más de 10 kilogramos se clasifiquen como perros, ya que en los datos no se encuentra ningún caso en contrario. Al comienzo del entrenamiento, este parámetro se elegiría al azar y luego se acercaría gradualmente a un valor significativo en el curso del proceso de aprendizaje. Con la ayuda de más parámetros, los datos se pueden distinguir aún mejor aquí.

Optimización y validación

Para mejorar gradualmente el modelo, se debe determinar su calidad. Por ejemplo, se puede hacer que el modelo resuelva la tarea para los datos de entrenamiento disponibles y examine si las etiquetas pronosticadas coinciden con las etiquetas reales. La definición matemática de esta idea suele denominarse función objetivo, que depende de los parámetros y datos observados. A continuación, se puede utilizar la optimización matemática para mejorar gradualmente los parámetros en función de la función objetivo.

Ahora se puede usar un modelo completamente entrenado para hacer predicciones para datos donde se desconoce la etiqueta. Sin embargo, ¿cómo se puede determinar la calidad de los datos desconocidos o incluso comparar dos modelos entrenados entre sí? Estas preguntas explican por qué los datos etiquetados que se encuentran a mano se dividen normalmente en datos de entrenamiento y de prueba. Los datos de entrenamiento solo se utilizan para entrenar el modelo. Luego, el modelo se aplica a los datos de prueba, que también tienen etiquetas. Estos datos no se utilizaron en el entrenamiento y, por lo tanto, indican la calidad del modelo para datos desconocidos. Este proceso se llama validación. El siguiente gráfico resume los subpasos del aprendizaje automático de manera clara:

Subpasos del aprendizaje automático

Esto explica algunos aspectos importantes y fundamentales del aprendizaje automático. ¿Se ha despertado tu interés por cuestiones sobre tecnologías y temas de aprendizaje automático e inteligencia artificial? Sigue nuestro blog. ¿Tiene alguna pregunta o comentario? ¡No dude en utilizar el formulario de contacto para ponerse en contacto con nosotros!

Fuente:

ML2R | Blog

¿Cómo aprenden las máquinas?