En aprendizaje automático existen diferentes paradigmas: difieren en la selección de datos de entrenamiento y en el tipo y frecuencia de retroalimentación durante la fase de entrenamiento.

Después de tratar cómo aprenden las máquinas, como parte la serie Fundamentos de Machine Learning, analizamos los tipos de aprendizaje automático (Machine Learning, ML).

Un paradigma define cómo aprende un algoritmo. Miramos paradigmas, pero no miramos algoritmos concretos para el aprendizaje. El paradigma que se utilice depende de la tarea y el tipo de datos. Para que un paradigma sea utilizado, debe implementarse como un método. En esta publicación de blog, presentamos cinco tipos de aprendizaje automático:

  • no supervisado,
  • supervisado,
  • semisupervisado,
  • activo, y
  • por refuerzo.

Aprendizaje no supervisado (Unsupervised Learning)

Con el aprendizaje no supervisado, no hay retroalimentación al algoritmo durante el aprendizaje. En este caso, el algoritmo intenta reconocer estructuras inherentes a los datos y aprender de ellos. Los métodos de aprendizaje no supervisado incluyen todos los métodos basados en la similitud, como el análisis clúster, que agrupa objetos similares, o algunos métodos de reducción de la dimensionalidad. Un ejemplo común de reducción dimensional es una sombra. Proporciona una imagen bidimensional de un objeto tridimensional. Si imaginamos los datos como objetos de grandes dimensiones, también podemos proyectarlos en dimensiones más bajas y así reducir la complejidad.

Aprendizaje supervisado (Supervised Learning)

El aprendizaje supervisado se caracteriza por el hecho de que es posible una retroalimentación activa para cada ejemplo de entrenamiento. Un algoritmo recupera de forma independiente la retroalimentación de los datos de entrenamiento. Esto supone que los datos de entrenamiento son tales que se conoce la respuesta correcta para cada punto de datos. Un ejemplo clásico de aprendizaje supervisado es el entrenamiento de modelos de clasificación o regresión. Estos modelos están muy extendidos y tienen una aplicación muy universal. Muchas preguntas se pueden formular como preguntas de verdadero o falso, por ejemplo, si un cliente cancelará. Todas las preguntas con un número fijo de respuestas se pueden formular como un problema de clasificación. Si una tarea se puede formular como una predicción de un número, como la predicción de una temperatura, entonces se utilizan modelos de regresión.

Aprendizaje semisupervisado (Semi-supervised Learning)

En el aprendizaje semisupervisado, algunos ejemplos tienen la misma retroalimentación que en el aprendizaje supervisado, otros no. Este suele ser el caso, por ejemplo, cuando se trata de identificar fraudes. Se sabe que todas las estafas detectadas son estafas. Para todos los demás datos, la probabilidad de que se trate de una estafa es baja. Sin embargo, es muy probable que todavía haya casos de fraude ocultos en los datos sin descubrir.

Aprendizaje por refuerzo (Reinforcement Learning)

El aprendizaje por refuerzo difiere de las formas anteriores de aprendizaje en que no hay retroalimentación para cada punto de datos, pero la retroalimentación a menudo solo se proporciona después de muchos pasos. Esta es una situación clásica en muchos juegos donde hay comentarios positivos por ganar un juego y comentarios negativos por perder. En estos casos, la retroalimentación solo está disponible al final del juego. Luego se vuelve a calcular para todas las partidas que se han realizado. Para aprender una buena estrategia, se debe jugar un juego varias veces.

Aprendizaje activo (Active Learning)

En algunos casos de uso, es imposible o muy costoso obtener las respuestas correctas para todos los puntos de datos. Un ejemplo clásico son los sistemas de recomendación. Ningún cliente está dispuesto a calificar miles de películas para recibir sugerencias adecuadas. Es por eso que los sistemas de recomendación funcionan de una manera diferente: con cada sugerencia que hace el sistema, y de la cual el cliente selecciona una película, el sistema recibe retroalimentación sobre las preferencias del cliente. Al seleccionar activamente qué sugerencias ve un cliente potencial, el sistema también decide activamente. Puede encontrar más información sobre el aprendizaje activo en la publicación de blog “Etiquetado más inteligente con aprendizaje activo”.

Fuente:

ML2R | Blog

¿Qué tipos de aprendizaje automático existen?