¿Qué es el aprendizaje supervisado?
El aprendizaje supervisado es un enfoque para crear inteligencia artificial (IA), donde un algoritmo informático se entrena con datos de entrada que han sido etiquetados para una salida en particular. El modelo se entrena hasta que puede detectar los patrones subyacentes y las relaciones entre los datos de entrada y las etiquetas de salida, lo que le permite producir resultados de etiquetado precisos cuando se presentan con datos nunca antes vistos.
El aprendizaje supervisado es bueno en problemas de clasificación y regresión, como determinar a qué categoría pertenece un artículo de noticias o predecir el volumen de ventas para una fecha futura determinada. En el aprendizaje supervisado, el objetivo es dar sentido a los datos dentro del contexto de una pregunta específica.
En contraste con el aprendizaje supervisado, el aprendizaje no supervisado. En este enfoque, el algoritmo se presenta con datos sin etiquetar y está diseñado para detectar patrones o similitudes por sí solo, un proceso que se describe con más detalle a continuación.
¿Cómo funciona el aprendizaje supervisado?
Como todos los algoritmos de aprendizaje automático, el aprendizaje supervisado se basa en el entrenamiento. Durante su fase de entrenamiento, el sistema se alimenta con conjuntos de datos etiquetados, que le indican al sistema qué salida está relacionada con cada valor de entrada específico. Luego, el modelo entrenado se presenta con datos de prueba: estos son datos que se han etiquetado, pero las etiquetas no se han revelado al algoritmo. El objetivo de los datos de prueba es medir la precisión con la que funcionará el algoritmo en datos no etiquetados.
En los algoritmos de redes neuronales, el proceso de aprendizaje supervisado se mejora midiendo constantemente las salidas resultantes del modelo y ajustando el sistema para acercarse a su precisión objetivo. El nivel de precisión que se puede obtener depende de dos cosas: los datos etiquetados disponibles y el algoritmo que se utiliza. Además:
- Los datos de entrenamiento deben estar equilibrados y limpios. La basura o los datos duplicados sesgarán la comprensión de la IA; por lo tanto, los científicos de datos deben tener cuidado con los datos en los que está entrenado el modelo.
- La diversidad de los datos determina qué tan bien se desempeñará la IA cuando se le presenten nuevos casos; si no hay suficientes muestras en el conjunto de datos de entrenamiento, el modelo fallará y no producirá respuestas confiables.
- Paradójicamente, una alta precisión no es necesariamente una buena indicación; también podría significar que el modelo sufre de sobreajuste, es decir, está sobreajustado a su conjunto de datos de entrenamiento particular. Un conjunto de datos de este tipo puede funcionar bien en escenarios de prueba, pero fallar miserablemente cuando se presentan desafíos del mundo real. Para evitar el sobreajuste, es importante que los datos de prueba sean diferentes de los datos de entrenamiento para garantizar que el modelo no obtenga respuestas de su experiencia anterior, sino que la inferencia del modelo sea generalizada.
- El algoritmo, por otro lado, determina cómo se pueden utilizar esos datos. Por ejemplo, los algoritmos de aprendizaje profundo se pueden entrenar para extraer miles de millones de parámetros de sus datos y alcanzar niveles de precisión sin precedentes, como lo demuestra el GPT-3 de OpenAI.
Además de las redes neuronales, existen muchos otros algoritmos de aprendizaje supervisado (ver más abajo). Los algoritmos de aprendizaje supervisado generan principalmente dos tipos de resultados: clasificación y regresión.
Algoritmos de clasificación
Un algoritmo de clasificación tiene como objetivo ordenar las entradas en un número determinado de categorías o clases, en función de los datos etiquetados en los que se entrenó. Los algoritmos de clasificación se pueden utilizar para clasificaciones binarias, como filtrar el correo electrónico en spam o no spam y clasificar los comentarios de los clientes como positivos o negativos. El reconocimiento de características, como el reconocimiento de letras y números escritos a mano o la clasificación de medicamentos en muchas categorías diferentes, es otro problema de clasificación que se resuelve mediante el aprendizaje supervisado.
Modelos de regresión
Las tareas de regresión son diferentes, ya que esperan que el modelo produzca una relación numérica entre los datos de entrada y salida. Los ejemplos de modelos de regresión incluyen la predicción de precios inmobiliarios basados en el código postal o la predicción de las tasas de clics en los anuncios en línea en relación con la hora del día, o la determinación de cuánto estarían dispuestos a pagar los clientes por un determinado producto en función de su edad.
Los algoritmos que se utilizan comúnmente en los programas de aprendizaje supervisado incluyen los siguientes:
Al elegir un algoritmo de aprendizaje supervisado, hay algunas cosas que deben tenerse en cuenta. El primero es el sesgo y la varianza que existen dentro del algoritmo, ya que existe una delgada línea entre ser lo suficientemente flexible y demasiado flexible. Otro es la complejidad del modelo o función que el sistema está tratando de aprender. Como se señaló, la heterogeneidad, precisión, redundancia y linealidad de los datos también deben analizarse antes de elegir un algoritmo.
Obtenga más información sobre los algoritmos de aprendizaje supervisado y cómo se aplican mejor en este manual de aprendizaje supervisado de Arcitura Education.
Aprendizaje supervisado versus no supervisado
La principal diferencia entre el aprendizaje supervisado y no supervisado está en cómo aprende el algoritmo. En el aprendizaje no supervisado, el algoritmo recibe datos sin etiquetar como un conjunto de entrenamiento. A diferencia del aprendizaje supervisado, no hay valores de salida correctos; el algoritmo determina los patrones y similitudes dentro de los datos, en lugar de relacionarlos con alguna medición externa. En otras palabras, los algoritmos pueden funcionar libremente para aprender más sobre los datos y encontrar hallazgos interesantes o inesperados que los seres humanos no estaban buscando. El aprendizaje no supervisado es popular en aplicaciones de agrupamiento (el acto de descubrir grupos dentro de los datos) y asociación (el acto de predecir reglas que describen los datos).
Beneficios y limitaciones
Los modelos de aprendizaje supervisado tienen algunas ventajas sobre el enfoque no supervisado, pero también tienen limitaciones. Es más probable que los sistemas de aprendizaje supervisados emitan juicios con los que los humanos puedan relacionarse, por ejemplo, porque los humanos han proporcionado la base para las decisiones.
Sin embargo, en el caso de un método basado en la recuperación, los sistemas de aprendizaje supervisados tienen problemas para tratar con nueva información. Si un sistema con categorías para automóviles y camiones se presenta con una bicicleta, por ejemplo, tendría que agruparse incorrectamente en una categoría u otra. Sin embargo, si el sistema de IA fuera generativo (es decir, sin supervisión), es posible que no sepa qué es la bicicleta, pero podría reconocerla como perteneciente a una categoría separada.
El aprendizaje supervisado también suele requerir grandes cantidades de datos correctamente etiquetados para alcanzar niveles de rendimiento aceptables, y es posible que dichos datos no siempre estén disponibles. El aprendizaje no supervisado no sufre este problema y también puede funcionar con datos no etiquetados.
Aprendizaje semi-supervisado
En los casos en los que se necesita aprendizaje supervisado pero hay una falta de datos de calidad, el aprendizaje semi-supervisado puede ser el método de aprendizaje apropiado. Este modelo de aprendizaje reside entre aprendizaje supervisado y no supervisado; acepta datos que están parcialmente etiquetados, es decir, la mayoría de los datos carecen de etiquetas.
El aprendizaje semi-supervisado determina las correlaciones entre los puntos de datos, al igual que el aprendizaje no supervisado, y luego usa los datos etiquetados para marcar esos puntos de datos. Finalmente, todo el modelo se entrena en función de las etiquetas recién aplicadas.
El aprendizaje semi-supervisado ha demostrado producir resultados precisos y es aplicable a muchos problemas del mundo real donde la pequeña cantidad de datos etiquetados evitaría que los algoritmos de aprendizaje supervisado funcionen correctamente. Como regla general, un conjunto de datos con al menos un 25% de datos etiquetados es adecuado para el aprendizaje semi-supervisado.
El reconocimiento facial, por ejemplo, es ideal para el aprendizaje semi-supervisado; la gran cantidad de imágenes de diferentes personas se agrupa por similitud y luego se le da sentido con una imagen etiquetada que da identidad a las fotos agrupadas.
Ejemplo de un proyecto de aprendizaje supervisado
Considere el problema de categorización de noticias de antes. Un enfoque es determinar a qué categoría pertenece cada noticia, como negocios, finanzas, tecnología o deportes. Para resolver este problema, un modelo supervisado sería la mejor opción.
Los seres humanos presentarían el modelo con varios artículos de noticias y sus categorías y harían que el modelo aprendiera qué tipo de noticias pertenece a cada categoría. De esta manera, el modelo se vuelve capaz de reconocer la categoría de noticias de cualquier artículo que mire en función de su experiencia de formación previa.
Sin embargo, los humanos también pueden llegar a la conclusión de que clasificar las noticias en función de las categorías predeterminadas no es lo suficientemente informativo o flexible, ya que algunas noticias pueden hablar sobre tecnologías del cambio climático o los problemas de la fuerza laboral en una industria. Hay miles de millones de artículos de noticias, y separarlos en 40 o 50 categorías puede ser una simplificación excesiva. En cambio, un mejor enfoque sería encontrar las similitudes entre los artículos de noticias y agrupar las noticias en consecuencia. En su lugar, eso sería buscar en grupos de noticias, donde los artículos similares se agruparían. Ya no hay categorías específicas.
Esto es lo que logra el aprendizaje no supervisado: determina los patrones y similitudes dentro de los datos, en lugar de relacionarlos con alguna medición externa.
Aprenda cómo el aprendizaje semi-supervisado y el nuevo «aprendizaje único«El enfoque tiene como objetivo reducir la necesidad de grandes conjuntos de datos y la intervención humana.