Krypton Solid

La última tecnología en raciones de 5 minutos

¿Qué es el aprendizaje supervisado?

¿Qué es el aprendizaje supervisado?

El aprendizaje supervisado es un enfoque para crear inteligencia artificial (IA), donde un algoritmo informático se entrena con datos de entrada que han sido etiquetados para una salida en particular. El modelo se entrena hasta que puede detectar los patrones subyacentes y las relaciones entre los datos de entrada y las etiquetas de salida, lo que le permite producir resultados de etiquetado precisos cuando se presentan con datos nunca antes vistos.

El aprendizaje supervisado es bueno en problemas de clasificación y regresión, como determinar a qué categoría pertenece un artículo de noticias o predecir el volumen de ventas para una fecha futura determinada. En el aprendizaje supervisado, el objetivo es dar sentido a los datos dentro del contexto de una pregunta específica.

En contraste con el aprendizaje supervisado, el aprendizaje no supervisado. En este enfoque, el algoritmo se presenta con datos sin etiquetar y está diseñado para detectar patrones o similitudes por sí solo, un proceso que se describe con más detalle a continuación.

¿Cómo funciona el aprendizaje supervisado?

Como todos los algoritmos de aprendizaje automático, el aprendizaje supervisado se basa en el entrenamiento. Durante su fase de entrenamiento, el sistema se alimenta con conjuntos de datos etiquetados, que le indican al sistema qué salida está relacionada con cada valor de entrada específico. Luego, el modelo entrenado se presenta con datos de prueba: estos son datos que se han etiquetado, pero las etiquetas no se han revelado al algoritmo. El objetivo de los datos de prueba es medir la precisión con la que funcionará el algoritmo en datos no etiquetados.

En los algoritmos de redes neuronales, el proceso de aprendizaje supervisado se mejora midiendo constantemente las salidas resultantes del modelo y ajustando el sistema para acercarse a su precisión objetivo. El nivel de precisión que se puede obtener depende de dos cosas: los datos etiquetados disponibles y el algoritmo que se utiliza. Además:

  • Los datos de entrenamiento deben estar equilibrados y limpios. La basura o los datos duplicados sesgarán la comprensión de la IA; por lo tanto, los científicos de datos deben tener cuidado con los datos en los que está entrenado el modelo.
  • La diversidad de los datos determina qué tan bien se desempeñará la IA cuando se le presenten nuevos casos; si no hay suficientes muestras en el conjunto de datos de entrenamiento, el modelo fallará y no producirá respuestas confiables.
  • Paradójicamente, una alta precisión no es necesariamente una buena indicación; también podría significar que el modelo sufre de sobreajuste, es decir, está sobreajustado a su conjunto de datos de entrenamiento particular. Un conjunto de datos de este tipo puede funcionar bien en escenarios de prueba, pero fallar miserablemente cuando se presentan desafíos del mundo real. Para evitar el sobreajuste, es importante que los datos de prueba sean diferentes de los datos de entrenamiento para garantizar que el modelo no obtenga respuestas de su experiencia anterior, sino que la inferencia del modelo sea generalizada.
  • El algoritmo, por otro lado, determina cómo se pueden utilizar esos datos. Por ejemplo, los algoritmos de aprendizaje profundo se pueden entrenar para extraer miles de millones de parámetros de sus datos y alcanzar niveles de precisión sin precedentes, como lo demuestra el GPT-3 de OpenAI.

Además de las redes neuronales, existen muchos otros algoritmos de aprendizaje supervisado (ver más abajo). Los algoritmos de aprendizaje supervisado generan principalmente dos tipos de resultados: clasificación y regresión.

Algoritmos de clasificación

Un algoritmo de clasificación tiene como objetivo ordenar las entradas en un número determinado de categorías o clases, en función de los datos etiquetados en los que se entrenó. Los algoritmos de clasificación se pueden utilizar para clasificaciones binarias, como filtrar el correo electrónico en spam o no spam y clasificar los comentarios de los clientes como positivos o negativos. El reconocimiento de características, como el reconocimiento de letras y números escritos a mano o la clasificación de medicamentos en muchas categorías diferentes, es otro problema de clasificación que se resuelve mediante el aprendizaje supervisado.

Modelos de regresión

Las tareas de regresión son diferentes, ya que esperan que el modelo produzca una relación numérica entre los datos de entrada y salida. Los ejemplos de modelos de regresión incluyen la predicción de precios inmobiliarios basados ​​en el código postal o la predicción de las tasas de clics en los anuncios en línea en relación con la hora del día, o la determinación de cuánto estarían dispuestos a pagar los clientes por un determinado producto en función de su edad.

Los algoritmos que se utilizan comúnmente en los programas de aprendizaje supervisado incluyen los siguientes:

Al elegir un algoritmo de aprendizaje supervisado, hay algunas cosas que deben tenerse en cuenta. El primero es el sesgo y la varianza que existen dentro del algoritmo, ya que existe una delgada línea entre ser lo suficientemente flexible y demasiado flexible. Otro es la complejidad del modelo o función que el sistema está tratando de aprender. Como se señaló, la heterogeneidad, precisión, redundancia y linealidad de los datos también deben analizarse antes de elegir un algoritmo.

Obtenga más información sobre los algoritmos de aprendizaje supervisado y cómo se aplican mejor en este manual de aprendizaje supervisado de Arcitura Education.

Aprendizaje supervisado versus no supervisado

La principal diferencia entre el aprendizaje supervisado y no supervisado está en cómo aprende el algoritmo. En el aprendizaje no supervisado, el algoritmo recibe datos sin etiquetar como un conjunto de entrenamiento. A diferencia del aprendizaje supervisado, no hay valores de salida correctos; el algoritmo determina los patrones y similitudes dentro de los datos, en lugar de relacionarlos con alguna medición externa. En otras palabras, los algoritmos pueden funcionar libremente para aprender más sobre los datos y encontrar hallazgos interesantes o inesperados que los seres humanos no estaban buscando. El aprendizaje no supervisado es popular en aplicaciones de agrupamiento (el acto de descubrir grupos dentro de los datos) y asociación (el acto de predecir reglas que describen los datos).

Enfoques de aprendizaje automático
Algoritmos utilizados en el aprendizaje supervisado, no supervisado y semi-supervisado.

Beneficios y limitaciones

Los modelos de aprendizaje supervisado tienen algunas ventajas sobre el enfoque no supervisado, pero también tienen limitaciones. Es más probable que los sistemas de aprendizaje supervisados ​​emitan juicios con los que los humanos puedan relacionarse, por ejemplo, porque los humanos han proporcionado la base para las decisiones.

Sin embargo, en el caso de un método basado en la recuperación, los sistemas de aprendizaje supervisados ​​tienen problemas para tratar con nueva información. Si un sistema con categorías para automóviles y camiones se presenta con una bicicleta, por ejemplo, tendría que agruparse incorrectamente en una categoría u otra. Sin embargo, si el sistema de IA fuera generativo (es decir, sin supervisión), es posible que no sepa qué es la bicicleta, pero podría reconocerla como perteneciente a una categoría separada.

El aprendizaje supervisado también suele requerir grandes cantidades de datos correctamente etiquetados para alcanzar niveles de rendimiento aceptables, y es posible que dichos datos no siempre estén disponibles. El aprendizaje no supervisado no sufre este problema y también puede funcionar con datos no etiquetados.

Aprendizaje semi-supervisado

En los casos en los que se necesita aprendizaje supervisado pero hay una falta de datos de calidad, el aprendizaje semi-supervisado puede ser el método de aprendizaje apropiado. Este modelo de aprendizaje reside entre aprendizaje supervisado y no supervisado; acepta datos que están parcialmente etiquetados, es decir, la mayoría de los datos carecen de etiquetas.

El aprendizaje semi-supervisado determina las correlaciones entre los puntos de datos, al igual que el aprendizaje no supervisado, y luego usa los datos etiquetados para marcar esos puntos de datos. Finalmente, todo el modelo se entrena en función de las etiquetas recién aplicadas.

El aprendizaje semi-supervisado ha demostrado producir resultados precisos y es aplicable a muchos problemas del mundo real donde la pequeña cantidad de datos etiquetados evitaría que los algoritmos de aprendizaje supervisado funcionen correctamente. Como regla general, un conjunto de datos con al menos un 25% de datos etiquetados es adecuado para el aprendizaje semi-supervisado.

El reconocimiento facial, por ejemplo, es ideal para el aprendizaje semi-supervisado; la gran cantidad de imágenes de diferentes personas se agrupa por similitud y luego se le da sentido con una imagen etiquetada que da identidad a las fotos agrupadas.

Ejemplo de un proyecto de aprendizaje supervisado

Considere el problema de categorización de noticias de antes. Un enfoque es determinar a qué categoría pertenece cada noticia, como negocios, finanzas, tecnología o deportes. Para resolver este problema, un modelo supervisado sería la mejor opción.

Los seres humanos presentarían el modelo con varios artículos de noticias y sus categorías y harían que el modelo aprendiera qué tipo de noticias pertenece a cada categoría. De esta manera, el modelo se vuelve capaz de reconocer la categoría de noticias de cualquier artículo que mire en función de su experiencia de formación previa.

Sin embargo, los humanos también pueden llegar a la conclusión de que clasificar las noticias en función de las categorías predeterminadas no es lo suficientemente informativo o flexible, ya que algunas noticias pueden hablar sobre tecnologías del cambio climático o los problemas de la fuerza laboral en una industria. Hay miles de millones de artículos de noticias, y separarlos en 40 o 50 categorías puede ser una simplificación excesiva. En cambio, un mejor enfoque sería encontrar las similitudes entre los artículos de noticias y agrupar las noticias en consecuencia. En su lugar, eso sería buscar en grupos de noticias, donde los artículos similares se agruparían. Ya no hay categorías específicas.

Esto es lo que logra el aprendizaje no supervisado: determina los patrones y similitudes dentro de los datos, en lugar de relacionarlos con alguna medición externa.

Aprenda cómo el aprendizaje semi-supervisado y el nuevo «aprendizaje único«El enfoque tiene como objetivo reducir la necesidad de grandes conjuntos de datos y la intervención humana.

Deja un comentario

También te puede interesar...

Controla un telescopio a través de iPhone

Tim DeBenedictis, arquitecto de productos de Carina Software, presenta la aplicación para iPhone SkyVoyager de la compañía, que permite a los usuarios encontrar estrellas, cúmulos y galaxias en el cielo nocturno. También demuestra SkyFi, un

Skype sigue su propio camino (esta vez con códecs de video)

Skype, que aún no forma parte oficialmente de Microsoft, no está en modo de reorganización mientras continúa el proceso de verificación antimonopolio. De hecho, Skype continúa lanzando actualizaciones a sus servicios existentes en una variedad

Microsoft, Xandros apunta al correo electrónico móvil

Microsoft ha ampliado su pacto con el distribuidor de Linux Xandros. Xandros ha creado una distribución de Linux basada en Debian tanto para escritorios como para servidores. También vende servidores de correo electrónico de código

Definición de reaseguro finito

¿Qué es el reaseguro finito? El reaseguro finito, también conocido como reaseguro de riesgo finito, es una categoría de reaseguro que otorga al reasegurador una cantidad finita o limitada de riesgo. Al transferir un menor

Definición de hipótesis de mercado fractal (FMH).

¿Qué es la hipótesis del mercado fractal (FMH)? La hipótesis del mercado fractal (FMH) establece que los datos de series temporales de cotizaciones bursátiles tienen propiedades similares a los fractales y atribuyen estas propiedades a

Definición de costes de reparación.

¿Cuáles son los costos de reparación? Los costos de reparación son cualquier costo de reparación en el que haya incurrido una persona durante el proceso de preparación de la vivienda para la venta, como reemplazar

Adictos a las drogas y al código abierto

Mientras cumplía Obligaciones familiares La semana pasada, encontré una verdad que conecta el mundo político y el código abierto. (Cartel de Noticias aterradoras.) A la mayoría de la gente no le importa. No como nosotros.

Definición de disonancia cognitiva

¿Qué es la disonancia cognitiva? La disonancia cognitiva es la emoción desagradable que resulta de mantener dos creencias, actitudes o comportamientos en conflicto al mismo tiempo. El estudio de la disonancia cognitiva es uno de

Usar el código abierto como moneda de cambio

comentario ¿Ha notado el ruido esponjoso de la cobertura de los medios sobre «uno y el mismo está investigando Linux / código abierto, por lo que Microsoft sufrirá pérdidas considerables»? Llegó a una etapa tan

Definición de límite superior

¿Qué es Limit Up? El límite es la cantidad máxima que se permite que suba un precio durante un día de negociación. El término se utiliza a menudo en relación con los mercados de futuros

¿No funciona OK Google? 12 formas de solucionarlo

¿No funciona OK Google? Aquí tienes 12 formas de solucionarlo: 1. Verifica tu conexión a Internet: Asegúrate de que tu dispositivo esté conectado a una red estable y segura. 2. Reinicia tu dispositivo: A veces,