El aprendizaje autosupervisado (SSL) está ganando un lugar más importante en el mundo del aprendizaje automático (ML). A medida que los modelos de aprendizaje se refinan y amplían, el siguiente paso son las máquinas que aprenden por sí mismas, entienden el contexto y pueden llenar los espacios en blanco donde hay agujeros en la información.
Modelos de aprendizaje automático
A las máquinas se les enseña a analizar, predecir y dar consejos sobre posibles resultados. Los estilos de aprendizaje más comunes que utilizan los científicos de datos son:
-
Aprendizaje supervisado – Los practicantes entrenan a la máquina en entradas asociadas con salidas etiquetadas, enseñándole a hacer asociaciones. Ejemplo: Una forma con tres lados se etiqueta como ¨triángulo¨. El aprendizaje supervisado es el modelo más utilizado para situaciones que involucran clasificación, modelado de regresión y predicción.
-
Aprendizaje sin supervisión – El algoritmo examina los datos sin etiqueta dados al identificar la estructura básica de los datos, como cuántos lados tiene una forma. El aprendizaje no supervisado es ideal para tareas como la agrupación en clústeres y la detección de anomalías.
-
Aprendizaje semisupervisado – Es un híbrido de aprendizaje supervisado y no supervisado. El modelo semisupervisado se alimenta con una combinación de datos pequeños etiquetados y grandes sin etiquetar. La combinación ayuda al algoritmo a identificar datos etiquetados sucesivos.
-
Consolidación del aprendizaje – Se trata de cómo un agente realiza acciones en un entorno para maximizar los reforzadores positivos (también conocido como recompensa acumulativa). El aprendizaje por refuerzo se usa a menudo en robótica.
Problemas con el aprendizaje automático
El problema con el aprendizaje supervisado es que necesita una gran cantidad de datos, algo que es costoso y requiere mucho tiempo. (Lea también: Desacreditando los 4 mitos principales sobre el aprendizaje automático).
Los modelos impulsados por el aprendizaje no supervisado, por otro lado, tienen una capacidad mental limitada. Solo se les da un pequeño lote de información y se les deja que lleguen a sus propias conclusiones. ¿Resultado? Los algoritmos escupen tareas relativamente simples como agrupar y agrupar.
El aprendizaje semisupervisado combina ambos problemas. Finalmente, con el aprendizaje por refuerzo, los algoritmos son adoctrinados por su entorno, lo que a menudo produce resultados sesgados o distorsionados.
Lo que necesita es aprendizaje autosupervisado, un enfoque en el que las máquinas puedan aprender por sí mismas.
¿Qué es el aprendizaje autosupervisado?
Desarrollado por un informático Yann Le Cun En 2017, el aprendizaje autosupervisado se infiltró en gigantes tecnológicos como Facebook, Google y Microsoft, así como en instituciones de vanguardia más pequeñas. Es lo mejor de la inteligencia artificial (IA).
En esencia, LeCun sugirió que las máquinas dan forma a los niños. Así como los niños se sumergen en ciertos entornos y captan influencias culturales y de desarrollo a medida que sus cerebros maduran, las máquinas, sugirió, también podrían hacerlo.
Los niños están expuestos al equivalente natural del aprendizaje supervisado y no supervisado. El aprendizaje supervisado se puede ver cuando los maestros los entrenan en lotes de datos etiquetados. Se les muestran dibujos y se les dice, por ejemplo, que «Este es un dinosaurio terópodo llamado Giganotosaurus» y «este hombre era George Washington».
Al mismo tiempo, aprenden de forma natural y automática a deducir, inducir, correlacionar y predecir como una función innata de su cerebro/mente. Ahí es donde entra en juego el aprendizaje autosupervisado. Los seres humanos se encuentran con todo tipo de datos no etiquetados (incidentes y conceptos) como parte de su desarrollo y simbióticamente forman sus propias conclusiones. Básicamente, el aprendizaje autosupervisado es una clase de métodos de aprendizaje que utilizan la supervisión disponible en los datos para entrenar un modelo de aprendizaje automático. El aprendizaje autosupervisado se utiliza para entrenar transformadores: modelos de última generación en procesamiento de lenguaje natural y clasificación de imágenes.
Transformadores
Transformadores son un modelo complejo basado en ML que utiliza principios de procesamiento de lenguaje natural (NLP) para «transformar» una imagen o leyenda simple en una fuente de información capaz de tomar decisiones informadas mediante el sondeo de parte de una muestra de datos para averiguar el resto. parte. Estos datos pueden ser texto, imágenes, videos, audio o cualquier otra cosa.
Los transformadores son esencialmente un modelo de secuencia a secuencia que transforma una secuencia de entrada en una secuencia de salida, por ejemplo, traduciendo una oración de un idioma de origen a un idioma de destino. Los transformadores involucran dos componentes: codificador y decodificador. El codificador aprende a procesar la secuencia de entrada modelando las dependencias entre las secuencias de entrada para representar mejor las entradas para las traducciones. Las dependencias se modelan mediante una técnica conocida como mecanismo de autoatención. El decodificador aprende a mapear la secuencia de entrada a la salida utilizando una técnica conocida como mecanismo de atención.
Los resultados finales son los mismos que los programas ML alimentados con grandes conjuntos de datos. Es decir, los modelos aprenden a formar asociaciones, correlaciones, reconocer patrones y realizar estimaciones estadísticas, entre otras funciones. (Lea también: ¿Por qué algunos proyectos de aprendizaje automático pueden requerir una enorme cantidad de actores?)
En otras palabras, los modelos de aprendizaje autosupervisados extraen y usan contexto orgánico y metadatos integrados para formular conocimientos relevantes y en tiempo real.
Las ramificaciones del aprendizaje autosupervisado
El aprendizaje autosupervisado se centra principalmente en mejorar la visión por computadora y las capacidades de PNL. Sus capacidades se utilizan para lo siguiente:
-
Colorización para colorear imágenes en escala de grises.
-
Llenado de contexto, donde la tecnología llena un espacio en una imagen o predice un espacio en una grabación de voz o texto.
-
Predicción de movimiento de video donde proporciona una distribución de todos los cuadros de video posibles después de un cuadro determinado.
Tan popular como es el aprendizaje autosupervisado, todavía está muy lejos de comprender el lenguaje humano o de obtener una comprensión intuitiva del contexto o el matiz de la imagen. (Lea también: ¿Realmente un chatbot puede pasar por una persona?)
Dicho esto, el aprendizaje autosupervisado ha contribuido a las innovaciones en todos los campos.
Ejemplos de aprendizaje autosupervisado
-
En salud y medicina, el aprendizaje autosupervisado ha contribuido a cirugía robótica y endoscopia monocular estimando la profundidad densa en el cuerpo humano y el cerebro. También mejora las imágenes médicas con tecnologías de visión artificial mejoradas, como la colorización y el relleno de contexto.
-
Con la conducción autónoma, la IA autosupervisada ayuda a los coches «siente» la aspereza del terreno cuando vas fuera de la carretera. La tecnología también proporciona una estimación de la profundidad, lo que ayuda a los automóviles a identificar la distancia a otros automóviles, personas u objetos mientras conducen.
-
Con chatbots, donde se utilizan transformadores para implantarles símbolos matemáticos y representaciones de lenguaje. Sin embargo, estos chatbots se ocupan del contexto.
Pensamientos finales
Los entusiastas del aprendizaje autosupervisado dicen que su modelo de aprendizaje es el primer paso para hacer que las máquinas sean más humanas. Las máquinas que pueden evaluar y comprender datos para llenar los vacíos que faltan son complejas y lejos de ser perfectas en este momento, pero las implicaciones para el futuro de la tecnología son increíbles. Es una perspectiva interesante, pero que también está cargada de su propio conjunto de complicaciones y preguntas. ¿Lograrán los ingenieros y científicos lograr el equilibrio y crear «humanidad» en el aprendizaje automático?
Es hora de decir…