Una red generativa adversarial (GAN) es un modelo de aprendizaje automático (ML) en el que dos redes neuronales compiten entre sí para ser más precisas en sus predicciones. Las GAN generalmente se ejecutan sin supervisión y utilizan un marco de juego cooperativo de suma cero para aprender.
Las dos redes neuronales que componen una GAN se denominan generador y discriminador. El generador es una red neuronal convolucional y el discriminador es una red neuronal deconvolucional. El objetivo del generador es fabricar salidas de forma artificial que puedan confundirse fácilmente con datos reales. El objetivo del discriminador es identificar qué salidas recibe que se han creado artificialmente.
Básicamente, los GAN crean sus propios datos de entrenamiento. A medida que continúe el ciclo de retroalimentación entre las redes adversarias, el generador comenzará a producir una salida de mayor calidad y el discriminador mejorará para marcar los datos que se han creado artificialmente.
Cómo funcionan las GAN
El primer paso para establecer una GAN es identificar el resultado final deseado y recopilar un conjunto de datos de entrenamiento inicial basado en esos parámetros. Luego, estos datos se aleatorizan y se ingresan en el generador hasta que adquieren una precisión básica en la producción de salidas.
Después de esto, las imágenes generadas se introducen en el discriminador junto con los puntos de datos reales del concepto original. El discriminador filtra la información y devuelve una probabilidad entre 0 y 1 para representar la autenticidad de cada imagen (1 se correlaciona con real y 0 se correlaciona con falso). Luego, estos valores se verifican manualmente para verificar su éxito y se repiten hasta que se alcanza el resultado deseado.
Casos de uso populares para GAN
Las GAN se están convirtiendo en un modelo de aprendizaje automático popular para las ventas minoristas en línea debido a su capacidad para comprender y recrear contenido visual con una precisión cada vez más notable. Los casos de uso incluyen:
- Relleno de imágenes a partir de un esquema.
- Generando una imagen realista a partir de texto.
- Producir representaciones fotorrealistas de prototipos de productos.
- Conversión de imágenes en blanco y negro a color.
En la producción de video, las GAN se pueden utilizar para:
- Modele patrones de comportamiento y movimiento humanos dentro de un marco.
- Predecir fotogramas de video posteriores.
- Crear deepfake
Esto se actualizó por última vez en Agosto de 2019
Continuar leyendo sobre la red generativa adversaria (GAN)