Las redes generativas antagónicas están en los titulares con su capacidad única de comprender y recrear contenido con una precisión cada vez más notable. Se ha prestado una atención significativa a los casos de uso de GAN que generan imágenes fotorrealistas de rostros. Los programas muestran ejemplos de imágenes completamente generadas por computadora que son notables por su semejanza con personas reales y preocupantes por cómo se podría aplicar la tecnología.
Las iteraciones anteriores de imágenes generadas por GAN eran relativamente fáciles de identificar como generadas por computadora. Sin embargo, las últimas versiones de GAN altamente capacitados están comenzando a hacer retratos realistas de humanos que pueden engañar fácilmente a la mayoría de los observadores casuales. Estas imágenes generadas por GAN plantean serias preocupaciones sobre la privacidad y la identidad. Hay poco que pueda evitar que alguien cree cuentas de redes sociales falsas utilizando imágenes generadas por GAN para uso malicioso y actividades fraudulentas. Además, para las empresas que dependen del software de reconocimiento facial, estas imágenes podrían generar problemas de seguridad y privacidad.
El genio detrás de las GAN es su sistema de confrontación, que se compone de dos componentes principales: modelos generativos y discriminatorios. Estos modelos se enfrentan entre sí en una eterna batalla por la perfección en la que uno analiza y recopila datos para referenciar y el otro genera contenido comparable para enfrentar el análisis del otro sistema. Estas redes neuronales les permiten no solo aprender y analizar imágenes y otros datos, sino también crearlos a su manera. Su capacidad para reconocer patrones complejos dentro de los datos y luego generar contenido basado en esos patrones está dando lugar a avances en varias industrias.
GAN en arte y creación de contenido
Aunque las GAN plantean cuestiones de gran preocupación, muchas empresas están encontrando formas de utilizar las GAN para un bien mayor. La policía puede usar fácilmente la capacidad de un GAN para crear un retrato para crear fotos alteradas de personas desaparecidas o puede hacer que su teléfono inteligente reconozca mejor su rostro en nuevas circunstancias.
Las GAN están encontrando una amplia gama de aplicaciones en la creación de imágenes realistas que son nuevas y novedosas. Los GAN pueden reconocer el estilo de una obra de arte y luego crear perfectamente una obra de arte nueva y original que imite aún más ese estilo de una manera realista. Las GAN también pueden generar y crear otras formas de contenido, desde fachadas de edificios que no existen hasta prendas de vestir completamente generadas, representaciones de la naturaleza y escenas al aire libre, e incluso habitaciones completamente ficticias y completamente amuebladas en una casa. El fabricante de chips Nvidia, con sede en Santa Clara, California, está utilizando GAN para una generación de mundos virtuales de alta definición e increíblemente detallados para el futuro de los juegos.
Dado que las GAN crean una versión comprimida de una representación ideal de una imagen, también se pueden utilizar para la búsqueda rápida de imágenes y otros datos no estructurados. Utilizadas junto con repositorios de datos no estructurados, las GAN recuperan e identifican imágenes que son visualmente similares. En lugar de utilizar algún tipo de huella digital basada en archivos, la GAN representa una representación de imagen comprimida que se puede comparar con otras representaciones de imágenes comprimidas para ofrecer una mejor coincidencia.
Con esta idea de la representación comprimida de una imagen en mente, incluso puede usar GAN para generar imágenes nuevas y novedosas solo a partir de descripciones textuales de una imagen. Podemos usar formas de aprendizaje supervisado para etiquetar las imágenes que crean las GAN y luego usar nuestras propias descripciones textuales generadas por humanos para mostrar una imagen generada por GAN que mejor se adapte a la descripción. Esto trae a colación la idea única de texto a imagen, como el concepto de texto a voz con voz generada por máquina.
GAN en el cuidado de la salud
Actualmente, los casos de uso de GAN en la atención médica incluyen la identificación de anomalías físicas en los resultados de laboratorio que podrían conducir a un diagnóstico más rápido y opciones de tratamiento para los pacientes. Su capacidad para reconocer errores en una imagen les permite analizar y tomar determinaciones de inmediato sobre la salud de un paciente. Aunque es posible que no hagan el diagnóstico oficial, ciertamente pueden usarse en un enfoque de inteligencia aumentada para levantar banderas para los profesionales médicos. Las GAN también se están utilizando para investigar las alteraciones de la medicación al alinear los tratamientos con las enfermedades para generar nuevos medicamentos para afecciones existentes y previamente incurables.
Además, los investigadores están comenzando a utilizar GAN para facilitar el descubrimiento de fármacos y la creación de nuevos fármacos. De la misma manera que un GAN puede crear una imagen realista, puede crear compuestos y moléculas de fármacos realistas que podrían potencialmente proporcionar nuevos tratamientos para afecciones médicas. Investigadores de Insilico Medicine, una empresa de biotecnología con sede en Maryland, están utilizando GAN para generar compuestos candidatos a fármacos que podrían valer la pena seguir investigando. Con las GAN, los investigadores están descubriendo que se puede utilizar el modelo discriminador-generador de las GAN para probar rápidamente múltiples candidatos a fármacos potenciales y ver si serán adecuados para una mayor investigación.
Las GAN también son muy prometedoras en el control de calidad, dada su capacidad para detectar anomalías de forma rápida y precisa. Los sistemas están entrenados para procesar datos complejos y destilarlos hasta sus componentes más pequeños posibles. Los GAN también pueden tomar decisiones sobre cómo llenar con precisión los vacíos en los datos, que se muestran a través de GAN tomando imágenes pequeñas y haciéndolas significativamente más grandes sin comprometer la imagen en sí. Esto significa que los GAN pueden hacer conjeturas fundamentadas sobre qué debería estar y dónde y adaptarse en consecuencia.
Las GAN son una evolución poderosa del uso del aprendizaje automático y las redes neuronales. Dado que las GAN son capaces de analizar y reconocer datos detallados, estos sistemas son una fuente inagotable de generación de contenido artificial. Desafortunadamente, el proceso actual para producir contenido generado por GAN requiere un trabajo humano significativo, un presupuesto, tiempo y tecnología excesivos. Con la introducción de aplicaciones comerciales, quizás podamos generar más fácilmente este tipo de contenido realista para encontrar casos de uso de GAN amplios y positivos.