La generación automática de imágenes: cómo funciona y sus aplicaciones
La generación automática de imágenes: cómo funciona y sus aplicaciones
Empecemos desde lo básico: ¿cómo es posible que un software (o algoritmo) pueda crear imágenes complejas e hiperrealistas a partir de simples instrucciones de texto? En los últimos años, la fusión del conocimiento sobre IA con las cada vez mayores bases de datos disponibles, también de código abierto (es decir, sin restricciones especiales para usuarios comunes), ha llevado a la creación de programas capaces de realizar tareas antes impensables. Los cimientos de este proceso también se basan en la capacidad de los investigadores para crear algoritmos cada vez mejores para aprender, adaptándose a nueva información y actualizándose de forma autónoma.

En realidad, este tipo de enfoque tecnológico se basa fuertemente en el funcionamiento del cerebro humano, tanto que se basa en las llamadas "redes neuronales", interconexiones entre diferentes elementos que pueden influirse mutuamente creando un conocimiento cada vez más completo. La lógica consecuencia de este proceso es que en el futuro se podría esperar un crecimiento cada vez más estable de los programas de generación de imágenes, con una mayor importancia tanto en el debate público como en la vida cotidiana de cada individuo.
Usos y problemas de las imágenes generadas automáticamente
Aunque la potencia de los nuevos programas disponibles en línea es evidente, muchos aún desconocen por qué deberían usarlos. En otras palabras, ¿quién podría aprovechar estas plataformas no solo para divertirse, sino también para obtener un beneficio, tal vez de manera profesional? Las respuestas son diversas:
- Los artistas e ilustradores: aquellos que están involucrados en el mundo del arte podrían estar muy interesados en incorporar la automatización en sus obras, incluso solo para inspirarse o mejorar su técnica;
- Las empresas que desean apostar por una campaña publicitaria impactante, dinámica y completamente personalizable. No es casualidad que muchas de las "fotos falsas" publicadas recientemente para sacudir la opinión pública se basen en el proyecto "UnHate" de Oliviero Toscani, lanzado por Benetton a fines de 2011;
- Los estudiantes y profesores que desean hacer que la experiencia educativa (propia o de otros) sea más entretenida, basada en estímulos visuales, incluso representando eventos históricos para los cuales no existen imágenes gráficas.

Sin embargo, para cada una de estas categorías, también hay problemas subyacentes que deben tenerse en cuenta para un uso realmente consciente de las imágenes generadas artificialmente. Además de lo mencionado en la introducción, siempre debemos recordar que las creaciones ficticias deben ser etiquetadas como tales; de lo contrario, se crearía un problema de credibilidad para los profesionales y de confusión entre contenido y imaginación para todos los demás usuarios.
Las principales plataformas de generación automática de imágenes
MidJourney
MidJourney es probablemente uno de los software más conocidos para la generación automática de imágenes, proporcionando un sistema complejo que combina diversas "bibliotecas" de las que los algoritmos obtienen su información. Los comandos que se le comunican al programa son frases o descripciones simples, incluso muy breves: el programa es lo suficientemente sofisticado como para completar el contexto de la imagen de manera autónoma; para operaciones más complejas (como ampliar o cambiar el estilo), es necesario conocer comandos básicos ligeramente más complejos.

Este programa no se puede utilizar en navegadores normales, sino que se debe iniciar desde la plataforma Discord, que generalmente une las "comunidades" de Internet ofreciendo un espacio de agregación en línea. Además, Mid Journey es gratuito solo por un período limitado, seguido de una suscripción que va desde $12 hasta aproximadamente $73 al mes, según el tiempo utilizado en la plataforma.
Stable Diffusion
Stable Diffusion ofrece la posibilidad de crear "imágenes foto-realistas" combinando la creatividad del usuario con las diversas bases de datos de la plataforma. Se puede utilizar directamente en Internet y da vida a las creaciones tanto a través de comandos positivos (como "decorated pot, green and gold") como negativos (como "no white").

Dall-E 2
Dall-E 2 es un software que forma parte de la misma familia que el famoso ChatGPT. Extremadamente sofisticado, los recursos de esta plataforma se pueden aprovechar directamente en línea a través de una interfaz muy intuitiva que brinda amplia libertad creativa al usuario. Aunque ofrece muchas ventajas, como la existencia de un perfil que se puede compartir y utilizar con fines profesionales, actualmente no hay un plan gratuito que permita generar las imágenes deseadas, ni siquiera por un período limitado. De hecho, es necesario comprar paquetes de 115 créditos para realizar las mismas creaciones, a un precio de $15 por paquete.
Neutral Love
Probablemente la herramienta más adaptable a las necesidades individuales, Neutral Love es un software que se puede utilizar directamente en línea no solo para crear imágenes, sino también para mejorar las ya existentes. La interfaz en línea permite moverse fácilmente entre las diversas secciones del sitio, tanto para generar como para inspirarse en las creaciones ya proporcionadas por la comunidad.

Los precios de la plataforma son diferenciados según la solución que el usuario elija: basándose en un sistema de créditos, van desde $10 hasta $500 mensuales. El costo relativamente alto para aquellos que son nuevos en esta tecnología está justificado por una serie de elementos adicionales, como la posibilidad de crear un avatar o mejorar videos y audio. Después de aprovechar las funciones del plan gratuito (que incluye la generación infinita de arte artificial), es posible ajustar la inversión según las intenciones de uso, que pueden ir desde la simple diversión hasta los propósitos empresariales y profesionales en general.