La inteligencia artificial que puede generar imágenes a partir de descripciones de texto ha progresado rápidamente desde principios de 2021. En ese momento, OpenAI mostró resultados impresionantes con DALL-E 1 y CLIP. La comunidad de código abierto utilizó CLIP para numerosos proyectos alternativos a lo largo del año. Luego, en 2022, OpenAI lanzó el impresionante DALL-E 2, Google mostró Imagen y Parti, Midjourney llegó a millones y Craiyon inundó las redes sociales con imágenes de IA.

Recientemente Huggingface.co trabaja con los parámetros de Stable Diffusion que se pueden probar en esta web (con un tiempo mayor de desarrollo para la imagen)

Dado que DALL.E 2 está entrenado en millones de imágenes de archivo, la salida que crea es mucho más sofisticada y es más adecuada para uso corporativo. Según Emad Mostaque (creador de Stable Diffusion), la pintura es la mejor característica de DALL.E 2, lo que lo diferencia de otros generadores de imágenes. Además, DALL.E 2 produce imágenes mucho mejores cuando tiene más de 2 caracteres, en comparación con Midjourney o Stable Diffusion.

a - DALL.E2 vs Midjourney vs Stable Diffusion

Midjourney, por otro lado, es una herramienta mejor conocida por su estilo artístico. La imagen que genera casi nunca parece una foto, sino una pintura. Algunos artistas lo ven como un estudiante de arte. “Siento que Midjourney es una estudiante de arte que tiene su propio estilo. Y cuando invocas mi nombre para crear una imagen, es como pedirle a un estudiante de arte que haga algo inspirado en mi arte”, dijo un artista. Definitivamente me he enamorado de Mindjourney.

Puedes ver una galería en su sitio web, puedes crear directamente desde discord utilizando un comando, para más info presiona aquí.

b 1024x576 - DALL.E2 vs Midjourney vs Stable Diffusion

Sin duda me estoy enamorando de Mindjourney

Stormy Medieval flying city above the moon 4k 143087e0 ee7d 4fad b019 9b0e9cc0c806 - DALL.E2 vs Midjourney vs Stable Diffusion

Open Diffusion ahora está disponible a través de una interfaz web. Después de iniciar sesión, puede generar imágenes a través de indicaciones de texto, similar a DALL-E 2, y tiene varias opciones adicionales para realizar ajustes. Al igual que con DALL-E 2, existen restricciones en las indicaciones, como imágenes sexuales o violentas.

En DreamStudio Beta, la interfaz web para Open Diffusion han implementado un modelo gratuito para testear sus capacidades. Puedes registrarte con tu email y podrás utilizar hasta 200 créditos gratis.

Stable Diffusion también tiene una buena comprensión de la ilustración artística moderna y puede producir obras de arte muy detalladas. Sin embargo, carece de la interpretación de indicaciones originales complejas. Stable Diffusion no puede producir las indicaciones que incluso un pequeño generador de imágenes como Cryon (anteriormente DALL.E mini) puede producir. Stable Diffusion es excelente para ilustraciones artísticas complejas, pero falla cuando se trata de generar imágenes generales como logotipos.

c 1024x576 - DALL.E2 vs Midjourney vs Stable Diffusion

Otra cosa que algunos señalan es que, dado que Stable Diffusion no tiene restricciones, a diferencia de Midjourney o DALL.E2, se ha utilizado para generar imágenes de desnudos de modelos, conflictos militares e imágenes de figuras políticas o religiosas en situaciones incongruentes.

d - DALL.E2 vs Midjourney vs Stable Diffusion

f - DALL.E2 vs Midjourney vs Stable Diffusion

Sin embargo, Stable Diffusion sería un hito en el mercado de generación de texto a imagen. Dado que es de código abierto, los desarrolladores en el futuro pueden generar herramientas más sofisticadas debido a los códigos disponibles en GitHub. En cuanto a cuál de ellos es el mejor, la habilidad artística de Midjourney, las imágenes realistas de DALL E2 y el uso sin restricciones de Stable Diffusion hacen que todos los modelos de IA sean mejores de una forma u otra. En los próximos años diversas IA´s podrá crear todo tipo de contenidos de calidad y el humano deberá desentrañar quizás otras interrogantes.