Poco más de un minuto es lo que ha tardado la nueva Inteligencia Artificial DALL-E mini en crear una imagen a partir de un texto.

en esta primera prueba fue con «elvis game of thrones»

Screenshot 1 - Dall-E - IA de diseño

Disponible en este enlace o este (migrando), su funcionamiento es realmente sencillo: le decimos lo que queremos que cree, en inglés o español (aunque en inglés es de forma nativa), y esperamos las imágenes inventadas por el motor inteligente

El proyecto ha sido creado por Boris Dayma, y se hizo viral en muy poco tiempo. DALL·E mini es un modelo de IA que puede generar imágenes a partir de cualquier indicación que le demos, y tiene su repositorio en GitHub para que los desarrolladoras puedan ejecutar o entrenar sus propios modelos.

El modelo se entrena mirando millones de imágenes de Internet con sus leyendas asociadas. Con el tiempo, aprende a dibujar una imagen a partir de un mensaje de texto. Aún sigue aprendiendo, de forma que irá perfeccionando los resultados.

Para lograr los resultados se combinan varios modelos:
– Un codificador de imágenes que convierte imágenes sin procesar en una secuencia de números con su decodificador asociado.
– Un modelo que convierte un mensaje de texto en una imagen codificada.
– Un modelo que juzga la calidad de las imágenes generadas para un mejor filtrado.

Esta versión “mini” es básica respecto a la calidad de Dall-E 2 la cual mucho más compleja y detallada, por ejemplo, podemos ver un gato con resaca de pizza, o un astronauta en caballo.

Screenshot 3 - Dall-E - IA de diseño
1655991441 077343 1655991749 noticia normal recorte1 1 - Dall-E - IA de diseño

Mas interesante aún, una portada a todo dar en Cosmopolitan

actual final dall e cosmo cover 1655775574 819x1024 - Dall-E - IA de diseño

El acceso de Dalle- 2 está aún cerrado para un grupo pequeño de personas, pero es bastante posible que sea una realidad en donde quizá el mismo buscador de Google nos proporcione estos resultados.

Una amenaza a las imágenes de stock

Imaginemos que tengo que escribir un artículo sobre los problemas de seguridad. Le pido a DALL-E que haga una imagen con «un hacker atacando un router», y este es el resultado:

a 1024x788 - Dall-E - IA de diseño

Mucho más práctico que buscar una foto de stock, y además obtenemos una imagen única, que nadie ha usado nunca, y que cumpla con todos los requisitos que deseemos.

Los peligros de este tipo de aplicaciones

Todo lo bueno tiene un lado oscuro. Si entregamos una herramienta capaz de generar cualquier imagen, realista, a partir de texto, las Fake News se multiplicarán de forma impresionante, las redes sociales estarán bombardeadas de «fotos y videos» que nunca se hicieron, y los algoritmos de detección tendrán que ponerse las pilas para que, de alguna forma, consigan identificar ese nuevo material. En la actualidad esto ya ocurre como dado el entrenamiento de las diferentes aplicaciones que se utilizan en redes sociales. Un buen ejemplo sería este de cantinflas.

¿Solo fotografías?

La dimensión que tendrá a nivel cultural el desarrollo y entrenamiento de las IA’s será gigantesco. En unos años se va renderizar video con sonido, películas enteras hechas por una IA, quizá hasta un nuevo mundo.