Cómo utilizar DALL-E para generar imágenes de IA a partir de texto.
DALL-E es la aplicación de generación de imágenes AI que sorprendió al mundo al crear retratos de alta calidad y pinturas artísticas sin usar una cámara, película, lienzo o pincel. La imagen de arriba es un ejemplo perfecto, creada completamente con DALL-E en pocos minutos con solo unas pocas palabras y algo de pintura exterior para ampliar la relación de aspecto. Lo bueno de esta nueva tecnología es que cualquiera puede participar en esta forma revolucionaria de crear imágenes.
Si bien es fácil encontrar ejemplos de imágenes impresionantes creadas con DALL-E, se necesita un poco más de trabajo para generar obras de arte hermosas y imágenes fotorrealistas de manera confiable con esta potente herramienta. La buena noticia es que el arte de IA ha avanzado significativamente en los últimos meses, y las monstruosidades con múltiples extremidades son mucho menos probables a medida que OpenAI y otros perfeccionan esta nueva tecnología.
Tabla de contenidos
- ¿Qué es DALL-E 2?
- Cómo comenzar a usar DALL-E
- ¿Es DALL-E gratis? ¿Y cómo funcionan los créditos?
- Cómo utilizar DALL-E para inspiración
- Use DALL-E Outpainting para imágenes finalizadas.
- “DALL-E Prompt Engineering” - Ingeniería de instrucciones de DALL-E
- Variaciones de DALL-E
¿Qué es DALL-E 2?
DALL-E (actualmente estilizado oficialmente como DALL·E 2) es un IA de aprendizaje profundo que puede tomar indicaciones de texto (o descripciones) y convertirlas en imágenes digitales que muestran lo que se describió. La IA fue desarrollada por OpenAI, el mismo laboratorio de IA con sede en San Francisco que creó el popular chatbot ChatGPT.
Entrenar a DALL-E implicó recopilar cientos de millones de combinaciones de fotos/imágenes y texto de Internet para que la IA aprenda la relación entre texto y datos visuales, y el resultado es que puede crear imágenes a partir de texto utilizando lo que ha “visto” antes.
El nombre DALL-E es un acrónimo que combina el nombre del artista surrealista español Salvador Dalí con el robot homónimo en la película de Pixar WALL-E.
OpenAI anunció el original DALL-E al mundo en enero de 2021 y se presentó DALL-E 2 en abril de 2022, trayendo mejoras como mayor realismo, mayor resolución (hasta 2048×2048) y una IA más potente.
Los generadores de imágenes de IA han explotado en popularidad en los últimos tiempos debido a resultados cada vez más impresionantes, que a veces pueden ser indistinguibles de fotografías reales para la mayoría de los espectadores.

Cómo comenzar a usar DALL-E
“No es necesario ser un experto en IA para usar DALL-E. Esa es la maravillosa cosa de entrenar computadoras en lenguaje natural. El programa, en efecto, está compuesto por palabras humanas. Si quieres ver “un perro con rayas de tigre”, solo necesitas escribir esas palabras en el cuadro de texto de DALL-E y hacer clic en Generar.”
Para comenzar con DALL-E, ve al sitio web de DALL-E de OpenAI e inicia sesión. Si no tienes una cuenta, crea una o inicia sesión con tu cuenta de Google o Microsoft.

Una vez que hayas iniciado sesión, verás un gran cuadro en el centro de la página. Haz clic en el botón Sorpréndeme justo encima del cuadro para completar una descripción de texto predefinida o escribir algunas palabras propias para indicar al sistema de inteligencia artificial qué te gustaría ver.

Puedes ingresar tanto o tan poco como desees, hasta 400 caracteres de longitud, y luego hacer clic en el botón Generar para iniciar el proceso.
DALL-E suele tardar menos de un minuto en presentar los resultados, pero en momentos de mucho trabajo puede tardar más. Mientras esperas, DALL-E te proporciona consejos.

Se mostrarán cuatro imágenes de muestra y puedes hacer clic en cualquiera de ellas para ver una vista más grande. Selecciona el botón de flecha hacia abajo en la esquina superior derecha para descargarlo en tu computadora. Si algo parece estar mal con el resultado, ya sea que la imagen no coincida con tu descripción o sea ofensiva de alguna manera, puedes alertar a OpenAI haciendo clic en el ícono de bandera y seleccionando la opción adecuada.

Cada imagen que generes con DALL-E se guarda automáticamente y verás una cuadrícula de miniaturas en el lado derecho de la ventana de tu navegador, con las creaciones más recientes apareciendo en la parte superior. Siempre puedes volver atrás y abrir estas imágenes más tarde como referencia, para descargarlas o modificarlas para un nuevo proyecto.
¿DALL-E es gratis? ¿Y cómo funcionan los créditos?
Cuando te registras por primera vez en DALL-E, recibirás 50 créditos, una cantidad generosa que te da la oportunidad de familiarizarte con cómo funciona la IA. Eso equivale a 50 generaciones. Obtienes 4 imágenes para cada generación, pero aún así va sorprendentemente rápido si te apresuras a través de varias repeticiones tratando de obtener un resultado exacto.
Para ver tus créditos, abre el menú de opciones en la parte superior derecha de la ventana que se ve como tres puntos horizontales. Tus créditos restantes aparecerán debajo de tu nombre de inicio de sesión y correo electrónico.

No te preocupes, obtienes más créditos cada mes, pero probablemente encontrarás que la asignación mensual de 15 créditos gratuitos es demasiado restrictiva. Además, ten en cuenta que los créditos gratuitos no se acumulan. Los usas o los pierdes. Si necesitas más, puedes comprar créditos abriendo el menú de opciones y eligiendo Comprar créditos.
Se abrirá una ventana que te permite elegir cuántos créditos deseas comprar. En el momento de escribir esto, 115 créditos cuestan $15 y puedes agregar más en incrementos de 115 créditos. Eso hace que el precio de cada generación sea de aproximadamente 13 centavos. Ten en cuenta que DALL-E genera cuatro imágenes a la vez, lo que reduce el costo por imagen a 3 centavos. En algunos casos, tu solicitud a DALL-E puede resultar en solo una imagen, lo que hace que algunas herramientas sean más caras de usar.

Los créditos gratuitos caducan cada mes y los créditos pagados caducan en 12 meses. Es mejor pedir lo que necesitas y no más. No parece haber ningún ahorro al comprar a granel a través del sistema en línea automatizado. Por ejemplo, elegir 11,500 créditos en la ventana de pedido muestra un precio de $1,500, así que aún es aproximadamente 13 centavos por generación.

Si anticipas utilizar DALL-E en gran volumen, puedes comunicarte con el equipo de ventas de OpenAI. Esto probablemente solo tiene sentido para empresas con varios empleados, pero no está de más preguntar si necesitas generar miles de imágenes.
Cómo usar DALL-E para inspiración
Una de las formas más fáciles de usar DALL-E es para inspiración. Escribe algunas palabras y la IA presentará cuatro imágenes basadas en tus palabras. Como referencias, es difícil equivocarse. DALL-E elimina el síndrome del lienzo en blanco con ideas ilimitadas para impulsar tu nueva creación.
Por ejemplo, podría ser difícil encontrar imágenes en línea que muestren a personas montando en una montaña rusa en la Antártida, aunque existan atracciones temáticas del Ártico en climas más templados. DALL-E maneja esto fácilmente y dos de las cuatro imágenes generadas cuando probé esta indicación fueron representaciones excelentes.

Uno muestra un primer plano de una jinete emocionada, llevando puesto un abrigo cálido y sujetándose fuerte. Observa la luz dorada del sol en el lado derecho de su rostro y el tono fresco de las sombras de la nieve y el hielo.

Otro ofrece una visión amplia de la montaña rusa, con personas levantando los brazos mientras el carro avanza por su recorrido a través de un paisaje frío cubierto de nieve, salientes rocosos y el distante mar lleno de hielo.

Es fácil ver cómo DALL-E puede ser una herramienta increíble para estimular la creatividad, sugiriendo ángulos, iluminación, encuadre y tema a partir de tan solo unas pocas palabras.
Usa DALL-E Outpainting para imágenes finalizadas.
DALL-E puede generar imágenes lo suficientemente buenas como para utilizar como trabajo terminado; sin embargo, la resolución de píxeles de 1024 por 1024 es un poco pequeña en la mayoría de los casos y no hay opción para aumentarla, como puedes hacerlo con algunos servicios de generación de imágenes de IA.
Hay dos soluciones. Puedes simplemente descargar la imagen de DALL-E y aumentar su tamaño con otra aplicación o servicio. Alternativamente, puedes usar la técnica de DALL-E llamada “outpainting” para expandir los bordes de la imagen en cualquier dirección sin modificar su escala.
Para comenzar, abre una imagen de DALL-E. Puedes ingresar una sugerencia, como “Una pintura realista de un lago en un bosque de pinos con un elefante bañándose”, o elige entre las imágenes generadas anteriormente en la barra lateral derecha.

Después de abrir una imagen en la vista ampliada, haz clic en el botón Editar en la parte superior.

Aparecerá una pantalla de edición, que te permite añadir a los bordes o borrar y generar secciones que te gustaría cambiar. DALL-E advierte que las imágenes completas no se guardan, así que debes descargar con frecuencia para guardar copias de tu progreso.

La herramienta de borrador está activa cuando ingresas por primera vez a la edición, así que no hagas clic en tu imagen a menos que desees reemplazar algún elemento. Si quieres agregar a los bordes, haz clic en el botón en la parte inferior que parece una caja con un signo más. Esta es la herramienta de generación de marco de agregar.

Una gran caja a cuadros seguirá tu cursor para que puedas colocar la caja de 1024 por 1024 en cualquier borde o esquina para llenar la imagen. Es una buena idea superponer la imagen existente para que DALL-E tenga algún material de referencia para trabajar. Haz clic cuando estés satisfecho con la posición.

Puedes dejar la indicación original o cambiarla si deseas introducir algún nuevo elemento en el borde. Haz clic en el botón “Generar” para comenzar el outpainting de DALL-E.

Se presentarán cuatro variaciones y podrás utilizar las flechas blancas debajo del marco de la nueva generación para pasar por las opciones. Haz clic en Aceptar para elegir una o Cancelar si ninguna es aceptable. Cada nueva generación cuesta un crédito.

Puedes arrastrar el marco de generación a una nueva ubicación y expandir otro borde o esquina, variando la sugerencia en cualquier momento que desees. Eliminé al elefante y agregué una jirafa a la sugerencia, ya que el elefante no estaba dentro del nuevo marco de generación y no quería más elefantes.

A medida que trabajas en los bordes, intenta considerar cómo podrías recortar la imagen final para evitar crear más generaciones de las necesarias.

Recuerda descargar tu imagen final. Los elementos generados por DALL-E se guardarán en tu historial, pero la imagen completa no lo estará.

Ingeniería de consultas DALL-E
Una guía completa para una ingeniería rápida de DALL-E está más allá del alcance de este artículo. En gran parte, deberías empezar de forma sencilla con algunas palabras si no sabes exactamente lo que quieres. DALL-E puede sorprenderte con creaciones maravillosamente serendipitosas que superen tus expectativas si le das espacio para completar los vacíos que has dejado intencionalmente.
Explorar los ejemplos de DALL-E es una buena manera de aprender. Haz clic en DALL-E en la parte superior izquierda para volver a la página de inicio, luego desplázate hacia abajo para ver las imágenes destacadas. Si pasas el puntero sobre una imagen, se revelará la indicación que se utilizó para crearla.

Haz clic en cualquiera de las imágenes en la página principal para generar un conjunto de cuatro basado en la misma indicación.

Si estás buscando una imagen específica, agregar palabras clave que puedas encontrar en descripciones de obras de arte o fotografías reales puede ayudar a dirigir la IA en la dirección correcta. Si quieres calidad fotográfica con mucho desenfoque (bokeh), utiliza eso en tu indicación o especifica qué tipo de cámara y lente capturarían el tipo de imagen que te gustaría. Puedes describir el encuadre de la imagen (gran angular o primer plano), la iluminación dentro de la escena (melancólico, amanecer), la posición del espectador (desde arriba o debajo), la orientación de las personas y objetos (a la derecha y en la distancia) y cualquier otro detalle que se te ocurra.
‘Variaciones de DALL-E’
La versión actual de DALL-E es oficialmente DALL-E 2, un generador de imágenes más rápido y de mayor calidad que su predecesor DALL-E 1. Dado que la versión original ya no está disponible, la última actualización suele denominarse simplemente DALL-E.
DALL-E mini, conocido ahora como Craiyon, no fue creado por OpenAI ni se basó en el código de DALL-E. Inspirado por el trabajo de OpenAI, Boris Dayma creó una alternativa de código abierto a DALL-E el año pasado. La salida de Craiyon se asemeja más a la generación anterior de DALL-E.
Por supuesto, hay muchas otras generadoras de imágenes de IA. Stable Diffusion y Midjourney han logrado alcanzar la calidad de DALL-E en solo unos meses y nuevos servicios están surgiendo casi a diario.
Conclusión
DALL-E es una herramienta maravillosa para crear imágenes generadas por IA, pero eso no significa que no haya necesidad de creatividad humana y de formar nuevas ideas. Si el arte humano cesara, la aparentemente ilimitada imaginación de la IA eventualmente se volverá aburrida. El arte de IA puede parecer sorprendente, pero este código sin vida simplemente está recomponiendo el trabajo de millones de imágenes creadas por humanos.
Si bien todavía existe controversia sobre la fuente de las imágenes utilizadas para entrenar los modelos de IA, DALL-E y otros servicios de IA pueden ser utilizados de manera consciente y efectiva para la motivación y referencia. Así como uno puede inspirarse en bellas y desafiantes obras de arte originales, o estudiar la iluminación y el encuadre de fotografías impactantes antes de crear nuevas creaciones, las imágenes de IA creadas por DALL-E pueden servir este propósito.
Cuando tengas dudas, toma inspiración para tu propia creación en lugar de usar las imágenes generadas por DALL-E directamente. Editar y pintar sobre obras existentes con la ayuda de la inteligencia artificial es otra buena manera de aprovechar estas herramientas manteniendo tu estilo original intacto.
En la actualidad, no hay ninguna ley que prohíba promover una imagen de DALL-E y utilizar el resultado con fines de lucro, pero algunos podrían objetar moralmente. Si no te preocupa utilizar obras de arte creadas por IA, aún podría ser una buena idea señalar que la imagen fue creada por una IA. Muchas quejas se centran en que se mantenga en secreto su origen.
DALL-E y otras herramientas de IA tienen el potencial de mejorar y acelerar significativamente la próxima generación de arte si las utilizamos como una herramienta para avanzar en la forma de arte digital y mejorar las habilidades de fotografía. Si aún no has experimentado con DALL-E, realmente deberías intentarlo para comprender lo que es posible con imágenes generadas por IA.
Contenido Relacionado