Cómo crear imágenes con la nueva integración de Dall-E 3 a ChatGPT
El nuevo generador de imágenes de OpenAI es sorprendente e imperfecto. Aquí te explicamos cómo usar la función beta en ChatGPT Plus y te damos algunos consejos para empezar.
OpenAI acaba de integrar su nuevo generador de imágenes, Dall-E 3, en ChatGPT. La herramienta está actualmente en fase beta para los suscriptores de ChatGPT Plus, el servicio de 20 dólares al mes de OpenAI. Con Dall-E 3 activado, puedes pedirle al chatbot en lenguaje informal que cree un conjunto de cuatro imágenes distintas.
A medida que se ponen a disposición del público generadores de imágenes más potentes, las cuestiones legales y éticas van ganando protagonismo. Por ejemplo, varios artistas han intentado demandar a OpenAI por posible infracción de derechos de autor. Además de las preocupaciones legales, los expertos en seguridad han expresado su temor ante la posibilidad de que los generadores de imágenes de IA permitan una mayor difusión de la desinformación.
Si quieres probar Dall-E 3 gratis hay una versión disponible a través de Bing Image Creator de Microsoft. Durante los primeros días de esta integración, los usuarios crearon imágenes extremas con Bing, como Bob Esponja pilotando un avión hacia las Torres Gemelas. Desde entonces, Microsoft ha añadido más barreras al generador de imágenes de IA.
Si tienes curiosidad por utilizar ChatGPT con Dall-E 3 para crear imágenes, aquí tienes cómo empezar y algunos consejos basados en mi experiencia probando las nuevas herramientas de chatbot.
Cómo acceder a Dall-E 3 en ChatGPT
Si eres suscriptor de ChatGPT Plus, es bastante sencillo activar las funciones Dall-E 3 del chatbot. En primer lugar, inicia sesión en el sitio web de OpenAI o en la aplicación móvil ChatGPT para Apple o Android. Tras abrir ChatGPT, haz clic en la pestaña GPT-4 en la parte superior de la pantalla. En el menú que se despliega, selecciona Dall-E 3 (Beta).
Hay un límite de uso en la frecuencia con la que puedes interactuar con la versión GPT-4 de ChatGPT (procesar estos prompts o instrucciones requieren de una enorme potencia de computadora). El límite oficial está fijado en 50 mensajes cada tres horas. Si alcanzas este límite, el chatbot muestra un mensaje de error indicando el tiempo que tendrás que esperar antes de recuperar el acceso.
Más allá de este límite, prepárate para esperar unos 30 segundos hasta que lleguen las imágenes. Si alguna de las creaciones va en contra de las directrices de OpenAI, es posible que solo recibas imágenes que estén conformes con la normativa, o incluso un mensaje denegando la solicitud.
Algunos consejos para experimentar con Dall-E 3
Si alguna vez has experimentado con un generador de imágenes de IA, como Dall-E 2 o Midjourney, una de las principales diferencias es que ahora puedes ver cómo ChatGPT actúa como intermediario, creando múltiples prompts para que Dall-E 3 los complete.
Estas instrucciones creadas por ChatGPT van desde frases largas hasta párrafos enteros, y cada una incluye detalles diferentes para Dall-E 3. Si hay personas en la imagen, el chatbot a menudo mencionará explícitamente el género y la raza de los sujetos. Por ejemplo, esta es uno de los prompts que ChatGPT utilizó cuando solicité una imagen de dos reporteros de WIRED entrevistando a un director general:
«Foto de un grupo diverso de tres personas en un entorno corporativo: una reportera de WIRED de Oriente Medio con una cámara en la mano, una reportera de WIRED africana con un micrófono y un director general caucásico que responde a sus preguntas. El telón de fondo es una elegante sala de oficina».
Si no te gustan los primeros resultados del chatbot, pídele que ajuste algunos aspectos, como la combinación de colores o el ambiente general. Digamos que te gusta mucho la tercera imagen que Dall-E 3 produce a partir de tu pregunta. Después de hacer clic en el botón de descarga en la esquina superior izquierda, puedes solicitar más imágenes similares a la tercera opción.
¿Se ha hecho algo para proteger a los artistas en esta nueva actualización? La verdad es que no. Aunque el chatbot no creará imágenes si le pides que imite a un artista contemporáneo, hay muchas formas de darle la vuelta.
Le pedí a ChatGPT que diseñara una taza de café con arte al estilo de Keith Haring. La herramienta de IA rechazó la petición inicial, pero me ofreció una solución intermedia: “Puedo crear un diseño inspirado en las características generales de su arte, como líneas atrevidas, colores vibrantes y figuras simplistas. ¿Quisieras que proceda con eso?”. Los resultados finales de ChatGPT, en este caso, fueron desordenados y mediocres.
Con Dall-E 3, el arte de algunos de los prompts podría pasar por obra humana hasta que te fijas en el fondo y en los detalles más sutiles. A pesar de las mejoras en la calidad, persisten muchos de los problemas subyacentes de los generadores de imágenes.
Espera ver distorsiones raras y caras extrañas en las imágenes creadas por Dall-E 3. Los problemas pueden resultar graciosos, pero otros errores son más graves. Cuando se le pidió que creara un mapa de Israel y la franja de Gaza, ChatGPT confundió repetidamente Gaza con parte del mar Mediterráneo.
Otro problema de los generadores de imágenes es que las herramientas suelen recurrir a estereotipos racistas cuando representan a seres humanos. Dall-E 3 no es una excepción. De las 20 imágenes que le pedí a ChatGPT que creara representando a «reporteros de periodismo», el chatbot solicitó una representación específica y diversa para las imágenes, con solo un par de excepciones. Cuando ChatGPT no añadió la raza o el género a la solicitud, los resultados fueron todos blancos y principalmente masculinos.
1 comentario
YouTube Desata una Revolución Tecnológica con su Sorprendente Arsenal de Herramientas de IA - Seven Ecuador · a las
[…] que sacudirá el mundo de la creación de contenido, YouTube ha presentado un conjunto de innovadoras herramientas de inteligencia artificial (IA) en su evento “Made […]
Los comentarios están cerrados.