Lanzamiento de Midjourney V6

El lanzamiento de Midjourney versión 6 representa un avance significativo en el campo de la inteligencia artificial. Sus resultados destacan por su impresionante nivel de detalle, tiene un realismo sorprendente.

Gonzalo Sandoval

12/27/20234 min read

Desde mi experiencia personal con Midjourney, puedo decir que su lanzamiento como una herramienta de IA accesible a través de Discord marcó un punto de inflexión significativo. Esta accesibilidad, sin la necesidad de hardware o software especializado, hizo que su popularidad entre los usuarios creciera rápidamente.

A lo largo del tiempo, he observado cómo Midjourney ha evolucionado con actualizaciones regulares, mejorando notablemente la calidad de imagen, precisión y respuesta a prompts complejos. Esto ha ampliado sus aplicaciones en diversas áreas creativas, algo que pude constatar personalmente.

Recuerdo que cuando probé Midjourney por primera vez, quedé impactado por los resultados. Era la versión 4, y aunque a veces la coherencia entre lo que pedía y lo que obtenía era cuestionable, en ocasiones la IA, por accidente, generaba algo impresionante o completamente distinto a lo que había imaginado. Esta falta de precisión dejaba un sabor agridulce, especialmente notorio en la generación de manos, que solían tener un número incorrecto de dedos.

Más adelante, con la versión 5.2, junto a mi compañero de un proyecto musical, creamos la portada de una de nuestras canciones. Después de cientos de intentos, nos acercamos a lo que buscábamos. Esta versión había mejorado en la generación de manos, pero aún enfrentábamos retos. Por ejemplo, al generar un fondo que representaba un agujero negro en el cosmos, todos los resultados eran tan buenos que nos costaba elegir el mejor, pero las representaciones de manos seguían siendo un desafío para obtener solo una imagen buena. Esta experiencia me mostró tanto las capacidades como las limitaciones de Midjourney en ese momento.

Midjourney ha cultivado una comunidad vibrante y activa, donde el feedback y las sugerencias de los usuarios desempeñan un papel crucial en su desarrollo continuo. Las contribuciones de esta comunidad son frecuentemente incorporadas en nuevas versiones, enriqueciendo la plataforma con cada actualización.

Recientemente, me he reinscrito a Midjourney para explorar su versión 6 y los avances son evidentes, especialmente en la calidad de los detalles al generar imágenes realistas y en la coherencia respecto a lo solicitado.

Realizaré una comparativa entre Midjourney y otras IA de generación de imágenes que considero mis favoritas, estas generaron una imagen utilizando el mismo Promp y la diferencia en los resultados es evidente.

A dog drinking water from a bone-shaped glass, sitting on a boat sailing on a purple sea.

Para comparar las 3 IAs se utilizaron los siguientes Prompt:

Closeup of a woman in nature, with soft lighting, wearing black clothing. She has a joyful facial expression, short red hair, amber-colored eyes, and white skin. The style of the photography is professional, without post-processing.

Imagen mujer: Este resultado destaca por su impresionante nivel de detalle, tiene un realismo sorprendente. De hecho, su calidad es tal que podría confundirse fácilmente con una fotografía de una persona real. Este logro se debe, en gran parte, a la precisión y riqueza de detalles proporcionados en el prompt. Es un claro ejemplo de cómo una descripción detallada y bien articulada puede influir significativamente en el resultado final, permitiendo que la inteligencia artificial de Midjourney capture y materialice con precisión la visión deseada.

Imagen perro: Este resultado no fue el esperado, pero esto no se debió a una incapacidad de Midjourney para generar una imagen de alta calidad. Más bien, la clave está en la especificidad del prompt proporcionado. No indiqué claramente que buscaba una imagen realista, por lo que Midjourney optó por una interpretación más libre, creando una pintura de un perro bebiendo agua. Además, algunos elementos del prompt, como el vaso con forma de hueso, no se reflejaron en el resultado final. Esto resalta la importancia de detallar con precisión las expectativas al utilizar Midjourney para obtener los mejores resultados.

Imagen mujer: A diferencia de Midjourney, DALL-E 3 parece no alcanzar las mismas expectativas en términos de realismo detallado. Aunque se le proporcione un prompt muy detallado, es bastante evidente que las imágenes resultantes son generadas por IA. Esta observación resalta una diferencia clave entre ambas plataformas: mientras Midjourney sobresale en la creación de imágenes que bordean la línea entre lo artificial y lo real, DALL-E 3, a pesar de sus avanzadas capacidades, aún muestra ciertas limitaciones en este aspecto, quedando ligeramente por detrás en la carrera por el realismo fotográfico.

Imagen perro: Aunque DALL-E 3 no destaca tanto en realismo fotográfico, sobresale en interpretar de manera precisa cada palabra del prompt proporcionado. En este sentido, es excepcional, realizando exactamente lo que se le pide. Su limitación reside principalmente en la generación de imágenes realistas, pero compensa esta carencia con su habilidad en estilos artísticos. DALL-E 3 es, por lo tanto, particularmente eficaz en seguir instrucciones detalladas y en crear obras con un toque artístico distintivo.

Imagen mujer: Brutal, cuando conocí por primera vez a Stable Diffusion, una IA de código abierto, no me impresionó demasiado debido a sus resultados iniciales y la limitada resolución de las imágenes que generaba. Sin embargo, con el paso del tiempo, específicamente después de un año o más, esta herramienta me ha sorprendido enormemente. Siendo gratuita y de código abierto, ahora produce resultados espectaculares. Se ha convertido en una de mis favoritas para la creación de imágenes realistas. A pesar de esto, a veces presenta fallos en cuanto a coherencia y en la ejecución precisa de los detalles específicos del prompt.

Imagen perro: En esta imagen, se hace evidente que Stable Diffusion es capaz de generar imágenes de alta calidad. Sin embargo, también se nota que no siempre logra responder con precisión a los detalles específicos solicitados en el prompt. Esto subraya su habilidad para crear visuales impactantes y de buen acabado, aunque con cierta limitación en cuanto a seguir instrucciones detalladas y complejas.

Midjourney V6

DALL-E 3

Stable Difusion

Lo más emocionante de estas herramientas de IA es cómo han abierto nuevas avenidas para mí, permitiéndome generar ingresos adicionales en mi tiempo libre. Su facilidad de uso y los resultados de alta calidad que ofrecen no requieren mucho tiempo, lo que me ha permitido explorar mi creatividad y encontrar oportunidades de negocio inesperadas.

El lanzamiento de Midjourney V6 no solo representa un avance tecnológico, sino también una puerta hacia nuevas posibilidades creativas y económicas para entusiastas y profesionales por igual.