¿Publicidad engañosa de Google?

Después del lanzamiento de Gemini, el nuevo modelo de inteligencia artificial de Google, me he propuesto escribir este segundo artículo sobre el tema. En él, describo las diferencias entre el video promocional y el articulo publicado por Google sobre su nuevo modelo, resaltando tanto el potencial de Gemini como la crucial importancia de la transparencia en la presentación de las tecnologías emergentes de IA.

Gonzalo Sandoval Cordova

12/9/20232 min read

La reciente revelación del modelo de inteligencia artificial Gemini de Google generó una ola de entusiasmo en la comunidad tecnológica. Su video de lanzamiento, titulado "Hands-on with Gemini: Interacting with multimodal AI", rápidamente capturó la atención de expertos y entusiastas. Pero, ¿representa este video la verdadera capacidad de Gemini?

Inicialmente, el video impresionó a muchos con su demostración de "multimodal prompting", una capacidad para interpretar y reaccionar simultáneamente a señales de video en tiempo real. Sin embargo, no pasó un dia para recibir un balde de agua fria, luego de descubrir que el video no era una demostración en tiempo real, sino más bien una representación de lo que Gemini "podría ser capaz de hacer".

El video de Google fue cuidadosamente editado para mostrar secuencias y respuestas seleccionadas, lejos de ser una interacción en tiempo real. Aunque Google aclaró que su intención era "inspirar" más que engañar, la discrepancia entre la presentación y la realidad ha generado dudas. Las respuestas de Gemini, aunque reales, fueron el resultado de un proceso más planificado, por ejemplo, el modelo no reaccionaba al video en tiempo real, sino que a fotogramas previamente usados como inputs acompañados de instrucciones del usuario que interactuaba con Gemini.

Para entender de manera más integral este panorama, me atrevería a afirmar que el modelo de IA más destacado actualmente es ChatGPT. En este contexto, Google, un coloso tecnológico de nuestra era, busca consolidar su lugar en esta revolución emergente. A comienzos de este año, Google introdujo Bard, una propuesta que no logró eclipsar una actualización reciente de ChatGPT. Sin embargo, esta semana, tras el lanzamiento de Gemini, mi impresión inicial fue de triunfo para Google: 'Lo han logrado'. Lamentablemente, esta percepción cambió radicalmente tras examinar en detalle el lanzamiento de Gemini.

A pesar de la controversia, Gemini representa un avance significativo para Google en el campo de la inteligencia artificial. Aunque el modelo podría no ser tan avanzado como se insinuaba inicialmente, su potencial y las expectativas futuras de competir con modelos como ChatGPT siguen siendo altas.

La presentación de Gemini por parte de Google pone de manifiesto la importancia de la transparencia en la divulgación tecnológica. Mientras que la edición del video buscaba destacar las posibilidades futuras, también subraya la necesidad de una comunicación clara y precisa en la demostración de nuevas tecnologías. A medida que avanzamos en esta era de desarrollo acelerado de IA, la autenticidad en la representación de capacidades se vuelve crucial para mantener la confianza y las expectativas realistas.

Fuentes:
https://developers.googleblog.com/2023/12/how-its-made-gemini-multimodal-prompting.html
https://www.youtube.com/watch?v=UIZAiXYceBI&t=244s
https://www.youtube.com/watch?v=u2Q7ASSJI6U
https://techcrunch.com/2023/12/07/googles-best-gemini-demo-was-faked/