Google Imagen 2: Tecnología AI de Texto a Imagen

En este artículo, me gustaría hablar del lanzamiento de Google Imagen 2, la última innovación de Google AI desarrollada por su área de DeepMind sobre la tecnología de texto a imagen.

Esta tecnología no solo promete transformar la forma en que interactuamos con las imágenes digitales, sino que también establece nuevos estándares en cuanto a realismo, calidad y responsabilidad ética en el campo de la IA.

¿Qué es Google Imagen 2?

Google Imagen 2 se posiciona en la tecnología de texto a imagen, un campo que ha experimentado un crecimiento exponencial en los últimos años.

Es capaz de traducir descripciones textuales en imágenes visuales con una precisión impresionante, es un gran salto de calidad.

Google Imagen 2 destaca por su habilidad para generar imágenes fotorrealistas de alta calidad. A diferencia de otros sistemas que dependen de estilos preprogramados, Google Imagen 2 utiliza la distribución natural de datos de entrenamiento, lo que permite una generación de imágenes más orgánica y precisa.

Es una herramienta que no solo «ve», sino que también «comprende» e «interpreta» las solicitudes del usuario de una manera sorprendentemente intuitiva.

Las nuevas funcionalidades de Google Imagen 2, como el acondicionamiento de estilo fluido y las técnicas avanzadas de rellenado e inpainting/outpainting, elevan el estándar en la generación de imágenes.

Esta nueva tecnología ya queda incluida en Bard desde el 01 de febrero de 2024 con su modelo de IA llamado Gemini Pro. Puedes probar mientras hacen el despliegue completo sobre los más de 200 países, mediante VPN con US geolocalizada. Hasta ahora sólo he podido probar la generación de texto a imagen, pero no las funciones de in-outpainting, ni de expand o upscale como sí hacen herramientas como MidJourney o Stable Diffusion.

Compromiso de Google con la Responsabilidad y Ética en IA

Me llama la atención la parte del comunicado donde mencionan el marcado de imágenes para identificar contenido generado por IA mediante el marcado de agua, SynthID, además de aplicar controles de seguridad a los datos de entrenamiento, mensajes de entrada, y salidas generadas para evitar contenido problemático.

La tecnología SynthID incrusta una marca de agua digital en imágenes o audio generados por IA, que es imperceptible para los humanos pero detectable para la identificación.

Ya comentamos en otro artículo, cómo puedes llegar a analizar los meta datos de una imagen para ver si ha sido o no generada por IA.

Otro punto que me genera interés, es el ver cómo buscadores como Google va a tratar estos recursos creativos generados automáticamente frente a los trabajos profesionales.

Otros posts relacionados