Cómo analizar si una imagen fue generada por IA a través de sus meta datos

Una de las acciones que en ciberseguridad y en concreto en forense, se suelen dar, es el análisis o auditorías de archivos (imágenes, vídeos, audios, etc.).

Pues bien, a raíz de esto, y de descubrir una de las herramientas más utilizadas en forense para analizar la meta data de archivos como es EXIFTOOL, me surgió la duda de si existe actualmente algún valor en la meta data que pueda ayudar a identificar si ese archivo fue generado por inteligencia artificial o fue creado por una persona.

Y es que esto a futuro podría tener implicaciones incluso para los motores de búsqueda como Google, ya que por ejemplo podría aplicar un «filtro» para posicionar «peor» aquellas imágenes que no han sido creadas por humanos, si no que han sido creadas por herramientas generativas de IA como Midjourney o DALL-E…

Pues bien, he estado analizando con la herramienta EXIFTOOL qué tipo de meta data muestran las imágenes generadas con IA tanto por Midjourney como por ChatGPT (Dalle) y efectivamente se marcan con etiquetas concretas para distinguir la autoría y derechos de autor.

Estructura del contenido

Meta Data generada por imágenes por MIDJOURNEY

En concreto, se tratan de las etiquetas «Digital Image GUID» y «Digital Source Type».

La etiqueta «Digital Image GUID» hace referencia a un identificador único de imagen (Globally Unique Identifier) que suele se utilizada para rastrear, gestionar o identificar una imagen en diversos sistemas y bases de datos.

Puede ser útil para gestionar derechos de autor, controlar versiones de archivos, o realizar un seguimiento del origen y distribución de imágenes en sistemas complejos o entornos de medios digitales. Su valor es generado al crear la imagen y generalmente es mantenido a lo largo del ciclo de vida de la imagen, asegurando que la identificación sea persistente.

Este código NO correspondería con el código JobID de la imagen en Midjourney ni con el seed , sería un código único.

Por otro lado, está la etiqueta «Digital Source Type» que sirve para identificar la naturaleza del origen de la imagen.

En este caso se referencia a una url de IPTC (International Press Telecommunications Council) donde se ve el texto «trainedAlgorithmicMedia» en su slug. Este tipo de etiqueta ayuda a clasificar la imagen como no creada de manera tradicional sino por procesos de IA.

Si accedes a esa url puedes ver

En esa página se menciona el uso de la imagen a través de la licencia de Creative Commons de Atribución la cual permite a otros distribuir, mezclar, ajustar y construir a partir de tu obra, incluso comercialmente, siempre y cuando te den crédito de manera adecuada por la creación original.

Es una de las licencias más flexibles ofrecidas por Creative Commons, promoviendo una amplia utilización del material licenciado.

Por ejemplo, Midjourney en el uso de las imágenes generadas con su herramienta menciona lo siguiente, para que lo tengas en cuenta a la hora de usarlo en tu web:

Meta Data generada por imágenes por CHATGPT (DALL-E)

En el caso de ChatGPT utilizando el modelo de DALL-E para generar imágenes, el resultado de la meta data es mucho más detallado:

Las etiquetas más relevantes que destacan las características de cómo se generó la imagen y su fuente serían:

Actions Digital Source Type:
- Valor: https://cv.iptc.org/newscodes/digitalsourcetype/trainedAlgorithmicMedia
- Significado: indica que la imagen ha sido creada utilizando medios algorítmicos entrenados (mismo caso que el anterior con Midjourney).
Actions Software Agents:
- Valor: en este caso indica que se creó usando el programa DALL-E.
Claim generator:
- Valor: en este caso se refiere al componente o sistema que ha generado los metadatos asociados con la imagen donde el valor es OpenAI-API c2pa-rs/0.31.3 lo que significa que el generador de reclamaciones es proporcionado por OpenAI y lo que le sigue es la versión versión de la API o el software utilizado en el proceso de creación de la imagen.

C2PA (Coalition for Content Provenance and Authenticity) es una iniciativa que desarrolla especificaciones para asegurar que el contenido digital es auténtico y puede verificarse.

Igual que en el caso de Midjourney se referencia a la licencia de Creative Commons de Atribución la cual permite a otros distribuir, mezclar, ajustar y construir a partir de tu obra, incluso comercialmente, siempre y cuando te den crédito de manera adecuada por la creación original.

En el caso de ChatGPT OpenAI en el uso de las imágenes generadas con su herramienta menciona lo siguiente:

Ejemplos de otros posibles meta datos que podrías encontrar

Si analizar la meta información de una imagen, estos podrían ser algunos de los valores que llevarían las meta etiquetas de imágenes ocultas o no visibles al usuario:

Ejemplo 1: Una imagen tiene la etiqueta AIGenerated con el valor true. Esta imagen es muy probable que haya sido generada con IA.
Ejemplo 2: Una imagen tiene la etiqueta Creator con el valor DALL-E. Esta imagen es muy probable que haya sido generada con el modelo de IA DALL-E.
Ejemplo 3: Una imagen tiene la etiqueta Model con el valor GPT-3. Esta imagen es muy probable que haya sido generada con el modelo de IA GPT-3.
Ejemplo 4: Una imagen tiene la etiqueta Parameters con los valores height=100, width=100, prompt="un perro sentado en un sofá". Esta imagen es muy probable que haya sido generada con un modelo de IA que fue entrenado para generar imágenes de perros sentados en sofás.

Cómo se pueden utilizar otras técnicas para identificar imágenes generadas con IA

Además de los metadatos, también se pueden utilizar otras técnicas para identificar imágenes generadas con IA. Por ejemplo, se pueden analizar los patrones en la imagen o se puede utilizar una herramienta de detección de IA.

Análisis de patrones: Las imágenes generadas con IA a menudo tienen patrones que son diferentes a los que se encuentran en las imágenes tomadas por cámaras. Por ejemplo, las imágenes generadas con IA pueden tener bordes irregulares, colores poco naturales o texturas repetitivas.
Herramientas de detección de IA: Hay varias herramientas disponibles en línea que pueden ayudar a identificar imágenes generadas con IA. Estas herramientas utilizan diferentes técnicas para identificar patrones que son comunes en las imágenes generadas con IA. Incluso Google lanzó recientemente su propuesta SynthID donde incrusta una marca de agua digital en imágenes o audio generados por IA, que es imperceptible para los humanos pero detectable para la identificación y así pueden ayudar a identificar la fuente.

Es importante tener en cuenta que ninguna de estas técnicas es perfecta. Las imágenes generadas con IA están cada vez más difíciles de distinguir de las imágenes tomadas por cámaras.

En este repositorio de Github he encontrado la propuesta que muestra cómo se podría etiquetar una imagen que ha sido generada por IA para ser identificada.

Cómo analizar si una imagen fue generada por IA a través de sus meta datos

Meta Data generada por imágenes por MIDJOURNEY

Meta Data generada por imágenes por CHATGPT (DALL-E)

Ejemplos de otros posibles meta datos que podrías encontrar

Cómo se pueden utilizar otras técnicas para identificar imágenes generadas con IA

Otros posts relacionados

Vacaciones | Dockerlabs [WriteUp]

Dockerlabs: qué es y cómo empezar