Cómo detectar imágenes de DALL·E y ChatGPT

Aquí hay una buena noticia poco conocida: las imágenes generadas con ChatGPT y DALL·E salen de fábrica con credenciales de contenido C2PA — metadatos firmados que declaran que la imagen fue creada por IA y con qué herramienta. Es lo más parecido a un DNI de la imagen que existe hoy.

La mala noticia: esa etiqueta es frágil. Una captura de pantalla, una subida a la mayoría de redes sociales o una simple reconversión de formato la borra. Esta guía te explica cómo aprovechar la procedencia cuando existe y qué hacer cuando ha desaparecido.

C2PA: la etiqueta que OpenAI pone y las redes borran

OpenAI incrusta credenciales C2PA (Content Credentials) en las imágenes que genera. TrustGlyph las lee y verifica criptográficamente la firma: si la cadena de procedencia está intacta, el veredicto es directo y muy fiable — “esta imagen declara haber sido generada por IA”.

El problema es el viaje de la imagen. La mayoría de plataformas reescriben los archivos al subirlos y eliminan esos metadatos. Una imagen de DALL·E que llega por WhatsApp o descargada de una red social probablemente ya no conserve su etiqueta. Que no tenga C2PA no prueba que sea real: solo prueba que no podemos verificar su origen por esa vía.

Señales visuales típicas de DALL·E

Cuando la procedencia se ha perdido, estas pistas orientan (sin ser prueba):

Acabado “ilustración pulida”: colores saturados y limpios, superficies suaves, estética amable por defecto.
Texto dentro de la imagen mejor que el de otros generadores, pero que aún falla en frases largas o tipografías pequeñas.
Fondos coherentes pero genéricos: oficinas, calles o paisajes que no corresponden a ningún lugar identificable.
Iluminación uniforme y sin las imperfecciones ópticas de una cámara (viñeteado, grano, aberraciones).

Cómo lo analiza TrustGlyph

Primero, procedencia: leemos las credenciales C2PA en JPEG, PNG y WebP y verificamos la firma criptográficamente. Si está, lo sabrás con su cadena de custodia. También revisamos EXIF/XMP por si quedan restos del software de origen.

Si la etiqueta ha desaparecido, los clasificadores entrenados aportan una probabilidad con su margen de error declarado, y los planes de pago suman detectores premium y búsqueda inversa para localizar el origen de la imagen. Si las señales se contradicen, el veredicto es “no concluyente” — preferimos eso a una certeza inventada.

Lo que no se puede verificar

Una captura de pantalla de una imagen de DALL·E no conserva nada: ni C2PA, ni EXIF, ni parámetros. En ese escenario solo quedan los clasificadores, y un resultado de probabilidad nunca debería tratarse como una sentencia. Te diremos exactamente qué hemos comprobado y qué no.

Verificar una imagen gratis

Leemos y verificamos las credenciales C2PA — y te decimos si ya no están.

Preguntas frecuentes

¿Todas las imágenes de ChatGPT llevan C2PA?

Las imágenes generadas salen con credenciales C2PA incrustadas, pero sobreviven solo si nadie reprocesa el archivo. Capturas de pantalla, recortes y la mayoría de subidas a redes las eliminan.

Si una imagen no tiene C2PA, ¿es real?

No. La ausencia de metadatos no prueba autenticidad: la mayoría de las imágenes (reales e IA) circulan sin ellos. Solo significa que hay que recurrir a otras señales, todas con margen de error.

¿TrustGlyph verifica la firma C2PA o solo la lee?

La verificamos criptográficamente. No nos limitamos a mostrar el texto del metadato: comprobamos que la firma sea válida, porque un metadato sin verificar se puede falsificar.

¿El análisis es gratis?

Sí, el análisis de imágenes es gratuito. Los planes de pago añaden detectores premium y búsqueda inversa de imagen para rastrear el origen.