Glosario de manipulación digital e IA
Los términos que necesitas para entender qué es real y qué no en internet — explicados de forma útil, no académica. Cuando algo no se puede verificar, también lo decimos aquí.
- Alucinación (IA)
Cuando un modelo de lenguaje afirma con total seguridad algo que es falso o que se ha inventado.
Los modelos de lenguaje no consultan una base de datos de hechos: predicen la siguiente palabra más probable. Cuando no 'saben' algo, no se callan — generan la respuesta más plausible, con citas inventadas, fechas erróneas y sentencias judiciales que nunca existieron, todo en tono impecable.
Esto también afecta a los detectores basados en IA, incluido el nuestro: por eso TrustGlyph no te da un 'es falso' rotundo, sino probabilidades con sus límites explicados. Cualquier herramienta que afirme certezas sobre contenido IA está, irónicamente, alucinando.
- Astroturfing
Simular apoyo popular espontáneo — reseñas, comentarios, cuentas — que en realidad está orquestado y pagado.
El nombre viene de AstroTurf, la marca de césped artificial: parece movimiento de base ('grassroots') pero es sintético. Hoy la IA generativa lo ha abaratado a escala industrial: cientos de reseñas con redacción distinta, perfiles con foto generada y opiniones coordinadas que parecen consenso orgánico.
Las señales clásicas siguen valiendo: cuentas recién creadas, actividad en ráfagas, lenguaje sospechosamente parecido entre 'usuarios' distintos, y entusiasmo desproporcionado por productos o causas muy concretas.
- Búsqueda inversa de imagen
Buscar una imagen por la imagen misma (no por palabras) para descubrir dónde y cuándo apareció antes en internet.
Es la herramienta de verificación más rentable que existe y es gratis: Google Lens, TinEye o Yandex Images te dicen en segundos si esa 'foto de última hora' lleva años circulando con otro contexto. TinEye además ordena por fecha, perfecto para encontrar la primera aparición.
Cubre justo el hueco que los detectores de IA no pueden: la descontextualización y el cheapfake. Flujo recomendado: primero búsqueda inversa (¿es reciclada?), después análisis de detección (¿es generada?). Las dos preguntas son distintas y necesitas responder ambas.
- C2PA
Estándar abierto (Coalition for Content Provenance and Authenticity) que firma criptográficamente el origen y el historial de edición de un archivo.
C2PA incrusta en el archivo un manifiesto firmado: qué cámara o herramienta lo creó, qué ediciones ha sufrido y quién las hizo. Lo impulsan Adobe, Microsoft, Google, OpenAI y fabricantes de cámaras como Leica o Sony. Es la apuesta seria de la industria por la procedencia del contenido.
Su limitación es honesta y conocida: si alguien hace una captura de pantalla o reexporta el archivo, los metadatos C2PA desaparecen. La ausencia de C2PA no demuestra nada; su presencia, verificada criptográficamente (como hace TrustGlyph), sí dice mucho.
Analizar un archivo y leer su C2PA · Detector de imágenes IA
- Cheapfake
Manipulación barata sin IA: recortar, ralentizar, cambiar el pie de foto o sacar un vídeo real de contexto.
La mayoría de la desinformación visual no usa IA. Un vídeo real de 2015 presentado como actual, una foto recortada para ocultar una pancarta, o un clip ralentizado para que alguien parezca ebrio: eso son cheapfakes, y funcionan igual de bien que un deepfake con una fracción del esfuerzo.
Contra el cheapfake los detectores de IA no sirven de nada, porque el contenido es auténtico — lo falso es el contexto. Aquí las armas son la búsqueda inversa de imagen y comprobar la fuente original.
- Content Credentials
La implementación visible de C2PA: la etiqueta 'CR' que muestra quién creó un contenido y cómo se editó.
Content Credentials es el nombre comercial con el que Adobe y la industria presentan C2PA al público. Cuando ves el icono 'CR' en una imagen, puedes inspeccionar su historial: herramienta de creación, ediciones y, si el autor lo decide, su identidad.
Photoshop, Firefly y DALL·E ya las añaden por defecto a sus generaciones. El problema sigue siendo el mismo que con C2PA: la mayoría de plataformas sociales eliminan estos metadatos al subir el archivo, así que en la práctica casi nunca llegan al espectador final.
- Deepfake
Vídeo, imagen o audio manipulado con IA para que una persona parezca decir o hacer algo que nunca dijo o hizo.
El término viene de 'deep learning' + 'fake'. Los primeros deepfakes (2017) requerían horas de material y conocimientos técnicos; hoy basta una foto y una app gratuita. Los más peligrosos no son los virales y burdos, sino los discretos: un audio de 20 segundos imitando la voz de tu jefe pidiendo una transferencia.
Detectarlos a ojo es cada vez más difícil, y ningún detector automático acierta siempre. Lo más fiable sigue siendo el contexto: ¿quién lo publica, cuándo y por qué? Si un vídeo te provoca una reacción fuerte e inmediata, esa es exactamente la señal para parar y verificar.
- Descontextualización
Usar contenido auténtico con un contexto falso: otra fecha, otro lugar u otra historia que la imagen real nunca contó.
Es la técnica de desinformación más eficaz que existe, precisamente porque el contenido pasa cualquier análisis forense: la foto es real, el vídeo es real. Lo que miente es el titular, el pie de foto o la cuenta que lo comparte. Un incendio de 2018 reciclado en cada ola de calor, una protesta de otro país atribuida al tuyo.
Ningún detector de IA puede ayudarte aquí. La defensa es la búsqueda inversa (¿cuándo apareció esta imagen por primera vez?) y la pregunta básica del fact-checking: ¿la fuente original confirma este contexto?
- Desinformación vs misinformación
Desinformación es información falsa difundida con intención de engañar; misinformación es la misma falsedad compartida sin saberlo.
La distinción importa porque el remedio es distinto. Contra la desinformación (campañas coordinadas, granjas de bots, propaganda) hacen falta moderación y trazabilidad. Contra la misinformación (tu tía reenviando un bulo de buena fe) lo que funciona es dar herramientas de verificación fáciles antes de compartir.
La mayoría del contenido falso que circula es misinformación: gente normal amplificando algo que les indignó o les conmovió sin pararse a comprobarlo. Por eso la verificación tiene que ser rápida y gratuita, o no la usará nadie.
- Detección probabilística
Análisis que estima la probabilidad de que un contenido sea generado por IA — nunca una certeza, siempre una estimación con margen de error.
Es como funcionan todos los detectores de IA del mercado, digan lo que digan sus webs: buscan patrones estadísticos asociados a la generación sintética y devuelven una probabilidad. Ningún detector — ni el nuestro ni ninguno — puede darte un 'sí' o un 'no' garantizado, y los modelos nuevos invalidan señales constantemente.
Por eso TrustGlyph te muestra el porcentaje junto a lo que no ha podido verificar, en lugar de un veredicto binario. Un detector honesto te da mejor información para decidir; uno que promete certezas te da una falsa seguridad, que es peor que no tener detector.
- Ed25519
Algoritmo de firma digital de curva elíptica, rápido y resistente, usado por SSH, Signal y el Sello de TrustGlyph.
Funciona con un par de claves: la privada firma, la pública verifica. Con claves de solo 32 bytes ofrece una seguridad equivalente a RSA de 3000+ bits, firma en microsegundos y su diseño elimina clases enteras de errores de implementación que han hundido otros esquemas.
Es un estándar abierto y auditado durante más de una década, no criptografía casera: la misma confianza que protege tus conexiones SSH es la que respalda cada sello. La seguridad real depende, como siempre, de proteger la clave privada.
- EXIF
Metadatos que una cámara o un móvil guardan dentro de la foto: fecha, modelo de dispositivo, ajustes y a veces ubicación GPS.
Los datos EXIF pueden contar mucho: una foto 'tomada hoy' con fecha EXIF de 2019, o una imagen 'de cámara' sin ningún dato de dispositivo, son banderas rojas. Las imágenes de Stable Diffusion incluso guardan a veces el prompt completo en los metadatos PNG — TrustGlyph los lee y te los muestra.
Pero cuidado con las conclusiones rápidas: WhatsApp, Instagram y la mayoría de redes borran el EXIF al subir la imagen, y editarlo a mano es trivial. EXIF ausente no significa nada; EXIF presente es una pista, nunca una prueba.
Analizar metadatos de un archivo · Cómo saber si una foto es real
- Fact-checking
Verificación periodística de afirmaciones y contenidos: contrastar con fuentes primarias antes de dar algo por cierto.
En España lo hacen organizaciones como Maldita.es, Newtral o EFE Verifica, certificadas por redes internacionales (IFCN, EFCSN) con metodologías públicas. Antes de compartir un contenido dudoso, buscar si ya lo han desmentido lleva 30 segundos.
El fact-checking profesional y las herramientas automáticas se complementan, no compiten: un detector te da una señal técnica en segundos; un fact-checker investiga la fuente, el contexto y la cadena de difusión. Para decisiones que importan, quieres las dos cosas.
- GAN
Red generativa antagónica: dos redes neuronales que compiten — una genera falsificaciones y otra intenta detectarlas — hasta que las falsificaciones son indistinguibles.
Las GAN (2014) dominaron la primera ola de rostros sintéticos: thispersondoesnotexist.com y la mayoría de fotos de perfil falsas usadas en astroturfing salen de ahí. Sus huellas clásicas — orejas asimétricas, fondos derretidos, dientes raros — fueron las primeras 'señales para detectar IA'.
Hoy los modelos de difusión las han desplazado en calidad, pero las GAN siguen activas en deepfakes de vídeo en tiempo real y en generación de rostros baratos. Moraleja: las guías de detección caducan; el método de verificación, no.
- Hash (SHA-256)
Huella digital de un archivo: una cadena fija de 64 caracteres que cambia por completo si se altera un solo bit del contenido.
SHA-256 convierte cualquier archivo — de un tuit a una película — en una huella única de 256 bits. Es determinista (el mismo archivo da siempre el mismo hash) e irreversible (del hash no se puede reconstruir el archivo), y encontrar dos archivos distintos con el mismo hash es computacionalmente inviable.
Es la pieza que une todo el sistema de sellado: lo que se firma con Ed25519 y se ancla en el tiempo con RFC 3161 no es el archivo entero, sino su hash. Verificar es recalcular la huella y comprobar que coincide con la firmada.
- Marca de agua (watermark)
Señal incrustada en un contenido — visible o invisible — para identificar su origen o marcarlo como generado por IA.
Hay tres familias: visibles (el logo en la esquina de una foto de stock), de metadatos (etiquetas en el archivo, fáciles de borrar) y estadísticas/invisibles (alteraciones imperceptibles del propio contenido, como SynthID). Cada una resiste cosas distintas.
Ninguna marca de agua es invulnerable: las visibles se recortan, los metadatos se eliminan al reexportar y las invisibles pueden degradarse con ediciones agresivas. Por eso la marca de agua es una pieza de la verificación, no la respuesta completa.
- Modelo de difusión
Arquitectura de IA generativa que crea imágenes partiendo de ruido aleatorio y refinándolo paso a paso hasta formar la imagen pedida.
Es la tecnología detrás de Stable Diffusion, Midjourney, DALL·E y Flux. El modelo aprende a 'limpiar' ruido en miles de pasos durante el entrenamiento; al generar, invierte el proceso: empieza con estática pura y la esculpe hacia lo que describe el prompt.
Para la detección importa porque los modelos de difusión dejan huellas estadísticas distintas a las de las GAN, y porque algunos (Stable Diffusion en local) guardan los parámetros de generación en el propio PNG — una confesión completa que TrustGlyph lee directamente.
- Perplejidad
Métrica que mide cuán predecible es un texto para un modelo de lenguaje; los textos de IA tienden a ser más predecibles (baja perplejidad).
Es la base de detectores como GPTZero: los modelos generan la palabra más probable, así que su texto sorprende poco. El texto humano tiene más altibajos — giros raros, errores, ocurrencias — que disparan la perplejidad.
El problema es serio: el texto humano formulaico (académico, legal, de no nativos) también tiene baja perplejidad, lo que produce falsos positivos que han costado acusaciones injustas a estudiantes. Y basta pedirle a la IA que 'escriba con más variedad' para subir la perplejidad artificialmente. Útil como señal; peligrosa como veredicto.
- Procedencia (provenance)
El historial verificable de un contenido: quién lo creó, con qué herramienta y qué cambios ha sufrido desde entonces.
Es el cambio de paradigma más importante en autenticidad digital: en lugar de intentar detectar lo falso (una carrera perdida contra modelos cada vez mejores), se trata de demostrar lo auténtico desde el origen. C2PA, Content Credentials y los sellos criptográficos son herramientas de procedencia.
El enfoque de TrustGlyph combina ambos mundos: análisis de detección cuando no hay procedencia, y verificación criptográfica cuando sí la hay. La procedencia, cuando existe, siempre pesa más que cualquier puntuación probabilística.
- Prompt
La instrucción en lenguaje natural que se le da a un modelo de IA para que genere texto, imagen, audio o vídeo.
Del prompt depende todo el resultado: 'foto realista de una manifestación en Madrid, lente 35mm, luz de tarde' produce algo muy distinto a 'dibujo de una protesta'. Por eso el prompt es también evidencia: si aparece, delata que el contenido es generado y exactamente qué se pidió.
Algunas herramientas lo dejan escrito en el archivo — Stable Diffusion lo guarda en los metadatos PNG junto al modelo y la semilla usados. Cuando TrustGlyph encuentra estos parámetros, el caso queda cerrado sin necesidad de ningún análisis probabilístico.
- Sello criptográfico
Firma matemática que vincula un contenido exacto a un autor y a un momento, de forma que cualquier alteración posterior se detecta.
A diferencia de la detección (que adivina hacia atrás), el sello prueba hacia adelante: tú declaras 'esto es mío, tal cual está, en esta fecha' y las matemáticas hacen el resto. Si alguien cambia un solo bit del archivo, la verificación falla. No requiere confiar en nadie: cualquiera puede comprobarlo.
El Sello de TrustGlyph combina una firma Ed25519 con un sello de tiempo RFC 3161 de una autoridad independiente. Ojo a lo que NO hace: no demuestra que el contenido sea verdad ni que lo crearas tú desde cero — demuestra que existía en ese momento y que nadie lo ha tocado desde entonces.
- Sello de tiempo RFC 3161
Estándar por el que una autoridad de sellado de tiempo certifica criptográficamente que un hash existía en un instante concreto.
Una firma digital prueba quién, pero no cuándo: la fecha la pone tu ordenador y se puede falsear. RFC 3161 resuelve esto con un tercero neutral (una TSA, Time Stamping Authority) que firma tu hash junto con la hora oficial, creando una prueba de existencia independiente de ti.
El Sello de TrustGlyph incluye este sello de tiempo además de la firma Ed25519: así puedes demostrar que tu contenido existía antes de una fecha — útil en disputas de autoría, plagio o 'yo lo publiqué primero' — sin que nadie tenga que fiarse de tu palabra ni de la nuestra.
- Sesgo de confirmación
La tendencia humana a creer y compartir lo que confirma lo que ya pensábamos, y a descartar lo que lo contradice.
Es el motor psicológico de toda la desinformación: un bulo no necesita ser convincente, solo necesita darte la razón. Por eso los contenidos manipulados más efectivos no intentan cambiar tu opinión — la refuerzan, y tú haces el trabajo de difundirlos.
La defensa incómoda: desconfía más de lo que te da la razón. Si una imagen confirma exactamente lo que pensabas del político que detestas, verifícala con más cuidado, no con menos. Ahí es donde todos bajamos la guardia.
- SynthID
Marca de agua invisible de Google DeepMind que se incrusta en los píxeles, el audio o el texto generado por sus modelos de IA.
A diferencia de los metadatos, SynthID modifica sutilmente el contenido en sí (los píxeles de una imagen de Imagen, la distribución de palabras de un texto de Gemini), de modo que sobrevive a recortes, compresión y capturas de pantalla mejor que C2PA.
La letra pequeña importa: solo Google puede leer SynthID. No hay un verificador público ni una API abierta, así que ningún detector independiente — incluido el nuestro — puede confirmarte si una imagen lleva esta marca. Es procedencia, pero de jardín cerrado.
¿Tienes algo que verificar?
Análisis gratuito — y te decimos qué no se ha podido comprobar.
Analizar contenido gratis