Metadatos frente al contenido de las comunicaciones: por qué no basta con cifrar solo el „texto" - VSX.is

Cuando hablan de Privacidad En el mundo online, la mayor parte de la atención se centra en el contenido de la comunicación: el texto del mensaje, el archivo grabado, el vídeo de la llamada. Menos visibles, pero a menudo igual de importantes, son los metadatos: información sobre quién se comunicó, cuándo y cómo. En este texto intentaré explicar la diferencia entre contenido y metadatos, mostrar qué se puede deducir de los metadatos y, lo que es más importante, cómo abordarlos con sensatez, no con paranoia.

Qué es el contenido de la comunicación y qué son los metadatos de la comunicación

El contenido de la comunicación es lo que intuitivamente percibimos como „mensaje“. El texto de un correo electrónico, la voz en una llamada telefónica, una imagen en una videoconferencia, un documento adjunto en un archivo adjunto. Si la comunicación está cifrada, es este contenido el que debe protegerse para que nadie no autorizado pueda leerlo o escucharlo.

Los metadatos de comunicación, por su parte, son información o para comunicarse. Suelen incluir: quién se comunica con quién (cuentas, direcciones de correo electrónico, números de teléfono), cuándo tiene lugar la comunicación y cuánto dura, qué direcciones IP y aproximadamente desde qué ubicación se conecta alguien, cuántos datos fluyen y con qué frecuencia, qué dispositivos, aplicaciones o protocolos se utilizaron. El alcance específico de estos datos varía en función del servicio y de su operador.

En el correo electrónico, el contenido de la comunicación es texto y archivos adjuntos, mientras que los metadatos de la comunicación son cabeceras con una lista de remitentes y destinatarios, marcas de tiempo y los servidores por los que ha pasado el mensaje. U videoconferencia es el contenido de un flujo de audio y vídeo cifrado, los metadatos de la comunicación son un registro de quién se conectó cuándo, cuánto tiempo estuvo conectado, desde qué dirección IP y qué parámetros técnicos tenía la transmisión.

Cómo se crean los metadatos de comunicación

Los metadatos de comunicación se crean prácticamente en cada paso del camino entre dos participantes: en el dispositivo del usuario (registros de aplicaciones, información de conexión), en la red (enrutadores, NAT, ISP) y en el lado del servicio (servidores que proporcionan registro, enrutamiento, almacenamiento de registros).

Aunque el contenido de los mensajes esté cifrado de extremo a extremo, la infraestructura necesita saber al menos lo suficiente para poder establecer, mantener y, posiblemente, borrar la conexión. Por ello, los proveedores suelen almacenar diversas formas de registros de tráfico y Telemetría: estadísticas de conexión, registros de errores, datos para la supervisión del rendimiento o la protección contra abusos.

Qué puede leerse en los metadatos de comunicación

Los metadatos de comunicación parecen „inocentes“ a primera vista, pero en conjunto pueden ser sorprendentemente reveladores. Por ejemplo, permiten reconstruir la red de relaciones: quién se comunica con quién frecuentemente, quién sólo esporádicamente, quién es el centro de atención. Pueden servir para estimar los ritmos diarios: a qué hora se suele trabajar, cuándo se está conectado, cuándo no se está disponible. Las direcciones IP y los puntos de acceso pueden indicar a menudo si alguien permanece en un lugar o viaja con regularidad. Y una repentina densificación de la comunicación en un grupo concreto puede indicar que está ocurriendo „algo importante“ sin que nadie lea el contenido de los mensajes.

Imagínese un ejemplo sencillo: alguien no conoce el contenido de sus mensajes, pero ve que el número de largas llamadas nocturnas con una persona concreta de otra ciudad ha aumentado considerablemente en las últimas semanas. Esta imagen por sí sola puede ser muy sensible en determinados contextos.

Quién suele ver los metadatos de comunicación

Diferentes tipos de metadatos de comunicación están disponibles para diferentes actores. El proveedor de servicios de Internet (ISP) ve la capa de red: direcciones IP, puertos, volúmenes de datos transferidos, a veces incluso información dada por los requisitos legales de conservación de registros. El proveedor de un servicio específico (correo electrónico, mensajero, videoconferencia) tiene acceso a registros, telemetría técnica, registros de llamadas y otros datos operativos que necesita para hacer funcionar la plataforma y protegerse contra los abusos. Y los terceros a los que se subcontrata parte de la infraestructura -centros de datos en la nube, CDN, proveedores de supervisión- procesan su parte de metadatos, a menudo con arreglo a sus propias normas y dentro de sus propios límites. Jurisdicción.

En algunos casos, las autoridades públicas pueden solicitar el acceso a determinados metadatos en virtud de la legislación local. En la República Checa, la Ley de Comunicaciones Electrónicas (artículo 97, apartado 3, de la Ley nº 127/2005 Recop.) obliga a los proveedores de redes públicas de comunicaciones a conservar los datos de tráfico y localización durante seis meses. Estos datos pueden ponerse a disposición de las autoridades policiales, los servicios de inteligencia y otros organismos oficiales que los soliciten. Para los lectores, esto supone un horizonte concreto: aunque nadie lea sus mensajes, los metadatos sobre quién se comunicó, cuándo y desde dónde pueden rastrearse hasta seis meses atrás.

Cifrado de extremo a extremo y sus límites

De extremo a extremo encriptación Es una herramienta importante para la protección de la privacidad, pero hay que ser consciente de sus limitaciones. Protege el contenido de las comunicaciones —texto, audio, vídeo— entre los dispositivos finales. Los datos se cifran de tal manera que ni siquiera el proveedor del servicio puede verlos.

Sin embargo, el cifrado del contenido en sí no suele abordar: quién se conectó con quién y cuándo, desde qué dirección IP y con qué parámetros técnicos, cuánto duró la comunicación y cuántos datos se transfirieron. La cantidad de metadatos de comunicación que el servicio almacena a pesar del cifrado de contenidos varía significativamente entre proveedores. Un buen ejemplo es la comparación de WhatsApp a Señal – ambas aplicaciones utilizan el mismo protocolo de cifrado (Protocolo Signal) para proteger el contenido, pero difieren radicalmente en el tratamiento de los metadatos. WhatsApp almacena datos operativos sobre quién se comunica con quién y cuándo. Signal, por el contrario, gracias a la tecnología Sealed Sender, minimiza desde el punto de vista arquitectónico incluso que sus servidores sepan quién envía un mensaje a quién. El mismo protocolo de cifrado, una huella de metadatos radicalmente diferente.

En la práctica, tiene sentido considerar la comunicación en tres capas: aplicación - donde protegemos el contenido (por ejemplo, chat cifrado), red - donde se crean los metadatos necesarios para la entrega (IP, puertos, enrutamiento), y operativa - donde se crean la telemetría y los registros utilizados para operar y asegurar el servicio.

Inserción técnica: direcciones IP, DNS, registros, telemetría

Para quienes deseen un poco de contexto técnico, vale la pena una breve inserción. Una dirección IP es el identificador del dispositivo (más concretamente, del punto final) que se conecta a la red. Combinada con la hora de conexión y los registros de asignación del proveedor de conexión, permite rastrear quién estaba „detrás“ de una dirección IP determinada en un momento concreto. Los logs son registros de eventos significativos: por ejemplo, que un usuario se ha conectado, que se ha producido un error, que se ha establecido una nueva conexión de red. Telemetría es un término genérico que engloba los datos operativos y de diagnóstico utilizados para supervisar la salud de un sistema: utilización, latencia, tasa de errores.

A estas capas tradicionales de metadatos de comunicación se añaden dos vectores que a menudo se pasan por alto. Las consultas DNS -a menos que el usuario utilice DNS cifrado (como DoT o DoH)- viajan por la red en texto plano, de modo que el ISP ve cada nombre de dominio resuelto. E incluso con una conexión HTTPS cifrada, el encabezado de la indicación del nombre del servidor (SNI) contiene el nombre del sitio de destino sin cifrar cuando se establece la conexión. Esto crea una situación paradójica: el contenido de la comunicación está cifrado, pero la dirección a la que se dirige la comunicación suele permanecer transparente.

Estas capas suelen estar relacionadas. Basándose en los registros y la telemetría, el operador del servicio decide si es necesario aumentar la capacidad, si el servicio está siendo atacado o si una configuración concreta está causando errores. Al mismo tiempo, sin embargo, cualquier información de diagnóstico de este tipo amplía el conjunto de metadatos de comunicación que existen sobre el usuario.

Ejemplo práctico: un usuario normal

Imagina un usuario típico que utiliza el correo electrónico en un gran proveedor de servicios, un popular servicio de chat con cifrado de extremo a extremo y videoconferencia para el trabajo y llamadas privadas.

A nivel de metadatos de comunicación, puede surgir el siguiente panorama. El proveedor de correo electrónico suele saber cuándo se conecta, desde qué dirección IP, con qué dispositivo y con qué frecuencia envía y recibe correo. Un proveedor de chat suele saber cuándo está conectado, a qué contactos escribe, con qué frecuencia y cuánto dura cada sesión, sin conocer el contenido. Un proveedor de videoconferencias tiene registros de cuándo participó en llamadas, cuánto duraron, cuántos participantes había, de qué regiones y el flujo técnico de la llamada.

A esto se añaden los metadatos del ISP y cualquier registro de la nube o de la infraestructura de monitorización. Sin „abrir“ ni una sola vez el contenido, se observa que el usuario está en línea aproximadamente de 8 de la mañana a 5 de la tarde todos los días laborables, suele mantener videollamadas más largas con una persona concreta por la noche, el volumen de comunicación varía significativamente los fines de semana y, más recientemente, han aparecido conexiones regulares desde otro país, lo que puede indicar viajes.

Para una persona normal, puede estar en el límite entre un registro técnico benigno y una información personal sensible: depende del contexto, de quién tenga acceso a los datos y de cómo los maneje.

Ejemplo práctico: una pequeña organización sin ánimo de lucro

Imagine una pequeña organización sin ánimo de lucro de diez personas. No adquiere servidores propios, pero utiliza una suite ofimática y de correo electrónico basada en la nube, una plataforma de videoconferencia independiente, una herramienta de chat para la comunicación interna y varios servicios adicionales (compartición de archivos, gestión de proyectos).

En el nivel de contenido de la comunicación, puedes tener varias cosas bien protegidas: documentos encriptados, chat encriptado, almacenamiento encriptado. Pero los metadatos de la comunicación se crean en cada uno de estos servicios: en el correo electrónico (quién escribió a quién, cuándo, desde qué IP, con qué frecuencia), en el chat (cuándo se reúne el equipo, cuáles son los canales „calientes“), en la videoconferencia (patrones de tiempo y asistencia a las reuniones) y en las herramientas para compartir archivos (cuándo se trabaja en documentos específicos, quién los abre).

A esto hay que añadir la infraestructura de los proveedores individuales: sus centros de datos en la nube, los sistemas de supervisión y registro, y cualquier subcontratista tecnológico. El objetivo aquí no es pintar escenarios catastróficos, sino mostrar que incluso una organización relativamente pequeña deja muchos metadatos de comunicación que muestran cuándo la carga de trabajo es máxima, en qué proyectos se centra, qué personas de la organización están más conectadas en comunicación y si hay cambios repentinos en la actividad (por ejemplo, antes de eventos importantes).

Desde el punto de vista de la seguridad interna y la reputación, puede ser importante para una organización saber dónde residen estos metadatos, quién los procesa y en qué condiciones.

Cómo abordar los metadatos de comunicación con sensatez

El objetivo no es resignarse a las herramientas digitales ni sucumbir a la sensación de que „de todos modos, todo está perdido“. Un planteamiento sensato podría ser el siguiente Reconocer que los metadatos de comunicación no son sólo un tecnicismo, sino parte de la imagen de nuestro comportamiento. A la hora de elegir herramientas, hay que fijarse no sólo en si el contenido de la comunicación está cifrado, sino también en cómo describe el proveedor la recogida y almacenamiento de los datos de tráfico. Siempre que sea posible, elija soluciones que recopilación de metadatos minimizar, describir claramente qué se registra y por qué, y dar al usuario tanto control como sea posible. Y para temas realmente delicados, considera otras formas de contacto.

Los metadatos de comunicación en sí mismos no son „malos“. Son parte esencial de una infraestructura que funciona. El problema surge cuando no se conocen, se recopilan de forma inadecuada o se manejan de forma poco transparente. Un usuario de la información -ya sea un individuo o una organización- tiene la posibilidad de navegar por este espacio y tomar decisiones adecuadas a su propia relación con la privacidad.

La información y las calificaciones de este artículo se basan en fuentes públicas disponibles en la fecha de publicación y están sujetas a cambios con el tiempo. Recomendamos comprobar el estado actual de las aplicaciones individuales directamente con sus operadores antes de tomar una decisión.