Metadaten vs. Kommunikationsinhalte: warum es nicht ausreicht, nur „Text" zu verschlüsseln - VSX.is

Wenn sie über Privatsphäre In der Online-Welt wird die meiste Aufmerksamkeit auf den Inhalt der Kommunikation gerichtet - den Text der Nachricht, die aufgezeichnete Datei, das Video des Anrufs. Weniger sichtbar, aber oft genauso wichtig, sind die Metadaten: Informationen darüber, wer wann und wie kommuniziert hat. In diesem Text werde ich versuchen, den Unterschied zwischen Inhalt und Metadaten zu erklären, zu zeigen, was man aus Metadaten herauslesen kann, und - was am wichtigsten ist - wie man vernünftig und nicht paranoid damit umgeht.

Was sind Kommunikationsinhalte und was sind Kommunikationsmetadaten?

Der Inhalt der Kommunikation ist das, was wir intuitiv als „Nachricht“ wahrnehmen. Der Text einer E-Mail, eine Stimme in einem Telefonat, ein Bild in einer Videokonferenz, ein Dokument in einem Anhang. Wenn die Kommunikation verschlüsselt ist, ist es dieser Inhalt, der geschützt werden sollte, damit kein Unbefugter ihn lesen oder abhören kann.

Kommunikations-Metadaten hingegen sind Informationen o Kommunikation. Dazu gehören in der Regel: wer mit wem kommuniziert (Konten, E-Mail-Adressen, Telefonnummern), wann die Kommunikation stattfindet und wie lange sie dauert, welche IP-Adressen und von welchem Standort aus jemand eine Verbindung herstellt, wie viele Daten fließen und wie oft, welche Geräte, Anwendungen oder Protokolle verwendet werden. Der konkrete Umfang dieser Daten ist je nach Dienst und Betreiber unterschiedlich.

Bei E-Mails besteht der Inhalt der Kommunikation aus Text und Anhängen, während die Metadaten der Kommunikation aus Kopfzeilen mit einer Liste von Absendern und Empfängern, Zeitstempeln und den Servern, über die die Nachricht lief, bestehen. U Videokonferenzen ist der Inhalt eines verschlüsselten Audio-Video-Streams, die Metadaten der Kommunikation sind eine Aufzeichnung darüber, wer sich wann verbunden hat, wie lange er online war, von welcher IP-Adresse aus und welche technischen Parameter die Übertragung hatte.

Wie Kommunikations-Metadaten erstellt werden

Kommunikations-Metadaten werden praktisch bei jedem Schritt auf dem Weg zwischen zwei Teilnehmern erstellt: auf dem Gerät des Nutzers (Anwendungsprotokolle, Verbindungsinformationen), im Netz (Router, NAT, ISP) und auf der Seite des Dienstes (Server, die Protokollierung, Routing, Protokollspeicherung bereitstellen).

Selbst wenn der Inhalt der Nachrichten Ende-zu-Ende verschlüsselt ist, muss die Infrastruktur zumindest so viel wissen, dass sie in der Lage ist, die Verbindung herzustellen, aufrechtzuerhalten und möglicherweise abzubauen. Daher speichern die Anbieter in der Regel verschiedene Formen von Verkehrsprotokollen und TelemetrieVerbindungsstatistiken, Fehlerprotokolle, Daten zur Leistungsüberwachung oder zum Schutz vor Missbrauch.

Was aus den Metadaten der Kommunikation zu entnehmen ist

Kommunikations-Metadaten sehen auf den ersten Blick „unschuldig“ aus, aber in ihrer Gesamtheit können sie überraschend aufschlussreich sein. Sie ermöglichen es zum Beispiel, das Beziehungsnetz zu rekonstruieren - wer kommuniziert mit wem häufig, wer nur sporadisch, wer steht im Mittelpunkt. Sie können dazu verwendet werden, den Tagesrhythmus abzuschätzen - zu welcher Zeit Sie normalerweise arbeiten, wann Sie online sind und wann Sie nicht erreichbar sind. Anhand von IP-Adressen und Zugangspunkten lässt sich oft feststellen, ob sich jemand an einem Ort aufhält oder regelmäßig reist. Und eine plötzliche Verdichtung der Kommunikation in einer bestimmten Gruppe kann signalisieren, dass „etwas Wichtiges“ passiert, ohne dass jemand den Inhalt der Nachrichten liest.

Stellen Sie sich ein einfaches Beispiel vor: Jemand kennt den Inhalt Ihrer Nachrichten nicht, sieht aber, dass die Zahl der langen abendlichen Telefonate mit einer bestimmten Person aus einer anderen Stadt in den letzten Wochen deutlich zugenommen hat. Allein dieses Bild kann in bestimmten Zusammenhängen hochsensibel sein.

Wer sieht normalerweise die Metadaten der Kommunikation?

Verschiedene Arten von Kommunikations-Metadaten sind für verschiedene Akteure verfügbar. Der Internetdienstanbieter (ISP) sieht die Netzebene - IP-Adressen, Ports, übertragene Datenmengen, manchmal sogar Informationen, die durch gesetzliche Vorschriften für die Aufbewahrung von Protokollen vorgegeben sind. Der Anbieter eines bestimmten Dienstes (E-Mail, Bote, Videokonferenzen) hat Zugang zu Protokollen, technischen Telemetriedaten, Anrufprotokollen und anderen Betriebsdaten, die sie für den Betrieb der Plattform und den Schutz vor Missbrauch benötigt. Und die Dritten, an die ein Teil der Infrastruktur ausgelagert ist - Cloud-Rechenzentren, CDNs, Überwachungsanbieter - verarbeiten ihren Teil der Metadaten, oft nach ihren eigenen Regeln und innerhalb ihrer eigenen Zuständigkeitsbereich.

In einigen Fällen können die Behörden auf der Grundlage lokaler Rechtsvorschriften Zugang zu bestimmten Metadaten verlangen. In der Tschechischen Republik verpflichtet das Gesetz über elektronische Kommunikation (Artikel 97 Absatz 3 des Gesetzes Nr. 127/2005 Slg.) die Betreiber öffentlicher Kommunikationsnetze, Verkehrs- und Standortdaten sechs Monate lang aufzubewahren. Diese Daten können den Strafverfolgungsbehörden, Nachrichtendiensten und anderen gesetzlichen Einrichtungen auf Anfrage zur Verfügung gestellt werden. Für die Leser bedeutet dies einen konkreten Horizont: Selbst wenn niemand Ihre Nachrichten liest, können die Metadaten darüber, wer wann und von wo aus kommuniziert hat, bis zu sechs Monate zurückverfolgt werden.

Ende-zu-Ende-Verschlüsselung und ihre Grenzen

Ende-zu-Ende Verschlüsselung ist ein wichtiges Instrument zum Schutz der Privatsphäre, aber seine Grenzen müssen bekannt sein. Es schützt den Inhalt der Kommunikation - Text, Audio, Video - zwischen Endgeräten. Die Daten werden verschlüsselt, so dass nicht einmal der Dienstanbieter sie sehen kann.

Die Verschlüsselung der Inhalte selbst sagt jedoch in der Regel nichts darüber aus, wer sich wann mit wem verbunden hat, von welcher IP-Adresse und mit welchen technischen Parametern, wie lange die Kommunikation gedauert hat und wie viele Daten übertragen wurden. Der Umfang der Kommunikationsmetadaten, die der Dienst trotz der Verschlüsselung der Inhalte speichert, ist von Anbieter zu Anbieter sehr unterschiedlich. Ein gutes Beispiel ist der Vergleich von WhatsApp a Signal - beide Anwendungen verwenden das gleiche Verschlüsselungsprotokoll (Signal-Protokoll) für den Schutz von Inhalten, aber sie unterscheiden sich grundlegend in der Behandlung von Metadaten. WhatsApp speichert Verkehrsdaten darüber, wer mit wem und wann kommuniziert. Signal hingegen minimiert durch den Einsatz der Sealed-Sender-Technologie auch architektonisch, dass seine Server überhaupt wissen, wer eine Nachricht an wen sendet. Gleiches Verschlüsselungsprotokoll, grundlegend anderer Metadaten-Fingerabdruck.

In der Praxis ist es sinnvoll, die Kommunikation auf drei Ebenen zu betrachten: Anwendung - hier werden die Inhalte geschützt (z. B. verschlüsselter Chat), Netzwerk - hier werden die für die Zustellung erforderlichen Metadaten (IP, Ports, Routing) erstellt - und Betrieb - hier werden Telemetrie und Protokolle für den Betrieb und die Sicherheit des Dienstes erstellt.

Technischer Einsatz: IP-Adressen, DNS, Protokolle, Telemetrie

Für diejenigen, die ein wenig technischen Kontext wünschen, lohnt sich ein kurzer Einschub. Eine IP-Adresse ist die Kennung eines Geräts (genauer gesagt, eines Endpunkts), das eine Verbindung zu einem Netz herstellt. In Verbindung mit der Verbindungszeit und den Zuweisungsprotokollen des Verbindungsanbieters lässt sich damit zurückverfolgen, wer zu einem bestimmten Zeitpunkt „hinter“ einer bestimmten IP-Adresse war. Protokolle sind Aufzeichnungen bedeutender Ereignisse - zum Beispiel, dass sich ein Benutzer angemeldet hat, dass ein Fehler aufgetreten ist, dass eine neue Netzwerkverbindung hergestellt wurde. Telemetrie ist ein Oberbegriff für Diagnose- und Betriebsdaten, die zur Überwachung des Zustands eines Systems verwendet werden: Auslastung, Latenz, Fehlerrate.

Zu diesen traditionellen Schichten von Kommunikationsmetadaten kommen zwei oft übersehene Vektoren hinzu. DNS-Abfragen - es sei denn, der Benutzer verwendet verschlüsselte DNS (wie DoT oder DoH) - durchlaufen das Netzwerk im Klartext, so dass der Internetdienstanbieter jeden aufgelösten Domänennamen sieht. Und selbst bei einer verschlüsselten HTTPS-Verbindung enthält der Server Name Indication (SNI)-Header den Namen der Zielsite in unverschlüsselter Form, wenn die Verbindung hergestellt wird. Dies führt zu einer paradoxen Situation: Der Inhalt der Kommunikation ist verschlüsselt, aber die Adresse, an die die Kommunikation gerichtet ist, bleibt normalerweise transparent.

Diese Ebenen sind oft miteinander verbunden. Anhand der Protokolle und Telemetriedaten entscheidet der Dienstbetreiber, ob die Kapazität erhöht werden muss, ob der Dienst angegriffen wird oder ob eine bestimmte Konfiguration Fehler verursacht. Gleichzeitig erweitern solche Diagnoseinformationen aber auch den Satz an Kommunikationsmetadaten, der über den Benutzer existiert.

Praktisches Beispiel: ein normaler Benutzer

Stellen Sie sich einen typischen Benutzer vor, der E-Mail bei einem großen Dienstanbieter, einen beliebten Chat-Dienst mit Ende-zu-Ende-Verschlüsselung und Videokonferenzen für berufliche und private Anrufe nutzt.

Auf der Ebene der Kommunikations-Metadaten kann sich folgendes Bild ergeben. Der E-Mail-Anbieter weiß in der Regel, wann er sich einloggt, von welcher IP-Adresse aus, mit welchem Gerät, und wie oft er E-Mails sendet und empfängt. Ein Chat-Anbieter weiß in der Regel, wann er online ist, an welche Kontakte er schreibt, wie oft und wie lange jede Sitzung ist - ohne den Inhalt zu kennen. Ein Anbieter von Videokonferenzen hat Aufzeichnungen darüber, wann er an Anrufen teilgenommen hat, wie lange sie gedauert haben, wie viele Teilnehmer es gab, aus welchen Regionen sie kamen und wie der technische Ablauf des Anrufs war.

Hinzu kommen Metadaten des Internetdienstanbieters und etwaige Protokolle aus der Cloud oder der Überwachungsinfrastruktur. Ohne ein einziges „Öffnen“ der Inhalte lässt sich feststellen, dass der Nutzer an jedem Wochentag von etwa 8 bis 17 Uhr online ist, abends oft längere Videoanrufe mit einer bestimmten Person führt, das Kommunikationsvolumen am Wochenende stark schwankt und in letzter Zeit regelmäßige Verbindungen aus einem anderen Land aufgetaucht sind, was auf Reisen hinweisen könnte.

Für den Durchschnittsbürger können sie an der Grenze zwischen einer harmlosen technischen Aufzeichnung und sensiblen persönlichen Informationen liegen - es kommt auf den Kontext an, wer Zugang zu den Daten hat und wie er sie handhabt.

Praxisbeispiel: eine kleine gemeinnützige Organisation

Stellen Sie sich eine kleine Non-Profit-Organisation mit zehn Mitarbeitern vor. Sie erwirbt keine eigene Server, sondern nutzt eine Cloud-basierte E-Mail- und Office-Suite, eine separate Videokonferenzplattform, ein Chat-Tool für die interne Kommunikation und mehrere zusätzliche Dienste (Dateifreigabe, Projektmanagement).

Auf der Inhaltsebene der Kommunikation kann man eine Reihe von Dingen gut sichern - verschlüsselte Dokumente, verschlüsselte Chats, verschlüsselte Speicherung. Aber die Metadaten der Kommunikation werden in jedem dieser Dienste erstellt: in E-Mails (wer hat wem wann geschrieben, von welcher IP aus, wie oft), in Chats (wann trifft sich das Team, was sind die „heißen“ Kanäle), in Videokonferenzen (Zeit- und Anwesenheitsmuster von Sitzungen) und in Dateifreigabe-Tools (wann wird an bestimmten Dokumenten gearbeitet, wer öffnet sie).

Hinzu kommt die Infrastruktur der einzelnen Anbieter: ihre Cloud-Rechenzentren, Überwachungs- und Protokollierungssysteme sowie etwaige technische Subunternehmer. Es geht hier nicht darum, Katastrophenszenarien zu malen, sondern zu zeigen, dass selbst eine relativ kleine Organisation eine Menge Kommunikations-Metadaten hinterlässt, aus denen hervorgeht, wann die Arbeitsbelastung am höchsten ist, welche Projekte im Mittelpunkt stehen, welche Personen in der Organisation am stärksten in der Kommunikation verbunden sind und ob es plötzliche Veränderungen in der Aktivität gibt (zum Beispiel vor wichtigen Ereignissen).

Für die interne Sicherheit und den Ruf einer Organisation kann es wichtig sein zu wissen, wo diese Metadaten gespeichert sind, wer sie verarbeitet und unter welchen Bedingungen.

Wie man sinnvoll mit Kommunikationsmetadaten umgeht

Es geht nicht darum, sich mit digitalen Werkzeugen abzufinden oder dem Gefühl zu erliegen, dass „sowieso alles verloren ist“. Ein vernünftiger Ansatz könnte folgendermaßen aussehen. Erkennen Sie, dass die Metadaten der Kommunikation nicht nur eine technische Angelegenheit sind, sondern ein Teil des Bildes unseres Verhaltens. Achten Sie bei der Auswahl von Tools nicht nur darauf, ob der Inhalt der Kommunikation verschlüsselt ist, sondern auch darauf, wie der Anbieter die Erfassung und Speicherung von Verkehrsdaten beschreibt. Wann immer möglich, wählen Sie Lösungen, die Metadatensammlung minimieren, klar beschreiben, was protokolliert wird und warum, und dem Nutzer so viel Kontrolle wie möglich geben. Und bei wirklich sensiblen Themen sollten Sie andere Formen der Kontaktaufnahme in Betracht ziehen.

Kommunikations-Metadaten an sich sind nicht „böse“. Sie sind ein wesentlicher Bestandteil einer funktionierenden Infrastruktur. Problematisch wird es, wenn sie nicht bekannt sind, in unzureichendem Maße gesammelt werden oder in intransparenter Weise gehandhabt werden. Ein informationsfähiger Nutzer - ob eine Einzelperson oder eine Organisation - hat die Möglichkeit, sich in diesem Raum zurechtzufinden und Entscheidungen zu treffen, die seinem eigenen Verhältnis zur Privatsphäre entsprechen.

Die Informationen und Bewertungen in diesem Artikel beruhen auf öffentlich zugänglichen Quellen zum Zeitpunkt der Veröffentlichung und können sich im Laufe der Zeit ändern. Wir empfehlen, den aktuellen Stand der einzelnen Anwendungen direkt bei den Betreibern zu erfragen, bevor Sie eine Entscheidung treffen.