Šifrovat neznamená být v soukromí: co o vás vypovídají metadata
Šifrovaný obsah a viditelná metadata jsou dvě odlišné věci. Když služba mluví o "koncovém šifrování", vypráví jen polovinu příběhu.
Zámek, který nechrání vše
Velká část dnešních messagingových služeb inzeruje koncové šifrování. A je to pravda: obsah zpráv putuje šifrovaně, takže nikdo na cestě – dokonce ani poskytovatel služby – nemůže text během přenosu číst. Potud je tvrzení přesné.
Problém je, že obsah je jen částí příběhu. I když nikdo nemůže číst, co říkáte, služba zná jiné věci s velmi vysokou přesností: s kým mluvíte, v kolik hodin, jak často, z jaké přibližné polohy, na jakém zařízení, kolik zpráv odesíláte a kolik přijímáte, kolik souborů sdílíte. Tomu všemu se říká metadata. A metadata v mnoha případech vypovídají téměř tolik jako samotná zpráva.
Co metadata odhalují
Není třeba číst zprávu, abychom věděli mnoho věcí. Pokud někdo volá nebo píše onkologovi každé úterý v devět ráno po dobu šesti měsíců, není nutné poslouchat rozhovor, abychom tušili, co se děje. Pokud si dva lidé vymění sto zpráv denně a najednou s tím přestanou, není třeba číst žádnou, abychom pochopili, co se stalo. Pokud daňový poradce obdrží dvacet zpráv v řadě od stejného klienta noc před čtvrtletní uzávěrkou, vzorec mluví sám za sebe.
Metadata odhalují vzorce chování: kdo se s kým stýká, jaký má kdo rozvrh, kdy bdí, kdy spí, kdy cestuje, kteří klienti jsou nejaktivnější, které profesní vztahy jsou nejintenzivnější. Server, který sbírá metadata, může sestavit podrobný profil osobního i profesního života kteréhokoli uživatele, aniž by kdy přečetl jediné slovo z toho, co dotyčný píše.
Existuje historický příklad, který to ilustruje velmi tvrdě. Bývalý ředitel NSA Michael Hayden to v roce 2014 formuloval bez obalu: "We kill people based on metadata". Tvrzení se týkalo amerických vojenských operací proti cílům identifikovaným výhradně na základě jejich komunikačních vzorců. Ani jedna přečtená zpráva. Pouze graf kontaktů a časové údaje.
To, že služba sbírá metadata, neznamená nutně, že je použije proti svým uživatelům. Znamená to, že k tomu má schopnost a že třetí strana s přístupem k těmto údajům – na základě soudního příkazu, v důsledku narušení bezpečnosti nebo prodeje třetím stranám, pokud to podmínky služby umožňují – ji má také.
Přístup ke kontaktům
Další vektor, který prochází téměř bez povšimnutí: seznam kontaktů. Velká část messagingových služeb žádá při registraci o přístup k telefonnímu seznamu. Nahrají všechna čísla na svůj server, aby ukázaly, kdo další službu používá. Od té chvíle má společnost kompletní mapu vztahů uživatele, i když ten nikdy nikomu nenapsal jedinou zprávu.
Pro profesionála s profesním tajemstvím – právníka, lékaře, psychologa, poradce – tento seznam obsahuje klienty. Pokud byl seznam nahrán na server třetí strany, jména klientů jsou v infrastruktuře, jejíž jurisdikci a politiku profesionál nekontroluje. Profesní tajemství se neporuší v den, kdy někdo unikne konverzaci: bylo porušeno mnohem dříve, v okamžiku souhlasu s nahráním.
Rozdíl mezi šifrováním a nesbíráním
Šifrovat znamená chránit obsah. Být v soukromí znamená nesbírat to, co není potřeba. Jsou to odlišné věci a rozdíl je operativně kritický. Služba může všechny zprávy dokonale šifrovat a zároveň o svých uživatelích vědět téměř vše prostřednictvím metadat. Obě věci jsou dokonale kompatibilní. Ve skutečnosti je to dominantní obchodní model v odvětví.
Správná otázka pro posouzení skutečného soukromí služby nezní "šifruje obsah?". Tato otázka je považována za zodpovězenou již léta. Správná otázka zní: "jaká metadata generuje a kde se ukládají?". A především: "jaká metadata nepotřebuje generovat?".
Architektura, která minimalizuje metadata záměrně (by design) – nikoli slibem, nikoli interní politikou – je strukturálně soukromější než architektura, která je sbírá a šifruje. Protože data, která neexistují, nelze uniknout, prodat, předat na základě soudního příkazu ani ztratit při narušení bezpečnosti.
Pro profesionálního čtenáře
Pokud vaše profesní činnost zahrnuje tajemství, důvěrnost nebo prostě respekt k informacím třetích stran, je vhodné si položit otázky v tomto pořadí:
- Šifruje aplikace, kterou používám ke komunikaci, obsah? (Pravděpodobně ano.)
- Šifruje metadata? (Pravděpodobně ne.)
- Generuje metadata, která ke svému fungování nepotřebuje? (Téměř jistě ano.)
- Kde jsou tato metadata uložena a pod jakou jurisdikcí? (Pravděpodobně mimo Evropský hospodářský prostor.)
- Ví můj klient nebo pacient, že jsou tam jeho data?
Poslední otázka je ta nepříjemná. Protože upřímná odpověď ve většině případů zní, že ne.
Tento článek je první ze série o skutečném fungování profesionálních komunikačních nástrojů. Příští díly se budou věnovat souladu s GDPR v messagingu a konceptu profesního tajemství v digitální éře.
Zdroje a další čtení
- Hayden, M. – Prohlášení na Johns Hopkins University, 2014 ("We kill people based on metadata"). Veřejné přepisy k dispozici.
- GDPR (Nařízení EU 2016/679), čl. 4 a 5 – definice osobních údajů a zásady zpracování (metadata jsou osobní údaje).
- EDPS a EDPB – stanoviska k zpracování provozních údajů a metadat v elektronických komunikacích (směrnice ePrivacy).