PRISM: Exabyte, Zettabyte oder Yottabyte?
Die aktuelle Berichterstattung zu dem Überwachungsprogramm PRISM ist in mancher Hinsicht äußerst kurios: Da wird mit unglaublichen Datenmengen um sich geworfen. Exabytes reichen dafür schon gar nicht mehr aus. Laut einigen Berichten soll das Volumen bei mehreren Zettabytes liegen – oder sogar in die Yottabytes gehen. Doch wie plausibel sind diese Zahlen?
Zum Vergleich: Microsoft speichert für seine 400 Millionen Nutzer von Outlook.com nach eigenen Angaben in Summe ungefähr 200 Petabyte – also 0,2 Exabyte. Ein Zettabyte entspricht demnach dem 5.000-fachen Volumen von Outlook.com. Gefühlt ist das sehr viel.
Interessanter ist die Betrachtung der Kosten für die Speicherung dieser Datenmengen. Der Benchmark für günstigen Offline-Speicher ist Amazon Glacier. Dort kostest das Gigabyte genutzter Speicher pro Jahr 0,12 USD (ohne Mehrwertsteuer). Oder umgekehrt: Mit einem jährlichen Budget von einer Million USD bekommt man bei Amazon 8,3 Petabyte Speicherkapazität.
Bei dieser Kalkulation sind zwei Dinge zu beachten: Erstens sollte man Amazon eine Gewinnerzielungsabsicht unterstellen, so dass die tatsächlichen Kosten niedriger liegen. Zweitens könnte PRISM für die Speicherung neu-entwickelte Verfahren verwenden, die der freien Wirtschaft nicht zur Verfügung stehen. Es ist daher denkbar, dass PRISM auf gleichem Raum wesentlich höhere Volumina speichert. Unwahrscheinlich ist hingegen, dass solche Verfahren Kosten-effizienter sind, solange es keinen signifikanten Markt dafür gibt.
Meine konservative Kostenabschätzung liegt bei 20 Petabyte Speicherkapazität pro Million USD. Umgekehrt liegt das jährliche Budget für die Internetüberwachung der US-amerikanischen Geheimdienste laut mehreren Medienberichten bei 5 Milliarden USD. Würde also das komplette Budget in die Speicherkapazitäten investiert werden, so würde man damit lediglich 100 Exabyte erhalten. Die von einigen Stellen genannten fünf Zettabyte sind damit vollkommen absurd – ganz zu schweigen von Yottabytes.
Sollte die NSA also wirklich verdachtsunabhängig Daten von Bürgern in großen Maße sammeln, so würde ich realistisch betrachtet von einem Gesamtvolumen ausgehen, das zwischen 5 und 50 Exabyte liegt. Alles darüber hinaus ist nicht nur vom Volumen sondern insbesondere auch von den Kosten einfach nicht mehr plausibel.