Human Web ist eine Software, die in die Browser bzw. Browsererweiterungen von Cliqz und Ghostery eingebaut ist. Der Zweck ist der Aufbau von Statistiken, die wir als Treibstoff für unsere Produkte nutzen. Mit den kollektiv zusammengetragenen Statistiken finden wir heraus, welche Websites am besten zu Suchanfragen passen und decken gefälschte Websites und Tracker auf. So machen die Human-Web-Nutzer das Internet als Gemeinschaft zu einem besseren Ort. Die Teilnahme am Human Web ist freiwillig, du kannst es auch abschalten (Opt-out). Die Privacy-by-Design-Architektur der Human-Web-Technologie stellt sicher, dass sich in den Statistiken keinerlei Daten über einzelne Nutzer befinden. Die Anonymität der Nutzer ist stets vollständig gewährleistet und Tracking ausgeschlossen. Das ist nachprüfbar, denn der Softwarecode von Human Web ist öffentlich (Open Source).

Die Human Web Technologie verbindet Big Data, Internetsuche und Datenschutz auf innovative Weise.

Herkömmliche Suchmaschinen folgen einem rein technischen Ansatz, indem sie hauptsächlich Daten über Inhalte, Strukturierung und Vernetzung von Websites auswerten.

Cliqz setzt mit Human Web hingegen auf die „Weisheit der Masse”. Unsere Suchmaschine arbeitet mit strikt anonymen statistischen, kollektiv gesammelten Daten über Suchanfragen und Seitenbesuche, um die Relevanz von Websites einzustufen. Es wird auf statistischer Ebene auch gemessen, wie viele Klicks die Websitevorschläge in der Cliqz-Schnellsuche insgesamt bekommen. So erstellen wir das Ergebnisranking.

In den Human Web-Statistiken existieren keinerlei Daten, anhand der einzelne Nutzer oder Geräte identifiziert werden können. Die Daten sind nicht nur strikt anonym, sondern werden auch auf eine Weise erfasst, die eine De-Anonymisierung verhindert. So wird sichergestellt, dass das Human Web niemals etwas über die Web-Suchen und Websitebesuche einzelner Personen preisgibt. Tracking ist somit strikt ausgeschlossen.

Anonymität des Nutzers bleibt immer gewahrt

Um in jedem Fall die vollständige Anonymität des einzelnen Users zu gewährleisten, ist das Human Web so konzipiert, dass keinerlei Rückschlüsse auf Personen durch die Verknüpfung verschiedener Datenpunkte möglich sind. Dafür sorgen zwei Kernkomponenten: eine Rahmenstruktur zur Datensammlung und ein Proxy-Netzwerk.

Erstere stellt sicher, dass alle von Nutzern beigetragenen Datenpunkte nur als einzelnes zusammengeführtes Ereignis bewertet werden. Dadurch ist es unmöglich, Daten von mehreren Sucheingaben oder mehrfachen Seitenbesuchen zu verknüpfen. Auch lassen sich diese Informationen nicht mit irgendwelchen persönlichen Daten des Nutzers wie seiner E-Mail-Adresse verbinden. Zum Schutz deiner Privatsphäre bleiben zudem die Website-Besuchsstatistiken immer strikt von den statistischen Daten über Sucheingaben getrennt. Wir speichern keine Session-IDs oder sekunden- bzw. minutengenaue Zeitstempel. Wir erfassen auch keinerlei Informationen von besuchten Seiten, die irgendeine Art von Anmeldung benötigen. Unsere Human-Web-Technik filtert automatisch alle vertraulichen oder personenbezogenen Daten aus URLs heraus, die eine Identifizierung von Einzelpersonen erlauben (z. B. twitter.com/benutzername). Dazu setzt sie verschiedene heuristische und auf Maschinenlernen basierende Verfahren ein. Auf diese Weise vermeiden wir von Vornherein, dass solche Informationen überhaupt auf unseren Servern landen.

Nur Daten von URLs, die ein- sowie ausgeloggt den gleichen Inhalt haben, werden als „öffentlich“ erkannt und an das Human Web gesendet. URL-Teile, die persönliche Informationen enthalten könnten, werden vor der Übertragung entfernt.
Nur Daten von URLs, die ein- sowie ausgeloggt den gleichen Inhalt haben, werden als „öffentlich“ erkannt und an das Human Web gesendet. URL-Teile, die persönliche Informationen enthalten könnten, werden vor der Übertragung entfernt.

Die Übermittlung der Human-Web-Daten läuft komplett verschlüsselt über ein Proxy-Netzwerk. Dies stellt sicher, dass wir nichts über den Nutzer wissen, wenn die Daten uns erreichen, da das Proxy-Netzwerk die individuelle IP-Adresse des Users entfernt. Wir erhalten lediglich die IP-Adresse des Proxy-Netzwerks und können keine Nutzer daraus ableiten. Die Proxies selbst sind nicht in der Lage, die verschlüsselten Informationen zu lesen oder etwas darüber zu erfahren. Dadurch sind Absender und Inhalt vollständig voneinander getrennt. Das macht es uns sowie Dritten unmöglich, Nutzer und Nutzungsdaten je miteinander in Verbindung zu bringen. Eine nachträgliche De-Anonymisierung ist aufgrund der Art, wie wir Daten erfassen und speichern, ausgeschlossen.

Die IP-Adresse wird im Proxy-Netzwerk verschleiert, Cliqz sieht nur die Suchanfrage ohne jeglichen Personenbezug.
Die IP-Adresse wird im Proxy-Netzwerk verschleiert, Cliqz sieht nur die Suchanfrage ohne jeglichen Personenbezug.

Größtmögliche Transparenz

Wie alle in den Cliqz-Browser integrierten Funktionen ist auch Human Web quelloffen. Somit kann jeder den clientseitigen Softwarecode auf GitHub einsehen und mit ausreichend Fachwissen selbst prüfen. Unsere Software, unsere Infrastruktur sowie unsere Methoden zur Datensammlung werden zudem regelmäßig intern wie extern überprüft. An externen Gutachten waren unter anderem der TÜV Saarland, Mozilla, Forscher der Princeton University und RedTeam Pentesting beteiligt. Zusätzlich haben wir in unseren Browser ein Transparenz-Cockpit eingebaut, das einen Echtzeit-Überblick über die von deinem Endgerät an Cliqz übermittelten Daten gibt.

Indem du an Human Web teilnimmst, trägst du nicht nur zu besseren Website-Vorschlägen der Cliqz-Suche bei, sondern auch allgemein zu einem sichereren Internet. Die Teilnahme ist und bleibt jedoch freiwillig. Falls du dich dagegen entscheidest, anonyme Statistiken über deine Suchen und Website-Besuche zu übermitteln, kannst du dich jederzeit vom Human Web abmelden. Öffne dazu im Browser das Control Center (Q-Menü rechts neben der URL-Leiste) und stelle unter „Mehr Suchoptionen“ den Schalter bei „Am Human Web teilnehmen“ auf „AUS“. Auf Mobilgeräten findest du die Option unter dem Punkt „Human Web“ in den Browsereinstellungen.

Manche Webdienste wie eine Suchmaschine sind auf sehr große Datenmengen angewiesen, um zuverlässig zu funktionieren. Big Data und Datenschutz sind aber nicht zwingend unüberwindliche Gegensätze. Entscheidend ist, wie mit personenbezogenen Daten umgegangen wird. Im Gegensatz zu den meisten anderen Internetunternehmen beschränkt sich Cliqz ausschließlich auf anonyme statistische Daten ohne jeglichen Personenbezug. Das Human Web beweist, dass sich komplexe Systeme wie eine Websuche auch aufbauen und betreiben lassen, ohne die Privatsphäre der Nutzer zu gefährden.

Gemeinsam für ein sichereres Internet

Die Human-Web-Technologie wurde zunächst zur Indexierung des Internet für die Cliqz Schnellsuchmaschine entwickelt. Heute kommen Human Web auch zur Gewinnung von Statistiken zum Einsatz, mit denen wir Tracker und gefälschten Websites erkennen. Nutzer, die kollektiv und vollständig anonym zu den Statistiken beitragen, arbeiten also daran mit, das Internet für uns alle sicherer zu machen und unser aller Privatsphäre zu schützen.