Cliqz- und Ghostery-Nutzer tragen mit anonymen statistischen Daten dazu bei, die Relevanz und Sicherheit von Webseiten zu bewerten. Damit machen sie das Web zu einem besseren Ort.

Unser Suchalgorithmus stuft als relevant ein, was viele Menschen relevant finden (Grafik: Cliqz)
Cliqz stuft als relevant ein, was viele Menschen relevant finden.

Was erwartest du von einer Suchmaschine? Dass sie dir genau die Websites vorschlägt, die am besten zu deiner Suchanfrage passen. Entscheidend ist die Relevanz. Um diese zu ermitteln, werden sehr viele Daten benötigt. Die von uns selbst entwickelte Technologie, die diese Daten erhebt und daraus einen Web-Index aufbaut, nennen wir Human Web.

Herkömmliche Suchmaschinen folgen einem rein technischen Ansatz, indem sie hauptsächlich Daten über Inhalte, Strukturierung und Vernetzung von Websites auswerten. Der Suchalgorithmus von Cliqz setzt hingegen auf die „Weisheit der Masse“, also das Verhalten von Menschen im Web. Er arbeitet mit anonymen statistischen Daten über Suchanfragen und Seitenbesuche, um die Relevanz von Websites einzustufen und auf dieser Basis ein Ergebnisranking zu erstellen.

Bessere Suchergebnisse und ein sichereres Internet

Die Gemeinschaft der Cliqz- und Ghostery-Nutzer trägt mit ihren über Human Web erfassten Statistikdaten direkt dazu bei, die Relevanz und Sicherheit von Internetseiten zu bewerten. Auf diese Weise verbessert jeder Human-Web-Teilnehmer die Suche für alle anderen User und macht das Web insgesamt zu einem sichereren Ort. Dabei bleibt die Privatsphäre jedes Einzelnen gewahrt. Unserem Leitprinzip Privacy by Design folgend speichert Cliqz keinerlei personenbezogene Informationen, anhand derer du oder dein Endgerät identifizierbar wären. Darin unterscheiden wir uns grundsätzlich von anderen Suchanbietern, die umfassende Profile über ihre Nutzer anlegen.

Die Human-Web-Technologie erfasst ausschließlich statistische Web-Traffic-Daten wie Website-Adressen (URLs) und Verweildauer auf einzelnen Seiten, die die Gesamtheit der Nutzer besucht. Getrennt von den Web-Traffic-Daten speichert Cliqz, was die Gesamtheit der Nutzer im Web sucht und was sie in die Browserzeile eingibt.

Anonymität des Nutzers bleibt immer gewahrt

Um in jedem Fall die vollständige Anonymität des einzelnen Users zu gewährleisten, ist das Human Web so konzipiert, dass keinerlei Rückschlüsse auf Personen durch die Verknüpfung verschiedener Datenpunkte möglich sind. Dafür sorgen zwei Kernkomponenten: eine Rahmenstruktur zur Datensammlung und ein Proxy-Netzwerk.

Erstere stellt sicher, dass alle von Nutzern beigetragenen Datenpunkte nur als einzelnes zusammengeführtes Ereignis bewertet werden. Dadurch ist es unmöglich, Daten von mehreren Sucheingaben oder mehrfachen Seitenbesuchen zu verknüpfen. Auch lassen sich diese Informationen nicht mit irgendwelchen persönlichen Daten des Nutzers wie seiner E-Mail-Adresse verbinden. Zum Schutz deiner Privatsphäre bleiben zudem die Website-Besuchsstatistiken immer strikt von den statistischen Daten über Sucheingaben getrennt. Wir speichern keine Session-IDs oder sekunden- bzw. minutengenaue Zeitstempel. Wir erfassen auch keinerlei Informationen von besuchten Seiten, die irgendeine Art von Anmeldung benötigen. Unsere Human-Web-Technik filtert automatisch alle vertraulichen oder personenbezogenen Daten aus URLs heraus, die eine Identifizierung von Einzelpersonen erlauben (z. B. twitter.com/benutzername). Dazu setzt sie verschiedene heuristische und auf Maschinenlernen basierende Verfahren ein. Auf diese Weise vermeiden wir von Vornherein, dass solche Informationen überhaupt auf unseren Servern landen.

Nur Daten von URLs, die ein- sowie ausgeloggt den gleichen Inhalt haben, werden als „öffentlich“ erkannt und an das Human Web gesendet. URL-Teile, die persönliche Informationen enthalten könnten, werden vor der Übertragung entfernt.
Nur Daten von URLs, die ein- sowie ausgeloggt den gleichen Inhalt haben, werden als „öffentlich“ erkannt und an das Human Web gesendet. URL-Teile, die persönliche Informationen enthalten könnten, werden vor der Übertragung entfernt.

Die Übermittlung der Human-Web-Daten läuft komplett verschlüsselt über ein Proxy-Netzwerk. Dies stellt sicher, dass wir nichts über den Nutzer wissen, wenn die Daten uns erreichen, da das Proxy-Netzwerk die individuelle IP-Adresse des Users entfernt. Wir erhalten lediglich die IP-Adresse des Proxy-Netzwerks und können keine Nutzer daraus ableiten. Die Proxies selbst sind nicht in der Lage, die verschlüsselten Informationen zu lesen oder etwas darüber zu erfahren. Dadurch sind Absender und Inhalt vollständig voneinander getrennt. Das macht es uns sowie Dritten unmöglich, Nutzer und Nutzungsdaten je miteinander in Verbindung zu bringen. Eine nachträgliche Deanonymisierung ist aufgrund der Art, wie wir Daten erfassen und speichern, ausgeschlossen.

Die IP-Adresse wird im Proxy-Netzwerk verschleiert, Cliqz sieht nur die Suchanfrage ohne jeglichen Personenbezug.
Die IP-Adresse wird im Proxy-Netzwerk verschleiert, Cliqz sieht nur die Suchanfrage ohne jeglichen Personenbezug.

Größtmögliche Transparenz

Wie alle in den Cliqz-Browser integrierten Funktionen ist auch Human Web quelloffen. Somit kann jeder den clientseitigen Softwarecode auf GitHub einsehen und mit ausreichend Fachwissen selbst prüfen. Unsere Software, unsere Infrastruktur sowie unsere Methoden zur Datensammlung werden zudem regelmäßig intern wie extern überprüft. An externen Gutachten waren unter anderem der TÜV Saarland, Mozilla, Forscher der Princeton University und RedTeam Pentesting beteiligt. Zusätzlich haben wir in unseren Browser ein Transparenz-Cockpit eingebaut, das einen Echtzeit-Überblick über die von deinem Endgerät an Cliqz übermittelten Daten gibt.

Indem du an Human Web teilnimmst, trägst du nicht nur zu besseren Website-Vorschlägen der Cliqz-Suche bei, sondern auch allgemein zu einem sichereren Internet. Die Teilnahme ist und bleibt jedoch freiwillig. Falls du dich dagegen entscheidest, anonyme Statistiken über deine Suchen und Website-Besuche zu übermitteln, kannst du dich jederzeit vom Human Web abmelden. Öffne dazu im Browser das Control Center (Q-Menü rechts neben der URL-Leiste) und stelle unter „Mehr Suchoptionen“ den Schalter bei „Am Human Web teilnehmen“ auf „AUS“. Auf Mobilgeräten findest du die Option unter dem Punkt „Human Web“ in den Browsereinstellungen.

Manche Webdienste wie eine Suchmaschine sind auf sehr große Datenmengen angewiesen, um zuverlässig zu funktionieren. Big Data und Datenschutz sind aber nicht zwingend unüberwindliche Gegensätze. Entscheidend ist, wie mit personenbezogenen Daten umgegangen wird. Im Gegensatz zu den meisten anderen Internetunternehmen beschränkt sich Cliqz ausschließlich auf anonyme statistische Daten ohne jeglichen Personenbezug. Das Human Web beweist, dass sich komplexe Systeme wie eine Websuche auch aufbauen und betreiben lassen, ohne die Privatsphäre der Nutzer zu gefährden.