Warum die Welt Cliqz braucht

Warum ist es wichtig und wie ist es möglich, die Art zu verändern, wie Daten von Nutzern gesammelt werden? Antworten auf diese und weitere Fragen erhielt die Tech-Community bei einem Meetup in München.

Björn GreifRedakteur

Unter dem Motto „Why the world needs Cliqz“ („Warum die Welt Cliqz braucht“) haben wir vergangenen Donnerstag die Tech-Community zu einem Meetup in unsere Münchener Büroräume eingeladen. In entspannter Atmosphäre konnten sich die Besucher ausgiebig über die Produkte, Projekte und Philosophie von Cliqz informieren. Im Zentrum standen die Fragen, welche Technologien Cliqz einsetzt, warum wir dies tun und wie die technische Umsetzung genau aussieht. Bei leckerem Essen und kühlen Getränken gab es auch reichlich Gelegenheit, sich auszutauschen.

Du hast die Veranstaltung verpasst oder möchtest dir alle Vorträge nochmals ansehen? Kein Problem! Auf unserer Facebook-Seite findest du eine Aufzeichnung des Livestreams.

Suche + Browser + Datenschutz = Cliqz

In seinem einleitenden Vortrag warf Jean-Paul Schmetz, Gründer und Geschäftsführer von Cliqz, zunächst einen Blick zurück in die Zeit, in der das World Wide Web noch „offen, anonym und – auf positive Weise – hässlich“ war. Über die Jahre gab es verschiedene dominierende Browser, angefangen von Mosaic über Netscape, Internet Explorer, Firefox bis hin zu Chrome. Warum sollte es also nicht möglich sein, die heute marktbeherrschende Stellung von Chrome zu durchbrechen?

Diese Stellung verdankt Google vor allem der Tatsache, dass es als erstes erkannte, welch ungeheures Geschäftspotenzial in der Suche steckt und dass dafür ein Browser benötigt wird, weil er als Hauptvertriebskanal für die Suche dient. Um seine Suche vor äußeren Einflüssen abzuschotten, baute Google schließlich Chrome. Im Grunde dienen alle seine Services und Produkte nur einem Zweck: seine Suche und damit seine Haupteinnahmequelle zu schützen.

Cliqz-Gründer Jean-Paul Schmetz erläuterte unter anderem, wie Google so dominant werden konnte.
Cliqz-Gründer Jean-Paul Schmetz erläuterte unter anderem, wie Google so dominant werden konnte.

Als wir bei Cliqz mit der Entwicklung einer Suchmaschine begannen, war uns ebenfalls schnell klar, dass wir zusätzlich einen eigenen Browser brauchen, um nicht auf Gedeih und Verderb von Partnern abhängig zu sein. Nach einer sehr erfolgreichen Erweiterung für Firefox entwickelten wir daher eine eigene Firefox-Fork sowie später Mobilbrowser für Android und iOS. Uns war zudem klar, dass wir quasi als Startkapital Webtraffic-Daten benötigen, um einen Suchmaschinenindex aufzubauen. „Wir waren jedoch überrascht und schockiert, dass man alles über jeden erfahren kann, wenn man nur bereit ist, für Daten einen bedeutenden Geldbetrag auszugeben“, so Schmetz.

Aus dieser erschreckenden Erkenntnis resultierte die Entscheidung, den Cliqz Browser mit einer auf Künstlicher Intelligenz (KI) basierenden Anti-Tracking-Technologie auszustatten und alle Erweiterungen zu blockieren, um die Daten und Privatsphäre unserer Nutzer zu schützen. Mit unserer Philosophie, bei allem was wir tun, zuerst an die Nutzer zu denken, unterscheidet sich Cliqz von den Konzernen, die das Internet heute beherrschen und das Web nach ihren Interessen und denen der Werbeindustrie gestalten.

Eine andere Art Ökosystem

Wie mächtig Konzerne wie Google, Facebook, Apple, Amazon und Microsoft geworden sind, verdeutlichte Cliqz-Produktmanagerin Oleksandra Karpovych zu Beginn ihres Vortrags „Designing a different kind of ecosystem“. Die Marktkapitalisierung der „Big Five“ übersteigt mit 3,76 Billionen Dollar inzwischen das Bruttoinlandsprodukt Deutschlands (3,68 Billionen Dollar). Nur die USA, China und Japan haben ein höheres Bruttoinlandsprodukt. Der Suchmarkt hat einen Gesamtwert von 92,4 Milliarden Dollar, von denen allein Google rund 90 Prozent abschöpft. Eine solche den Wettbewerb einschränkende Marktmacht erreichte Google, indem es seine Nutzer mit vermeintlich kostenlosen Diensten an sein Ökosystem bindet. Letztlich bezahlen die User jedoch mit ihren privaten Daten, die für die Konzerne bares Geld wert sind, weil sie zur Erstellung detaillierter Profile für Werbezwecke dienen.

Wir bei Cliqz wollen natürlich auch Geld verdienen, aber auf ethische Weise. Wir haben ein Geschäftsmodell entwickelt, bei dem die Privatsphäre der Nutzer respektiert wird. Anders als Google und Co speichert Cliqz Nutzerdaten nicht zentral auf Servern in Profilen. Stattdessen haben wir die Datenaggregation komplett auf die Client-Seite verlagert. So bleiben alle personenbezogenen Daten stets lokal auf dem Gerät und unter der Kontrolle des Nutzers. Auf unseren Servern speichern wir ausschließlich anonyme Statistiken, anhand derer sich keine Einzelpersonen identifizieren oder Profile erstellen lassen.

Dieser Ansatz bildet die Grundlage für alle Cliqz-Produkte und -Funktionen (z.B. die anonyme Schnellsuchmaschine) sowie für unser DSGVO-konformes Geschäftsmodell MyOffrz. Letzteres zeigt direkt im Browser für den Nutzer relevante Angebote an. Es vereint erstmals hypergranulares Targeting mit konsequentem Datenschutz.

Der Produktüberblick von Oleksandra umfasste auch das Geschäftsmodell MyOffrz.
Der Produktüberblick von Oleksandra umfasste auch das Geschäftsmodell MyOffrz.

Datengestütztes Anti-Tracking

Der Schutz der Daten unserer Nutzer steht auch im Zentrum der Anti-Tracking-Technologie von Cliqz und Ghostery. Sie verhindert, dass Drittanbieter-Tracker Nutzer quer durchs Netz verfolgen, um ihre Surfgewohnheiten zu überwachen. Sam Macbeth, Software-Entwickler im Cliqz Privacy Team, lieferte in seinem Vortrag „Data-Driven Anti-tracking“ einen tieferen technischen Einblick in die Methoden der Tracker und verschiedene Anti-Tracking-Maßnahmen.

Einfache Gegenmaßnahmen wie das Blockieren von Drittanbieter-Cookies führen oft nicht zum gewünschten Erfolg und häufig dazu, dass Website-Funktionen gestört werden. Daher verfolgt Cliqz Anti-Tracking einen heuristischen Ansatz: Es filtert Datenwerte heraus, die eine Identifizierung des Nutzers erlauben, überschreibt sie mit einem generischen Platzhalter und sendet diese Information zurück an die Tracker. Vorteil dieser Methode ist, dass sie seltener Website-Funktionen einschränkt und auch vor Fingerprinting sowie neuartigen Tracking-Verfahren schützt. Wie der intelligente Tracking-Schutz von Cliqz im Detail funktioniert, kannst du in einem englischsprachigen Techblog-Artikel nachlesen.

Sam zeigte, was der Tracking-Schutz von Cliqz und Ghostery täglich leistet.
Sam zeigte, was der Tracking-Schutz von Cliqz und Ghostery täglich leistet.

Transparenz rund um die Machenschaften von Trackern bieten Cliqz und Ghostery mit der Website WhoTracks.me. Sie liefert strukturierte Informationen zu Tracking-Techniken, Marktstrukturen und dem Datenaustausch im Internet. Dort findest du unter anderem Antworten auf die Fragen, welche Websites dich am stärksten ausforschen, welche Tracker am weitesten verbreitet sind oder welche Unternehmen hinter welchen Trackern stecken. Die unter der Creative-Commons-Lizenz frei verfügbaren WhoTracks.me-Daten umfassen Statistiken zu über 1000 Trackern, 1800 Websites und 1700 Tracker-Domains.

Was den Cliqz Browser besonders macht

Über die Besonderheiten der Cliqz Browser, die für Windows, Mac, Android und iOS zum kostenlosen Download bereitstehen, informierten die Software-Entwickler Alexander Komarnitskiy und Naira Sahakyan. Alle Versionen basieren auf Open-Source-Browsertechnologien: Die Desktop-Ausgabe setzt wie die iOS-App auf Firefox auf. Gleiches wird künftig auch für die Android-Variante gelten, die derzeit noch Lightning als technische Basis nutzt. Der Softwarecode sämtlicher Cliqz-Anwendungen ist ebenfalls Open Source und damit für jeden öffentlich auf GitHub einsehbar.

Alexander und Naira stellten die Cliqz Browser und ihre Besonderheiten vor.
Alexander und Naira stellten die Cliqz Browser und ihre Besonderheiten vor.

Als Mehrwert bieten die Cliqz Browser diverse Privatsphäre- und Sicherheitsfunktionen (Anti-Tracking, Anti-Phishing, HTTPS Everywhere) sowie nützliche Zusatzfeatures. Zu letzteren zählen ein Werbeblocker, ein Video Downloader, ein automatischer Vergessenmodus (Inkognitomodus), die P2P-basierte Synchronisierungsfunktion Connect sowie die anpassbare Neue-Tab-Seite Cliqz Tab mit Direktlinks zu meistbesuchten bzw. favorisierten Websites und kuratierten Nachrichten. Natürlich ist standardmäßig auch die hauseigene anonyme Schnellsuchmaschine an Bord, die noch während der Eingabe der Suchanfrage passende Webseiten-Vorschläge liefert. Auf Mobilgeräten werden diese auf intelligent designten Karten angezeigt, was Zeit und Datenvolumen spart: Einfach tippen, Vorschlag auswählen oder weiterwischen.

Kurze Geschichte der Cliqz-Suche

Einen Überblick über die Funktionsweise und die technischen Grundlagen der Cliqz-Suchmaschine gab abschließend Alexandra Konrad, Software-Entwicklerin im Cliqz Search Core Team. Oberste Prämisse bei der Entwicklung der eigenständigen Suchmaschine war und ist es, die Nutzer bzw. ihre Privatsphäre zu respektieren und somit auf Tracking zu verzichten. Dieser Ansatz unterscheidet sich grundlegend von dem der heute dominierenden Suchmaschinen. Allen voran Google sammelt über seine Suche und seine anderen Dienste Unmengen an Nutzerdaten, die es verknüpft und zu umfassenden Profilen verarbeitet. Auf Basis dieser auf Servern gespeicherten Nutzerprofile zeigt es personalisierte Ergebnisse und Suchwerbung an.

Alexandra erklärte, was der entscheidende Vorteil der Cliqz-Suche ist.
Alexandra erklärte, was der entscheidende Vorteil der Cliqz-Suche ist.

Cliqz verzichtet hingegen auf solche zentral gespeicherten Profile, da sie schlicht nicht nötig sind, um Nutzern je nach Kontext die relevantesten Ergebnisse zu präsentieren. Denn schon durch Anwendung simpler Statistik und verschiedener Ranking-Faktoren lässt sich die Ergebnisreihenfolge optimieren. Stark vereinfacht ausgedrückt: Die für eine bestimmte Suchanfrage am häufigsten aufgerufene URL ist das beste Ergebnis. Sogar eine auf individuelle Nutzer zugeschnittene Auswahl von Websitevorschlägen ist möglich. Dies lässt sich komplett auf der Client-Seite realisieren. So sind auch personalisierte Ergebnisse unter Wahrung der Privatsphäre möglich.

Statt manuell angepasste Algorithmen kommen für die Cliqz-Suche verstärkt Maschinenlernverfahren zum Einsatz, um den rund 6 TByte großen kompilierten Index nach den passendsten Ergebnissen für eine Anfrage zu durchforsten. In 90 Prozent der Fälle liegen die Resultate innerhalb von 100 Millisekunden vor. Das Such-Backend läuft aktuell auf drei Servern parallel und kann bis zu 200 Anfragen pro Sekunde beantworten. Das System ist hochskalierbar: auf sieben Servern lassen sich bis zu 1500 Anfragen pro Sekunde verarbeiten.

Die Cliqz-Schnellsuche zeigt immer die drei relevantesten Ergebnisse an. Da dies bei manchen Suchanfragen aber nicht ausreicht, arbeiten wir derzeit an einer klassischen Suchergebnisseite (SERP) mit mehr Resultaten. Ebenfalls noch in der Entwicklung ist ein Unified Index, der mehrere Sprachen unterstützt, um für jedes Land die passendsten Ergebnisse liefern zu können.

Fazit

Wo Daten massenhaft gesammelt und zentral auf Servern gespeichert werden, gibt es immer (unerwünschte) Nebeneffekte mit negativen Auswirkungen auf die Privatsphäre. In Zeiten des Internets der Dinge ist dies ein riesiges Problem. Denn schon heute stecken Sensoren und Prozessoren in allen möglichen Alltagsgegenständen, z.B. in Autos, Kühlschränken oder Kleidung. Es darf einfach nicht sein, dass all diese Minicomputer „nach Hause telefonieren“ wie es Tracker heutzutage von nahezu jeder Webseite tun.

„Wenn wir dieses Problem nicht schon im Browser lösen, gibt es wenig Chancen, dass wir es in der realen Welt lösen können“, so Cliqz-Gründer Jean-Paul Schmetz. „Und wir müssen es im Browser lösen (bzw. in der mobilen Welt im Betriebssystem), weil die Lösung höchstwahrscheinlich auch auf das Internet der Dinge anwendbar ist.“ Allerdings sei die Lösung nicht von Unternehmen wie Google oder Facebook zu erwarten, die am meisten von dem Problem profitierten, und ebenso wenig von Leuten, deren Umsätze von diesen Unternehmen abhingen. Der Lösungsansatz von Cliqz ist die Client-seitige Datenaggregation, bei der alle personenbezogenen Daten auf dem Gerät, im Besitz und unter der Kontrolle des Nutzers bleiben.


CLIQZ FÜR MOBILE