17/07/2024 6m read

GenAI-Sicherheit entmystifiziert – und wie Cato Ihnen hilft, den Zugriff Ihrer Organisation zu ChatGPT zu sichern

Vadim Freger
Vadim Freger

Inhaltsverzeichnis

Im vergangenen Jahr wurden unzรคhlige Artikel, Vorhersagen, Prophezeiungen und Warnungen รผber die Risiken von KI geschrieben, wobei GenAI (Generative AI) und ChatGPT im Mittelpunkt standen. Das Spektrum reicht von der Ethik bis hin zu weitreichenden Auswirkungen auf die Gesellschaft und Arbeitskrรคfte (โ€žNein, Mama, der Terminator wird erstmal nicht Wirklichkeit…“).
Die Vorhersagen und Befรผrchtungen haben Cato Security Research and Engineering so fasziniert, dass wir uns entschlossen haben, die Risiken von ChatGPT fรผr Unternehmen zu untersuchen. Unsere Ergebnisse lassen sich in mehreren zentralen Schlussfolgerungen zusammenfassen:

  1. Fรผr Unternehmen, die ChatGPT und รคhnliche Dienste nutzen, gibt es derzeit mehr Panikmache als reale Risiken.
  2. Die Produktivitรคtsvorteile รผberwiegen die Risiken bei weitem.
  3. Dennoch sollten Unternehmen Sicherheitskontrollen einrichten, um zu verhindern, dass ihre sensiblen und geschรผtzten Informationen in Tools wie ChatGPT verwendet werden, da sich die Bedrohungslage schnell รคndern kann.

Die untersuchten Bedenken

Der Datenschutzaspekt von ChatGPT und die zugrundeliegende GenAI-Technologie machen einen groรŸen Teil dieser Panikmache aus. ย Es geht darum, was genau mit den Daten geschieht, die in ChatGPT ausgetauscht werden, wie sie verwendet (oder nicht verwendet) werden um das Modell im Hintergrund zu trainieren, wie sie gespeichert werden (wenn sie gespeichert werden), und so weiter.

Problematisch ist das Risiko von Datenverlusten und Datenlecks in Bezug auf das geistige Eigentum des Unternehmens, wenn Benutzer mit ChatGPT interagieren. Typische Szenarien sind:

  • Mitarbeiter, die ChatGPT nutzen: Ein Benutzer lรคdt geschรผtzte oder vertrauliche Informationen auf ChatGPT hoch โ€“ z. B. ein Softwareentwickler, der einen Codeblock zur รœberprรผfung durch die KI hochlรคdt. Kรถnnte dieser Code spรคter durch Antworten (versehentlich oder bรถswillig) in andere Konten gelangen, wenn das Modell diese Daten zum weiteren Training verwendet?
    Spoiler: Dies ist unwahrscheinlich, und es wurden auch keine konkreten Beweise fรผr eine systematische Ausbeutung verรถffentlicht.

  • Datenverluste durch den Dienst selbst: Welches Risiko besteht fรผr eine Organisation, die ChatGPT nutzt, wenn OpenAI Datenleaks erleidet oder Benutzerdaten durch Fehler in ChatGPT offengelegt werden? Kรถnnten sensible Informationen auf diese Weise durchsickern?
    Spoiler: Mรถglicherweise, von OpenAI wurde mindestens ein รถffentlicher Vorfall gemeldet, bei dem einige Nutzer aufgrund eines Fehlers in der OpenAI-Infrastruktur Chat-Titel anderer Nutzer in ihrem Konto sehen konnten.

  • Proprietรคre GenAI-Implementierungen: KI verfรผgt bereits รผber ein eigenes MITRE-Angriffs-Framework, ATLAS, mit Techniken, die von Eingabemanipulation bis zu Datenexfiltration, Datenvergiftung, Inferenzangriffen usw. reichen. Kรถnnten die sensiblen Daten eines Unternehmens durch diese Methoden gestohlen werden?
    Spoiler: Ja, die Methoden reichen von harmlos รผber theoretisch bis hin zu praktisch, wie in einem kรผrzlich erschienenen Artikel von Cato Research zu diesem Thema beschrieben. Die Sicherung der proprietรคren Implementierung von GenAI ist nicht Gegenstand dieses Artikels.

Alles, was wir tun, birgt immer ein Risiko. Auch im Internet besteht ein Risiko, aber das hรคlt Milliarden von Nutzern nicht davon ab, es jeden Tag zu nutzen. Man muss nur die entsprechenden VorsichtsmaรŸnahmen treffen. Das Gleiche gilt fรผr ChatGPT.ย  Zwar sind einige Szenarien wahrscheinlicher als andere, aber wenn man das Problem vom praktischen Standpunkt aus betrachtet, kann man einfache Sicherheitskontrollen einfรผhren, um sich keine Sorgen zu machen.

Everything You Wanted To Know About AI Security But Were Afraid To Ask | Watch the Webinar

GenAI-Sicherheitskontrollen

Diese Anwendungsfรคlle sind in einer modernen SASE-Architektur, die CASB und DLP als Teil der Plattform enthรคlt, leicht zu handhaben. Die Plattform von Cato tut genau das: Sie bietet einen mehrschichtigen Ansatz, um zu gewรคhrleisten, dass ChatGPT und รคhnliche Anwendungen innerhalb des Unternehmens verwendet werden:

  1. Kontrollieren Sie, welche Anwendungen erlaubt sind und welche Benutzer/Gruppen diese Anwendungen nutzen dรผrfen.
  2. Kontrollieren Sie, welche Texte/Daten รผbermittelt werden dรผrfen
  3. Anwendungsspezifische Optionen werden durchgesetzt, z.B. Ablehnung der Vorratsdatenspeicherung, Mandatenkontrolle etc.

Der erste Ansatz besteht darin, festzulegen, welche KI-Anwendungen zulรคssig sind und welche Nutzergruppen sie verwenden dรผrfen. Dies kann durch eine Kombination aus der Anwendungskategorie โ€žGenerative KI-Werkzeuge“ und den spezifischen Werkzeugen, die zugelassen werden sollen, erfolgen, z.B. indem alle GenAI-Werkzeuge gesperrt werden und nur โ€žOpenAI“ zugelassen wird.

Ein weiterer Baustein fortschrittlicher DLP-Lรถsungen ist die Fรคhigkeit, Daten zuverlรคssig zu klassifizieren. Die bisherigen Ansรคtze des exakten Datenabgleichs, der statischen Regeln und der regulรคren Ausdrรผcke sind fรผr sich genommen nahezu รผberholt. Beispielsweise wรคre das Blockieren einer Kreditkartennummer mit einem regulรคren Ausdruck einfach, aber in realen Szenarien mit Finanzdokumenten gibt es viele andere Mรถglichkeiten, wie sensible Informationen nach auรŸen gelangen kรถnnen. Ohne eine fortschrittliche Lรถsung, die einfach funktioniert, wรคre es nahezu unmรถglich, mit den sich รคndernden Daten und der Feinabstimmung der Richtlinien Schritt zu halten.

Glรผcklicherweise ist das genau der Punkt, an dem die ML (Machine Learning) Data Classifiers von Cato ins Spiel kommen. Dies ist die neueste Ergรคnzung der bereits umfangreichen KI/ML-Funktionalitรคt, die Cato im Laufe der Jahre in die Plattform integriert hat. Unser hauseigenes LLM (Large Language Model), das an Millionen von Dokumenten und Datentypen trainiert wurde, kann Dokumente in Echtzeit identifizieren und ist damit das perfekte Werkzeug fรผr solche Richtlinien.
Betrachten wir das Szenario, in dem bestimmte Texteingaben mit ChatGPT blockiert werden, z.B. das Hochladen von vertraulichen oder sensiblen Daten รผber die Eingabeaufforderung. Angenommen, ein Mitarbeiter der Rechtsabteilung entwirft eine Geheimhaltungsvereinbarung (Non Disclosure Agreement, NDA) und gibt sie vor der Fertigstellung an ChatGPT weiter, damit dieser sie durchsieht, Verbesserungsvorschlรคge macht oder auch nur die Grammatik รผberprรผft. Dies kรถnnte natรผrlich einen VerstoรŸ gegen die Datenschutzbestimmungen des Unternehmens darstellen, insbesondere wenn das Dokument personenbezogene Daten enthรคlt.

Abbildung 1 – Beispielregel, die ML-Klassifikatoren verwendet, um das Hochladen von Rechtsdokumenten zu blockieren

Lassen Sie uns noch tiefer eintauchen

Wir wollen einen weiteren Aspekt der Datenschutzkontrollen von ChatGPT untersuchen, um die Leistungsfรคhigkeit und Flexibilitรคt einer umfassenden CASB-Lรถsung weiter zu demonstrieren. In den Einstellungen gibt es eine Option zum Deaktivieren von โ€žChat-Verlauf & Training“. Damit kann der Benutzer entscheiden, dass seine Daten nicht fรผr das Training des Modells verwendet und auf den Servern von OpenAI gespeichert werden sollen.
Diese wichtige Datenschutzkontrolle ist standardmรครŸig deaktiviert, d.h. standardmรครŸig werden alle Chats von OpenAI gespeichert, sodass die Benutzer entscheiden mรผssen, was ihre Organisation bei allen arbeitsbezogenen Aktivitรคten mit ChatGPT vermeiden sollte.

Abbildung 2 – ChatGPTs Datenkontrollkonfiguration

Ein guter Weg, um ein Gleichgewicht zwischen der Flexibilitรคt der Benutzer bei der Nutzung von ChatGPT und einer strengeren Kontrolle zu erreichen, ist es, nur Chats in ChatGPT zuzulassen, bei denen der Chat-Verlauf deaktiviert ist. Die granulare ChatGPT-Anwendung von Catos CASB ermรถglicht diese Flexibilitรคt, indem sie in Echtzeit erkennt, ob ein Benutzer fรผr den Chat freigeschaltet ist, und die Verbindung blockiert, bevor Daten gesendet werden.

Abbildung 3 – Beispielregel fรผr die Durchsetzung des โ€žTrainings-Opt-outs“

Alternativ (oder ergรคnzend) zum obigen Ansatz ist es mรถglich, Mandantenkontrolle fรผr den ChatGPT-Zugriff zu konfigurieren, d.h. zu erzwingen, welche Konten auf die Anwendung zugreifen dรผrfen. Ein mรถgliches Szenario ist, dass eine Organisation Unternehmenskonten bei ChatGPT hat, wo sie voreingestellte Sicherheits- und Datenkontrollrichtlinien fรผr alle Mitarbeiter durchgesetzt hat, und sicherstellen mรถchte, dass die Mitarbeiter nicht mit ihren persรถnlichen Konten auf das kostenlose ChatGPT-Angebot zugreifen.

Abbildung 4 – Beispielregel fรผr die Mandantenkontrolle

Um mehr รผber CASB und DLP von Cato zu erfahren, besuchen Sie:

Related Topics

Vadim Freger

Vadim Freger

Vadim Freger fungiert als Director of Service Evangelism bei Cato und setzt sich dort dafรผr ein, Catos Ruf als fรผhrendes SASE- und Cybersicherheitsunternehmen zu fรถrdern. Mit รผber sieben Jahren Erfahrung bei Cato war Vadim zuvor als Director of DevOps und SRE tรคtig und spielte eine entscheidende Rolle bei der Gestaltung und Weiterentwicklung der globalen Cloud-Services und -Operationen von Cato. Bevor er zu Cato kam, hatte Vadim verschiedene Managementpositionen bei Imperva inne und verfรผgte รผber insgesamt 15 Jahre Erfahrung in den Bereichen Netzwerk- und Cybersicherheit.

Read More