Die ProzessWerkstatt - Der Podcast für Automatisierung, Prozesse & KI in Fertigung, Handwerk und B2B-Mittelstand.

Die ProzessWerkstatt - Der Podcast für Automatisierung, Prozesse & KI in Fertigung, Handwerk und B2B-Mittelstand.

Transkript

Zurück zur Episode

00:00:00: Eine kurze Shorty-Folge zum Feiertag, wenn

00:00:04: du das jetzt heute hörst. Und zwar ist mir eben der Gedanke gekommen,

00:00:08: wie man lokale KI-Modelle zur Anonymisierung

00:00:11: nutzen kann und dann anschließend direkt in

00:00:15: öffentliche Modelle reinzugehen, ja

00:00:19: einfach sensible Daten auch weiterverarbeiten zu können. Wie gesagt, hier die Folge.

00:00:23: Muss man wirklich genau beachten, wie man das macht, aber du

00:00:27: könntest damit auf jeden Fall die Möglichkeit schaffen,

00:00:31: schnelle öffentliche Modelle zu nutzen, die Ausarbeitung zu machen

00:00:34: und mit einem komplett lokal laufenden Modell, was auf deinem PC sitzt,

00:00:38: eine Anonymisierung der Daten vornehmen. Also du kannst die Daten im

00:00:42: Vorfeld anonymisieren und im Nachgang de-anonymisieren.

00:00:46: Und wie ich da jetzt bei mir konkret vorgegangen bin, da geht es einen Website-Umzug

00:00:50: von einem Kunden, wo wir von einem anderen Website-Anbieter

00:00:53: zu einem neuen wechseln müssen und da sind relativ viele

00:00:57: Codes dabei. Und jetzt bin ich in mein lokales

00:01:01: Olama-Modell gegangen. Also ich habe mir Olama runtergeladen, habe

00:01:04: auf dem olama gamma 4 e 4 b

00:01:08: installiert das ist ein komplett lokales modell von Google

00:01:11: und da habe ich jetzt die komplette anfrage reingegeben und habe

00:01:16: den kollegen gebeten das ganze zu anonymisieren

00:01:19: und ja der ganze Part hat 19, 1

00:01:23: Sekunden gedauert, hat jetzt alles abgeändert in

00:01:27: Platzhalter, wie zum Beispiel sehr geehrter Empfänger, Ansprechpartner, Vielen Dank

00:01:30: und so weiter. Also die E-Mail komplett, Beendigungsdatum zum

00:01:34: Datum End, Outcode, Transfercode und so weiter und so fort.

00:01:38: Und unten drunter die kompletten DNS-Settings hat er

00:01:42: einmal komplett abgeändert in eine Tabelle,

00:01:46: die mit Platzhaltern gedeckelt ist. Und jetzt kann ich

00:01:49: diese Struktur nehmen und kann mit dieser Struktur in ein anderes

00:01:53: Sprachmodell reingehen, wie zum Beispiel Cloud Code und habe dort die

00:01:57: Möglichkeit zu sagen, alles klar, wunderbar, nutze bitte diesen

00:02:01: Plan oder diese Idee und erstelle mir einen kompletten Umzugsplan

00:02:05: Schritt für Schritt. Das ist jetzt ein einfaches Beispiel. Aber so

00:02:08: könntest du rein theoretisch vorgehen, wenn du mit

00:02:12: sensiblen Daten hantierst und nicht willst, dass diese Daten irgendwo

00:02:16: in die Öffentlichkeit kommen. Jetzt musst du allerdings hier darauf achten, sensible Daten hat

00:02:19: ja immer mehrere Punkte. Du kannst ja auf der einen Seite sagen, sensible Daten sind

00:02:23: irgendwo Namen, Adressen, sensible Kundendaten, die du

00:02:27: irgendwo aus dem CRM rausziehst. Sensible Daten können aber beispielsweise

00:02:31: auch irgendwelche Zeichnungsdaten sein. Habe ich jetzt auch bei einem Kunden, der

00:02:35: seinen 2D-Bereich oder 2D-3D-Bereich bearbeiten

00:02:39: will und die müssen natürlich mit ihren Zeichnungen aufpassen. Das ist dann

00:02:42: wiederum ein bisschen schwierig, aber für reine Textbearbeitung, Wenn du zum Beispiel

00:02:46: ein Steuerberater, eine Kanzlei bist oder sonst

00:02:49: irgendwas in dem Bereich oder ein Arzt, der mit

00:02:53: sensiblen Personendaten arbeitet, dann kannst du diesen

00:02:56: kleinen Workaround wunderbar nutzen, a

00:03:00: die Kraft 1 lokalen Modells zu nutzen, dass die Daten halt bei dir

00:03:04: in dem eigenen Bereich bleiben und auf der anderen Seite

00:03:08: b ein öffentliches Modell mit der Performance, mit dem Know-how, mit der Geschwindigkeit

00:03:12: nutzen, die komplette Ausarbeitung durchzuführen und alles das, was du jetzt

00:03:15: ausgearbeitet hast, spuckst du nachher wieder in das lokale

00:03:19: Modell rein und sagst wunderbar, hier ist die Ausarbeitung, bitte diese

00:03:23: wieder de-anonymisieren. Und damit hast du den Bogen gespannt

00:03:26: zwischen du hast die kompletten sensiblen Daten bei dir lokal

00:03:30: verwaltet, hast die Ausarbeitung auf einem externen Modell gemacht, was halt

00:03:34: von der Performance her besser ist und hast das Ganze nachher wieder zurück gespielt und

00:03:37: hast einen Plan, der zu 100 Prozent,

00:03:41: ja ich sag mal DSGVO-konform verarbeitet wurde, weil du

00:03:45: nichts davon nach außen gegeben hast. Auch da wieder der Hinweis, ich bin

00:03:48: kein Rechtskanzler oder kein Jurist, ich darf dir da keine Rechtsberatung

00:03:52: zu dem Thema DSGVO, Datenschutz und Co. Geben, aber wenn du da mal Fragen hast,

00:03:56: habe ich auch jemanden im Netzwerk, der sich damit wunderbar auskennt.

00:04:00: Also von daher, wenn du genau dieses Problem hast und

00:04:04: dich immer wieder fragst, wie kriege ich das hin, meine sensiblen Daten auch

00:04:07: verarbeiten zu können, da auch KI nutzen zu können, dann nutze einfach

00:04:11: diesen Workaround und wenn du nicht genau weißt, wie du das Ganze einrichten sollst, denn

00:04:14: hier dieses System habe ich so wie es ist schon bei mehreren Kunden installiert. Das

00:04:17: dauert eine halbe Stunde ungefähr. Lass es vielleicht eine Stunde dauern.

00:04:21: Dann gehe unten auf den Link oder gehe auf www.prozesswerkstatt.com.

00:04:26: Buche dir ein kostenfreies Erstgespräch bei mir und wir schauen uns diese Situation bei

00:04:30: dir im Unternehmen an und kriegen das Thema hin. In diesem Sinne

00:04:33: noch einen schönen Feiertag, ein schönes langes Wochenende. Bis dann, dein Felix.