Verstehen · B4 · 5 Stufen

Modelle, Token und DSGVO-Stufen

Welches Modell, welcher Datenschutz, welche Kosten? Die drei Stellgrößen, die Entscheider bei AuxData verstehen müssen — ohne Admin-Tiefe.

Worum es geht

AuxData ist modell-agnostisch: Hinter jedem Agenten steckt ein wählbares Sprachmodell. Welches Modell läuft, entscheidet über Datenschutz (DSGVO-Stufe), Fähigkeiten und Kosten (Token-Faktor). Dieses letzte Track-B-Tutorial macht diese drei Stellgrößen für Entscheider greifbar — und zeigt, wie man Verbrauch und Budget im Griff behält.

Wir bleiben bei der Muster GmbH. Es geht ums Verstehen und Entscheiden, nicht ums Administrieren — das vertieft Track D.

Quellen und Stand

Inhaltlich geprüft gegen das AuxData-Administrator-Handbuch (Stand Juni 2026), Kapitel 10 (LLM-Konfiguration, DSGVO-Stufen), 12 (DSGVO, Anonymisierung, Entitäten) und 13 (Nutzungsstatistiken, Token-Faktor). Modellbeispiele zusätzlich gegen offizielle Provider-Dokumentation geprüft am 02.06.2026.

Track B ist konzeptlastig: Statt Klickstrecken erklären wir die Plattform-Logik. Schematische Darstellungen veranschaulichen die Konzepte.

Stufe 1 von 5

Modelle & Provider

Ein Agent, ein wählbares Sprachmodell.

1Modell-agnostische Plattform

AuxData bindet viele LLM-Anbieter ein — OpenAI, Microsoft Azure, Mistral, Google, Anthropic, IONOS …

Jedes konkrete Modell hat Fähigkeiten (Text, Vision, Audio, Funktionsaufrufe/Tool-Use, DSGVO-konform), einen Token-Faktor (Kosten) und einen Standort (USA, EU, Deutschland). Aktuelle Beispiele sind u. a. OpenAI GPT-5.2/GPT-5.1/GPT-5 mini/nano, Claude Opus 4.8/Sonnet 4.6/Haiku 4.5, Gemini 3.1 Pro/Gemini 2.5, Mistral Medium 3.5, Mistral Large 3 und Mistral Small 4. (AH 10.1; Provider-Dokus Stand 02.06.2026)

Aktualitätsregel: Provider ändern Modellnamen laufend. Entscheidend ist nicht der Markenname, sondern die Kombination aus Fähigkeit, Standort/DSGVO-Stufe und Token-Faktor in deiner konkreten AuxData-Instanz.

2Freischalten und routen

Die Organisation entscheidet, welche Modelle in Agenten überhaupt wählbar sind. Über das Routing nutzt ein Agent pro Anfrage das passende Modell: ein günstiges „kurz & bündig" für einfache und ein starkes „Referatsmodus" für anspruchsvolle Antworten. (AH 10.2, 10.4)

Drei Stellgrößen pro Modell, die Entscheider kennen sollten: Fähigkeiten (kann es die Aufgabe?), Token-Faktor (was kostet es?) und Standort/DSGVO-Stufe (darf es die Daten sehen?).
✎ Denkaufgabe: Für welche Aufgaben in deiner Organisation reicht ein günstiges Modell — und wo braucht es das starke?

✓ Das solltest du jetzt können

Stufe 2 von 5

DSGVO-Stufen 0/1/2

Wie ein Modell mit personenbezogenen Daten umgehen darf.

1Drei Stufen des Datenschutzes

Jedes Modell trägt eine DSGVO-Stufe, die festlegt, wohin personenbezogene Daten fließen dürfen.

Stufe 0 — Nein
personenbezogene Daten landen auf unsicheren Drittanbieter-Servern (z. B. OpenAI in den USA).
Stufe 1 — Bedingt
mit Auftragsverarbeitungsvertrag und angemessenen Garantien (z. B. Microsoft mit Enterprise Data Protection).
Stufe 2 — Ja
rein DSGVO-konform (z. B. Microsoft Deutschland, Self-Hosted, IONOS).

Quelle: AH 10.2.

2Konformität erzwingen

In der Organisations-LLM-Konfiguration ist die DSGVO-Stufe pro Modell als Spalte sichtbar (✓ Ja, ~ Bedingt, ✗ Nein). Der Schalter „Immer DSGVO-konform handeln" zwingt jede Anfrage auf konforme Infrastruktur — unabhängig vom sonst gewählten Modell. (AH 10.2, 12.5)

Entscheider-Frage: Welche Datenarten dürfen das Haus überhaupt verlassen? Für personenbezogene Daten ist Stufe 2 der sichere Default.
Seite „Verfügbare KI-Modelle
B4-S01 · Organisations-LLM-Konfiguration: Modelle mit Token-Faktor, Fähigkeiten und Aktiv-Schalter
LLM-Konfiguration der Organisation (offizielle Abbildung aus dem Admin-Handbuch)
Offizielle Abbildung aus dem Admin-Handbuch (Kap. 10) — die LLM-Konfiguration der Organisation.
✎ Denkaufgabe: Welche Daten in deiner Organisation dürften ausschließlich auf einem Stufe-2-Modell verarbeitet werden?

✓ Das solltest du jetzt können

Stufe 3 von 5

Personenbezogene Daten schützen

Anonymisierung, automatische Erkennung und Abwehr.

1Anonymisierung

Der Anonymizer ersetzt personenbezogene Daten durch Platzhalter, bevor sie das Modell erreichen.

Aus Klarnamen, Adressen, E-Mails, Telefonnummern oder Bankverbindungen werden Platzhalter wie <Person>, <EMAIL> oder <PHONE>. Er arbeitet wortweise, um den Satzkontext zu erhalten; fällt das LLM aus, greift Microsoft Presidio als regelbasierter Fallback. Aktivierbar pro Agent (erzwungen), pro Workflow-Schritt oder per Cockpit-Schalter für die einzelne Anfrage. (AH 12.2)

2Automatik & Abwehr

Der GDPR-Analyzer bewertet jede Anfrage automatisch auf DSGVO-Relevanz und routet heikle Anfragen an ein konformes Modell. Optional prüft eine vorgeschaltete Defense-Schicht Eingaben und Antworten: Guard erkennt Prompt-Injection und Jailbreaks, Judge bewertet Halluzination und Toxizität, Spotlighting schreibt riskante Prompts um. (AH 12.4, 12.5)

LightRAG beachten: Der Wissensgraph speichert Personen und Beziehungen explizit — ein DSGVO-Risiko. Entitäten regelmäßig sichten, Falsch-Treffer löschen und LightRAG für sensible Container deaktivieren. (AH 12.6)
✎ Denkaufgabe: Für welchen eurer Anwendungsfälle würdest du die Anonymisierung pro Agent erzwingen?

✓ Das solltest du jetzt können

Stufe 4 von 5

Token & Token-Faktor

Wie Verbrauch gemessen und abgerechnet wird.

1Verbrauch in Tokens

Sprachmodelle rechnen in Tokens — kleinen Text-Einheiten.

Jeder Anbieter tokenisiert nach eigener Logik (OpenAI mit tiktoken, Anthropic mit dem Claude-Token-Counter usw.). Eingabe und Ausgabe zählen beide. (AH 10.3)

Aus Anwendersicht: Den Verbrauch sieht der Nutzer direkt im Chatfenster (Tankanzeige je Unterhaltung, BH 3.10); die Anonymisierung ist ein an der Eingabezeile schaltbares Werkzeug (BH 3.4). So werden die Admin-Stellgrößen aus B4 an der konkreten Oberfläche greifbar.

2Der Token-Faktor

Der gezählte Token-Wert wird mit dem Token-Faktor des Modells multipliziert — das ergibt die abgerechneten Tokens. Premium-Modelle kosten so ein Vielfaches eines Basis-Modells. (AH 10.3, 13.4)

Schnell & günstig
z. B. GPT-5 mini/nano, Claude Haiku 4.5, Gemini 2.5 Flash Lite, Mistral Small 4/Ministral — niedriger Faktor.
Ausgewogen
z. B. GPT-5.1, Claude Sonnet 4.6, Gemini 2.5 Flash, Mistral Medium 3.5 — mittlerer Faktor.
Stark / komplex
z. B. GPT-5.2/GPT-5.2 pro, Claude Opus 4.8, Gemini 3.1 Pro, Mistral Large 3 — hoher Faktor.
Bild / Video / Audio
z. B. GPT Image 1.5, Sora 2, Imagen/Gemini-Bildmodelle oder Realtime-/TTS-Modelle — oft eigene Abrechnungseinheiten.

Die Klassen ersetzen keine Preisliste. Richtwerte und Faktoren pflegt der Plattform-Manager in AuxData; öffentliche Provider-Preise und Modellnamen ändern sich regelmäßig.

Entscheider-Hebel: das starke Modell nur dort einsetzen, wo es nötig ist; einfache Anfragen per Routing aufs günstige Modell lenken. (AH 13.7)
✎ Denkaufgabe: Ein Modell mit Faktor 3,0 statt 1,0 verdreifacht die Kosten pro Token — für welche Aufgaben ist das gerechtfertigt?

✓ Das solltest du jetzt können

Stufe 5 von 5

Budget & Entscheidung

Verbrauch sehen, Limits setzen, richtig entscheiden.

1Verbrauch sichtbar machen

Die Nutzungsstatistik aggregiert den Token-Verbrauch monatlich — pro Benutzer und pro Agent.

Die Verwendungsübersicht zeigt Eingabe-, Ausgabe- und berechnete Tokens (inkl. Token-Faktor). So wird sichtbar, welche Anwendungsfälle besonders kostenintensiv sind. (AH 13.1, 13.2)

2Budgets setzen

Im Verbrauchsmanager der Organisation setzt man Tageslimits: pro Benutzer, pro Admin und für die gesamte Organisation. Wird ein Limit überschritten, erscheint im Cockpit eine Fehlermeldung; weitere Anfragen sind erst nach Anpassung oder am Folgetag möglich. (AH 13.3)

Ein Audit-Trail protokolliert u. a. Token-Verbrauch, Service-Ausführungen und Rechteänderungen — Nachweis für DSGVO-Audits und ISO-27001. (AH 12.8)

3Die Entscheidungshilfe

Datenschutz
DSGVO-Stufe nach Datenart wählen — für personenbezogene Daten Stufe 2.
Modell
Fähigkeit und Token-Faktor abwägen, Routing für günstig/stark nutzen.
Budget
Tageslimits setzen und monatlich die Top-Kostentreiber prüfen.

Track B abgeschlossen!

Du verstehst jetzt Modelle, DSGVO-Stufen, Anonymisierung, Token-Faktor und Budget — und damit AuxData als Plattform (B1–B4). Tiefer ins Verwalten geht Track D (Modelle & Budgets, DSGVO & Audit); ins Bauen Track C (Agenten, Wissen, Services, Workflows).

✎ Denkaufgabe: Lege für einen typischen Anwendungsfall fest: welche DSGVO-Stufe, welches Modell (günstig/stark) und welches Tageslimit?

✓ Das solltest du jetzt können

Kurz-Quiz

Sitzen Modelle, Token & DSGVO?

5 Fragen aus den Stufen 1–5. Kein Zertifikat — einfach zur Selbstkontrolle. Beliebig oft wiederholbar.

Frage 1 von 5
Lade Frage…