Modelle und Token-Budgets steuern
Track D ist der Betreiber-Track. In D3 schaltest du als Org-Admin Modelle frei, erzwingst DSGVO-Konformität, setzt Budgets im Verbrauchsmanager und findest Kostenausreißer.
Was du danach steuern kannst
Du bist Org-Admin der Muster GmbH. Du schaltest Modelle für die Agenten frei (u. a. für den in Track C gebauten Helpdesk-Assistenten), erzwingst Datenschutz-Konformität, setzt Verbrauchslimits im Verbrauchsmanager und findest in der Nutzungsstatistik die Kostentreiber. Die Admin-Ansichten zeigen wir als Konfigurations-Mockups.
Voraussetzung: Track B zum Verständnis empfohlen (insb. B4) und die Rolle Org-Admin (Modelle freischalten, Budgets setzen). Fehlen die Reiter „Verbrauchsmanager“ oder „LLM-Konfiguration“, Rechte bzw. die Plattform-Manager-Zuständigkeit der Instanz prüfen.
Quellen und Stand
Geprüft gegen das AuxData-Administrator-Handbuch Kap. 10 (LLM-Konfiguration) und 13 (Nutzungsstatistiken), DSGVO-Bezug aus 12.5/12.8. Modell- und Token-Faktor-Beispiele gegen die Provider-Dokus (OpenAI/Anthropic/Google/Mistral) Stand 01.06.2026. Keine statische Preisliste — Modellklassen und Token-Faktoren pflegt der Plattform-Manager in der Instanz.
LLM-Konfiguration: Modelle freischalten
Drei Ebenen der LLM-Infrastruktur — und welche du als Org-Admin steuerst.
1Die drei Ebenen
Die LLM-Infrastruktur hat drei Ebenen — als Org-Admin steuerst du vor allem Ebene 3. (AH 10.1, 10.2)
- Provider
- Zugangsdaten der Anbieter (OpenAI, Microsoft Azure, Mistral, Google, Anthropic, IONOS, Perplexity, OpenHippo).
- Modelle
- konkrete Modelle mit Fähigkeiten und Token-Faktor.
- Freischaltung pro Organisation
- welche Modelle in den Agenten wählbar sind — deine Hauptstellgröße.
2Verfügbare LL-Modelle (Kachel-Ansicht)
Filter nach Name & Provider, Status und Fähigkeit; je Karte ein Toggle, der das Modell für deine Organisation aktiv/inaktiv schaltet. (AH 10.1)

3Organisations-LLM-Konfiguration (Bulk-Tabelle)
Für Bulk-Arbeit der Tabellen-Reiter mit Spalten Aktiv, Provider, Name, Tokenfaktor, DSGVO, Standort und Fähigkeiten. Speichern schreibt alle Checkbox-Änderungen in einem Rutsch. (AH 10.2)
🧠 Für Profis: Projekt-Freigabe — zwei Stolperfallen
✓ Das hast du jetzt verwaltet
DSGVO-Stufen 0/1/2 steuern
Die ✓/~/✗-Spalte lesen — und Konformität erzwingen.
1Die DSGVO-Spalte
In der Organisations-LLM-Konfiguration ist DSGVO/Standort eine eigene Spalte: ✓ (Ja), ~ (Bedingt), ✗ (Nein). Dahinter stehen drei Stufen. (AH 10.2)
- Stufe 0 — Nein (✗)
- personenbezogene Daten landen auf unsicheren 3rd-Party-Servern (z. B. OpenAI USA).
- Stufe 1 — Bedingt (~)
- mit DPA und angemessenen Garantien (z. B. Microsoft mit Enterprise Data Protection).
- Stufe 2 — Ja (✓)
- rein DSGVO-konform (z. B. Microsoft Deutschland, Self-Hosted, IONOS).
2Konformität erzwingen
Diese Stufe steuert den Schalter „Immer DSGVO-konform handeln“ im Organisations-Editor. Ist er aktiv, wird jede Anfrage auf DSGVO-konforme Infrastruktur gezwungen. (AH 10.2)
Ergänzend bewertet der interne GDPR-Analyzer (AH 12.5) jede Anfrage auf DSGVO-Relevanz und routet heikle Anfragen an ein konformes Modell — der Org-Schalter „Immer DSGVO-konform handeln“ überschreibt diese Prüfung und erzwingt Konformität generell.
✓ Das hast du jetzt geprüft
Token-Faktor & Berechnung
Wie aus gezählten Tokens abgerechnete Tokens werden.
1Tokenisierung und Faktor
Jeder Provider tokenisiert eigen: OpenAI tiktoken, Google nativer Tokenizer, Mistral eigene Implementierung, Anthropic Claude-Token-Counter. (AH 10.3)
Der gezählte Token-Wert wird mit dem Token-Faktor des Modells multipliziert = abgerechnete Tokens. Ein Premium-Modell mit Faktor 2,5 kostet pro Token also ein Vielfaches eines Basis-Modells. (AH 13.4)
Derselbe Rohverbrauch wirkt sich je nach Faktor sehr unterschiedlich auf das Budget aus.
2Modellklassen statt Preisliste
Keine statische Preisliste — nutze Modellklassen als Grobabschätzung (typische Verhältnisse aus AH 13.4; offizielle Provider-Dokus Stand 01.06.2026):
- Schnell & günstig
(Faktor ~0,3–0,5) - z. B. GPT-5 nano / GPT-5 mini, Claude Haiku 4.5, Gemini 3.1 Flash-Lite oder Gemini 2.5 Flash-Lite, Mistral Small 4 / Ministral 3.
- Ausgewogen
(Faktor ~1,0–1,5) - z. B. GPT-5.1 / GPT-5.2 je nach Instanz, Claude Sonnet 4.5/4.6, Gemini 3 Flash / Gemini 2.5 Flash, Mistral Medium 3.5.
- Stark / komplex
(Faktor ~2,5–3,0) - z. B. GPT-5.2 pro / GPT-5 pro, Claude Opus 4.8, Gemini 3.1 Pro, Mistral Large 3.
- Bild / Video
(Faktor 3,0+ bzw. 5,0+) - eigene Einheiten, z. B. GPT Image 1.5 / gpt-image-1-mini, Gemini Nano Banana / Imagen 4, Sora 2 oder Veo 3.1 pro Bild bzw. Sekunde.
✓ Das hast du jetzt verwaltet
Nutzungsstatistik lesen
Wer und welcher Agent verbraucht wie viel?
1Nutzungsstatistik der Organisation
Unter Einstellungen → Nutzungsstatistik wird der Token-Verbrauch monatlich aggregiert, aufgeschlüsselt nach Benutzer und Agent. (AH 13.1)

2Benutzer-, Agenten- und Verwendungsübersicht
Benutzer-Nutzung (je Benutzer): Benutzer, Info/Status, Verbrauch, Budget, Quote (%), Restbudget. Agenten-Nutzung (zweite Tabelle): Agent + Verbrauch — zeigt, welche Anwendungsfälle besonders kostenintensiv sind.
Für Schnell-Checks die Verwendungsübersicht (AH 13.2): Filter Monat/Jahr; Zusammenfassung mit Total Calls, Sum Input Tokens, Sum Output Tokens, Sum Calculated Tokens (inkl. Token-Faktor und Overhead). Detailtabelle je Anfrage: Timestamp, Tokens, Input, Output, Calculated (mit Token-Faktor).

✓ Das hast du jetzt geprüft
Budgets & Verbrauchsmanager
Tageslimits setzen — und Monatslogik einordnen.
1Reiter „Verbrauchsmanager“
Im Organisations-Editor, Reiter Verbrauchsmanager, setzt du laut AH 13.3 Tageslimits. AH 9.1 beschreibt denselben Reiter teils als monatliche Token-Limits — die Beschriftung und Abrechnungslogik deiner Instanz entscheidet. (AH 9.1/13.3)

0 heißt UNBEGRENZT, nicht „kein Verbrauch": Die Felder zeigen „0 = deaktiviert". Deaktiviert bedeutet hier: kein Limit — also unbegrenzter Verbrauch ohne Stopp, nicht etwa eine Sperre. Wer Kosten wirklich begrenzen will, muss bewusst einen Wert größer als 0 setzen; 0 stehen zu lassen öffnet das Budget vollständig. (AH 13.3; an der Instanz gegenprüfen)2Konsequenz beim Überschreiten
Überschreitet ein Benutzer sein Limit, bekommt er im Cockpit eine Fehlermeldung; weitere Anfragen sind erst nach Budgetanpassung oder am nächsten passenden Zeitraum möglich. Überschreitet die Organisation das Gesamtlimit, sind alle Benutzer betroffen. Individuelle Budgets je Benutzer erscheinen wieder in der Benutzer-Nutzung (Quote/Restbudget, AH 13.1).
✓ Das hast du jetzt eingerichtet
Kostenkontrolle in der Praxis
Ausreißer finden, behandeln — und nachweisbar machen.
1Ausreißer finden und behandeln
Good Practice (AH 13.7): monatliche Reviews im Admin-Meeting — die Top-3-Kostentreiber besprechen.
Hoher Verbrauch bei einem Agenten → Service-Optimierung: Prompts kürzen, Chunk-Limit senken, günstigeres Modell für einfache Anfragen per Routing (siehe Stufe 1 und Agent-Editor). Transparenz für Benutzer: Endnutzer sehen ihren Verbrauch pro Chat im Cockpit-Reiter Einstellungen — kommunizieren, dass kurze Prompts Budget schonen.
2Wo finde ich was (FAQ)
- Welcher Agent kostet am meisten?
- Agenten-Nutzung in der Nutzungsstatistik.
- Wer übertrifft sein Budget?
- Benutzer-Nutzung, Quote-Spalte.
- Verbrauch über Monate?
- Export der letzten 3–6 Monate per API / BI-Auswertung.
- Wie teuer ist Bildnutzung?
- Detailtabelle der Nutzungsanalyse, Filter nach Agent/Service.
3Audit-Bezug
AuxData schreibt automatisch Audit-Logs u. a. für Token-Verbrauch, Service-Ausführungen, Rechte-/Rollenwechsel und Änderungen an der Organisations-Konfiguration (also auch Modell-Freischaltungen und Budget-Änderungen). Diese Logs dienen als Nachweis in DSGVO-Audits und ISO-27001-Zertifizierungen — Budget- und Modell-Entscheidungen sind damit nachvollziehbar. (AH 12.8)
Modelle und Budgets im Griff!
Du steuerst jetzt als Org-Admin die Modell-Freischaltung, die DSGVO-Stufen, den Token-Faktor-Effekt, die Nutzungsstatistik und die Budgets der Muster GmbH — und findest Kostenausreißer. Mach das Quiz und geh dann weiter zu D4 — DSGVO, Anonymisierung und Audit absichern.
✓ Das hast du jetzt verwaltet
Sitzt das Steuern von Modellen & Budgets?
6 Fragen aus den Stufen 1–6. Kein Zertifikat — zur Selbstkontrolle. Beliebig oft wiederholbar.