Verwalten · D3 · 6 Stufen

Modelle und Token-Budgets steuern

Track D ist der Betreiber-Track. In D3 schaltest du als Org-Admin Modelle frei, erzwingst DSGVO-Konformität, setzt Budgets im Verbrauchsmanager und findest Kostenausreißer.

Was du danach steuern kannst

Du bist Org-Admin der Muster GmbH. Du schaltest Modelle für die Agenten frei (u. a. für den in Track C gebauten Helpdesk-Assistenten), erzwingst Datenschutz-Konformität, setzt Verbrauchslimits im Verbrauchsmanager und findest in der Nutzungsstatistik die Kostentreiber. Die Admin-Ansichten zeigen wir als Konfigurations-Mockups.

Voraussetzung: Track B zum Verständnis empfohlen (insb. B4) und die Rolle Org-Admin (Modelle freischalten, Budgets setzen). Fehlen die Reiter „Verbrauchsmanager“ oder „LLM-Konfiguration“, Rechte bzw. die Plattform-Manager-Zuständigkeit der Instanz prüfen.

Abgrenzung zu B4: B4 hat das Konzept Modell / Token / DSGVO-Stufe eingeführt. D3 vertieft die Org-Steuerung: welche Modelle die Organisation freischaltet, wie Konformität erzwungen und wie Budgets gesetzt werden. Anonymizer und Audit-Trail vertieft danach D4, das organisationsweite Monitoring D5.

Quellen und Stand

Geprüft gegen das AuxData-Administrator-Handbuch Kap. 10 (LLM-Konfiguration) und 13 (Nutzungsstatistiken), DSGVO-Bezug aus 12.5/12.8. Modell- und Token-Faktor-Beispiele gegen die Provider-Dokus (OpenAI/Anthropic/Google/Mistral) Stand 01.06.2026. Keine statische Preisliste — Modellklassen und Token-Faktoren pflegt der Plattform-Manager in der Instanz.

Stufe 1 von 6

LLM-Konfiguration: Modelle freischalten

Drei Ebenen der LLM-Infrastruktur — und welche du als Org-Admin steuerst.

1Die drei Ebenen

Die LLM-Infrastruktur hat drei Ebenen — als Org-Admin steuerst du vor allem Ebene 3. (AH 10.1, 10.2)

Provider: Zugangsdaten der Anbieter (OpenAI, Microsoft Azure, Mistral, Google, Anthropic, IONOS, Perplexity, OpenHippo).
Modelle: konkrete Modelle mit Fähigkeiten und Token-Faktor.
Freischaltung pro Organisation: welche Modelle in den Agenten wählbar sind — deine Hauptstellgröße.

2Verfügbare LL-Modelle (Kachel-Ansicht)

Filter nach Name & Provider, Status und Fähigkeit; je Karte ein Toggle, der das Modell für deine Organisation aktiv/inaktiv schaltet. (AH 10.1)

Verfügbare LL-ModelleOrganisations-LLM-KonfigurationProvider

Filter & Modell-Karte

SucheName & Provider (Freitext)

Modell oder Provider suchen …

Fähigkeits-Filter

DSGVO-konformTextverarbeitungCodeverarbeitungFunktionsaufrufeComputer-VisionBildgenerierungAudio-TranskriptionAudio/TTSVideo-Erstellung

Karte: Modell AProvider · Standort EU · Token-Faktor 1,0

aktiv

Karte: Modell BProvider · Standort USA · Token-Faktor 2,5

inaktiv

Echte Seite „Verfügbare KI-Modelle — D3-S01 · „Verfügbare KI-Modelle" an der Demo-Instanz (Token-Faktoren + Aktiv-Schalter je Modell)

3Organisations-LLM-Konfiguration (Bulk-Tabelle)

Für Bulk-Arbeit der Tabellen-Reiter mit Spalten Aktiv, Provider, Name, Tokenfaktor, DSGVO, Standort und Fähigkeiten. Speichern schreibt alle Checkbox-Änderungen in einem Rutsch. (AH 10.2)

Verfügbare LL-ModelleOrganisations-LLM-Konfiguration

Modelle für die Organisation freischalten

Günstiges Standard-Modell„kurz & bündig“ · Faktor ~0,4 · DSGVO ✓

aktiv

Starkes Standard-Modell„Referatsmodus“ · Faktor ~2,5 · DSGVO ✓

aktiv

Speichern

schreibt alle Änderungen in die Datenbank

Best Practice (AH 10.4): mindestens zwei Standard-Modelle freischalten — ein günstiges und ein starkes — und das Routing im Agent-Editor pro Anfrage das Passende wählen lassen. Konkrete Provider-Modellnamen sind Beispiele und gegen die Instanz zu prüfen; entscheidend sind Fähigkeit, Standort/DSGVO-Stufe und Token-Faktor.

Zweite Stellgröße — „Für Projekte verfügbar": Neben „Aktiv" hat jedes Modell eine zweite Checkbox, die bestimmt, welche org-aktiven Modelle Endanwendern in der Projekt-Modellauswahl angeboten werden. Deaktivierst du ein Modell org-weit, wird die Projekt-Freigabe automatisch mitentfernt; bei Reaktivierung startet es wieder als „nicht freigegeben". Sind keine Modelle freigegeben, sieht der Endanwender einen Hinweisdialog. (AH 10.2)

🧠 Für Profis: Projekt-Freigabe — zwei Stolperfallen

Die zweite Checkbox „Für Projekte verfügbar“ wirkt unabhängig von „Aktiv“ und entscheidet, welche org-aktiven Modelle Endanwender in der Projekt-Modellauswahl sehen. Zwei Verhaltensweisen überraschen im Alltag: (1) Deaktivierst und reaktivierst du ein Modell, startet es wieder als „nicht für Projekte freigegeben“ — die Freigabe musst du bewusst neu setzen. (2) Beim Anlegen einer neuen Organisation werden alle DSGVO-konformen aktiven Modelle automatisch org-aktiv und projektfreigegeben — danach frei anpassbar. (AH 10.2)

✎ Übung: Welche Fähigkeiten braucht der Helpdesk-Assistent der Muster GmbH wirklich (Text? Tool-Use? Vision?) — und welche nicht?

✓ Das hast du jetzt verwaltet

Ich kenne die drei Ebenen und steuere die Freischaltung pro Organisation.

Ich habe zwei Modelle (ein günstiges, ein starkes) aktiv gesetzt und gespeichert.

Stufe 2 von 6

DSGVO-Stufen 0/1/2 steuern

Die ✓/~/✗-Spalte lesen — und Konformität erzwingen.

1Die DSGVO-Spalte

In der Organisations-LLM-Konfiguration ist DSGVO/Standort eine eigene Spalte: ✓ (Ja), ~ (Bedingt), ✗ (Nein). Dahinter stehen drei Stufen. (AH 10.2)

Stufe 0 — Nein (✗): personenbezogene Daten landen auf unsicheren 3rd-Party-Servern (z. B. OpenAI USA).
Stufe 1 — Bedingt (~): mit DPA und angemessenen Garantien (z. B. Microsoft mit Enterprise Data Protection).
Stufe 2 — Ja (✓): rein DSGVO-konform (z. B. Microsoft Deutschland, Self-Hosted, IONOS).

2Konformität erzwingen

Diese Stufe steuert den Schalter „Immer DSGVO-konform handeln“ im Organisations-Editor. Ist er aktiv, wird jede Anfrage auf DSGVO-konforme Infrastruktur gezwungen. (AH 10.2)

Organisations-Editor → Datenschutz

Immer DSGVO-konform handelnzwingt jede Anfrage auf konforme Infrastruktur

an

GDPR-Analyzerbewertet jede Anfrage auf DSGVO-Relevanz

routet heikle Anfragen an ein konformes Modell

Ergänzend bewertet der interne GDPR-Analyzer (AH 12.5) jede Anfrage auf DSGVO-Relevanz und routet heikle Anfragen an ein konformes Modell — der Org-Schalter „Immer DSGVO-konform handeln“ überschreibt diese Prüfung und erzwingt Konformität generell.

Wenn personenbezogene Daten im Spiel sind: mindestens ein Stufe-2-Modell als Default freischalten und „Immer DSGVO-konform handeln“ durchsetzen (AH 10.4). Sonst können personenbezogene Daten über ein Stufe-0-Modell auf unsichere Drittanbieter-Server gelangen.

Bei neuer Organisation: Alle DSGVO-konformen aktiven Modelle werden automatisch org-aktiv und für Projekte freigegeben — der Org-Admin passt danach an. Das erklärt, warum bei einer frischen Organisation schon Modelle „an" sind. (AH 10.2)

✎ Übung: Welche der freigeschalteten Modelle der Muster GmbH dürfen personenbezogene Daten verarbeiten — und welche nur für anonymisierte/öffentliche Inhalte?

✓ Das hast du jetzt geprüft

Ich habe geprüft, ob ein Stufe-2-Modell (✓) aktiv ist.

„Immer DSGVO-konform handeln“ ist gesetzt.

Stufe 3 von 6

Token-Faktor & Berechnung

Wie aus gezählten Tokens abgerechnete Tokens werden.

1Tokenisierung und Faktor

Jeder Provider tokenisiert eigen: OpenAI tiktoken, Google nativer Tokenizer, Mistral eigene Implementierung, Anthropic Claude-Token-Counter. (AH 10.3)

Der gezählte Token-Wert wird mit dem Token-Faktor des Modells multipliziert = abgerechnete Tokens. Ein Premium-Modell mit Faktor 2,5 kostet pro Token also ein Vielfaches eines Basis-Modells. (AH 13.4)

Derselbe Rohverbrauch wirkt sich je nach Faktor sehr unterschiedlich auf das Budget aus.

2Modellklassen statt Preisliste

Keine statische Preisliste — nutze Modellklassen als Grobabschätzung (typische Verhältnisse aus AH 13.4; offizielle Provider-Dokus Stand 01.06.2026):

Schnell & günstig (Faktor ~0,3–0,5): z. B. GPT-5 nano / GPT-5 mini, Claude Haiku 4.5, Gemini 3.1 Flash-Lite oder Gemini 2.5 Flash-Lite, Mistral Small 4 / Ministral 3.
Ausgewogen (Faktor ~1,0–1,5): z. B. GPT-5.1 / GPT-5.2 je nach Instanz, Claude Sonnet 4.5/4.6, Gemini 3 Flash / Gemini 2.5 Flash, Mistral Medium 3.5.
Stark / komplex (Faktor ~2,5–3,0): z. B. GPT-5.2 pro / GPT-5 pro, Claude Opus 4.8, Gemini 3.1 Pro, Mistral Large 3.
Bild / Video (Faktor 3,0+ bzw. 5,0+): eigene Einheiten, z. B. GPT Image 1.5 / gpt-image-1-mini, Gemini Nano Banana / Imagen 4, Sora 2 oder Veo 3.1 pro Bild bzw. Sekunde.

Richtwerte, kein Preis: Diese Faktoren dienen der Grobabschätzung; die konkreten Faktoren pflegt der Plattform-Manager in AuxData. Provider-Modelle, Aliase, Preise und Verfügbarkeit ändern sich regelmäßig — maßgeblich ist die in deiner Instanz freigeschaltete Modellliste plus aktuelle Provider-Doku.

✎ Übung: Wie viele abgerechnete Tokens entstehen aus 1.000 gezählten Tokens bei Faktor 0,4 vs. 2,5 — und was heißt das fürs Tagesbudget?

✓ Das hast du jetzt verwaltet

Ich verstehe, dass abgerechnete Tokens = gezählte Tokens × Token-Faktor.

Ich habe die Tokenfaktor-Spalte geprüft und teure Modelle (Faktor ≥ 2,5) bewusst nur dort freigeschaltet, wo nötig.

Stufe 4 von 6

Nutzungsstatistik lesen

Wer und welcher Agent verbraucht wie viel?

1Nutzungsstatistik der Organisation

Unter Einstellungen → Nutzungsstatistik wird der Token-Verbrauch monatlich aggregiert, aufgeschlüsselt nach Benutzer und Agent. (AH 13.1)

NutzungsstatistikVerwendungsübersicht

Zeitraum & Nutzungsübersicht

Zeitraum

Monat (1–12)JahrAbrufen

Summary · Volume-basiertgegen Instanz prüfen

Summe Tokens verbraucht · Token-Budget gesamt · Verbrauchsquote (%) · Token-Restbudget

Summary · Lizenz-basiertgegen Instanz prüfen

Summe Tokens (informativ) · Lizenzierte Anwender · verbrauchte Tokenpakete

Echte Nutzungsstatistik der Organisation, Reiter Nutzungsübersicht: Summe Tokens verbraucht, Token-Budget gesamt, Verbrauchsquote und Restbudget; per-Benutzer-Reiter bewusst nicht gezeigt — D3-S04 · Nutzungsstatistik (Reiter „Nutzungsübersicht") an der Demo-Instanz — Aggregat ohne personenbezogene Daten

2Benutzer-, Agenten- und Verwendungsübersicht

Benutzer-Nutzung (je Benutzer): Benutzer, Info/Status, Verbrauch, Budget, Quote (%), Restbudget. Agenten-Nutzung (zweite Tabelle): Agent + Verbrauch — zeigt, welche Anwendungsfälle besonders kostenintensiv sind.

Für Schnell-Checks die Verwendungsübersicht (AH 13.2): Filter Monat/Jahr; Zusammenfassung mit Total Calls, Sum Input Tokens, Sum Output Tokens, Sum Calculated Tokens (inkl. Token-Faktor und Overhead). Detailtabelle je Anfrage: Timestamp, Tokens, Input, Output, Calculated (mit Token-Faktor).

Abrechnungsmodell unterscheiden: Volume-basiert rechnet über ein Token-Budget; lizenz-basiert über aktive Anwender / Tokenpakete. Welches gilt, hängt von der Instanz ab — gegen Instanz prüfen.

Nutzungsanalyse eines Agenten (offizielle Abbildung aus dem Admin-Handbuch) — Offizielle Abbildung aus dem Admin-Handbuch (Kap. 13) — die Nutzungsanalyse je Agent (Verbrauch pro Anwendungsfall), ergänzend zur org-weiten Statistik oben.

✎ Übung: Welcher Agent der Muster GmbH verursacht den meisten Verbrauch — und liegt das an Faktor, Anfragezahl oder langen Prompts?

✓ Das hast du jetzt geprüft

Aktuellen Monat abgerufen.

Top-Verbraucher (Agenten-Nutzung) und höchste Quote (Benutzer-Nutzung) abgelesen.

Stufe 5 von 6

Budgets & Verbrauchsmanager

Tageslimits setzen — und Monatslogik einordnen.

1Reiter „Verbrauchsmanager“

Im Organisations-Editor, Reiter Verbrauchsmanager, setzt du laut AH 13.3 Tageslimits. AH 9.1 beschreibt denselben Reiter teils als monatliche Token-Limits — die Beschriftung und Abrechnungslogik deiner Instanz entscheidet. (AH 9.1/13.3)

StammdatenDatenschutzVerbrauchsmanager

Tageslimits (Zeitraum gegen Instanz prüfen)

Max. Verbrauch pro Benutzer pro Tag

aus Monatsverbrauch (Stufe 4) ableiten

Max. Verbrauch für Admin pro Tag

höher als Benutzer, für Tests/Pflege

Max. Verbrauch Organisation pro Tag

harter Stopp für alle Benutzer

Speichern

Limits aktiv setzen

Echter Verbrauchsmanager im Organisations-Editor: Token-Limits pro Tag für Anwender, Administratoren und Organisation gesamt (Demo-Werte 5/20/200 Mio.) — D3-S03 · Verbrauchsmanager an der Demo-Instanz (Tages-Token-Limits je Rolle)

Falle — 0 heißt UNBEGRENZT, nicht „kein Verbrauch": Die Felder zeigen „0 = deaktiviert". Deaktiviert bedeutet hier: kein Limit — also unbegrenzter Verbrauch ohne Stopp, nicht etwa eine Sperre. Wer Kosten wirklich begrenzen will, muss bewusst einen Wert größer als 0 setzen; 0 stehen zu lassen öffnet das Budget vollständig. (AH 13.3; an der Instanz gegenprüfen)

Handbuch-Abgleich: AH 13.3 erklärt die Sperrwirkung am Tageslimit; AH 13.1 aggregiert Monatsverbrauch, AH 9.1 nennt monatliche Token-Limits im Organisations-Reiter. Kalibriere Tageswerte deshalb aus Monatsverbrauch, Arbeitstagen und Puffer — und bestätige in der Demo-Instanz, ob das Feld wirklich Tag oder Monat meint.

2Konsequenz beim Überschreiten

Überschreitet ein Benutzer sein Limit, bekommt er im Cockpit eine Fehlermeldung; weitere Anfragen sind erst nach Budgetanpassung oder am nächsten passenden Zeitraum möglich. Überschreitet die Organisation das Gesamtlimit, sind alle Benutzer betroffen. Individuelle Budgets je Benutzer erscheinen wieder in der Benutzer-Nutzung (Quote/Restbudget, AH 13.1).

Org-Tageslimit = harter Stopp für alle: zu niedrig blockiert den Betrieb, zu hoch lässt Kostenausreißer durch. Budgets nach realem Verbrauch aus Stufe 4 kalibrieren und Warnschwellen / Restbudget regelmäßig im Blick behalten.

✎ Übung: Welches Org-Tageslimit passt zur Muster GmbH, wenn der Monatsverbrauch X Tokens betrug — und wie viel Puffer lässt du?

✓ Das hast du jetzt eingerichtet

Ein Benutzer-Limit gesetzt und den Zeitraum (Tag/Monat) gegen die Instanz bestätigt.

Ein Org-Limit mit realistischem Puffer gesetzt und gespeichert.

Stufe 6 von 6

Kostenkontrolle in der Praxis

Ausreißer finden, behandeln — und nachweisbar machen.

1Ausreißer finden und behandeln

Good Practice (AH 13.7): monatliche Reviews im Admin-Meeting — die Top-3-Kostentreiber besprechen.

Hoher Verbrauch bei einem Agenten → Service-Optimierung: Prompts kürzen, Chunk-Limit senken, günstigeres Modell für einfache Anfragen per Routing (siehe Stufe 1 und Agent-Editor). Transparenz für Benutzer: Endnutzer sehen ihren Verbrauch pro Chat im Cockpit-Reiter Einstellungen — kommunizieren, dass kurze Prompts Budget schonen.

2Wo finde ich was (FAQ)

Welcher Agent kostet am meisten?: Agenten-Nutzung in der Nutzungsstatistik.
Wer übertrifft sein Budget?: Benutzer-Nutzung, Quote-Spalte.
Verbrauch über Monate?: Export der letzten 3–6 Monate per API / BI-Auswertung.
Wie teuer ist Bildnutzung?: Detailtabelle der Nutzungsanalyse, Filter nach Agent/Service.

Intervall- und Offboarding-Kosten: Geplante Läufe (Intervallpläne) und vergessene Services verbrauchen still Tokens — auch von Konten, die längst hätten deaktiviert werden müssen. Diese organisationsweite Intervall-/Service-Sicht vertieft D5; der Bezug zum Lösch-/Offboarding-Workflow zu D4.

3Audit-Bezug

AuxData schreibt automatisch Audit-Logs u. a. für Token-Verbrauch, Service-Ausführungen, Rechte-/Rollenwechsel und Änderungen an der Organisations-Konfiguration (also auch Modell-Freischaltungen und Budget-Änderungen). Diese Logs dienen als Nachweis in DSGVO-Audits und ISO-27001-Zertifizierungen — Budget- und Modell-Entscheidungen sind damit nachvollziehbar. (AH 12.8)

Modelle und Budgets im Griff!

Du steuerst jetzt als Org-Admin die Modell-Freischaltung, die DSGVO-Stufen, den Token-Faktor-Effekt, die Nutzungsstatistik und die Budgets der Muster GmbH — und findest Kostenausreißer. Mach das Quiz und geh dann weiter zu D4 — DSGVO, Anonymisierung und Audit absichern.

✎ Übung: Ein Agent springt diesen Monat von Faktor-1,0- auf Faktor-2,5-Verbrauch — welche drei Stellgrößen prüfst du zuerst?

✓ Das hast du jetzt verwaltet

Top-3-Kostentreiber des Monats notiert.

Je Treiber eine Maßnahme festgelegt (Routing, Prompt/Chunk, Limit).

Kurz-Quiz

Sitzt das Steuern von Modellen & Budgets?

6 Fragen aus den Stufen 1–6. Kein Zertifikat — zur Selbstkontrolle. Beliebig oft wiederholbar.

Frage 1 von 6

Lade Frage…

Weiter: D4 · DSGVO, Anonymisierung und Audit →