DeepSeek lokal hosten: DSGVO-sicher — und besser als Azure OpenAI

Verfasst von

Dieser Satz aus einem Gespräch mit einem Mittelstands-CIO trifft den Kern einer Diskussion, die längst überfällig ist. Chinesische Open-Weight-Modelle wie DeepSeek V4 oder Qwen 3.6 werden reflexartig als „DSGVO-Problem" abgehakt — bei Azure OpenAI, Google Gemini oder AWS Bedrock stellt sich die gleiche Frage seltsamerweise nicht.

DeepSeek lokal hosten: DSGVO-sicher — und besser als Azure OpenAI

„DeepSeek klaut deine Daten? ChatGPT macht das genauso. Wer wirklich sicher sein will, muss lokal hosten."

Das DSGVO-Risiko liegt im Datenfluss — nicht im Modellgewicht

Art. 44 ff. DSGVO regelt nicht die Herkunft eines Algorithmus, sondern die Übermittlung personenbezogener Daten in Drittländer. Entscheidend ist also nicht, wo das Modell trainiert wurde, sondern wohin Prompts und Kontextdaten zur Inferenz fließen.

Setup	Datenfluss	Rechtsgrundlage / Risiko
Azure OpenAI (GPT-5)	Microsoft-Cloud, Tenant in EU möglich	CLOUD Act + FISA 702 → Drittlandtransfer
Google Gemini API	Google Cloud, US-Konzern	CLOUD Act + FISA 702 → Drittlandtransfer
DeepSeek V4 (on-premise)	Eigener Server, kein Egress	Kein Drittlandtransfer — DSGVO-konform
Qwen 3.6 (on-premise)	Eigener Server, kein Egress	Kein Drittlandtransfer — DSGVO-konform

Ein lokal betriebenes Open-Weight-Modell sendet keine einzige Zeile Prompt-Daten nach Peking, San Francisco oder sonstwohin. Die Modellgewichte sind nach Download statisches Material — sie „telefonieren" nicht heim.

Schrems II, FISA 702 und CLOUD Act — was tatsächlich gilt

Der EuGH hat im Urteil C-311/18 (Schrems II) vom 16. Juli 2020 das Privacy Shield gekippt und festgehalten: Solange US-Behörden über FISA Section 702 (50 U.S.C. § 1881a) Zugriff auf Daten von US-Anbietern haben, bietet ein US-Cloud-Vertrag — auch mit EU-Rechenzentrum — kein gleichwertiges Schutzniveau. Der CLOUD Act (2018) verschärft das: US-Unternehmen müssen Daten herausgeben, unabhängig vom physischen Speicherort.

Das Trans-Atlantic Data Privacy Framework (TADPF, 2023) hat den Zustand provisorisch repariert, ist aber bereits Gegenstand neuer Klagen (noyb, „Schrems III"). Wer heute auf TADPF baut, baut auf Sand.

Lokal gehostete Open-Weight-Modelle unterliegen keinem dieser Zugriffsregime — egal, ob die Gewichte aus China, Europa oder den USA stammen. Das Risiko reduziert sich auf das, was Sie in der eigenen Infrastruktur ohnehin kontrollieren.

Die richtige Frage: Wer kontrolliert die Infrastruktur?

Nicht „Cloud oder lokal" und auch nicht „US oder CN" sind die entscheidenden Achsen, sondern die Jurisdiktion des Betreibers:

US-Hyperscaler (Azure, AWS, GCP) — auch mit EU-Tenant: Daten unterliegen CLOUD Act und FISA 702. DSGVO-Konformität hängt an AVV, TIA, SCCs und Behördenzugang — und bleibt rechtlich angreifbar.
Europäische Cloud-Anbieter (IONOS, OVHcloud, StackIT): Können DSGVO-konform betrieben werden, da kein US-Mutterkonzern existiert. AVV bleibt erforderlich.
Eigene Infrastruktur (on-premise): Kein Drittanbieter, kein Transfer, kein Schrems-Risiko. Übrig bleibt klassische IT-Security.

Was on-premise heute realistisch ist (Stand Mai 2026)

Modell	Größe	Empfohlene Hardware
DeepSeek V4-Pro	1,6T MoE (49B aktiv), 1M Kontext	8× H200 oder Multi-Node H100
DeepSeek V4-Flash	284B MoE (13B aktiv), 1M Kontext	4× H100 / 2× H200
Qwen 3.6 27B	27B dense	1× RTX 6000 Ada / 1× H100
Qwen 3.6 35B-A3B	35B MoE (3B aktiv)	1× RTX 4090 24GB
Mistral Large 3 (EU)	675B MoE (41B aktiv), 256k Kontext	8× H200

Alle genannten Modelle stehen unter Apache 2.0 und sind über Hugging Face frei verfügbar. Auf passender Hardware liegt der Time-to-First-Token bei 50–150 ms, der Durchsatz je nach Quantisierung bei 40–120 Tokens/s pro Nutzer. Quantisierung (FP8, AWQ, GPTQ, INT4) reduziert den VRAM-Bedarf um Faktor 2–4 — ein quantisiertes Qwen 3.6 27B läuft inzwischen auf einem 24-GB-Mac. Inference-Stack: vLLM, SGLang oder TGI; für kleinere Setups Ollama oder llama.cpp. Air-Gapped-Betrieb ist Standard.

Fazit

Die Herkunft der Modellgewichte entscheidet nicht über DSGVO-Compliance — und der physische Serverstandort allein auch nicht. Entscheidend ist, wer die Infrastruktur betreibt und welcher Jurisdiktion er unterliegt. Ein Azure-Tenant in Frankfurt oder ein AWS-Rechenzentrum in Dublin ändern daran nichts: Solange Microsoft, Google oder Amazon US-Konzerne sind, greifen CLOUD Act und FISA 702 — der Datenzugriff ist nicht der Server, sondern der Mutterkonzern.

DSGVO-Konformität entsteht erst dort, wo kein US- (oder anderes Drittland-)Unternehmen rechtlich auf die Daten durchgreifen kann. Wer DeepSeek V4, Qwen 3.6 oder Mistral Large 3 auf eigener Hardware oder bei einem rein europäischen Betreiber hostet, schließt diese Lücke. Jedes Schrems-II-Konstrukt rund um GPT-5 in der Azure Cloud bleibt dagegen rechtlich angreifbar.

Lokale KI für Ihr Unternehmen einrichten? 30 Minuten mit einem AlpiType-Ingenieur. Kein Vertrieb — direkte technische Beratung. Gespräch vereinbaren →

Quellen

EuGH, Urteil v. 16.07.2020, C-311/18 (Schrems II)
50 U.S.C. § 1881a — FISA Section 702
Clarifying Lawful Overseas Use of Data Act (CLOUD Act), Pub.L. 115-141, Div. V (2018)
Verordnung (EU) 2016/679 (DSGVO), Art. 44–49
EDSA, Empfehlungen 01/2020 zu Übermittlungstools (TIA)

DeepSeek lokal hosten: DSGVO-sicher — und besser als Azure OpenAI

DeepSeek lokal hosten: DSGVO-sicher — und besser als Azure OpenAI

Das DSGVO-Risiko liegt im Datenfluss — nicht im Modellgewicht

Schrems II, FISA 702 und CLOUD Act — was tatsächlich gilt

Die richtige Frage: Wer kontrolliert die Infrastruktur?

Was on-premise heute realistisch ist (Stand Mai 2026)

Fazit

Quellen

Weitere Beiträge

KI-Sicherheit hinkt Frontier-KI hinterher: Was am Safety-Report-Artikel stimmt und wo er verkürzt

14 Wege, mit KI Geld zu verdienen: eine ehrliche Neubewertung aus Souveränitäts-Sicht

Wenn die USA ihre KI verstaatlichen: die Fable-5-Sperre ist erst der Anfang

OpenAI kauft Ona (ex-Gitpod): Europas Agenten-Infrastruktur wandert nach San Francisco