Die Geschichte von Xiaomi & KI
Vom Smartphone- und IoT-Giganten über den Sprachassistenten Xiao AI bis zur offenen MiMo-Familie — wie Xiaomi seine Geräte-Distribution in einen KI-Vorteil verwandelt.
Konfidenz-Kennzeichnung
- ✅ Faktum (belegt)
- 🟡 teilweise belegt
- 🔵 Interpretation
Kategorien
- Unternehmen
- Forschung
- Modell
- Produkt
Zeitleiste
Vier Kapitel vom Geräte-Fundament (2010) über das Large-Model-Team und HyperOS bis zur offenen MiMo-Familie und MiMo-V2.5-Pro (2026). Filtere nach Kategorie oder durchsuche alle Ereignisse — jeder Eintrag führt seine Quellen mit.
Fundament: Geräte, Xiao AI & Robotik
Das Smartphone- und IoT-Imperium, der Sprachassistent Xiao AI und erste Schritte in die verkörperte KI.
Gründung von Xiaomi
Lei Jun gründet Xiaomi in Beijing; aus dem Smartphone-Hersteller wird ein riesiges Geräte- und IoT-Ökosystem — das spätere Fundament der KI-Distribution über Phone, Auto und Smart Home.
Erstes Visual-AI-Team
Xiaomi baut sein erstes KI-Team (Computer Vision) auf — der Beginn interner KI-Kompetenz, Jahre vor dem LLM-Einstieg. Bis August 2023 wächst die KI-Mannschaft auf über 3.000 Personen.
Xiao AI (小爱同学) startetXiao AI
Xiaomis Sprachassistent debütiert mit dem Mi AI Speaker und wird über Phone, TV und Smart Home verteilt — laut Lei Jun rund 120 Mio. monatlich aktive Geräte. Die früheste Massen-KI-Schnittstelle des Konzerns.
CyberDog & CyberOne — Embodied AICyberDog / CyberOne
Der Roboterhund CyberDog (2021) und der humanoide CyberOne (2022) zeigen Xiaomis Ambition in Robotik und verkörperter KI — ein frühes Signal, dass KI bei Xiaomi hardware-nah gedacht wird.
Der Modell-Einstieg: Large-Model-Team, HyperOS & MiLM
Lei Jun startet das Large-Model-Team, HyperOS wird zum KI-Träger, MiLM zum ersten eigenen LLM.
Lei Jun macht KI zur Chefsache — mit Fokus auf die eigene Geräteflotte.
Large-Model-Team unter Lei Jun
Xiaomi gründet im April 2023 sein Large-Model-Team (rund 1.200 R&D-Personen, Start mit 6.500 GPUs), CEO Lei Jun selbst involviert. Die Strategie: leichte, effiziente Modelle für die eigene Geräteflotte statt reiner Frontier-Jagd.
Im April 2023 stellte Xiaomi sein KI-Large-Model-Team auf — mit rund 1.200 Forschungs- und Entwicklungspersonen und etwa 6.500 GPUs zum Start, geführt aus dem direkten Umfeld von CEO Lei Jun. Anders als die reinen China-„KI-Tiger" positionierte Xiaomi sich von Anfang an pragmatisch: nicht das größte Frontier-Modell um jeden Preis, sondern „leichte", effiziente Modelle, die auf der eigenen, hunderte Millionen Geräte umfassenden Flotte (Phone, Auto, IoT) sinnvoll laufen. Die KI-Gesamtmannschaft wuchs bis August 2023 auf über 3.000 Personen.
Im Kapitel weiterlesen →HyperOS löst MIUI abHyperOS
Xiaomi stellt HyperOS vor — das geräteübergreifende Betriebssystem für Phone, Auto und IoT, das später der Träger der KI-Funktionen wird. Debüt mit der Xiaomi-14-Serie am 26. Oktober 2023.
MiLM-6B / MiLM-1.3B — die ersten eigenen LLMsMiLM
Ende 2023 stellt Xiaomi seine ersten eigenen großen Sprachmodelle vor: MiLM-6B und MiLM-1.3B, trainiert auf chinesisch-englischem Mix. Die 1,3B-Variante ist explizit für den On-Device-Einsatz ausgelegt — Xiaomis Kernvorteil.
MiLM besteht das Behörden-Filing
Im Mai 2024 wird Xiaomis großes Modell MiLM offiziell für den China-Markt registriert (Generative-AI-Filing) — die regulatorische Voraussetzung für den breiten Consumer-Einsatz in Xiaomis Geräten.
Eigenes Wanka-GPU-Cluster (10.000+ GPUs)
Ende 2024 baut Xiaomi ein eigenes „Wanka"-Cluster mit über 10.000 GPUs auf und intensiviert die Modellinvestitionen — die Compute-Grundlage für die MiMo-Offensive 2025.
MiMo & die Open-Source-Offensive
Vom offenen MiMo-7B über multimodale und Audio-Modelle bis zum 309B-MoE MiMo-V2-Flash.
7 Mrd. Parameter, die o1-mini schlagen — Xiaomis offener Einstand.
MiMo-7B — das erste offene MiMoMiMo-7B
Xiaomis erstes Open-Source-LLM (mit Lizenz), Reasoning- und Coding-fokussiert, geleitet von der Ex-DeepSeek-Forscherin Luo Fuli. Trotz nur 7 Mrd. Parametern: MATH-500 95,8 %, schlägt OpenAI o1-mini und Alibabas Qwen-32B-Preview auf AIME 2024/2025.
Im April 2025 veröffentlichte Xiaomi MiMo-7B, sein erstes offenes großes Sprachmodell, unter einer offenen Lizenz auf Hugging Face. Geleitet wurde das Projekt von Luo Fuli, einer aus DeepSeek bekannten Forscherin. Trotz nur 7 Mrd. Parametern erreichte die RL-Variante auf MATH-500 nach Eigenangabe 95,8 % und übertraf auf den AIME-2024/2025-Mathematikwettbewerben OpenAIs o1-mini und Alibabas Qwen-32B-Preview. Das Modell wurde auf einem speziell kuratierten Datensatz mit rund 200 Mrd. Reasoning-Tokens (insgesamt ~25 Bio. Tokens über drei Phasen) trainiert. MiMo-7B war Xiaomis Statement: kleine, offene, scharf trainierte Modelle statt reiner Parameterzahl.
Im Kapitel weiterlesen →MiMo-VL — multimodal fürs Smart HomeMiMo-VL
Die Vision-Language-Variante MiMo-VL bringt Bild- und Videoverständnis; die Spezialvariante MiMo-VL-Miloco-7B ist auf Haus- und Umgebungserkennung trainiert (Gesten, Alltagsaktivitäten) — passgenau für Xiaomis Smart-Home-Flotte.
MiDashengLM-7B — Audio-VerständnisMiDashengLM-7B
Im August 2025 erscheint MiDashengLM-7B, ein Audio-KI-Modell (38.662 Stunden Trainingsdaten, Apache-2.0), das Musik, Umgebungsgeräusche und Sprecher-Emotion versteht — die Audio-Spur von Xiaomis multimodaler Strategie.
HyperAI & Super Xiao AIHyperAI
Auf der MWC 2025 stellt Xiaomi HyperAI vor — eine KI-Funktionssuite in HyperOS 2 (Echtzeit-Übersetzung, Schreibhilfe, Sprach-Zusammenfassung, Foto-Edit). Global setzt HyperAI auf Google Gemini als Backend, in China auf eigene Modelle; Xiao AI wird zu „Super Xiao AI" mit besserem Kontextgedächtnis.
MiMo-V2-Flash — 309B-MoEMiMo-V2-Flash
Im Dezember 2025 erscheint MiMo-V2-Flash: ein 309-Mrd.-Parameter-MoE mit rund 15 Mrd. aktiven Parametern. Nach Eigenangabe auf GPT-5- und Claude-4.5-Sonnet-Niveau bei Software-Engineering-Tests, ~150 Tokens/s, API-Preis $0,1 pro Mio. Input-Tokens — aggressive Preis-Leistung.
Frontier, Agenten & die „große Konvergenz"
Trillion-Parameter-Modelle, der Agent MiClaw, ~21 % OpenRouter-Traffic und die Bündelung von Chip, OS und Modell.
Trillion-Parameter, ein eigener Agent und eine 8,7-Mrd.-$-Wette.
MiMo-V2-Pro, MiClaw & die 8,7-Mrd.-$-WetteMiMo-V2-Pro / MiClaw
Im März 2026 stellt Xiaomi das Flaggschiff MiMo-V2-Pro vor (1 Bio. Parameter, 42 Mrd. aktiv, 1-Mio-Kontext, agentenorientiert) plus MiMo-V2-Omni und MiMo-V2-TTS. Dazu der KI-Agent MiClaw (Closed Beta auf der Xiaomi-17-Serie). Lei Jun kündigt 8,7 Mrd. $ KI-Investment über drei Jahre an.
Im März 2026 hob Xiaomi seine Modellstrategie auf Frontier-Niveau: MiMo-V2-Pro, ein Flaggschiff mit rund 1 Bio. Gesamt- und 42 Mrd. aktiven Parametern, 1-Mio-Token-Kontext und ausdrücklichem Fokus auf agentische Aufgaben, begleitet von den Companion-Modellen MiMo-V2-Omni (multimodal) und MiMo-V2-TTS. Gleichzeitig kündigte Xiaomi MiClaw an — einen autonomen KI-Agenten, zunächst in geschlossener Beta auf der Xiaomi-17-Serie. CEO Lei Jun unterlegte die Ambition finanziell mit der Ankündigung von 8,7 Mrd. $ KI-Investitionen über drei Jahre. Benchmark- und Niveau-Aussagen sind teils Eigenangaben und Momentaufnahmen.
Im Kapitel weiterlesen →1,02 Bio. Parameter, voll multimodal — Xiaomis aktuelles Flaggschiff.
MiMo-V2.5-Pro & MiMo CodeMiMo-V2.5-Pro
Ende April 2026 verschmilzt die V2-Familie zu MiMo-V2.5-Pro: 1,02 Bio. Parameter, multimodal (Text, Bild, Audio, Video nativ), 1-Mio-Kontext, veröffentlicht am 22. April 2026. Dazu MiMo Code, ein terminal-basierter Coding-Agent mit Langzeitgedächtnis für lange Projekte.
Ende April 2026 führte Xiaomi die V2-Modelle zu MiMo-V2.5-Pro zusammen — einem Mixture-of-Experts-Flaggschiff mit rund 1,02 Bio. Parametern, das Text, Bild, Audio und Video nativ verarbeitet und einen 1-Mio-Token-Kontext bietet (Release am 22. April 2026). Der MiMo-Audio-Encoder und die TTS/ASR-Pipeline wurden dabei integriert (Voice-Cloning, zweisprachige Erkennung). Parallel erschien MiMo Code, ein terminalbasierter Coding-Agent mit persistentem Gedächtnis für langlaufende Projekte — Xiaomis Antwort auf die agentischen Coding-Werkzeuge der Konkurrenz.
Im Kapitel weiterlesen →Rund 21 % des OpenRouter-Traffics
Anfang April 2026 erreichen Xiaomis Modelle laut Branchendaten rund 21 % des gesamten Traffics auf der KI-Routing-Plattform OpenRouter — vom Außenseiter zu einem der meistgenutzten Stacks. Zahl aus Drittquelle, Momentaufnahme.
OmniVoice — Voice-Cloning in 646 SprachenOmniVoice
Im Mai 2026 stellt Xiaomi OmniVoice quelloffen (Apache-2.0): ein Voice-Cloning-TTS-Modell für 646 Sprachen mit Zero-Shot-Fähigkeit aus wenigen Sekunden Audio, an einem Tag auf 100.000 Stunden trainiert, bis zu 40-fache Echtzeitgeschwindigkeit.
Die „große Konvergenz“: Chip + OS + Modell + Auto
2026 bündelt Lei Jun eigene Chips (XRing), HyperOS und die MiMo-Modelle zu integrierten Geräten; das Elektroauto SU7 und die Autonomous-Driving-KI verbinden die KI mit Xiaomis Hardware-Imperium. Die F&E-Ausgaben sollen 2026 bei rund 40 Mrd. Yuan liegen.
Lei Jun skizzierte für 2026 eine „große Konvergenz": eigene Chips (die XRing-Linie), HyperOS und die MiMo-Modelle sollen zu einheitlichen, KI-nativen Geräten verschmelzen. Anders als reine Modelllabore verfügt Xiaomi über die komplette Hardware-Kette — vom Smartphone über das Smart Home bis zum Elektroauto SU7 samt Autonomous-Driving-KI. Genau diese Distribution über hunderte Millionen Geräte ist Xiaomis struktureller Vorteil im KI-Rennen; die F&E-Ausgaben sollen 2026 bei rund 40 Mrd. Yuan (~5,7 Mrd. $) liegen. Aussagen zur Strategie und einzelne Zahlen sind teils Eigenangaben bzw. Drittdaten.
Im Kapitel weiterlesen →Vier Teile mit Quellenkritik, Datierung und Einordnung — vom Geräte-Fundament über das Large-Model-Team und die MiMo-Offensive bis zu MiMo-V2.5-Pro und der „großen Konvergenz“.