WM-Tippspiel 2026: Schick Dein Lieblings-LLM ins Rennen — statte es mit den richtigen Daten ausFür Menschen →Für LLMs →
FL Pro Consulting Web · Hosting · KI-Community

Autor: Flolu

  • KI-Sicherheit hinkt Frontier-KI hinterher: Was am Safety-Report-Artikel stimmt und wo er verkürzt

    KI-Sicherheit hinkt Frontier-KI hinterher: Was am Safety-Report-Artikel stimmt und wo er verkürzt

    Der Artikel „Safety is falling behind frontier AI capabilities“ trifft einen wichtigen Punkt: KI-Sicherheit ist kein einmaliges Modell-Zertifikat mehr. Deepfakes, persuasive Chatbots, Agenten, Cyber-Fähigkeiten und offene Modellgewichte machen Sicherheit zu einer laufenden Betriebsaufgabe.

    Am 24. Juni 2026 veröffentlichte Gleb Tsipursky in The Intelligencer den Meinungsbeitrag „Safety is falling behind frontier AI capabilities“. Er stützt sich auf den International AI Safety Report 2026 und zieht daraus eine klare Management-These: KI-Fähigkeiten entwickeln sich schneller als die Schutzmechanismen in Unternehmen, Behörden und Regulierung.

    Kurzfassung des Artikels

    Der Artikel beschreibt sechs Risikofelder, die für Unternehmen inzwischen praktisch relevant sind:

    • Deepfakes werden alltagstauglich. Synthetische Stimmen und Videos senken die Kosten für Betrug, Erpressung, Identitätsmissbrauch und Social Engineering.
    • Chatbots können Entscheidungen beeinflussen. Je persönlicher, länger und überzeugender KI-Systeme mit Menschen interagieren, desto größer wird das Risiko manipulativer Wirkung in sensiblen Bereichen wie Finanzen, Gesundheit, Personal oder Bildung.
    • KI-Agenten erhöhen den Schaden einzelner Fehler. Ein Tool-nutzender Agent kann recherchieren, schreiben, Dateien bearbeiten, Tickets auslösen oder Workflows starten. Ein falscher Schritt am Anfang kann sich über viele Folgeaktionen fortpflanzen.
    • Labortests reichen nicht mehr. Ein Benchmark vor dem Deployment sagt wenig darüber aus, wie sich ein System später mit Tools, Speicher, echten Nutzern, echten Berechtigungen und realen Anreizen verhält.
    • Open-Weight-Modelle beschleunigen die Verbreitung starker Fähigkeiten. Wenn Gewichte frei verfügbar sind, lässt sich Missbrauch schwerer zentral eindämmen.
    • Regulierung entsteht, bleibt aber oft freiwillig. EU-Code, G7-/Hiroshima-Prozesse und NIST-Leitlinien geben Orientierung, ersetzen aber keine durchgesetzten Betriebskontrollen.

    Die Schlussfolgerung des Artikels ist für den Mittelstand relevant: KI-Risiko darf nicht als Policy-Dokument im Ordner liegen. Es gehört in Betrieb, Architektur, Monitoring, Zugriffsrechte und Incident Response.

    Abgleich mit dem International AI Safety Report 2026

    Der Safety Report stützt die Grundrichtung des Artikels deutlich. Er nennt seit dem Report 2025 unter anderem bessere Fähigkeiten in Mathematik, Coding und autonomer Ausführung, mehr Hinweise auf KI-Einsatz in realen Cyberoperationen, schwierigere Pre-Deployment-Tests und eine stark freiwillig geprägte Safety-Governance.

    Wichtig ist aber die Nuance: Der Report ist kein Alarm-Pamphlet und gibt ausdrücklich keine konkreten politischen Empfehlungen. Er synthetisiert den Forschungsstand, betont Unsicherheiten und beschreibt viele Fähigkeiten als „jagged“: beeindruckend in manchen Aufgaben, unzuverlässig in anderen. Genau dieser Punkt fehlt im Artikel etwas. Der Artikel formuliert die Lage stärker als Management-Warnung; der Report formuliert sie als evidenzbasierte Risikolandkarte.

    Deepfakes: Der Artikel liegt richtig, aber das Problem ist breiter

    Symbolbild zu KI-Deepfakes und Social Engineering in Geschäftsprozessen

    Symbolbild: Synthetische Identitäten machen Freigabeprozesse angreifbarer.

    Die Deepfake-Passage ist gut begründet. OECD AIM und die AI Incident Database zeigen fortlaufend dokumentierte Fälle von KI-bezogenen Schäden, darunter Identitätsmissbrauch, synthetische Medien, Scam-Anzeigen und Falschdarstellungen. Auch neuere Studien zu synthetischer Stimme zeigen, dass Menschen Audiofälschungen in realistischen Vishing-Szenarien nur schlecht zuverlässig erkennen.

    Der zusätzliche Punkt: Es geht nicht nur darum, ob ein einzelner Fake erkannt wird. Ein größerer Schaden liegt in der Erosion von Vertrauen. Wenn Stimmen, Videos und Screenshots grundsätzlich verdächtig werden, verlieren Telefonfreigaben, Videocalls und „schnelle Chef-Anweisungen“ an Beweiskraft. Für Unternehmen heißt das: Nicht Deepfake-Detection allein löst das Problem, sondern belastbare Freigabeprozesse, Rückruf über bekannte Kanäle, Vier-Augen-Prinzip und klare Eskalationswege.

    Persuasive Chatbots: Belegt, aber kontextabhängig

    Der Artikel warnt vor personalisierten Chatbots, die Entscheidungen beeinflussen. Das passt zu aktueller Forschung: Experimente zeigen, dass KI-Systeme Einstellungen und teils auch Handlungen beeinflussen können. Besonders riskant wird es, wenn Systeme dauerhaft interagieren, Nutzerprofile kennen, Engagement optimieren und Vertrauen aufbauen.

    Trotzdem sollte man sauber trennen: Nicht jede hilfreiche Assistenz ist Manipulation. Das Risiko entsteht vor allem bei asymmetrischer Information, versteckten Zielen, emotionaler Abhängigkeit oder fehlender Transparenz. In regulierten Feldern wie Gesundheit, Finanzen, HR und Weiterbildung braucht es deshalb klare Grenzen: Zweckbindung, Protokollierung, menschliche Freigabe bei kritischen Empfehlungen und Kennzeichnung, wann ein System informiert, empfiehlt oder verkauft.

    Agenten und Cybersecurity: Der Trend stimmt, Vollautonomie ist aber nicht erreicht

    Symbolbild zu KI-Agenten mit Tool-Berechtigungen, Monitoring und menschlicher Freigabe

    Symbolbild: Agenten brauchen begrenzte Rechte, Audit-Logs und Freigaben für kritische Aktionen.

    Der Artikel betont Fehlerketten bei Agenten. Das ist der stärkste praktische Punkt. METR misst seit 2025 die Länge von Aufgaben, die KI-Agenten autonom mit einer bestimmten Erfolgswahrscheinlichkeit schaffen, und findet eine schnelle Zunahme dieser „Task Horizon“. Gleichzeitig zeigt METR auch die Grenze: Lange, unklare, echte Projekte bleiben deutlich schwieriger als kurze Aufgaben.

    Auch bei Cybersecurity ist das Bild zweigeteilt. Forschung zu Multi-Step-Cyber-Ranges zeigt Fortschritte bei mehrstufigen Angriffsszenarien. Der Safety Report berichtet mehr Evidenz für KI-Unterstützung in realen Cyberoperationen. Aber daraus folgt nicht, dass vollautomatische Cyberangriffe heute zuverlässig funktionieren. Die realistische Risikoklasse ist näher: Angreifer werden schneller, billiger und skalierbarer; Verteidiger müssen dieselbe Automatisierung für Monitoring, Triage und Reaktion einsetzen.

    Für Unternehmen bedeutet das: Agenten nur mit Capability Scoping, getrennten Rollen, Tool-Gating, Audit-Logs, Sandboxes, Secrets-Isolation und Human-in-the-Loop für irreversible Aktionen betreiben.

    Open Weights: Risiko und Souveränitätschance zugleich

    Symbolbild zu Open-Weight-Modellen, souveräner Infrastruktur und Governance

    Symbolbild: Offene Modellgewichte sind Risiko und Souveränitätschance zugleich.

    Der Artikel sieht offene Gewichte vor allem als Kontrollverlust. Das ist richtig, aber unvollständig. Open-Weight-Modelle können nach Veröffentlichung nicht einfach zurückgerufen werden; Safeguards lassen sich durch Fine-Tuning oder Jailbreaks umgehen. Das erhöht Missbrauchs- und Drittanbieter-Risiken.

    Gleichzeitig sind offene Modelle für europäische Souveränität wichtig. Sie erlauben Betrieb in eigener Infrastruktur, bessere Auditierbarkeit, geringere Abhängigkeit von einzelnen US-Cloud-Anbietern und modellagnostische Architekturen. Der Sicherheitsentscheid ist deshalb nicht „offen schlecht, geschlossen gut“, sondern: Welche Fähigkeiten hat das Modell, wo läuft es, wer kontrolliert die Umgebung, welche Daten sieht es, welche Tools darf es nutzen und welche Monitoring-Schicht sitzt darüber?

    Governance: Mehr Rahmenwerke, noch wenig Durchgriff

    Beim Regulierungsabgleich ist der Artikel im Kern richtig. NIST AI RMF ist freiwillig. Das OECD-Hiroshima-Reporting ist freiwillig. Der EU General-Purpose AI Code of Practice ist ebenfalls ein freiwilliges Instrument, allerdings eingebettet in verbindliche AI-Act-Pflichten für Anbieter allgemeiner KI-Modelle. Der International AI Safety Report selbst sagt, dass Frontier-Safety-Frameworks zwar die detaillierteste freiwillige Risikomanagementform sind, aber stark in Umfang, Schwellenwerten und Durchsetzbarkeit variieren.

    Der entscheidende Unterschied für Unternehmen: Auch wenn Modellanbieter besser reguliert werden, bleibt der eigene Einsatz nicht automatisch sicher. Ein Mittelständler, der KI mit CRM, E-Mail, DMS, ERP oder Ticketsystem verbindet, baut ein eigenes soziotechnisches System. Dafür braucht er eigene Kontrollen.

    Fazit für den Mittelstand

    Der Artikel überzieht nicht in der Richtung, sondern eher in der Zuspitzung. Ja: KI-Sicherheit fällt hinter den Fähigkeiten zurück. Aber die Antwort ist nicht Panik und auch nicht KI-Verzicht. Die Antwort ist ein Betriebsmodell.

    Praktisch heißt das:

    • KI-Systeme inventarisieren: Modell, Anbieter, Hosting-Ort, Datenarten, Berechtigungen, Kosten, Fallback.
    • Agenten begrenzen: klare Tool-Rechte, getrennte Rollen, keine pauschalen Schreibrechte, keine Secrets im Prompt-Kontext.
    • Kritische Aktionen absichern: Human-in-the-Loop, Vier-Augen-Freigabe, Rückkanalprüfung bei Zahlungs- und Identitätsprozessen.
    • Laufend überwachen: Logs, Prompt-/Output-Scanning, Anomalie-Erkennung, Incident-Prozess.
    • Modellagnostisch bauen: Anbieter wechseln können, ohne Workflows, Wissen und Governance neu zu bauen.
    • Deepfake-resistente Prozesse etablieren: keine Freigabe allein per Stimme, Video oder Chat.

    Die wichtigste Lehre bleibt: KI-Sicherheit ist keine Modell-Eigenschaft. Sie ist eine Architektur- und Betriebsdisziplin.

    Quellen

  • 14 Wege, mit KI Geld zu verdienen: eine ehrliche Neubewertung aus Souveränitäts-Sicht

    14 Wege, mit KI Geld zu verdienen: eine ehrliche Neubewertung aus Souveränitäts-Sicht

    Leonard Schmedding von Everlast AI hat ein sehenswertes Ranking veröffentlicht: 14 Geschäftsmodelle, mit denen man heute mit Künstlicher Intelligenz Geld verdienen kann – ehrlich sortiert von Flop bis Top. Die Einordnung ist praxisnah, klar begründet und auf den deutschsprachigen Markt gemünzt. Wir nehmen sie zum Anlass, dieselben 14 Wege noch einmal durch eine zweite Brille zu betrachten: die der digitalen Souveränität und der ehrlichen Machbarkeit für den Mittelstand. Wichtig vorweg: Dem Ranking fehlt nichts – es beantwortet seine Frage („Womit lässt sich Geld verdienen?") vollständig. Wir stellen nur eine zweite Frage daneben: „Und wem gehören dabei die Daten?" Es ist derselbe Gegenstand, nur ein anderer Blickwinkel – und das Ergebnis ist erstaunlich oft Zustimmung, an einigen Stellen aber eine andere Gewichtung.

    1. Worum es im Original geht

    Das Video „Die 14 Wege mit KI Geld zu verdienen (auch als absoluter Anfänger)" (31:44 min, veröffentlicht am 6. Juni 2026) stammt von Leonard Schmedding, Mitgründer von Everlast AI – nach eigener Darstellung der führende deutschsprachige YouTube-Kanal zu KI im Geschäftskontext und zugleich eine der marktführenden KI-Beratungs- und Implementierungsagenturen im DACH-Raum, staatlich zugelassener Bildungsträger inklusive. Diese Praxis-Perspektive merkt man dem Beitrag an: Statt vager „Passiv-Einkommen"-Versprechen bewertet Schmedding jedes Modell entlang von drei nüchternen Achsen – Profitabilität, Konkurrenzsituation und Langlebigkeit.

    Das ist die Stärke des Videos, und es ist fair, das vorab zu würdigen: Wer wissen will, womit sich im KI-Dienstleistungsmarkt 2026 tatsächlich Geld verdienen lässt, bekommt hier eine ungeschönte, erfahrungsgesättigte Landkarte. Genau deshalb lohnt es sich, sie ernst zu nehmen – und weiterzudenken.


    2. Schmeddings Einordnung im Überblick

    Schmedding rankt nicht streng von 1 bis 14, sondern sortiert die Modelle in vier Stufen. Zusammengefasst:

    • Top: KI-Beratung & Audits · KI-App-Entwicklung · Corporate-LLM-Setups · KI-Videoerstellung · Personal-AI-Assistants für Geschäftsführer
    • Gut: KI-Voice-Agents · RAG- & Wissensmanagement-Systeme · Workflow-Automatisierung · (Bonus) Microsoft-Copilot-Tuning
    • Mittel: KI-Copywriting · KI-Webdesign
    • Flop: Faceless YouTube-/TikTok-Kanäle · KI-Trading-Bots · KI-E-Commerce-Shops · Website-Chatbots

    Wer genau hinsieht, erkennt ein Muster: Schmeddings „Top"-Liste deckt sich fast deckungsgleich mit dem eigenen Angebotsportfolio von Everlast (KI-Beratung über kiberatung.de, eine Agentic-Coding-Masterclass, die KI-Videoagentur „Cinetic AI", eine Partnerschaft im Corporate-LLM-Bereich). Das ist kein Vorwurf – im Gegenteil: Wer ein Geschäftsmodell selbst täglich umsetzt, kann es am glaubwürdigsten beurteilen. Man sollte die Liste nur als das lesen, was sie ist: die sehr fundierte Sicht eines Anbieters, der genau diese Spitzen-Modelle verkauft. Eine zweite, unabhängige Perspektive schadet da nicht.


    3. Die zweite Brille: zwei zusätzliche Achsen

    Schmeddings drei Achsen bewerten ein Geschäftsmodell aus Sicht des Anbieters: Was bringt es mir, wie viele machen es schon, wie lange trägt es? Das ist vollständig und richtig – für die Frage „Womit verdiene ich Geld?". Wir legen zwei weitere Achsen daneben, die aus Sicht des deutschen Mittelstands und aus FL-Pro-Perspektive den Ausschlag geben. Sie ersetzen Schmeddings Blick nicht, sie schauen nur von der anderen Seite auf dieselben 14 Modelle:

    Achse 1 – Souveränität & Datenhoheit. Schafft das Modell Wert auf einer Infrastruktur, die der Kunde selbst kontrollieren kann – oder vertieft es die Abhängigkeit von US-Frontier-Tools? Das ist 2026 keine ideologische Frage mehr, sondern eine Risiko-Frage. Und sie ist feiner, als sie klingt: Die „EU-Region" eines US-Anbieters (AWS, Google, Microsoft) liegt zwar physisch in Europa, unterliegt aber als US-Konzern weiterhin dem US CLOUD Act – also potenziellem US-Behördenzugriff. Daten-residenz (Serverstandort) ist damit nicht dasselbe wie Daten-souveränität (Schutz vor fremdem Zugriff). Die Datenhoheit reicht von „US-Cloud (nur bedingt DSGVO-konform)" über die „EU-Region eines US-Anbieters" und die echte „Sovereign Cloud" europäischer Betreiber bis zu „On-Premise / lokales Modell – kein Byte verlässt das Haus, konform by design". Und es gibt inzwischen ernstzunehmende europäische Bausteine: Mistral (Large 3 / Medium 3.5, DSGVO-konform hostbar, 30–50 % günstiger als die US-Anbieter), das Fraunhofer-Projekt OpenGPT-X / Teuken-7B (auf allen 24 EU-Amtssprachen, on-prem einsetzbar), Aleph Alpha sowie lokale Engines wie Ollama.

    Achse 2 – Ehrliche Einsteiger-Machbarkeit. Der Titel verspricht „auch als absoluter Anfänger". Diese Versprechung halten wir gegen die Realität jedes einzelnen Modells. Denn die wahrhaftig profitablen Wege verlangen fast durchweg echte Fachtiefe – das ist kein Widerspruch zu Schmedding, aber eine Präzisierung, die Einsteiger vor Frust bewahrt.

    Dazu kommt ein Punkt, der bewusst jenseits der reinen Geschäftsmodell-Frage liegt – und den Schmedding für seinen Zweck zu Recht nicht vertieft: die Compliance. Ab dem 2. August 2026 greift Artikel 50 des EU AI Act – Chatbots und Voice-Agents müssen offenlegen, dass man mit einer KI spricht. Die Hochrisiko-Pflichten (Annex III) wurden per „Digital Omnibus" voraussichtlich auf Dezember 2027 verschoben, doch die Transparenzpflicht ist real und trifft gleich zwei Modelle der Liste.


    4. Die 14 Wege, neu gewichtet

    Die folgende Tabelle stellt Schmeddings Stufe unserer Gewichtung gegenüber. „Souveränität" beurteilt, wie gut sich das Modell auf eigener bzw. europäischer Infrastruktur umsetzen lässt.

    GeschäftsmodellSchmeddingFL-Pro-GewichtungSouveränität
    RAG & WissensmanagementGutTophoch (voll on-prem möglich)
    Workflow-AutomatisierungGutTophoch (n8n self-hosted)
    Corporate-LLM-SetupsTopTophoch – wenn mit EU-/lokalem Modell
    KI-App-EntwicklungTopTop*niedrig (US-Tools = CLOUD Act; EU-/lokales Modell nötig)
    KI-Beratung & AuditsTopGut–Topneutral (beratend)
    KI-Voice-AgentsGutGutmittel (Telefoniedaten sensibel)
    KI-VideoerstellungTopGutniedrig (US-/CN-Videomodelle)
    Personal-AI-AssistantsTopGut*niedrig ohne Sandbox/EU-Modell
    Microsoft-Copilot-TuningGutMittelniedrig (vertieft MS-Lock-in)
    KI-WebdesignMittelMittelmittel
    KI-CopywritingMittelMittelneutral
    Faceless YouTube/TikTokFlopFlop
    KI-Trading-BotsFlopFlop
    KI-E-Commerce-ShopsFlopFlop
    Website-Chatbots (solo)FlopFlop

    *Stern = grundsätzlich Top-Potenzial, aber mit Souveränitäts- oder Machbarkeits-Vorbehalt (siehe unten).


    5. Wo wir zustimmen – und wo wir anders gewichten

    Die unscheinbaren Gewinner: RAG, Wissensmanagement und Automatisierung

    Schmedding ordnet RAG-/Wissensmanagement-Systeme und Workflow-Automatisierung als „gut" ein. Aus Souveränitäts-Sicht sind das die beiden stärksten Modelle der ganzen Liste – wir heben sie nach oben. Der Grund: Beide lassen sich vollständig auf eigener Infrastruktur umsetzen. Eine Vektordatenbank mit lokal laufendem Embedding-Modell, ein selbstgehostetes n8n hinter dem eigenen Reverse-Proxy – hier verlässt kein sensibles Dokument das Haus. Sie sind das Fundament, auf dem alle anderen Projekte aufsetzen (auch ein Voice-Agent braucht zuerst aufbereitetes Wissen), sie altern langsam, und die Automatisierung ist zugleich der ehrlichste Einsteigerpfad: ein einziger Nischen-Workflow, beim ersten Kunden mühsam, danach beliebig replizierbar. Genau das ist die FL-Pro-Kernlane.

    Corporate-LLM-Setups: richtig erkannt, aber souverän zu Ende gedacht

    Hier sind wir uns mit Schmedding einig, dass dies ein Top-Modell ist – und ergänzen den entscheidenden Halbsatz. Schmedding rahmt das sichere Unternehmens-Workspace „DSGVO-konform" über eine Partnerlösung mit US-Frontier-Modellen. Souverän zu Ende gedacht heißt aber: Das eigentliche Differenzierungsmerkmal im deutschen Markt ist die Möglichkeit, europäische oder lokale Modelle (Mistral, OpenGPT-X) und eine mandantenfähige, DSGVO-feste Architektur anzubieten – statt nur einen hübschen Wrapper um ein US-Modell. Wer das kann, hat genau den Vorsprung, den Schmedding völlig zu Recht als „in den USA gar kein Thema" beschreibt.

    Die US-Tool-Abhängigkeit der „Top"-Modelle

    Drei von Schmeddings Top-Modellen – KI-App-Entwicklung, Personal-AI-Assistants und in Teilen die Videoerstellung – sind hochprofitabel, stehen aber technisch auf US-Frontier-Tools (Claude Code, Codex, Antigravity, Frontier-Videomodelle). Das ist kein Ausschlusskriterium, aber ein Sternchen:

    • KI-App-Entwicklung über Agentic Coding ist real lukrativ. Doch Claude Code und Codex routen Daten standardmäßig in die USA. Und der naheliegende Ausweg – diese Modelle über AWS Bedrock oder Google Vertex AI in einer EU-Region zu betreiben – schafft nur Daten-residenz, nicht Daten-souveränität: AWS und Google sind US-Konzerne und unterliegen dem US CLOUD Act, der US-Behörden den Zugriff auf die Daten erlauben kann – unabhängig davon, wo der Server physisch steht. Echte Souveränität entsteht erst mit europäischen Anbietern oder selbst gehosteten Modellen (Mistral on-premise, OpenGPT-X, Ollama). Für unkritische Projekte ist das egal – für Mittelständler mit sensiblem Code ist es genau der Unterschied, den man kennen und einpreisen sollte.
    • Personal-AI-Assistants für Geschäftsführer sind ein faszinierender, noch leerer Markt. Aber Schmeddings eigenes Beispiel – Claude Code auf einem VPS, der per Telegram/Teams Zugriff auf die Unternehmensinfrastruktur bekommt – ist sicherheitstechnisch genau die Stelle, an der Sandbox, Least-Privilege und im Idealfall ein souveränes Modell den Unterschied zwischen „genial" und „Datenschutz-Albtraum" machen. Top-Potenzial, ja – aber nur mit sauberem, souveränem Setup.
    • KI-Videoerstellung ist als Geschäft stark (vier- bis sechsstellige Filmbudgets, dünne Konkurrenz). Mit Souveränität hat es allerdings wenig zu tun; es ist im Kern eine Kreativagentur mit KI-Werkzeugen. Wir stufen es eine Stufe herab – nicht weil es schlechter verdient, sondern weil es außerhalb der Mittelstands-Souveränitäts-These liegt und hohe kreative Fachtiefe verlangt.

    KI-Beratung: stärkstes Argument, ehrlichste Einschränkung

    Schmeddings bestes Argument im ganzen Video betrifft die KI-Beratung: Unternehmen holen sich Berater nicht nur für das beste Wissen, sondern um Verantwortung auszulagern – ein Bedarf, der auch dann bleibt, wenn die KI selbst besser wird. Dem stimmen wir uneingeschränkt zu. Unsere einzige Ergänzung ist eine doppelte Realitätsprüfung: Erstens ist der Markt der generalistischen „KI-Agenturen" 2026 alles andere als leer – in Deutschland planen zwar rund 78 % der Unternehmen KI-Investitionen, aber nur 12 % wissen, wie; diese Lücke ist die Chance, doch sie zieht entsprechend viele Anbieter an. Schmeddings „Konkurrenz gering" gilt nur für echte Nischen mit echtem Handwerk. Zweitens ist das gerade kein Einsteigermodell: Es verlangt Vertrauen, Vertriebsstärke und Tiefe – die „absoluter Anfänger"-Verheißung des Titels trägt hier am wenigsten.

    Voice-Agents und Chatbots: dazu kommt der AI Act

    Voice-Agents (Schmedding: „gut") bewerten wir genauso – mit zwei Ergänzungen. Die Telefoniedaten sind hochsensibel, weshalb eine EU-/selbstgehostete Sprachverarbeitung (Speech-to-Text und Text-to-Speech) kein Nice-to-have ist. Und ab August 2026 gilt die AI-Act-Transparenzpflicht: Der Anrufer muss erfahren, dass er mit einer KI spricht. Wer das von Anfang an sauber baut, hat – wie Schmedding zu Recht sagt – wenig ernstzunehmende Konkurrenz, weil viele Anbieter schon an DSGVO scheitern. Dieselbe Transparenzpflicht macht die ohnehin schwachen Solo-Website-Chatbots (zu Recht „Flop") noch unattraktiver; ihren einzigen sinnvollen Platz haben sie eingebettet in ein Corporate-LLM – auch das sieht Schmedding richtig.

    Microsoft-Copilot-Tuning: kurzfristig lukrativ, strategisch ein Bumerang

    Schmeddings Bonus-Tipp ist datenseitig gut belegt: Microsoft 365 Copilot hat zwar Millionen bezahlte Seats, aber die tatsächliche Nutzung liegt bei nur rund 36 % – die Lücke zwischen „gekauft" und „genutzt" ist exakt die Beratungschance. Trotzdem stufen wir das Modell auf „mittel" herab: Jede Copilot-Optimierung vertieft die Abhängigkeit vom US-Ökosystem Microsoft – das genaue Gegenteil von Souveränität. Als schneller Umsatz okay; wer seine Kunden ernst nimmt, denkt eine europäische Ausstiegsoption gleich mit.

    Die klaren Flops – volle Zustimmung

    Bei Faceless-Kanälen, Trading-Bots, KI-E-Commerce für Quereinsteiger und Solo-Chatbots gibt es nichts zu relativieren: Schmeddings Flop-Urteile sind richtig. Geringe Marge, brutale Konkurrenz aus Asien bzw. von Plattform-Giganten, keine eigene Marke, keine Datenhoheit, keine Langlebigkeit. Finger weg – dem ist nichts hinzuzufügen.


    6. Das Fazit aus zwei Perspektiven

    Schmeddings Ranking ist als Markt-Landkarte verlässlich. Legt man die Souveränitäts-Brille darüber, verschiebt sich die Spitze: Die nachhaltigsten Modelle sind die, die Wert auf einer Infrastruktur schaffen, die der Kunde selbst besitzen kann – Wissensaufbereitung, Automatisierung und souverän gebaute Unternehmens-KI. Alles, was auf US-Frontier-Tools steht, bleibt lukrativ, trägt aber ein Souveränitäts-Sternchen.

    Für den deutschen Mittelstand lassen sich daraus drei nüchterne Empfehlungen ableiten:

    1. Fang beim Fundament an. Datenaufbereitung (RAG) und Automatisierung sind die unspektakulärsten, aber souveränsten und einsteigerfreundlichsten Wege – und die Basis für alles Weitere.
    2. Bau souverän, wo es zählt. Bei allem, was sensible Daten berührt – Voice-Agents, Personal-Assistants, Corporate-LLM – entscheidet die Architektur (EU-/lokale Modelle, Sandbox, On-Premise) über Wert und Risiko. Das ist verkaufbar als Vorsprung, nicht als Kostenfaktor.
    3. Nimm die Einsteiger-Verheißung mit Augenmaß. Die Top-Modelle verdienen top, weil sie Fachtiefe verlangen. „Auch als absoluter Anfänger" stimmt für den Einstieg (Automatisierung, Webdesign) – nicht für die Königsklasse.

    Schmeddings Video bleibt eine klare Empfehlung – ihm fehlt nichts, es beantwortet seine Frage vollständig. Es zeigt ehrlich, wo das Geld ist. Wir legen nur einen zweiten Blick daneben: wo davon das Geld liegt, das man auch in fünf Jahren noch souverän in der Hand hält.


    Quelle / Ursprung dieses Beitrags: Leonard Schmedding (Everlast AI): „Die 14 Wege mit KI Geld zu verdienen (auch als absoluter Anfänger)" – YouTube, 6. Juni 2026.

    Weiterführende Belege (Stand 23. Juni 2026): Souveräne EU-LLMs 2026 (Mistral, Teuken/OpenGPT-X) · On-Premise-LLM & DSGVO-Guide · Claude Enterprise: EU-Datenresidenz nur via Bedrock/Vertex · Microsoft-365-Copilot-Adoption 2026 · EU AI Act – Transparenzpflicht ab August 2026 (Art. 50) · KI-Markt & Agentur-Sättigung Deutschland


    ▶ Das Original-Video

  • Wenn die USA ihre KI verstaatlichen: die Fable-5-Sperre ist erst der Anfang

    Wenn die USA ihre KI verstaatlichen: die Fable-5-Sperre ist erst der Anfang

    Nicht das gesperrte Modell ist die eigentliche Nachricht – sondern die Richtung dahinter: Die USA machen Frontier-KI zur Staatssache.

    Wenn die USA ihre KI verstaatlichen: die Fable-5-Sperre ist erst der Anfang

    Nicht das gesperrte Modell ist die eigentliche Nachricht – sondern die Richtung dahinter: Die USA machen Frontier-KI zur Staatssache.

    Und Europas Wirtschaft hängt mit voller Wucht daran. Am 12. Juni 2026 zwang eine US-Exportkontroll-Direktive Anthropic, seine stärksten Modelle Fable 5 und Mythos 5 für sämtliche Nicht-US-Bürger abzuschalten – über Nacht, mit Verweis auf die nationale Sicherheit. Den Anstoß zu dieser Einordnung gab eine Analyse des KI-Beraters Leonard Schmedding; die hier genannten Entwicklungen haben wir an öffentlichen Quellen geprüft (siehe unten).

    Das eigentliche Thema: KI wird Staatssache

    Die zentrale These ist unbequem, aber sie ist längst keine reine Spekulation mehr: Die USA behandeln führende KI zunehmend als nationales Sicherheitsgut – und greifen nach Kontrolle. Exportkontrollen sind dabei nur der sichtbarste Hebel. Der zweite sind Eigentumsanteile.

    Die Belege haben sich in wenigen Wochen verdichtet: Am 5. Juni 2026 erklärte Donald Trump öffentlich, seine Regierung prüfe staatliche Beteiligungen an führenden KI-Unternehmen – namentlich genannt wurden OpenAI und xAI. OpenAI selbst hatte bereits im April 2026 einen „Public Wealth Fund" vorgeschlagen, über den es Anteile an den Staat abtreten würde. Aus der anderen politischen Ecke kommt Druck von Bernie Sanders: Sein „American AI Sovereign Wealth Fund Act" verlangt eine einmalige 50-Prozent-Abgabe, zahlbar in Aktien – und nennt OpenAI, Anthropic und xAI. Wichtig zur Einordnung: Anthropic ist (anders als OpenAI/xAI) nicht Teil der Beteiligungsgespräche mit der Regierung; das Verhältnis gilt als angespannt. Formale Deals gibt es bislang keine – aber die Richtung ist von links wie rechts dieselbe.

    Die ideologische Folie liefert Palantir-CEO Alex Karp in seinem Buch „The Technological Republic": Eine Technologie, die über künftige Machtverhältnisse entscheidet, gehöre zwangsläufig in den Dienst des Staates. Ob es exakt so kommt, ist offen. Dass die Tür weit offensteht, ist es nicht.

    Warum das Europas Problem ist

    Für europäische Unternehmen ist das keine US-Innenpolitik, sondern eine direkte Bedrohung der eigenen Handlungsfähigkeit. Denn der Kontinent läuft heute weitgehend auf amerikanischer KI. Wird dieser Zugang zum Instrument nationaler Interessen, dann gilt: Was unter staatlicher Kontrolle steht, kann priorisiert, rationiert oder gekappt werden – und zwar zuerst zugunsten amerikanischer und zulasten ausländischer Nutzer. Die Fable-5-Sperre hat genau das vorgeführt: Sie traf gezielt foreign nationals.

    Wie ungleich das Kräfteverhältnis ist, zeigt eine einzige Zahl: Nur rund 5 Prozent des globalen KI-Computes stehen in der EU – die USA stellen mit 74 bis 80 Prozent etwa die 17-fache Kapazität. Und die Unternehmen ahnen die Gefahr: Laut der Lünendonk-Studie „Digitale Souveränität – Vom Risiko zur Resilienz" halten 83 Prozent einen „Kill-Switch" durch einen US-Anbieter für realistisch – aber nur 57 Prozent haben eine belastbare Exit-Strategie. Genau diese Lücke entscheidet, wer im Ernstfall arbeitsfähig bleibt.

    Das Signal: die Sperre von Fable 5 und Mythos 5

    In dieses Bild fügt sich die Sperre nahtlos ein. Fable 5 war kurz das Beste, was verfügbar war – und dann, per Exportentscheidung, für alle Nicht-US-Nutzer weg. Auslöser war laut US-Regierung ein als sicherheitskritisch eingestufter Jailbreak (kolportiert wird ein chinesischer Zugriff); Anthropic hielt das Vorgehen für überzogen und widersprach öffentlich – musste die Modelle aber abschalten. Die Lehre bleibt dieselbe, egal wie man den Einzelfall bewertet: Uneingeschränkter Zugang zu Spitzen-KI war ein Zustand, kein Naturgesetz. Er kann jederzeit enden – ohne Vorwarnung, ohne Mitspracherecht der europäischen Anwender.

    Vom Konsumgut zum Staatsinteresse

    Dahinter steckt ein Bruch mit der libertären Gründerphilosophie des Silicon Valley. Die Phase, in der Technologie vor allem als „ephemeres Konsumgut" im Abomodell gedacht wurde, geht laut Schmedding zu Ende. KI rückt in dieselbe Kategorie wie Energie oder Rüstung: zu wichtig, um sie dem freien Markt zu überlassen. Für Nutzer außerhalb der USA heißt das: Im Konflikt zwischen kommerzieller Verfügbarkeit und nationaler Sicherheit verliert die Verfügbarkeit.

    Das chinesische Gegenmodell – ein Ausweg, wenn Europa selbst hostet

    Hier wird es scheinbar paradox: Ausgerechnet China, der Staat, der seine Technologie sonst straff kontrolliert, stellt viele seiner stärksten Modelle frei zur Verfügung. DeepSeek, Alibabas Qwen, Zhipus GLM, Moonshots Kimi – sie erscheinen als Open Weights, zum Herunterladen und Selbst-Betreiben, ohne Schalter aus Washington. Während die USA ihre Frontier-KI einsperren, verschenkt China sie.

    Ein echter Widerspruch ist das nur auf den ersten Blick. Beide betreiben Techno-Staatskunst – mit umgekehrten Hebeln. Die USA führen und nutzen Knappheit als Macht: kontrollieren, wer Zugang hat. China liegt am Frontier zurück (auch wegen der US-Chip-Exportkontrollen) und nutzt Allgegenwart als Macht: die Spitzentechnologie zur Massenware machen, den Vorsprung der US-Labore entwerten, globale Abhängigkeit von chinesischen Modell-Stacks aufbauen, Standards setzen. Eine US-Kongress-Kommission beschreibt genau das als industrielle Dominanzstrategie. „Offen" heißt dabei offene Gewichte – nicht offene Werte: staatliche Ausrichtung und Zensur sind eingebaut, im Inland bleibt die Kontrolle eng.

    Für Europa liegt genau hier die Chance – sie hängt aber an einer Bedingung: dem Hosting. Bezieht man ein chinesisches Modell über dessen Cloud oder API, tauscht man nur die US- gegen eine chinesische Abhängigkeit. Lädt man dieselben offenen Gewichte herunter und betreibt sie selbst – lokal oder in einem europäischen Rechenzentrum –, wird daraus ein echter Ausweg: Ein Modell, das auf eigener Infrastruktur läuft, kann niemand aus der Ferne abschalten oder rationieren. Was bleibt, ist eine Wertefrage (staatlich geprägtes Training) – aber genau das Verfügbarkeits- und Kill-Switch-Risiko, um das es hier geht, ist damit gelöst. Entscheidend ist also nicht die Herkunft des Modells, sondern wo es läuft und wer es kontrolliert.

    Intelligenz als kritische Infrastruktur

    Jensen Huang (NVIDIA) spricht von „Intelligence Infrastructure" – KI als Grundressource wie Strom oder Wasser. Der Zukunftsforscher Sven Gábor Jánszky geht weiter: Zugang zu KI werde künftig zur Daseinsvorsorge zählen. Beides klingt nach Fortschritt – kippt aber ins Bedrohliche, sobald diese Infrastruktur einem fremden Staat gehört. Wer seine Prozesse tief in US-Cloud-Modelle gegossen hat, ohne autarke Alternative, ist dann nicht souverän, sondern abhängig.

    Das Ende der billigen Tokens

    Auch ökonomisch ist die heutige Bequemlichkeit nicht von Dauer. Die Analysten von SemiAnalysis haben nachgerechnet, wie stark die Endkundenpreise subventioniert sind: Ein Plan für rund 200 US-Dollar im Monat liefert real API-Tokens im Gegenwert von etwa 8.000 Dollar (Claude) bis 14.000 Dollar (ChatGPT) – eine 40- bis 70-fache Subvention. Diese Phase diente der Marktgewinnung; sie ist nicht haltbar. Wer Prozesse blind auf das heutige Token-Niveau kalkuliert, baut auf Sand.

    Energie als Flaschenhals

    Selbst ohne Politik gibt es eine harte Grenze: Energie. Huang nennt KI eine „Power Limited Industry" – die Rechenleistung ist an verfügbaren Strom gekoppelt. In Mangellagen wird der Staat priorisieren, im Zweifel zugunsten nationaler Sicherheit und zulasten privater, erst recht ausländischer Nutzer. Sperren wie bei Fable 5 sind damit kein Ausreißer, sondern strukturell angelegt.

    Was das für den Mittelstand heißt

    Die gute Nachricht: Abhängigkeit ist eine Entscheidung – und damit umkehrbar. Wer KI ernsthaft einsetzt, trifft eine Architekturentscheidung, keine Tool-Wahl. Drei Hebel:

    • Lokale KI als Backup. Modelle, die offline laufen (etwa über Ollama), sichern Standardaufgaben – E-Mail-Zusammenfassungen, einfache Analysen – gegen jede Abschaltung von außen ab.
    • Ein modell-agnostischer Workspace. Ein „Corporate LLM" bündelt US-Cloud, EU-gehostete Instanzen und lokale Modelle unter einer Oberfläche. Fällt ein Anbieter aus oder wird zu teuer, wechselt man das Modell per Klick – ohne Agenten-Logiken, Integrationen und Wissensmanagement zu verlieren.
    • Modelle orchestrieren statt verschwenden. Nicht jede Trivialaufgabe braucht das Spitzenmodell. Kluge Lastverteilung zwischen Cloud und eigener Hardware senkt Risiko und Kosten zugleich.

    Wer zuerst die eigene Abhängigkeit kartieren will, findet in einem KI-Fahrplan-Workshop den nüchternen Einstieg: Wo hängen wir an wem – und was wäre der Plan B?

    Souverän bleiben – die Mittel gibt es

    Die Konsequenz ist kein Tech-Pessimismus, sondern eine Aufgabe – und die nötigen Bausteine existieren längst. Ein modell-agnostisches Cockpit, das US-Cloud, EU-gehostete und lokale Modelle bündelt – DSGVO-konform, auf Wunsch on-premise –, gibt es heute von mehreren Anbietern (etwa Auxdata); die Übersicht souveräner Anbieter zeigt die Bandbreite. Entscheidend ist das Prinzip, nicht das Produkt: Fällt ein Anbieter weg, bleibt das aufgebaute Wissen – und man wechselt das Modell, statt von vorn zu beginnen.

    Die vollständige Verstaatlichung der US-KI mag noch nicht beschlossen sein. Die Lehre aus Fable 5 ist es: KI ist kritische Infrastruktur – und kritische Infrastruktur überlässt man keiner fremden Regierung.

    Quellen


    Quelle: Leonard Schmedding (YouTube)

  • OpenAI kauft Ona (ex-Gitpod): Europas Agenten-Infrastruktur wandert nach San Francisco

    OpenAI kauft Ona (ex-Gitpod): Europas Agenten-Infrastruktur wandert nach San Francisco

    OpenAI übernimmt das Kieler Startup Ona (ehemals Gitpod) — einer der größten deutschen Tech-Exits der letzten Jahre.

    OpenAI kauft Ona (ex-Gitpod): Europas Agenten-Infrastruktur wandert nach San Francisco

    OpenAI übernimmt das Kieler Startup Ona (ehemals Gitpod) — einer der größten deutschen Tech-Exits der letzten Jahre.

    Der wohl wertvollste deutsche KI-Baustein der Agenten-Ära gehört damit bald einem US-Konzern — ein Lehrstück über europäische Souveränität, das unbequemer ist als die Erfolgsmeldung klingt.

    Was passiert ist

    OpenAI hat am 11. Juni 2026 angekündigt, das Kieler Unternehmen Ona zu übernehmen — bekannter unter seinem früheren Namen Gitpod. Es ist laut Gründerszene einer der größten deutschen Tech-Exits der letzten Jahre. Über den Kaufpreis schweigen beide Seiten; Branchenschätzungen (IDC) verorten Onas Jahresumsatz 2025 bei rund 7 Millionen Dollar. Der Deal ist noch nicht abgeschlossen, regulatorische Genehmigungen stehen aus. Mit dem Abschluss wechselt das gesamte rund 79-köpfige Team um Gründer und CEO Johannes Landgraf in OpenAIs Codex-Gruppe. Rund zwei Millionen Entwickler haben die Plattform bereits genutzt.

    Warum OpenAI ausgerechnet Ona braucht

    Der Zeitpunkt ist kein Zufall. OpenAIs Coding-Agent Codex zählt inzwischen fünf Millionen wöchentlich aktive Nutzer — ein Plus von 400 Prozent seit Jahresbeginn, von rund drei Millionen noch im April. Doch die wertvollsten Anwendungsfälle laufen nicht mehr in Minuten ab, sondern über Stunden oder Tage: komplexe Refactorings, mehrstufige Analysen. Ein Agent, der das leisten soll, darf nicht an ein zugeklapptes Laptop gebunden sein. Genau hier hatte OpenAI eine Lücke — und steckt im Kopf-an-Kopf-Rennen mit Anthropic, dessen Claude Code als wesentlicher Wachstumstreiber gilt. Beide haben bereits vertrauliche IPO-Unterlagen eingereicht. Wer das Enterprise-Geschäft gewinnen will, braucht nicht nur das beste Modell, sondern die Ausführungs- und Compliance-Schicht darunter. Selbst zu bauen hätte Monate gekostet — Zeit, die man gegen Anthropic nicht hat.

    Was Ona kann — und warum das strategisch ist

    Was als Ein-Klick-Cloud-IDE für GitHub begann, hat sich gewandelt: Im September 2025 benannte sich Gitpod in Ona um und positionierte sich neu als „KI-Software-Engineer". Das Produkt liefert sichere, dauerhaft laufende Cloud-Umgebungen, in denen KI-Agenten mit Zugriff auf Werkzeuge und Kontext arbeiten — und zwar innerhalb der Infrastruktur des jeweiligen Unternehmens. Onas Modell heißt „customer-controlled execution": Der Kunde behält die Kontrolle über Infrastruktur, Zugangsdaten und Logs, während der Anbieter die Intelligenz beisteuert. Genau das überzeugt Kundschaft mit hohen Compliance-Anforderungen — eine große US-Bank, europäische Pharmakonzerne, asiatische Staatsfonds.

    Der Souveränitäts-Haken

    Hier wird es unbequem. Onas „customer-controlled execution" ist im Kern dasselbe Prinzip, mit dem datensouveräne KI in Europa argumentiert: Daten und Schlüssel bleiben beim Anwender, die Kontrolle verlässt das Haus nicht. Eben dieser Baustein gehört künftig OpenAI. Und Ona ist kein Einzelfall: Nur wenige Wochen zuvor übernahm Mistral AI das Linzer Physics-AI-Startup Emmi AI — ebenfalls aus dem Portfolio des Wiener Wagniskapitalgebers Speedinvest. Dessen Chef Oliver Holle bringt die optimistische Lesart auf den Punkt: „Europäische Gründer bauen Technologien, die selbst die führenden KI-Unternehmen der Welt brauchen." Das stimmt — nur eben zur Hälfte: gebaut in Europa, kontrolliert anderswo. Europas Talent und Kapital liefern die strategisch unverzichtbaren Bausteine; die Wertschöpfung und die Kontrolle wandern ab.

    Was das für den Mittelstand heißt

    Am Tagesgeschäft ändert der Deal für deutsche Unternehmen zunächst wenig — an der Richtung viel. Wer Coding-Agenten wie Codex oder Claude Code im Betrieb einsetzt, sollte die Frage „Wo laufen meine Agenten, und wer hält eigentlich Zugangsdaten und Logs?" zur Architekturentscheidung machen, nicht zur Fußnote. Genau an diesem Punkt werden datensouveräne Backends — DSGVO-konform, Schlüssel beim Kunden — vom Nice-to-have zum Auswahlkriterium. Die Werkzeuge zu beherrschen ist das eine; zu wissen, wo die Kontrolle liegt, das andere. Europa kann die Bausteine bauen. Die eigentliche Aufgabe ist, sie auch zu behalten.

    Die europäische Antwort: souverän bleiben mit Auxdata

    Wer die Kontrolle nicht abgeben will, muss es auch nicht. Für genau dieses Bedürfnis — KI-Agenten produktiv nutzen, ohne Daten, Zugangsdaten und Logs aus der Hand zu geben — gibt es europäische Plattformen. Auxdata etwa verfolgt denselben Grundgedanken wie Onas „customer-controlled execution“, nur unter europäischer Kontrolle und DSGVO-konform: Modelle und Agenten laufen über ein datensouveränes Backend — mit Anonymisierung, abgestuften Datenschutz-Stufen und Audit-Trail, auf Wunsch auch on-premise im eigenen Haus. So lässt sich der Sprung in die Agenten-Ära mitgehen, ohne die strategische Kontrolle gleich mit nach San Francisco zu schicken.

    Quellen


    Präsentation

    Quelle: business-punk.com + OpenAI/CNBC (eigene Recherche)

    📄 Slide-Deck zum Beitrag: Präsentation (PDF)

  • Briefing: Die Einführung der Claude Mythos-Klasse (Fable 5 und Mythos 5)

    Briefing: Die Einführung der Claude Mythos-Klasse (Fable 5 und Mythos 5)

    Am 9. Juni 2026 veröffentlichte Anthropic mit **Claude Fable 5** und **Claude Mythos 5** eine neue Leistungsklasse von KI-Modellen, die über der bisherigen Opus-Stufe angesiedelt ist. Beide Modelle basieren auf derselben Architektur mit **10 Billionen Parametern** und markieren einen signifikanten Sprung in der Autonomie und Problemlösungsfähigkeit von KI-Systemen.

    Briefing: Die Einführung der Claude Mythos-Klasse (Fable 5 und Mythos 5)

    Executive Summary

    Am 9. Juni 2026 veröffentlichte Anthropic mit Claude Fable 5 und Claude Mythos 5 eine neue Leistungsklasse von KI-Modellen, die über der bisherigen Opus-Stufe angesiedelt ist. Beide Modelle basieren auf derselben Architektur mit 10 Billionen Parametern und markieren einen signifikanten Sprung in der Autonomie und Problemlösungsfähigkeit von KI-Systemen.

    Die wichtigsten Erkenntnisse dieser Markteinführung sind:

    • Zweigleisige Strategie: Während Claude Fable 5 mit integrierten Sicherheitsfiltern für die breite Öffentlichkeit zugänglich ist, bleibt Claude Mythos 5 (ohne diese Einschränkungen) spezialisierten Partnern für Cybersicherheit und Forschung vorbehalten.
    • Überlegene Autonomie: Fable 5 glänzt bei „Long-Horizon“-Aufgaben. In Tests konnte das Modell komplexe Software-Migrationen, die normalerweise Monate dauern, an einem einzigen Tag abschließen.
    • Neuartige Sicherheitsmechanismen: Fable 5 nutzt einen Fallback-Mechanismus. Bei potenziell riskanten Anfragen (Biologie, Chemie, Cybersicherheit) übernimmt automatisch das Modell Claude Opus 4.8 die Beantwortung.
    • Neue Datenschutzstandards: Für die Mythos-Klasse gilt eine obligatorische 30-tägige Datenaufbewahrung zur Sicherheitsüberwachung, was eine Abkehr von bisherigen Zero-Data-Retention-Optionen für Unternehmenskunden darstellt.
    • Aggressive Preisgestaltung: Mit 10 $ pro 1 Mio. Input-Token und 50 $ pro 1 Mio. Output-Token sind die Modelle deutlich günstiger als die vorherige Mythos-Preview, jedoch teurer als die Opus-Klasse.

    1. Modell-Architektur und technische Spezifikationen

    Die Mythos-Klasse stellt die bisher leistungsfähigste Generation der Claude-Modelle dar. Sie wurde speziell für Aufgaben entwickelt, die tiefes Fachwissen und die Koordination über komplexe Systeme hinweg erfordern.

    • Parameter-Skalierung: Mythos 5 ist das erste öffentlich zugängliche Modell, das die Schwelle von 10 Billionen Parametern überschreitet.
    • Mixture of Experts (MoE): Das Modell nutzt eine dynamische Routing-Architektur, bei der pro Token nur schätzungsweise 800 Milliarden bis 1,2 Billionen Parameter aktiv sind, was die Effizienz trotz der Modellgröße steigert.
    • Kontext-Kapazität: Beide Modelle unterstützen standardmäßig ein Kontextfenster von 1 Million Token (bei einer maximalen Ausgabe von 128.000 Token).
    • Adaptive Thinking: Diese Funktion ist dauerhaft aktiviert. Das Modell entscheidet eigenständig, wann und wie intensiv es interne Denkprozesse („Reasoning“) einsetzt, um die Antwortqualität zu optimieren.

    2. Leistungsanalyse und Benchmarks

    Fable 5 und Mythos 5 setzen neue Maßstäbe in fast allen relevanten KI-Leistungstests. Der Vorsprung gegenüber Vorgängermodellen und Wettbewerbern ist besonders bei komplexen Aufgaben deutlich.

    Software-Engineering und Coding

    Das Modell dominiert insbesondere bei Aufgaben, die das Verständnis ganzer Codebasen erfordern:

    • FrontierCode (Cognition): Höchster Score unter allen Frontier-Modellen.
    • SWE-bench Pro: Fable 5 erreicht eine Erfolgsquote von 80,3 % (im Vergleich zu 58,6 % bei GPT 5.5).
    • Multi-File Refactoring: Mit einer Erfolgsquote von 82,7 % übertrifft das Modell Wettbewerber wie Grok 4 (67,1 %) bei der Koordination von Änderungen über viele Dateien hinweg deutlich.

    Wissensarbeit und Analyse

    • Hebbia Finance Benchmark: Erreicht die höchste jemals gemessene Punktzahl für logisches Denken auf Senior-Level.
    • GPQA Diamond: Ein Score von 86,7 % unterstreicht die wissenschaftliche Kompetenz.
    • Vision-Fähigkeiten: Das Modell kann Web-Apps allein aus Screenshots rekonstruieren und komplexe wissenschaftliche Diagramme präzise auswerten. Ein timelapse-Video zeigt zudem, wie Fable 5 das Spiel Pokémon FireRed rein visuell und ohne zusätzliche Hilfsmittel durchspielt.

    3. Differenzierung: Fable 5 vs. Mythos 5

    Obwohl beide auf dem gleichen Modell basieren, unterscheiden sie sich durch ihre Sicherheitsarchitektur und Zielgruppen.

    MerkmalClaude Fable 5Claude Mythos 5
    ZielgruppeAllgemeinheit / UnternehmenGekennzeichnete Partner (Project Glasswing)
    SicherheitsfilterStreng (Cyber, Bio, Chemie)Gelockert für autorisierte Defensivarbeit
    FallbackAutomatisch zu Opus 4.8Keiner
    VerfügbarkeitGlobal verfügbarEingeschränkt / Einladung erforderlich

    Der Fallback-Mechanismus: Bei Fable 5 lösen etwa 5 % der Sitzungen einen Fallback aus. Erkennt das System eine Anfrage, die gegen Sicherheitsrichtlinien (z. B. Biowaffenforschung oder offensive Cyberangriffe) verstoßen könnte, antwortet Claude Opus 4.8 statt Fable 5. Dies ermöglicht den breiten Zugang zur hohen Intelligenz des Modells, während die gefährlichsten Fähigkeiten blockiert bleiben.


    4. Fachspezifische Durchbrüche (Mythos 5)

    In kontrollierten Umgebungen (Project Glasswing) hat die uneingeschränkte Version bereits transformative Ergebnisse geliefert:

    • Biologie und Pharmazie: Mythos 5 beschleunigte die Medikamentenentwicklung um das Zehnfache. Es entwarf eigenständig Proteinkomplexe für Ziele wie Neurodegeneration und Muskelkrankheiten. In 80 % der Fälle bevorzugten Wissenschaftler die vom Modell generierten molekularbiologischen Hypothesen gegenüber denen der Opus-Klasse.
    • Genomik: Das Modell führte über eine Woche lang weitgehend autonom Forschung an Millionen von Einzelzelldaten durch und entwickelte ein Modell zur Identifizierung von Zellrollen, das Fachpublikationen in der Zeitschrift Science übertraf.
    • Cybersicherheit: Mythos 5 fand Schwachstellen in „jedem großen Betriebssystem und jedem großen Webbrowser“. Mozilla nutzte das Modell, um 271 Sicherheitslücken in Firefox zu identifizieren und zu beheben.

    5. Sicherheit und neue Datenrichtlinien

    Mit der Einführung der Mythos-Klasse verschärft Anthropic die Sicherheits- und Überwachungsregeln:

    • 30-Tage-Aufbewahrung: Alle Prompts und Outputs werden für 30 Tage gespeichert, um Missbrauchsmuster (wie „Best-of-N Jailbreaking“ oder staatlich geförderte Spionage) zu erkennen. Dies gilt auch für Kunden, die zuvor Zero-Data-Retention (ZDR) nutzten.
    • Sicherheits-Review: Der Zugriff auf diese Daten ist streng limitiert und wird in fälschungssicheren Protokollen geloggt. Eine Nutzung der Daten zum Training neuer Modelle erfolgt nicht.
    • Uplift-Prävention: Die Sicherheitsfilter sollen verhindern, dass Angreifer durch die KI Informationen erhalten, die über das Wissen herkömmlicher Suchmaschinen hinausgehen.

    6. Verfügbarkeit und Preisgestaltung

    Anthropic hat ein gestaffeltes Modell für den Rollout gewählt, um die hohe Nachfrage zu bewältigen.

    • API-Preise: 10 $ pro 1 Mio. Input-Token / 50 $ pro 1 Mio. Output-Token.
    • Abonnement-Pläne (Pro, Max, Team):
    • Ab 23. Juni: Das Modell wird aus den Standard-Abos entfernt und erfordert „Usage Credits“ (Einzelabrechnung).
    • Langfristig: Anthropic plant, Fable 5 wieder fest in Abos zu integrieren, sobald ausreichende Rechenkapazitäten vorhanden sind.

    Infrastruktur: Das Modell ist über die Claude API, AWS Bedrock, Google Cloud Vertex AI und Microsoft Foundry verfügbar.


    7. Einschätzungen und Reaktionen

    Die Reaktionen auf die Einführung sind geteilt und spiegeln die Ambivalenz der Technologie wider.

    • Unternehmensfeedback: Stripe bezeichnete das Modell als „Engineering-Beschleuniger“. Rechtsabteilungen stellten fest, dass Fable 5 bei Vertragsprüfungen (Redlines) menschliche Anwälte in Blindtests erreichte oder übertraf.
    • Sicherheitsbedenken: US-Finanzminister Scott Bessent und Fed-Chef Jerome Powell warnten Banken-CEOs unmittelbar nach der Ankündigung vor den neuen Cyber-Risiken. Experten wie Thomas Fraise warnen sogar vor einer Destabilisierung der nuklearen Abschreckung durch KI-gestützte Cyberangriffe.
    • Nutzerfeedback: In Foren wie Reddit wird Fable 5 für seine „warme und menschliche“ Persönlichkeit gelobt, die an frühere Opus-Versionen erinnert, während gleichzeitig die hohen Kosten und die strengen Sicherheits-Fallbacks bei wissenschaftlichen Themen kritisiert werden.

    Quelle: Anthropic: Claude Fable 5 and Claude Mythos 5

  • Das Ende der Konversation: Warum OpenAI den Chat für tot erklärt und die Ära der Agenten einläutet

    Das Ende der Konversation: Warum OpenAI den Chat für tot erklärt und die Ära der Agenten einläutet

    Die Technologiebranche steht vor einer fundamentalen Zäsur, die weit über kosmetische App-Updates hinausgeht. Während das Jahr 2022 den Aufstieg der generativen KI durch reaktive Chat-Interfaces markierte, signalisiert OpenAI für die nahe Zukunft das Ende dieser Ära. Branchenkenner beobachten eine radikale Neuausrichtung: Weg von Systemen, die lediglich Fragen beantworten, hin zu autonomen Agenten, die komplexe Aufgaben eigenständig ausführen. Dieser Schwenk ist kein reiner Innovationsdrang – er ist eine ökonomische Notwendigkeit im harten Wettbewerb mit Anthropic und Google.

    Das Ende der Konversation: Warum OpenAI den Chat für tot erklärt und die Ära der Agenten einläutet

    Die Technologiebranche steht vor einer fundamentalen Zäsur, die weit über kosmetische App-Updates hinausgeht. Während das Jahr 2022 den Aufstieg der generativen KI durch reaktive Chat-Interfaces markierte, signalisiert OpenAI für die nahe Zukunft das Ende dieser Ära. Branchenkenner beobachten eine radikale Neuausrichtung: Weg von Systemen, die lediglich Fragen beantworten, hin zu autonomen Agenten, die komplexe Aufgaben eigenständig ausführen. Dieser Schwenk ist kein reiner Innovationsdrang – er ist eine ökonomische Notwendigkeit im harten Wettbewerb mit Anthropic und Google.

    1. Die Zäsur: Warum das Paradigma „Chat“ an seine Grenzen stößt

    Die provokante These eines leitenden OpenAI-Mitarbeiters – „Chat is dead“ – beschreibt den Abschied vom reaktiven Modell. Bisher fungierte die KI als passiver Gesprächspartner, der auf Prompts wartete. Doch das bloße Textfenster erweist sich als unzureichendes Interface für professionelle Workflows. OpenAI-Manager sehen den Chat künftig nur noch als „Entry Point“ für die eigentlichen, wertschöpfenden Dienste.

    Strukturelle Defizite aktueller Chat-Interfaces

    Aus der Analyse von Produktionsumgebungen lassen sich vier zentrale Schwachstellen isolieren, die den klassischen Chat für Unternehmen zunehmend unbrauchbar machen:

    • Chat-Tab-Amnesie: Sobald ein Browser-Tab geschlossen wird, „stirbt“ der aktuelle Status. Es fehlt eine integrierte Zustandspersistenz (State), um über Sitzungsgrenzen hinweg konsistent an komplexen Projekten zu arbeiten.
    • Kontextdrift bei komplexen Ketten: Bei mehrstufigen Aufgaben neigen Sprachmodelle dazu, vom ursprünglichen Ziel abzuweichen. Diese Fragilität senkt die Zuverlässigkeit in langen Prozessketten massiv.
    • Unstrukturierte Ausgaben: Die Erzeugung von freiem Text erschwert die automatisierte Weiterverarbeitung. Ohne deterministische Strukturen scheitert die verlässliche Übergabe an nachfolgende Business-Systeme.
    • Aufwand für „Manual Glue Work“: Der Nutzer wird oft zur manuellen Schnittstelle degradiert, die Daten kopieren, formatieren und korrigieren muss, um den Informationsfluss zwischen Mensch und Maschine aufrechtzuerhalten.

    Vergleich: Klassische Chatbots vs. KI-Agenten

    KriteriumKlassische ChatbotsKI-Agenten
    FunktionsweiseReaktiv (antwortet auf Prompts)Proaktiv (führt Aufgaben autonom aus)
    ZielsetzungInformation & TextgenerierungErgebnis & Prozesserledigung
    NutzerrolleManuelle Schnittstelle / „Vibe-Coder“Auftraggeber / Strategische Instanz
    KontextFlüchtiger SitzungsverlaufPersistente Speicher & Shared State

    2. OpenAIs Masterplan: Der Umbau zur agentischen Super-App

    Hinter den Kulissen vollzieht OpenAI den größten Umbau seit dem Launch von ChatGPT. Das Ziel ist die Transformation zu einer „Super-App“, die als zentrales Betriebssystem für das digitale Leben fungiert.

    Strategische Neuausrichtung und Rivalitätsdruck

    Unter der Leitung von Thibault Sottiaux, der zuvor das Programmier-Tool Codex verantwortete, wurden die Teams für ChatGPT, Codex und die Plattform-Entwicklung konsolidiert. Diese personelle Bündelung unterstreicht die neue Marschrichtung: Agenten-Power statt Plauderei.

    Der Druck ist immens: Während Google mit Gemini massiv bei den Nutzerzahlen aufholt (900 Mio. MAU), zieht der Rivale Anthropic beim Umsatzwachstum teilweise an OpenAI vorbei. Branchenanalysten wie Jenny Xiao (Leonis Capital) konstatieren ein Konvergenz-Phänomen: OpenAI muss nun – genau wie Anthropic – die Strategie „erst Geld verdienen, dann träumen“ verfolgen. Dies führt zu harten Priorisierungen: Während Prestigeprojekte wie die Video-KI Sora teilweise pausiert oder de-priorisiert wurden, fließt die Energie nun in margenstarke Enterprise-Produkte.

    Wirtschaftlicher Kontext: Der IPO-Fokus

    Mit einer Bewertung von rund 850 Mrd. USD und dem geplanten Börsengang (IPO) im Blick, ist OpenAI gezwungen, profitable Umsatzstrukturen nachzuweisen.

    • Enterprise-Offensive: Der Umsatzanteil durch Firmenverträge soll von derzeit 40 % auf über 50 % gesteigert werden.
    • Hebel Codex: Das Programmier-Tool Codex ist das Zugpferd dieser Strategie. Seit Einführung der Desktop-App im Februar hat sich die Nutzerzahl auf über 5 Millionen wöchentlich Aktive versechsfacht. Codex dient als technologisches Fundament, um hochpreisige Agenten-Infrastrukturen im Entwicklungssektor zu etablieren.

    Das Partner-Ökosystem und die Markenerosion

    OpenAI integriert Partner wie Canva und Booking.com direkt in die neue Oberfläche. Doch die strategische Planung sieht vor, Prompts und Markenpräsenz der Partner langfristig verschwinden zu lassen. Sobald die KI Absichten („Intents“) autonom erkennt, werden Drittanbieter zu bloßen API-Lieferanten im Hintergrund degradiert. Alex Embiricos (Head of Enterprise Product) skizziert eine AGI-Zukunft, in der eine „Single Entity“ alle Bedürfnisse erfüllt und individuelle Markenidentitäten bedeutungslos werden.


    3. Konkrete Implikationen für Anwender und Unternehmen

    Der Übergang vom Chat zum agentischen Workflow ermöglicht zwei primäre Pfade der Wertschöpfung:

    1. Track A: Kapazitätssteigerung (Ops-first): Automatisierung von Routineprozessen wie Intake-Verfahren, Reporting oder Compliance-Checks.
    2. Track B: Opportunity-Generierung (Signal-to-Action): Agenten scannen aktiv Marktsignale – etwa öffentliche Anhörungen, Genehmigungsverfahren (Permitting) oder Ausschreibungen (RFPs) – und erstellen autonom erste Entwürfe für Angebote.

    Die Realitätsprüfung: Der Reliability Gap

    Analysten-Box: Diskrepanz zwischen Nutzung und Delegation Die Datenlage ist eindeutig: Während rund 60 % der Entwickler KI-Tools in ihren Alltag integriert haben, können nur 0–20 % der Aufgaben tatsächlich vollständig autonom delegiert werden. Diese Lücke resultiert aus mangelhafter Error Recovery. Sobald ein Agent auf ein unvorhergesehenes Hindernis stößt, „friert“ das System ein oder halluziniert.

    Technische Barrieren und die Kosten der Autonomie

    Die Vision autonomer Agenten kollidiert oft mit der harten Realität des Webs:

    • Sicherheitsbarrieren: Captchas oder Layout-Änderungen auf Webseiten bringen Agenten zum Stillstand.
    • Lockdown Mode: Als Reaktion auf Vorfälle wie die Kaperung von über 20.000 Instagram-Konten (Meta-Beispiel) implementiert OpenAI Sicherheitsmechanismen wie den „Lockdown Mode“, um unbefugte Systemzugriffe zu verhindern.
    • Infrastrukturkosten: Die wirtschaftliche Dimension ist gewaltig. Der Betrieb spezialisierter Agenten-Netzwerke (wie am Beispiel OpenClaw sichtbar) kann Kosten von bis zu 1,3 Mio. USD pro Monat verursachen, was die Notwendigkeit hocheffizienter Modelle unterstreicht.

    Schlussbetrachtung: Strategische Empfehlungen

    Unternehmen müssen jetzt handeln, um den Anschluss an die agentische Ära nicht zu verlieren. Aus der Analyse ergeben sich drei Handlungsempfehlungen:

    1. Vom isolierten Chat zum choreografierten Workflow: Investieren Sie nicht in einfache Frage-Antwort-Bots. Bauen Sie Infrastrukturen auf, die auf „Choreografie“ setzen – also auf Systeme, die deterministische Schrittübergänge, persistente Zustände und verlässliche Handoffs zwischen Mensch und Maschine ermöglichen.
    2. Erdung durch RAG-Architekturen: Um Context Drift und Halluzinationen zu eliminieren, ist der Einsatz von Retrieval-Augmented Generation (RAG) alternativlos. Verknüpfen Sie Agenten direkt mit verifizierten Unternehmensdatenbanken (z.B. technischen Dokumentationen via InfoTwin), um die KI faktisch zu „erden“.
    3. Implementierung von kontrollierter Autonomie: Angesichts der Reliability Gap ist ein „Human-in-the-Loop“-Ansatz zwingend. Nutzen Sie Agenten für die schwere Vorarbeit (Recherche, Drafting), behalten Sie aber menschliche Checkpoints für finale Entscheidungen und Ausnahmen bei. Dies sichert die Stabilität, während die Kapazität skaliert.

    Präsentation

    Quelle: NotebookLM-Recherche: OpenAI – „Chat ist tot“ (23 Quellen)

    Agenten richtig einführen — statt blind Bots zu bauen

    Die Ära der Agenten kommt schneller als ihre Verlässlichkeit. Wenn Du wissen willst, wo Dein Unternehmen heute steht und welche KI-Schritte wirklich tragen — souverän, datenschutzkonform und auf den Mittelstand zugeschnitten — lass uns sprechen.

  • Postleitzahl-Lotterie: Was 2026 im KI-Förder-Dschungel wirklich entscheidet

    Postleitzahl-Lotterie: Was 2026 im KI-Förder-Dschungel wirklich entscheidet

    Zwei Unternehmen, gleiche Größe, gleiches KI-Sicherheits-Projekt mit 320.000 € Volumen: das eine sitzt in Kiel und kassiert 231.000 € Zuschuss bis Ende 2029. Das andere sitzt in Frankfurt — und muss erst durch eine wöchentliche Lotterie. Im Mai 2026 entscheidet nicht mehr die Idee, sondern die Postleitzahl, ob ein KI-Vorhaben gefördert wird.

    Die Frankfurter Lotterie

    Hessen ist 2026 das Bundesland mit der härtesten Eintrittshürde — und der besten Kombi-Logik. Der DIGI-Zuschuss zahlt bis zu 10.000 € (50 % Quote), aber die WIBank vergibt nicht nach Schnelligkeit, sondern per wöchentlicher Zufallsauswahl. Und: ein Unternehmen kann den Zuschuss in seiner ganzen Geschichte nur einmal abrufen. Wer ihn für ein 5.000-€-Kleinprojekt verbrennt, schließt sich selbst aus.

    Für ambitioniertere Projekte gibt es die Distr@l-Förderung mit bis zu 1 Mio. € — der nächste Stichtag ist der 05. Juli 2026. Der spannende Punkt: Hessen lässt im DIGI-Zuschuss als einziges Bundesland zu, dass KI-Komponenten und IT-Sicherheit in einem Antrag laufen — Hardware (z. B. KI-Firewall), Software-Lizenzen, Cybersecurity-Schulung und ISMS-Konzeption gehen gemeinsam durch.

    → Details: Hessen-Förderung im Förderkompass

    Sachsen-Anhalt: das 80-Prozent-Stillschweigen

    Während die meisten Mittelständler über regionale Programme reden, wird das wirksamste Instrument fast nie genannt: die BAFA-Beratungsförderung. Sie gilt bundesweit, aber die Quote ist regional gestaffelt. In den „neuen Bundesländern" — Sachsen-Anhalt, Sachsen, Thüringen, Mecklenburg-Vorpommern, Brandenburg, Berlin — gibt es 80 % Zuschuss (max. 2.800 €). Im Westen sind es nur 50 % (max. 1.750 €).

    Für NIS-2-Audits, Risikoanalysen oder die Vorklärung eines KI-Use-Cases ist das ein nahezu vollständig fremdfinanzierter Einstieg. In Sachsen-Anhalt kombiniert das DIGITAL INNOVATION-Programm der Investitionsbank diese Beratung mit einem Wettbewerbsverfahren in Tranchen — Qualität schlägt Schnelligkeit, und die nächste Aufrufrunde sollte engmaschig beobachtet werden.

    → Details: Sachsen-Anhalt — DIGITAL INNOVATION + BAFA-Hebel

    Schleswig-Holstein: das Mekka für KI-Startups

    Im Norden zahlt die KI-Förderrichtlinie Startups 75 % und KMU 50 % — und sie läuft mit Planungssicherheit bis zum 31. Dezember 2029. Das ist im deutschen Vergleich beispiellos: kein anderes Bundesland gibt Gründern derzeit eine vergleichbare Mehrjahres-Perspektive.

    Das oben skizzierte Szenario rechnet sich so: Ein Startup investiert 320.000 € in Plattform-Entwicklung und Markteinführung. Über die KI-Richtlinie (135.000 € auf 180.000 € Plattform-Volumen) und den EIK Seed-Bonus (96.000 €, gedeckelt) kommen 231.000 € Zuschuss zusammen. Der Eigenkapitalbedarf sinkt auf 89.000 €.

    → Details: Schleswig-Holstein — KI-Förderrichtlinie + EIK

    Die teuerste Falle: „Standard ist keine Innovation"

    Der häufigste Ablehnungsgrund bei Distr@l (Hessen), HighTech-Bonus (SH) und vergleichbaren Innovations-Programmen ist nicht der Antrag selbst — es ist der Innovationsgehalt. Ein ChatGPT-Abonnement, eine Standard-Firewall, ein vorkonfiguriertes SIEM: alles förderfähig im Digitalbonus-Kontext, aber kein Innovationsprojekt im Sinne der ambitionierten Förderrichtlinien.

    Die Skizze muss zeigen, dass das Vorhaben über den Stand der Technik hinausgeht — nicht nur eine bekannte Lösung implementiert. Innovation muss klares technisches Risiko beinhalten.

    Wer „KI-Sicherheits-Lösung XY einführen" beantragt, scheitert. Wer „eigene Anomalie-Erkennung im SIEM-Kontext entwickeln, die ein neues Klassifikationsverfahren auf NIS-2-relevante Logs anwendet" beantragt, ist im Spiel. Der Unterschied ist nicht semantisch — er ist rechtlich-technisch.

    Was im Süden und Westen läuft

    Wer nicht in den drei Hotspots sitzt, hat trotzdem starke Karten: Bayern fährt zwei Varianten (Standard + Plus, bis 50.000 €), Baden-Württemberg setzt auf ZIM/BAFA/L-Bank statt klassischem Digitalbonus, NRW nutzt MID, Niedersachsen den Digitalbonus, Rheinland-Pfalz das InnoTop-Programm, das Saarland DigitalInvest, Hamburg den Digital-Check und Bremen den Digitaler-Mittelstand-Topf.

    ⚠ Zwei Sonderfälle: In Mecklenburg-Vorpommern endet das aktuelle Digitalisierungsprogramm Mitte 2026 — wer hier antragen will, sollte sich beeilen. In Sachsen gibt es einen Bearbeitungsstau bei der SAB, der die Auszahlung deutlich verzögert.

    Was du jetzt tun solltest

    Drei Schritte für das zweite Halbjahr 2026:

    1. Standort prüfen. Jede Bundesland-Seite im Förderkompass zeigt Programm, Träger, Quote und Beispielrechnungen auf einen Blick.
    2. BAFA-Beratung ziehen, bevor du etwas Großes beantragst — 50 bis 80 % Zuschuss auf die strategische Vorklärung.
    3. Keine verbindliche Bestellung vor dem Bescheid. Ein einziger vorzeitiger Auftrag killt jeden Antrag.

    Welches Bundesland passt zu deinem Vorhaben? Der Förderkompass auf einen Blick hat eine klickbare Bundesländer-Karte und die Detail-Pages aller 16 Programme — Stand Mai 2026.


    Quelle: FL Pro Foerderkompass 2026 – KI & IT-Sicherheit in allen 16 Bundeslaendern

  • Code-Revolution 2026: Warum Deine KI-Agenten bald umziehen müssen (und welche Tools gewinnen)

    Code-Revolution 2026: Warum Deine KI-Agenten bald umziehen müssen (und welche Tools gewinnen)

    Die Welt der Softwareentwicklung im Mai 2026 hat einen Wendepunkt erreicht. Während wir die beispiellose Effizienz von CLI-Coding-Agents feiern, prallen zwei Welten ungebremst aufeinander: Die produktive Gier nach KI-Power und die harte Realität der **DSGVO** sowie des **US CLOUD Act**. Entwickler stehen heute vor einer Wand. Die drängende Frage in den C-Level-Etagen und Engineering-Teams lautet: Können wir die enorme Schlagkraft von Claude oder GPT-5 nutzen, ohne rechtlich mit einem Bein im Gefängnis zu stehen?

    Die "Souveränitäts-Falle" der Tech-Giganten

    Viele IT-Strategen wiegen sich in Sicherheit, weil sie Instanzen von US-Anbietern in EU-Regionen (Frankfurt oder Paris) nutzen. Doch im Jahr 2026 ist die Maske der "EU-Datenresidenz" gefallen. Die Sicht von Aufsichtsbehörden wie BfDI und CNIL ist eindeutig: Ein US-Anbieter unterliegt dem US CLOUD Act und FISA 702. Das bedeutet, dass US-Behörden Zugriff auf Daten verlangen können, völlig ungeachtet dessen, ob der Server in Deutschland steht.

    Besonders kritisch ist die Lage bei Claude Code. Ein Setup, das Claude-Modelle in der EU CLOUD-Act-frei bereitstellt, gilt derzeit als praktisch unmöglich, da kein rein europäischer Hyperscaler Claude nativ hostet. Wer heute auf diese proprietären Stacks setzt, manövriert sich in eine rechtliche Sackgasse.

    „Die Annahme, dass eine EU-Region eines US-Hyperscalers eine juristische Schutzmauer darstellt, ist 2026 als regulatorische Illusion entlarvt. Wer echte digitale Souveränität will, muss die Provider-Ebene wechseln, nicht nur den Server-Standort.“

    OpenCode – Die neue Macht der Community

    Während die geschlossenen Systeme mit regulatorischen Hürden kämpfen, hat OpenCode eine beispiellose Rallye hingelegt. Mit rund 163.000 GitHub-Sternen ist es zum unangefochtenen Marktführer der Community-Tools avanciert. Ein massiver Treiber für diesen Erfolg war der Claude-OAuth-Lockdown im Januar 2026, der viele Entwickler aus den proprietären Ökosystemen vertrieb.

    OpenCode besticht durch seinen radikalen modell-agnostischen Ansatz. Über den Dienst Models.dev unterstützt das Tool mehr als 75 Modelle.

    • Modellflexibilität: Volle Freiheit bei der Wahl des LLMs – kein Vendor-Lock-in.
    • Polierte TUI: Eine Terminal-Benutzeroberfläche, die in Sachen UX den kommerziellen Tools in nichts nachsteht.
    • OSS-Freiheit: Dank der MIT-Lizenz behalten Unternehmen die volle Kontrolle über ihre Tool-Chain.

    ForgeCode – Wenn Geschwindigkeit auf Multi-Agenten-Power trifft

    Wenn Millisekunden über den Flow entscheiden, führt 2026 kein Weg an ForgeCode vorbei. Im aktuellen Terminal-Bench 2.0 deklassiert das Tool die Konkurrenz mit einem Score von 81,8 %. Technisch basiert ForgeCode auf Rust, was einen extrem schnellen Start von unter 50 ms ermöglicht – ein entscheidender Vorteil gegenüber schwerfälligeren TypeScript-basierten Agents.

    ForgeCode setzt auf ein spezialisiertes Multi-Agent-System, das Aufgaben präzise verteilt:

    • forge: Übernimmt die primäre Implementierung des Codes.
    • sage: Fungiert als Architektur-Berater und liefert den nötigen Kontext.
    • muse: Verantwortlich für Code-Reviews und die finale Optimierung.

    Ein weiterer Gamechanger: Während OpenCode 75+ Modelle unterstützt, bietet ForgeCode Konnektivität zu über 300 Modellen. Damit ist es das flexibelste Werkzeug für Teams, die zwischen spezialisierten Nischen-Modellen und Generalisten wechseln wollen.

    Das DeepSeek-Paradoxon (Günstig, aber riskant)

    DeepSeek (das nach einem Branding-Drift nun oft unter CodeWhale firmiert) ist der Preis-Leistungs-König des Jahres 2026. Es ist rund 10-mal günstiger als GPT- oder Claude-Modelle und bietet ein gewaltiges 1-Million-Token-Context-Window.

    Doch Vorsicht: Die Nutzung der offiziellen API in China ist aufgrund des fehlenden EU-Adäquanzbeschlusses und der dortigen Sicherheitsgesetze datenschutzrechtlich hochgradig riskant. Die Profi-Lösung: Betreibe die DeepSeek-Open-Weights lokal via Ollama oder auf EU-GPUs bei Providern wie Scaleway oder Hetzner. So nutzt Du die brachiale Power, ohne dass ein einziges Byte Deinen Hoheitsbereich verlässt.

    Der "Goldstandard" für deutsche Entwickler im Jahr 2026

    Um volle Souveränität zu erreichen und das CLOUD-Act-Risiko zu eliminieren, hat sich für deutsche Unternehmen ein klarer Best-Practice-Pfad herauskristallisiert. Das Geheimnis liegt in der Kombination aus quelloffenen Tools und europäischen Infrastrukturen.

    Das ideale Setup für 2026:

    1. Die Allianz für Souveränität: Nutze Codex CLI (trotz des Namens unter Apache 2.0 lizenziert und damit völlig offen für Custom-Endpoints) oder ForgeCode.
    2. Der europäische Backbone: Als Modell-Provider dient Mistral AI (Frankreich) via "La Plateforme" oder die Kombination aus Cohere und Aleph Alpha (nachdem Cohere Aleph Alpha im April 2026 übernommen hat), betrieben auf der STACKIT-Infrastruktur der Schwarz Gruppe.
    3. Das Modell: Codestral oder Mistral Large 2 bieten die nötige Performance bei voller rechtlicher Absicherung innerhalb der EU-Jurisdiktion.

    Fazit: Der Blick nach vorn

    2026 ist das Jahr, in dem "Local-first" und "EU-native" von einer philosophischen Entscheidung zu einer geschäftskritischen Notwendigkeit geworden sind. Mit dem vollständigen Inkrafttreten des EU AI Act im August 2026 werden die Anforderungen an die Dokumentation und Transparenz von KI-Workflows weiter verschärft. Wer seine Code-Basis heute noch unreflektiert in US-gesteuerte Clouds schickt, handelt fahrlässig.

    Die Frage für Deine nächste Retrospektive lautet daher nicht mehr nur, wie schnell Dein Agent programmiert, sondern: Gehört Dein Code noch Dir, oder ist er bereits ein Exportgut?


    Quelle: FL Pro Consulting Research

    📄 Whitepaper zum Thema: CLI-Coding-Agents 2026 — das vollständige Whitepaper (PDF)

  • Claude Code kostenlos nutzen: Unbegrenzt coden ohne teure Abos

    Claude Code kostenlos nutzen: Unbegrenzt coden ohne teure Abos

    In der Welt der KI-gestützten Software-Entwicklung ist Claude Code aktuell das Maß der Dinge. Doch die Preispolitik von Anthropic stellt viele Entwickler vor eine Hürde: Während der Claude Pro Plan mit ca. 20 € pro Monat beginnt, schlägt der Max Plan mit fast 100 € zu Buche. Für Hobby-Entwickler oder Freelancer mit schwankender Auftragslage ist das oft eine unnötige finanzielle Belastung.

    Die Kostenfalle der KI-Coding-Tools

    In der Welt der KI-gestützten Software-Entwicklung ist Claude Code aktuell das Maß der Dinge. Doch die Preispolitik von Anthropic stellt viele Entwickler vor eine Hürde: Während der Claude Pro Plan mit ca. 20 € pro Monat beginnt, schlägt der Max Plan mit fast 100 € zu Buche. Für Hobby-Entwickler oder Freelancer mit schwankender Auftragslage ist das oft eine unnötige finanzielle Belastung.

    Die gute Nachricht: Als Experte für KI-Automatisierung kann ich Ihnen zeigen, wie Sie die mächtige Infrastruktur von Claude Code nutzen, ohne an die teuren Abos gebunden zu sein. Die Lösung liegt im Austausch des Sprachmodells über Open Router. Das gesamte Setup dauert weniger als fünf Minuten, erfordert keine lokale Rechenpower und funktioniert selbst auf schwächeren Laptops reibungslos.

    Was ist Claude Code eigentlich? (Harness vs. Modell)

    Um Claude Code flexibel nutzen zu können, müssen wir die Architektur verstehen. Claude Code ist kein Modell, sondern ein sogenannter Harness (eine agentische Hülle).

    Stellen Sie sich das wie bei einem modernen Fahrzeug vor:

    • Der Harness (Das Chassis): Claude Code liefert die Werkzeuge. Er kann Dateien lesen, Bash-Befehle im Terminal ausführen, den Kontext managen und autonom Aufgaben planen.
    • Das Modell (Der Motor): Das Sprachmodell übernimmt das „Denken“. Standardmäßig sind dies die Anthropic-Modelle (Sonnet 3.5, Opus oder Haiku), welche die Kosten verursachen.

    Da Claude Code modular aufgebaut ist, können wir den „Motor“ austauschen. Die agentische Funktionalität – also die Fähigkeit, selbstständig Code-Probleme zu lösen – bleibt erhalten, während wir als Rechenkern kostenlose Open-Source-Modelle einsetzen.

    Open Router: Das Tor zu kostenlosen Modellen

    Open Router fungiert als Aggregator, der Anfragen an verschiedene Provider weiterleitet. Anstatt für jeden Anbieter ein eigenes Abo abzuschließen, nutzen Sie einen einzigen API-Key. Besonders attraktiv ist die „Free“-Sektion von Open Router.

    Folgende Modelle sind laut aktuellem Stand im Quellmaterial kostenlos verfügbar:

    • GPT OSS 120B: Ein massives Modell für komplexe Logik.
    • Minimax M2.5: Hervorragende Performance bei Coding-Aufgaben.
    • Nemotron (Nvidia): Optimiert für technische Präzision.
    • DeepSeek V4 Flash: Ein extrem schnelles und effizientes Modell für schnelle Iterationen.

    Kostenlose Modelle werden häufig mit den eingegebenen Nutzerdaten trainiert. Nutzen Sie diese Methode daher nur für Hobby-Projekte, Lernzwecke oder Open-Source-Code. Für hochsensible Kundendaten oder proprietäre Firmengeheimnisse sollten Sie weiterhin auf die bezahlten, datenschutzkonformen Enterprise-Pläne setzen.

    Schritt-für-Schritt-Anleitung: Das Setup

    Schritt 1: API-Key erstellen

    Erstellen Sie einen Account bei OpenRouter.ai. Navigieren Sie zu Personal > Credits > API Keys und klicken Sie auf Create Key. Vergeben Sie einen Namen (z. B. „Claude-Code-Free“). Sie können optional ein Credit Limit setzen, um sicherzugehen, dass niemals ungewollte Kosten entstehen. Kopieren Sie den Key sofort – er wird nur einmal angezeigt.

    Schritt 2: Der 10-Dollar-Trick für Rate Limits

    Kostenlose Modelle haben oft strikte Rate Limits (begrenzte Anfragen pro Minute). Ein Expertentipp aus der Praxis: Laden Sie einmalig 10 $ Guthaben auf Ihren Open Router Account auf. Dadurch steigen Sie in ein höheres Nutzer-Tier auf, was die Rate Limits für Free-Modelle massiv erhöht. Da die Modelle selbst kostenlos sind, wird dieses Guthaben nicht verbraucht – es dient lediglich als „Türöffner“ für eine flüssige Performance.

    Schritt 3: Installation & Terminal-Nutzung

    Installieren Sie Claude Code global über Ihr Terminal (Node.js vorausgesetzt):

    npm install -g @anthropic-ai/claude-code

    Wichtiger Hinweis für VS Code Nutzer: Das offizielle Claude Dev / Claude Code Plugin für VS Code unterstützt diesen Modell-Austausch aktuell nicht. Um externe Modelle zu nutzen, müssen Sie Claude Code direkt über das integrierte Terminal in VS Code starten.

    Konfiguration der Settings.json

    Um Claude Code mit Open Router zu verknüpfen, müssen wir die Konfiguration anpassen. Erstellen Sie im Projektordner einen Unterordner .claude und darin die Datei settings.json.

    Hier ist ein Beispiel für eine professionelle Konfiguration:

    {
      "openRouterApiKey": "DEIN_OPEN_ROUTER_API_KEY_HIER",
      "primaryModel": "openrouter/free",
      "agentModel": "openrouter/free",
      "watchModel": "openrouter/free"
    }
    • openrouter/free: Dies ist ein intelligenter Router, der automatisch ein verfügbares Gratis-Modell wählt, das Tool-Use (Bash/Files) beherrscht.
    • Spezifische Modelle: Möchten Sie gezielt ein Modell nutzen, ersetzen Sie den Wert durch den Modellnamen von Open Router, z. B. deepseek/deepseek-v4-flash.

    Lokale vs. Globale Konfiguration

    Sie haben zwei Möglichkeiten, wo Sie diese Einstellungen hinterlegen:

    1. Lokal (Projektbezogen): Datei liegt in ./Projektordner/.claude/settings.json. Nur dieses Projekt nutzt die Gratis-Modelle.
    2. Global (Systemweit): Die Datei liegt in Ihrem Benutzerverzeichnis.
    3. Windows: %USERPROFILE%\.claude\settings.json
    4. Dies ist ideal, wenn Sie Claude Code dauerhaft und für alle Projekte auf Gratis-Basis umstellen möchten.

    Praktische Anwendung im Terminal

    Starten Sie das Tool einfach mit dem Befehl:

    claude

    Im Terminal sehen Sie nun oben links das aktuell aktive Modell (z. B. DeepSeek oder GPT OSS).

    • Modell wechseln: Mit dem Befehl /model können Sie jederzeit zwischen konfigurierten Modellen springen.
    • Reasoning-Modelle: Nutzen Sie Modelle mit Reasoning-Fähigkeiten, zeigt Ihnen Claude Code im Terminal den kompletten „Gedankengang“ (Thought Process) an – ein enormer Vorteil bei der Fehlersuche.
    • Agentic Features: Alle Funktionen wie der Plan-Modus (Shift + Tab) oder Rückfragen an den User (Ask User Question Tool) funktionieren weiterhin einwandfrei.

    Fazit und Takeaways

    Durch die Entkoppelung von Harness und Modell gewinnen Sie die volle Kontrolle über Ihre Entwicklungskosten. Claude Code wird so zu einem extrem mächtigen, aber kostenlosen Begleiter in Ihrem Workflow.

    Key-Takeaways:

    1. Flexibilität: Claude Code ist das Werkzeug, das Modell ist der austauschbare Motor. Nutzen Sie die besten Open-Source-Modelle ohne Abo-Zwang.
    2. Open Router: Fungiert als Brücke zu Gratis-Modellen wie DeepSeek oder GPT OSS über einen einzigen API-Key.
    3. Performance-Boost: Einmalige 10 $ Guthaben optimieren die Rate Limits und ermöglichen unterbrechungsfreies Coden.

    Beginnen Sie noch heute damit, Ihre Coding-Workflows zu automatisieren – ohne die monatliche Kostenlast. Viel Erfolg beim Coden!


    Quelle: YouTube: Claude Code kostenlos nutzen: Unbegrenzt coden ohne starken PC

  • 500 TB lokal statt Cloud: Wie ein Mittelständler 66.000 € jährlich spart und die Datenhoheit zurückgewinnt

    500 TB lokal statt Cloud: Wie ein Mittelständler 66.000 € jährlich spart und die Datenhoheit zurückgewinnt

    In der Ära der digitalen Transformation galt die Cloud lange Zeit als das unangefochtene Heilsversprechen für den industriellen Mittelstand. Doch die Realität hat das Dogma des „Cloud First“ eingeholt. Mit exponentiell wachsenden Datenmengen entwickeln sich die initial attraktiven Betriebskostenmodelle oft zu unkontrollierbaren Budgetfressern.

    Einleitung: Das Ende der Cloud-Euphorie im Mittelstand

    In der Ära der digitalen Transformation galt die Cloud lange Zeit als das unangefochtene Heilsversprechen für den industriellen Mittelstand. Doch die Realität hat das Dogma des „Cloud First“ eingeholt. Mit exponentiell wachsenden Datenmengen entwickeln sich die initial attraktiven Betriebskostenmodelle oft zu unkontrollierbaren Budgetfressern.

    Ein aktuelles Praxisprojekt verdeutlicht den Paradigmenwechsel: Ein Fertigungsbetrieb mit einem Datenvolumen von 500 TB konnte durch die gezielte Rückführung der Infrastruktur in den lokalen Betrieb bis zu 66.000 € an jährlichen Betriebskosten einsparen. Die zentrale Erkenntnis für Entscheider lautet: Eine lokale KI-Infrastruktur ist heute kein technologischer Rückschritt, sondern eine hochgradig strategische und ökonomische Entscheidung für Datensouveränität und die bilanzielle Optimierung der IT-Kosten.

    Die Kostenfalle Cloud: Warum 500 TB zum finanziellen Risiko wurden

    Für den betroffenen Fertigungsbetrieb (180 Mitarbeiter) war das Cloud-Modell in eine gefährliche Pfadabhängigkeit geraten. Das Kernproblem war die fehlende Differenzierung der Datenhaltung. In der Cloud-Welt des Kunden wurde ein CAD-Modell aus dem Jahr 2011, das seit über einem Jahrzehnt nicht mehr abgerufen wurde, zum identisch hohen Preis gespeichert wie ein hochaktuelles Prüfprotokoll aus der laufenden Schicht.

    Hinzu kam die Problematik der Total Cost of Ownership (TCO): Neben den reinen Speicherkosten belasteten sogenannte „Egress-Kosten“ (Gebühren für den Datenausgang) und Transaktionsgebühren der Hyperscaler das Budget. Bei 500 TB summierten sich die monatlichen Kosten auf 5.000 € bis 7.000 €. Aus strategischer Sicht ist dies ein unkalkulierbares Risiko, da die Kosten linear mit dem Datenwachstum skalieren. Die lokale Lösung hingegen ermöglichte eine Entkoppelung von Datenvolumen und laufenden Kosten durch den Wechsel von OpEx zu einer planbaren CapEx-Investition.

    Phase 1: KI-gestützte Klassifizierung als Schlüssel zum Erfolg

    Bevor Hardware investiert wurde, musste Transparenz geschaffen werden. Der Einsatz des lokalen KI-Systems „Alpi-M“ war hierbei der entscheidende Hebel, um die gewachsenen Silo-Strukturen aufzubrechen. Der Prozess der Datenaufbereitung erfolgte in einem vierstufigen Framework:

    1. Scan & Klassifikation: Systematisches Erfassen des gesamten 500-TB-Bestands nach Zugriffshäufigkeit, Datentyp und gesetzlichen Fristen – vollständig lokal und ohne Datentransfer nach außen.
    2. Data-Aging: Präzise Einteilung in drei Temperaturzonen:
    3. Warm: Daten mit wöchentlichem Zugriff auf kosteneffizienten SSDs.
    4. Cold: Archivdaten (HGB/GoBD-relevant), die sicher und günstig auf HDDs lagern.
    5. Clustering: Identifikation von Duplikaten und veralteten temporären Dateien, was den effektiven Speicherbedarf unmittelbar um 23 % reduzierte.
    6. Einhaltung von Fristen: Automatisierte Zuweisung von Lösch- und Aufbewahrungsregeln gemäß gesetzlicher Vorgaben.

    Das strategische Schlüsselergebnis: Die Analyse deckte auf, dass 71 % der Daten als „Cold Data“ einzustufen waren. Diese Bestände wurden jahrelang unnötigerweise in teuren, hochverfügbaren Cloud-Tiers vorgehalten.

    Phase 2: Die Hardware-Strategie – Präzision statt Raterei

    Basierend auf dem durch die KI erstellten Datenprofil erfolgte die physische Umsetzung durch den Partner OLKA IT-MBS. Statt pauschaler Überdimensionierung wurde eine präzise, auf die Temperaturzonen zugeschnittene Infrastruktur beschafft.

    KomponenteSpezifikation & AuswahlKosten
    NVMe-Tier (Hot)2× Samsung PM9A3 3.84 TB NVMe (RAID-1)3.148 €
    SSD-Tier (Warm)4× Seagate IronWolf Pro 16 TB SSD (RAID-6)4.716 €
    HDD-Tier (Cold)12× WD Gold 18 TB (RAID-6)5.364 €
    Chassis & NetzSupermicro 2U Server, Mellanox 25 GbE Dual-Port3.290 €
    IntegrationInstallation & Einweisung durch OLKA IT-MBS3.480 €
    GesamtinvestitionPräzise gemäß Projektangebot19.998 €

    Mit einer Einsparung von bis zu 66.000 € pro Jahr amortisiert sich diese Investition in unter fünf Monaten.

    Rechtssicherheit und Compliance: DSGVO lokal gelöst

    Die Rückkehr zur lokalen Infrastruktur ist ein massiver Gewinn für die Compliance-Sicherheit. Technology folgt hier der Business Logic: Florian Ludwig (FL-Consulting) definierte die unternehmerischen Anforderungen an die Datenaufbewahrung, während das System diese automatisiert umsetzte. Da die Daten das Unternehmen nie verlassen, entfallen komplexe rechtliche Unsicherheiten bezüglich Data Residency oder US-Behördenzugriffen.

    Folgende Anforderungen werden automatisiert abgebildet:

    • HGB §257 & GoBD: Revisionssichere Archivierung und lückenlose Protokollierung für Betriebsprüfungen.
    • DSGVO Art. 17 & 32: Automatisierte Löschkonzepte sowie Verschlüsselung „at-rest“ und „in-transit“.

    Zur Absicherung des operativen Restrisikos (Ransomware/Datenverlust) wurde die Infrastruktur über die Allianz/Fruhmann GbR explizit in die Cyber-Versicherung des Unternehmens integriert.

    Praxis-Check: Von 4 Wochen auf 4 Stunden – Der Audit-Härtetest

    Die Überlegenheit der neuen Architektur zeigte sich drei Monate nach Go-Live bei einer außerplanmäßigen Betriebsprüfung. Gefordert waren 847 Datensätze aus den Jahren 2018 bis 2022.

    In der alten Cloud-Welt wäre dies ein manueller Suchprozess über mehrere Wochen gewesen. Mit der KI-gestützten Indizierung lieferte das System alle Dokumente inklusive lückenlosem Zugriffsprotokoll in nur vier Stunden. Das beweist: Wirkliche Datensouveränität bedeutet nicht nur, Daten zu besitzen, sondern sie im Bedarfsfall unmittelbar handlungsfähig im Zugriff zu haben.

    Fazit und Takeaways: Souveränität als Wettbewerbsvorteil

    Der Case zeigt: Die strategische Dekopplung von Cloud-Hyperscalern ist für den Mittelstand bei großen Datenmengen ein massiver Renditehebel. Wer seine Daten versteht und klassifiziert, gewinnt nicht nur Kapital zurück, sondern minimiert gleichzeitig seine regulatorischen Risiken.

    Key Takeaways für Entscheider:

    • ROI-Maximierung: Die Amortisation lokaler Systeme liegt bei großen Volumina oft unter zwei Quartalen.
    • Compliance-Exzellenz: On-Premise-Lösungen vereinfachen die DSGVO-Konformität und erfüllen gesetzliche Archivierungspflichten ohne manuellen Aufwand.
    • Operative Effizienz: KI-gestützte Klassifizierung reduziert die Reaktionszeit bei Audits von Wochen auf Stunden.

    Ihr nächster Schritt: Möchten Sie das Einsparungspotenzial Ihres Datenbestands objektiv bewerten lassen? AlpiType bietet eine kostenlose Erstanalyse an, die innerhalb einer Woche Klarheit über Ihre Optimierungspotenziale schafft.

    Kontaktinformationen: AlpiType Ansprechpartner: Anton Lytvynenko E-Mail: info@alpitype.com LinkedIn: AlpiType / Anton Lytvynenko Standort: Landsberg am Lech


    Quelle: AlpiType