In diesem Überblick erfährst du von einem koordinierten Lieferkettenangriff auf Mistral‑PyPI v2.4.6 und TanStack‑npm‑Pakete, Anthropic‑Mythos, das autonom Tausende Zero‑Days findet, Googles Meldung, dass 75 % des neuen Codes KI‑generiert sind, neuen US‑AI‑Bewertungsabkommen und dem leaken Gemini 3.2 Flash‑Modell.
Verfolgt Modellveröffentlichungen, Finanzierungsrunden und Tool-Updates, die für Entwickler und Erbauer wichtig sind.
1. Lieferkette unter Angriff
12. Mai 2026
Eine koordinierte Software-Lieferkette-Kampagne namens "Mini Shai-Hulud" hat zwei der am häufigsten verwendeten Paket-Ökosysteme in der AI-Entwicklerwelt am selben Tag getroffen. Angreifer injizierten schädlichen Code in das Mistral-PyPI-Paket v2.4.6 und in mehrere TanStack-npm-Pakete, darunter `@tanstack/react-router`, `@tanstack/history` und `@tanstack/router-core`. Die TanStack-Pakete allein werden täglich zig Millionen Mal heruntergeladen, was den potenziellen Schadensradius ungewöhnlich groß macht.
Der Angriffsvektor ist einfach und schwer zu erkennen, bevor Schaden angerichtet wird. Der injizierte Code im Mistral-Paket wird automatisch bei Import ausgeführt, ohne dass der Entwickler ihn explizit aufrufen muss. Er lädt dann eine externe Payload von einem Remote-Server herunter und startet einen zweiten Angriff, der Linux-Systeme targets. GitHub, Cloud-Anmeldedaten und CI/CD-Tokens sind unter den gemeldeten Expositions-Kategorien. Microsoft bestätigte, dass es den Mistral-PyPI-v2.4.6-Kompromiss aktiv untersucht.
Was diesen Vorfall besonders relevant für AI-Entwickler macht, ist das Zielprofil. Mistral's Python-SDK und TanStack's Routing-Bibliotheken sind beide häufige Abhängigkeiten in AI-nahen Projekten. Entwickler, die agente Pipelines, LLM-Wrapper oder moderne Frontend-Schnittstellen für AI-Tools bauen, sind direkt betroffen. Die Kampagne signalisiert, dass AI-Entwickler-Tooling jetzt ein attraktives Ziel für Lieferkette-Angreifer ist, nicht nur eine Produktivitätskategorie.
Die ultimative Abkürzung zu einwandfreien KI-Ergebnissen
Verschwende keine Zeit mehr mit Trial-and-Error-Prompts. Erziele konsistente, professionelle KI-Ergebnisse beim ersten Versuch – jedes Mal.
Die Offenlegung kam von der Sicherheitsfirma Aikido, die die TanStack-Pakete zuerst flaggte, bevor der Mistral-Kompromiss Stunden später auftrat. Die beiden Angriffe scheinen Teil derselben laufenden Kampagne zu sein. Weder Mistral noch TanStack hatten zum Zeitpunkt der Offenlegung eine öffentliche Ankündigung gemacht.
Achtung: Pin alle Mistral- und TanStack-Pakete auf verifizierte Versionen und führen Sie `npm audit` und `pip-audit` aus, bevor Sie das nächste Mal deployen.
Anthropic stellte Claude Mythos Preview vor, ein allgemeines Frontier-Modell, das das Unternehmen als einen Meilenstein über seinem Vorgänger, Claude Opus 4.6, beschreibt. Das Modell wurde nicht explizit für Cybersicherheitsarbeit trainiert. Seine Fähigkeiten in der Schwachstellenentdeckung traten als eine Folge allgemeiner Verbesserungen in der Argumentation, der langen Kontextverständigung und der Software-Entwicklung auf, was das Ergebnis schwer zu ignorieren macht.
Über einen Zeitraum von mehreren Wochen verwendete Anthropic Mythos, um autonome Sicherheitsscans über alle großen Betriebssysteme und Browser durchzuführen. Das Modell identifizierte Tausende von Zero-Day-Schwachstellen, viele davon kritisch, ohne menschliche Steuerung nach einem anfänglichen Prompt. Unter den Funden befand sich ein 27 Jahre alter Fehler in OpenBSD, einem Betriebssystem mit einem langjährigen Ruf als eines der sichersten Plattformen, das häufig zum Betreiben von Firewalls und kritischer Infrastruktur verwendet wird.
Die Leistungssteigerung im Vergleich zu Opus 4.6 bei kontrollierten Exploit-Generierungsaufgaben ist signifikant:
Modell
Funktionierende Firefox-Exploits aus Hunderten von Versuchen
Claude Opus 4.6
2
Claude Mythos Preview
181
Auf dem OSS-Fuzz-Korpus erreichte Mythos eine vollständige Kontrollfluss-Hijack auf zehn separaten, vollständig gepatchten Zielen. Anthropic-Ingenieure ohne formale Sicherheitsausbildung baten das Modell, Remote-Code-Execution-Schwachstellen zu finden, und fanden am Morgen vollständige, funktionierende Exploits. Anthropic beschreibt die Situation als einen Wendepunkt: das Fenster zwischen der Entdeckung einer Schwachstelle und ihrer Waffenverwendung hat sich von Monaten auf Stunden verkürzt.
Angesichts dieser Fähigkeiten entschied sich Anthropic, das Modell nicht öffentlich zu veröffentlichen. Stattdessen startete es Projekt Glasswing, ein eingeschränktes Konsortium von 12 Partnerorganisationen, die Mythos verwenden werden, um Schwachstellen in kritischer Software zu identifizieren und zu patchen, bevor die Ergebnisse der breiteren Industrie zur Verfügung gestellt werden. Partner sind Apple, Amazon, Cisco, CrowdStrike, Google, JPMorgan Chase, die Linux Foundation, Microsoft, NVIDIA und Palo Alto Networks. Anthropic hat 100 Millionen Dollar in Nutzungsgutschriften für die Initiative bereitgestellt. Für Organisationen außerhalb des Konsortiums ist der Zugriff auf Mythos auf eine überwachte Gruppe von etwa 40 Organisationen beschränkt, die kritische Software bauen oder warten.
Hinweis: Mythos ist fünfmal so teuer wie Opus 4.6 für Glasswing-Partner. Berechnen Sie die gestaffelte Preisgestaltung in Ihre API-Budgetplanung ein.
In einem öffentlichen Blogbeitrag bestätigte Sundar Pichai, dass 75 % aller neuen Code bei Google jetzt AI-generiert und von Ingenieuren überprüft werden, bevor er ausgeliefert wird. Die Zahl ist auf sich selbst bezogen bereits auffallend, aber die Flugbahn macht sie noch auffälliger. Im Jahr 2024 lag der Anteil bei 25 %. Im Herbst 2025 hatte er sich auf 50 % verdoppelt. Der Sprung auf 75 % innerhalb von etwa zwei Quartalen spiegelt eine Beschleunigung wider, nicht ein Plateau.
Zeitraum
AI-generierter Code-Anteil
2024
25 %
Herbst 2025
50 %
April 2026
75 %
Die von Pichai genannten Produktivitätsgewinne sind konkrete. Eine komplexe Code-Migration, die von Agenten und Ingenieuren gemeinsam durchgeführt wurde, lief sechs Mal schneller als die entsprechende Aufgabe ein Jahr zuvor mit Ingenieuren allein. Pichai beschrieb die Richtung als einen Schritt in Richtung "wirklich agenter Workflows", bei denen Ingenieure zunehmend als Orchesterleiter autonomer digitaler Task-Forces und nicht mehr als direkte Autoren von Code fungieren.
Google ist in dieser Richtung nicht allein. Meta zielt auf einen vergleichbaren AI-Code-Anteil bis Mitte 2026 ab. Anthropic hat angegeben, dass zwischen 70 und 90 Prozent seines eigenen Codes mit Claude Code geschrieben werden. Aber Googles Offenlegung trägt besonderes Gewicht, weil des Unternehmens Größe. Das Unternehmen beschäftigt Zehntausende von Ingenieuren und betreibt einige der komplexesten Software-Infrastrukturen der Welt.
Das interne Bild ist komplizierter als die Schlagzeile. The New York Times berichtete, dass Google die Mitarbeiter dazu drängte, so viele AI-Agents zu erstellen, dass zusätzliche Agents eingeführt werden mussten, um die bestehenden zu finden und zu bewerten, was eine rekursive Schleife auslöste, die unter den Mitarbeitern Wut und Angst auslöste. Einige Mitarbeiter suchen nach neuen Jobs oder positionieren sich, um mit Abfindung entlassen zu werden. Google hat auch die AI-Nutzung formell an die Leistungsbeurteilung der Ingenieure für 2026 gebunden, was bedeutet, dass Entwickler, die die aktive Adoption nicht demonstrieren, negative Bewertungen riskieren.
Hinweis: Wenn Ihr Team noch keine AI-Adoptionsmetriken hat, definieren Sie sie jetzt, bevor die Führung sie für Sie tut.
Das Center for AI Standards and Innovation (CAISI), eine Abteilung des US-Handelsministeriums, das innerhalb von NIST angesiedelt ist, kündigte neue Vor-Deploy-Testvereinbarungen mit Google DeepMind, Microsoft und Elon Musks xAI an. Die Vereinbarungen ermöglichen es der US-Regierung, Frontier-AI-Modelle in klassifizierten Umgebungen zu testen, bevor sie öffentlich verfügbar gemacht werden. Der Schritt stellt eine bemerkenswerte Änderung der Haltung für eine Verwaltung dar, die sich ausdrücklich gegen die AI-Sicherheits- und Überwachungsrahmen positioniert hatte, die unter der Biden-Regierung etabliert wurden.
CAISI ist der umbenannte Nachfolger des Biden-Ära-US-AI-Sicherheitsinstituts. Zu Beginn der Trump-Regierung wurde das Institut effektiv ausgeschaltet und sein Personal reduziert. Die neuen Vereinbarungen stellen eine Umkehr dar. CAISI hat nun mehr als 40 Modellbewertungen abgeschlossen, einschließlich Bewertungen von state-of-the-art-Modellen, die noch nicht veröffentlicht wurden. Der Kongress genehmigte im Januar 2026 eine Erhöhung der Mittel für NISTs AI-Arbeit, einschließlich 55 Millionen Dollar für AI-Forschung und Messbemühungen und bis zu 10 Millionen Dollar speziell für CAISIs Erweiterung.
Der Umfang des Bewertungsprogramms umfasst drei Risikokategorien:
Cybersicherheit - Bewertung der Fähigkeit eines Modells, autonom Schwachstellen zu entdecken und auszunutzen
Biosecurity - Bewertung des möglichen Aufschwungs für biologische Bedrohungsakteure, die gefährliche Agenten synthetisieren oder einsetzen wollen
Chemische Waffenrisiken - Bewertung der Fähigkeit eines Modells, die Synthese oder Waffenverwendung chemischer Agenten zu unterstützen
Fortune berichtete, dass die Richtlinienumkehr direkt durch Anthropics Mythos-Modell und seine nachweisliche Fähigkeit, Schwachstellen autonom zu entdecken und auszunutzen, ausgelöst wurde. Das Weiße Haus wird auch beraten, eine Gruppe von Experten über eine mögliche Exekutivverordnung zu konsultieren, die ein formales Überprüfungsverfahren für fortgeschrittene AI-Systeme vor ihrer Veröffentlichung schaffen würde. CAISI-Direktor Chris Fall erklärte, dass "unabhängige, strenge Messwissenschaft für das Verständnis von Frontier-AI und seinen nationalen Sicherheitsimplikationen unerlässlich" sei. OpenAI bestätigte getrennt, dass es GPT-5.5 der Regierung vor der öffentlichen Veröffentlichung für nationale Sicherheitstests und Bewertungen zur Verfügung gestellt hat.
Die bestehenden Vereinbarungen mit OpenAI und Anthropic, die ursprünglich 2024 unter Biden unterzeichnet wurden, wurden neu verhandelt, um CAISIs aktualisierte Richtlinien von Handelsminister Howard Lutnick und dem America's AI Action Plan widerzuspiegeln.
Hinweis: Überwachen Sie CAISI-Richtlinien als führenden Indikator für Compliance-Anforderungen in regulierten Branchen.
Benutzer entdeckten Gemini 3.2 Flash, das live innerhalb der offiziellen iOS-Gemini-App und Google AI Studio läuft, ohne vorherige Ankündigung von Google. Die Entdeckung folgte Googles etabliertem Muster, bedeutende Modell-Updates stillschweigend vor wichtigen Ereignissen bereitzustellen. Berichte tauchten zunächst auf Reddit auf und wurden durch Benchmark-Aktivität auf Eleuther AI Arena bestätigt. Google veröffentlichte keine Pressemitteilung oder öffentliche Bestätigung zum Zeitpunkt der Sichtung.
Die durchgesickerten Preisdaten, die aus AI Studio extrahiert wurden, positionieren Gemini 3.2 Flash als kostengünstigen Schritt nach oben von bestehenden Flash-Tier-Modellen, der angeblich viel von Gemini 3.1 Pros Fähigkeiten in Codier- und kreativen Aufgaben bei Flash-Tier-Geschwindigkeit entspricht:
Modell
Eingabe-Preis pro Million Token
Ausgabe-Preis pro Million Token
Gemini 3.2 Flash (leaked)
0,25 $
2,00 $
Jenseits des Modells selbst offenbarte der Leak zwei weitere Signale über Googles Richtung. Ein neuer "Agents (Beta)"-Seitenleisten-Tab erschien im Gemini-UI, der derzeit inaktiv ist, was darauf hindeutet, dass agente Fähigkeiten in Vorbereitung sind. Eine visuelle Überarbeitung namens "Liquid Glass" wurde ebenfalls entdeckt, die einen pillenförmigen Prompt-Balken und pulsierende Gradientenhintergründe aufweist, was mit den umfassenderen Gemini-2.0-UI-Änderungen übereinstimmt, die zuvor für iOS gestartet wurden.
Am selben Tag veranstaltete Google die Android Show I/O Edition und stellte offiziell "Gemini Intelligence" vor, eine bedeutende Neupositionierung. Anstatt eine eigenständige App zu sein, wird Gemini Intelligence als die Intelligenzschicht beschrieben, die unter Android selbst läuft, ähnlich wie Apple Intelligence in iOS integriert ist. Die Marke erschien erstmals in einem vertraulichen Pixel-Video, das früher in der Woche aufgetaucht war. Die neue Googlebook-Laptop-Linie, die von Grund auf um Gemini Intelligence herum entwickelt wurde, wurde ebenfalls auf der Veranstaltung vorgestellt. Die vollständige Entwickler-Offenlegung für Gemini 3.2 Flash und etwaige weitere Modellankündigungen wird für Google I/O am 19. Mai erwartet.
Hinweis: Warten Sie mit der Festlegung von Gemini-Modellverträgen, bis die I/O-Ankündigung endgültige Spezifikationen und Preise bestätigt.