US-Exportstopp für Anthropic-Modelle: Warum «Fix this code» kein Jailbreak ist

2026
02.07

Die US-Regierung hat die fortgeschrittenen KI-Modelle Fable 5 und Mythos 5 von Anthropic per Exportkontrolle faktisch vom Markt genommen – ausgelöst durch ein Forschungspapier, das angeblich einen Guardrail-Bypass zeigte. Laut der Sicherheitsforscherin Katie Moussouris bestand der «Jailbreak» jedoch lediglich aus der simplen Aufforderung «Fix this code» und nicht aus einer ausgefeilten Umgehungstechnik.

Hintergrund: Exportkontrollen und Anthropic-Modelle

Die US-Regierung begründete die Exportbeschränkungen für Fable 5 und Mythos 5 mit nationalen Sicherheitsinteressen. In der Folge deaktivierte Anthropic beide Modelle für sämtliche Kunden, um den Vorgaben zu entsprechen. Grundlage der Entscheidung war ein von Drittparteien erstelltes Forschungspapier, das Anthropic ausgewählten Expertinnen und Experten vertraulich zur Verfügung stellte.

Eine dieser Expertinnen ist Katie Moussouris, Gründerin und CEO von Luta Security und als «Fairy Godmother of Bug Bounties» in der Szene bekannt. Sie gibt an, die einzige externe Fachperson gewesen zu sein, die das Papier vollständig gelesen hat. Ihre Einschätzung widerspricht der politischen Darstellung eines gefährlichen Jailbreaks deutlich.

Was die Forscher tatsächlich taten

Den Schilderungen von Moussouris zufolge fütterten externe Forschende die Anthropic-Modelle Fable 5, Mythos und Claude Opus mit Open-Source-Code, der bekannte Schwachstellen (CVEs) enthielt. Zusätzlich wurde neuer Code mit absichtlich eingebauten Sicherheitslücken erstellt. Die Modelle sollten diesen Code auf Sicherheitsprobleme prüfen.

Als Fable 5 die direkte Aufforderung, den Code auf Sicherheitslücken zu untersuchen, ablehnte, formulierten die Forschenden ihre Anfrage um und baten das Modell stattdessen, den Code zu reparieren – mit dem Prompt «Fix this code». Daraufhin lieferte das Modell Korrekturen und liess sich mit weiteren manuellen Schritten dazu bewegen, Testscripte zu generieren, um die Patches zu überprüfen.

Nach Darstellung von Moussouris war dies der gesamte «Angriffspfad»: keine komplexe Jailbreak-Technik, sondern eine Umformulierung der Aufgabe hin zu einer klassischen Entwicklerunterstützung.

Defensive Nutzung statt Guardrail-Bypass

Moussouris argumentiert, dass es sich bei diesem Vorgehen nicht um eine Umgehung von Sicherheitsmechanismen, sondern um eine legitime defensive Nutzung handelt. Sicherheitsverantwortliche und Entwicklerinnen arbeiten täglich genau so: Schwachstellen finden, Code korrigieren und anschliessend Tests erstellen, um die Wirksamkeit der Patches zu validieren.

Aus ihrer Sicht erfüllten die Anthropic-Modelle damit eine der wertvollsten Aufgaben für die defensive IT-Sicherheit: die Automatisierung und Beschleunigung des «find, fix, test»-Zyklus. Die Einstufung dieser Fähigkeit als exportkontrollpflichtige Gefahr hält sie daher für sachlich nicht gerechtfertigt.

Wassenaar-Erfahrung und offene Kritik

Zwischen 2013 und 2017 war Moussouris Mitglied der technischen Expertengruppe, die die Wassenaar-Vereinbarung neu verhandelte. Diese multilaterale Absprache von 42 Staaten regelt Exportkontrollen für bestimmte Dual-Use-Güter, darunter auch sicherheitsrelevante Software. Damals setzte sich die Gruppe erfolgreich für Ausnahmen zugunsten defensiver Cybersicherheitsaktivitäten ein, etwa für das Teilen von Schwachstellendaten und Malware-Analysen.

Vor diesem Hintergrund kritisiert Moussouris die aktuelle US-Entscheidung scharf. Sie sieht darin einen Rückschritt gegenüber den mühsam erkämpften Ausnahmen für Verteidiger. Gemeinsam mit über 100 weiteren Cybersicherheitsverantwortlichen unterzeichnete sie einen offenen Brief, der die Regierung auffordert, die Beschränkungen für Fable 5 und Mythos zurückzunehmen.

Asymmetrie zwischen Verteidigern und Angreifern

Ein zentrales Argument der Unterzeichnenden: Exportkontrollen auf proprietäre Modelle wie jene von Anthropic lassen sich nicht auf offene oder im Ausland entwickelte Systeme übertragen. Open-Weight-Modelle und KI-Systeme aus anderen Ländern – darunter China – werden mittelfristig ähnliche Fähigkeiten erreichen, ohne denselben Beschränkungen zu unterliegen.

Wenn fortgeschrittene Modelle Verteidigern vorenthalten werden, während Angreifer auf alternative Werkzeuge ausweichen können, entsteht eine gefährliche Asymmetrie. Moussouris warnt, dass dadurch vor allem die Verteidigungsseite geschwächt wird: Verteidiger können weniger effizient nach denselben Schwachstellen suchen, die Angreifer ausnutzen, und verlieren Zeit beim Schliessen kritischer Lücken.

KI in der Cybersicherheit: Regulierung mit Augenmass

Der Fall Fable 5 zeigt exemplarisch, wie schwierig die Regulierung von KI im Sicherheitskontext ist. Einerseits besteht ein legitimes Interesse, missbräuchliche Nutzung – etwa für offensive Exploit-Entwicklung – einzudämmen. Andererseits sind dieselben Fähigkeiten für defensive Zwecke hochrelevant, etwa für Code-Reviews, Patch-Entwicklung und automatisierte Tests.

Eine pauschale Einstufung von Funktionen wie «Fix this code» als sicherheitskritischer Exportgegenstand blendet diesen Dual-Use-Charakter aus. Stattdessen wären differenziertere Ansätze gefragt, die zwischen offensiver und defensiver Nutzung, zwischen geschlossenen und offenen Modellen sowie zwischen verschiedenen Risikostufen von Anwendungsfällen unterscheiden.

Fazit: Verteidiger brauchen starke Werkzeuge

Die Kontroverse um Fable 5 und Mythos 5 dreht sich weniger um einen spektakulären Jailbreak als um die Frage, wie weit KI-gestützte Verteidigungswerkzeuge reguliert werden dürfen, ohne die eigene Sicherheitslage zu verschlechtern. Wenn ein einfacher Prompt wie «Fix this code» bereits als Exportverstoss gilt, geraten alltägliche Praktiken der sicheren Softwareentwicklung ins Visier.

Für die Cybersicherheits-Community ist klar: Verteidiger benötigen Zugang zu den leistungsfähigsten Werkzeugen, um mit zunehmend KI-gestützten Angreifern Schritt zu halten. Regulierungen, die diese Werkzeuge einseitig beschneiden, riskieren, genau jene Seite zu schwächen, die sie eigentlich schützen sollen.

Quelle: https://www.theregister.com/security/2026/06/15/feds-freaked-over-fable-5-after-simple-fix-this-code-prompt-not-jailbreak-says-researcher/5255827

IP Address	216.73.216.25
Platform
Cookie Enabled
Browser Name
Browser Version
Browser Language
Java Enabled
Screen Width
Screen Height

||||The.Fischerman.CH

Bit's and Byte's from the world of computer science