Verklaring over de richtlijn van de Amerikaanse overheid om de toegang tot Fable 5 and Mythos 5 op te schorten
12 juni 2026
De Amerikaanse overheid heeft, onder beroep op nationale veiligheidsinstanties, een exportcontrole-richtlijn uitgevaardigd om alle toegang tot Fable 5 en Mythos 5 voor buitenlandse staatsburgers op te schorten, ongeacht of zij zich binnen of buiten de Verenigde Staten bevinden, met inbegrip van buitenlandse werknemers van Anthropic. Het feitelijke effect van dit bevel is dat we Fable 5 en Mythos 5 abrupt moeten uitschakelen voor al onze klanten om naleving te garanderen. De toegang tot alle andere modellen van Anthropic wordt hierdoor niet beïnvloed.
We hebben de richtlijn vandaag om 17:21 uur (ET) van de overheid ontvangen. De brief bevatte geen specifieke details over de zorgen omtrent de nationale veiligheid. Onze indruk is dat de overheid gelooft op de hoogte te zijn gebracht van een methode om Fable 5 te omzeilen, oftewel te "jailbreaken". We hebben een demonstratie bekeken van deze specifieke techniek, die werd gebruikt om een klein aantal reeds bekende, minder belangrijke kwetsbaarheden te identificeren. Deze kwetsbaarheden lijken allemaal relatief eenvoudig, en we hebben vastgesteld dat andere publiek beschikbare modellen deze eveneens kunnen ontdekken zonder dat daar een omzeiling voor nodig is.
De opstelling van Anthropic met betrekking tot de veiligheidsmaatregelen van Fable, zoals uiteengezet in onze blogpost bij de lancering, is als volgt:
- We hebben sterke veiligheidsmaatregelen ingesteld die de kans aanzienlijk verkleinen dat Fable wordt misbruikt voor taken die verband houden met (onder andere) cybersecurity. Onze veiligheidsmaatregelen zijn zelfs zo streng dat veel gebruikers hebben geklaagd dat ze te restrictief zijn.
- In de weken voorafgaand aan de lancering van Fable heeft Anthropic samengewerkt met de Amerikaanse overheid, de Britse AISI, meerdere private externe organisaties en interne teams om de veiligheidsmaatregelen van Fable in totaal duizenden uren te onderwerpen aan 'red-teaming' (cybersecuritytests).
- Deze tests toonden aan dat de veiligheidsmaatregelen van Fable aanzienlijk effectiever zijn dan die van elk eerder ingezet model.
- Geen enkele tester is er tot nu toe in geslaagd een universele jailbreak te vinden — een jailbreakmethode die de veiligheidsmaatregelen van het model op zeer brede schaal kan omzeilen, waardoor een breed scala aan cybercapaciteiten wordt vrijgegeven.
We vermoeden dat een perfecte weerstand tegen jailbreaks momenteel voor geen enkele modelaanbieder mogelijk is. Elke veiligheidsmaatregel die in de sector wordt gebruikt, is kwetsbaar voor niet-universele jailbreaks (die in specifieke omstandigheden bepaalde cyberinformatie kunnen ontlokken), en het is waarschijnlijk dat er in de toekomst wel universele jailbreaks zullen worden gevonden. Dit hebben we duidelijk vermeld toen we Fable 5 uitbrachten.
Aangezien een perfecte weerstand tegen jailbreaks vandaag de dag niet mogelijk lijkt, heeft Anthropic bij Fable 5 gekozen voor een 'defense in depth'-strategie (een gelaagde verdedigingsstrategie). Ons doel was om jailbreaks óf specifiek te maken (in het geval van niet-universele jailbreaks), óf zeer kostbaar om te produceren (in het geval van universele jailbreaks), en dit te combineren met grondige monitoring om eventuele succesvolle aanvallen snel te detecteren en te stoppen. Dit is ook de reden waarom Anthropic een bewaartermijn van 30 dagen voor klantgegevens heeft verplicht bij Fable — een beleidswijziging die reële kosten voor ons met zich meebrengt richting klanten, maar die ons in staat stelt om jailbreaks te onderzoeken en te beperken.
We blijven achter deze 'defense in depth'-strategie staan. Het vermindert de risico's van Fable en brengt ze op een niveau dat vergelijkbaar is met de risico's van bestaande modellen die al in de hele sector worden gebruikt.
We hebben niet eens een melding ontvangen van een zorgwekkende, niet-universele potentiële jailbreak die tot een schadelijk resultaat heeft geleid. De potentiële jailbreaks die aan ons zijn gemeld, betreffen ofwel volledig onschuldige reacties, ofwel minder belangrijke bevindingen die geen Mythos-specifieke voordelen opleveren.
Tot op heden heeft de overheid ons alleen mondeling bewijs geleverd van een potentiële specifieke, niet-universele jailbreak. Dit komt er in wezen op neer dat het model wordt gevraagd een specifieke codebase te lezen en eventuele softwarefouten te herstellen. Ons begrip is dat één potentiële jailbreak met de overheid is gedeeld. We hebben een rapport ingezien dat naar ons idee de basis vormt voor de richtlijn van de overheid. We hebben geverifieerd dat het capaciteitsniveau dat daarin wordt getoond, breed beschikbaar is bij andere modellen (inclusief GPT-5.5 van OpenAI) en dagelijks wordt gebruikt door de cybersecurity-experts die systemen veilig houden. We zullen de komende 24 uur meer details delen.
We geven gehoor aan de juridische richtlijn van de overheid en trekken de toegang tot Fable 5 en Mythos 5 voor alle gebruikers in. We zijn het er echter niet mee eens dat de vondst van een specifieke, potentiële jailbreak reden zou moeten zijn voor het terugtrekken van een commercieel model dat door honderden miljoenen mensen wordt gebruikt. Als deze norm in de hele sector zou worden toegepast, geloven we dat dit in feite de inzet van alle nieuwe modellen voor alle toonaangevende modelaanbieders tot stilstand zou brengen.
Zoals we publiekelijk hebben verklaard, vinden we dat de overheid de mogelijkheid moet hebben om onveilige implementaties te blokkeren, maar dan wel als onderdeel van een wettelijk proces dat transparant, eerlijk, duidelijk en gebaseerd op technische feiten is. Deze actie voldoet niet aan die principes.
Onze excuses aan onze klanten voor deze verstoring. We zijn van mening dat dit berust op een misverstand en werken eraan om de toegang zo snel mogelijk te herstellen.