Anthropicは、最も強力なモデルの公開を何ヶ月も見合わせていた。ソフトウェアへの侵入能力があまりに高すぎたからだ。その後、安全対策(ガードレール)を施し、プロジェクト「Glasswing」段階の価格から60%値下げして、6月9日にリリースした。6月22日までの2週間は無料で試用できるが、それ以降はクエリごとに利用クレジットが必要となる。
市場で最高のモデルを追加料金なしで使えるのは、あと12日間。それが今回の条件だ。ただし、契約書の細則には、6月22日以降、200ドルのPro Maxプランを利用している場合は補助金付きのクレジットが適用され、標準プランの場合は全額支払いになると書かれている。無料の窓口は同じ日に閉じる。
Fable 5の正体
Claude Fable 5は、Anthropicが初めて一般公開した「Mythos(ミュトス)」クラスのモデルであり、2026年6月9日にリリースされた。Claude Opus 4.8の上位層に位置し、価格は100万入力/出力トークンあたり10ドル/50ドルと、Opus 4.8のちょうど2倍に設定されている。
説明が必要なのは、この「2つのモデル」の構成だ。Claude Fable 5とClaude Mythos 5は、内部の重み(ウェイト)が全く同じである。Mythos 5は、プロジェクト「Glasswing」を通じて審査済みのサイバーセキュリティ研究者やインフラ事業者に提供される限定版で、同じ分類器が解除された同一の基盤モデルだ。これに対し、Fable 5は一般向けに出荷されたもので、リスクの高いクエリを自動的にOpus 4.8にリダイレクトする安全分類器で包まれている。そのため、Fable 5の使用中に突然明らかに能力の劣るモデルに応答が引き継がれたとしても、それはバグではなく、安全レイヤーが作動した結果である。
2026年初頭の段階で、Mythosのプレビュー版はすでに主要なすべてのオペレーティングシステムとWebブラウザで脆弱性を発見する能力を示していた。Mozillaはこれを利用して、2週間でFirefoxの脆弱性を271件修正した。その実力が、安全分類器というベールの下に隠されているのだ。
本当に注目すべきベンチマーク
多くのAIベンチマークは、科学的な体裁で装飾されたマーケティングにすぎない。ここで注目すべきなのは、モデルが大規模な商用レベルのコードベースにおける実際のGitHubの問題を解決できるかをテストするコーディング評価「SWE-Bench Pro」だ。
Fable 5はSWE-Bench Proで80.3%、SWE-Bench Verifiedで95%を記録した。参考までに、Opus 4.8はSWE-Bench Proで69.2%にとどまっている。多くの開発者が最も信頼を寄せるベンチマークにおいて、Fable 5は前世代의フラッグシップに対して11ポイントものリードを奪っている。
個人開発者らによる独自のCursor Benchテストの結果も、同様の事実を裏付けている。Fable 5 Maxのスコアは72.9%で、最も近いライバルであるGPT-5.5 Extra Highは64.3%だった。しかし、そのスコアに達するためのコストは対照的だ。Fable 5 Maxがタスクあたり18ドルかかるのに対し、GPT-5.5 Extra Highは4.37ドルである。性能は間違いなくクラス最高だが、安さの面では勝負にならない。
実際の開発現場で見せた実力
モデル間のベンチマーク上の差は、実際の製品バグに直面したときに縮まることが多い。だが、Fable 5はそうではない。
ある開発者がこのモデルをテストし、大規模なコードベースで発生した3つの別々のバグを報告した。破損したチャットストリームのWebsocket、機能しないPC操作エージェント、そして実際には送信されていないのに送信完了と表示されるiMessageの連携エラーだ。これらはすべてGPT-5.5とOpus 4.8の両方を阻んだバグだったが、Fable 5はわずか30分未満で解決した。しかも、指示はエラーメッセージをコピペしただけの最小限のコンテキストで、詳細な仕様書もないずぼらなプロンプトからだった。
コードレビューの品質も同じ傾向を示した。プルリクエストに1から5の信頼スコアを割り当てるAIコードレビューツール「Greptile」で、Fable 5のアウトプットは、ほぼ完璧なスコア(連続して5点満点、4点以下はほとんどなし)を獲得した。多くの開発者にとってGreptileのスコアは二者択一であり、4点未満はプルリクエストをマージできないことを意味する。Fable 5はこの基準を安定してクリアした。
誰もが驚いたUI生成能力
このモデルの異次元さを示すもう一つのシグナルは、フロントエンド生成テストから得られた。通常、このテストはAIモデルの自己アピールと、実際にレンダリングされる画面との間のギャップを浮き彫りにするものだ。
5つのプロンプトに、一発勝負(ワンショット)で挑んだ。スクロール連動のアニメーションを備えたデザイナーのポートフォリオ用LP、スクリーンショットとURLからのThree.jsギャラリーの再構築、FigmaのMCPエージェント連携を組み込んだヒーローセクションの再設計、ホバーエフェクトを加えたCraigslistのモダン化、そして動画を参考にGSAPとThree.jsを用いた受賞WebサイトのUI再現。
ポートフォリオページは、文字単位で分割されたテキストアニメーション、スクロール時の絶妙なイージング、動作するギャラリーセクションを備えて返ってきた。Three.jsギャラリーは、参考URLのコンセプトを見事に再構築した。ピクセル単位の完全なコピーではないが、構造的に正確な解釈だった。Craigslistの刷新では、オリジナルの文字が密集した雰囲気を保ちつつ、きれいなホバー表示を追加した。5回連続の一発UIテストで、Fable 5は5戦全勝した。
もちろん、これがシニアデザイナーの代わりになるわけではない。専門家が見れば、オリジナルの作品とモデルの模倣との違いは一目瞭然であり、アワード受賞サイトの再現テストでは明らかに限界も見えた。ベースラインとしては即座に役立つが、手直しなしで本物として通用するレベルではない。しかし、「すぐに使える土台」と「数日間の手書きコードが必要な状態」との間のギャップこそが、このツールに高い金を払う価値がある理由だ。
誰も解決していない価格の問題
入力100万トークンあたり10ドル、出力50ドルという価格設定は、Opus 4.8の2倍であり、入力に関してはGPT-5.5の2倍に達する。これまでのAIモデルは過大評価されていると何ヶ月も主張し、自らを「AI懐疑派」と呼んでいたある開発者は、200ドルのMaxプランに登録し、Fable 5を使って生産性アプリのビジュアルデザインを丸ごと再構築したところ、わずか2時間で月間制限を使い果たしてしまった。
彼のその後の苦情は、モデルが機能しなかったというものではなかった。むしろ、あまりにもスムーズに動きすぎたため、これまで自分の開発者としてのアイデンティティの拠り所にしていた「創作上の葛藤(フリクション)」を奪い去ってしまったという不満だった。これは「モデルが使い物にならない」という次元とは全く異なるクレームである。
コンピューティングの制約は深刻だ。Anthropicはこのインフラを維持するため、GPUに月間10億ドル近くを費やしている。Proプランでの無料アクセスが6月22日に打ち切られるのは、この規模で制限なしの利用を補助し続けることが物理的に不可能だからだ。容量に余裕ができ次第、標準機能として復活させる計画だが、具体的な日付は公表されていない。
各種サブスクリプションプラン — Pro、Max、Team、およびシートベースのEnterprise — は、2026年6月22日まで追加料金なしでFable 5を利用できる。6月23日以降は利用クレジットが必要となる。また、Coworkユーザーに対しては、6月5日から7月5日までの間、Cowork内での5時間制限が倍に延長される。
チャンスの窓は開いている。そして12日後に閉まる。
出典
- Anthropic公式: Claudeモデルのリリースおよび製品発表
- SWE-bench: LLM向けソフトウェアエンジニアリング評価ベンチマーク
- Greptile AI: AIによるコードレビューおよび信頼度分析
著者紹介
今期すでに4つのAIサブスクを使い果たし、サーバーの計算コストを「雰囲気税(vibe tax)」と呼ぶ、あなたの32歳のギークな弟。