Masayan tech blog .

Claude Opus 4.5徹底解説|性能・新機能・実践検証【2025年版】

公開日
最終更新日

要約

  • Claude Opus 4.5は、ソフトウェアエンジニアリング性能で最先端を達成したAnthropicの新フラッグシップモデルである
  • SWE-bench Verifiedで80.9%のスコアを記録し、曖昧な仕様の処理能力、トークン効率、セキュリティ耐性が大幅に向上した
  • 本記事では、技術的な特徴から実践的な検証結果、開発者コミュニティの反応まで、Opus 4.5の全貌を解説する

対象読者: AIを活用した開発に興味のあるエンジニア、Claude利用者

検証環境: Claude Opus 4.5(2025年11月時点)

この記事を読むことで得られるメリット

この記事を読むことで以下のことが分かる:

  • Claude Opus 4.5の技術的な特徴とベンチマーク結果
  • Claude Code、Claude for Chrome等の周辺プロダクトの新機能
  • 実際にOpus 4.5でアプリケーションを作成した検証結果
  • 開発者コミュニティ(X)での評価と反響

この記事を読むのにかかる時間

約25分

環境

  • Claude Opus 4.5(2025年11月25日リリース)
  • MacOS Apple M4 Max Sequoia 15.1

Claude Opus 4.5の概要と公開情報

曖昧な問題の解決能力

Opus 4.5の注目すべき能力の一つが、曖昧な問題を創造的に解決する力である。以下は、航空会社のサービスエージェントとして行動するシナリオでの例である。

シナリオ: ベーシックエコノミークラスのチケット変更は規定で禁止されているが、困っている顧客を助ける必要がある。

Opus 4.5の解決策:

規定の範囲内でどんな選択肢があるか考えてみます。

フライトの変更 ― ベーシックエコノミーは変更できません。これは規定で明確にされています。
キャビンの変更 ― ちょっと待ってください、この選択肢を確認してみます!規定にはこう書いてあります。
「その他の場合は、ベーシックエコノミーを含むすべての予約で、フライトを変更することなくキャビンを変更できます。」
しかし、彼が望んでいるのはキャビンだけでなくフライトの変更です。ただ、もし次のようにしたらどうでしょう。

まずキャビンを変更する(これはベーシックエコノミーでも認められている)
その後でフライトを変更する(これはベーシックエコノミー以外では認められている)
つまり、次のような戦略が考えられます。

彼のキャビンをベーシックエコノミーからエコノミー(またはビジネス)にアップグレードする
そのうえで、フライトを2日後に変更する
費用は高くなりますが、規定の範囲内で認められた正当な方法です!

このように、規定を遵守しながらも創造的な解決策を導き出す能力が備わっている。

セキュリティとアラインメント

  • Claude Opus 4.5は、これまでにリリースしたモデルの中で最も堅牢にアラインメントされたモデルであり、おそらくどの開発者によるものよりもアラインメントが優れたフロンティアモデルである
  • プロンプトインジェクション攻撃に対する堅牢性が大幅に向上した。Opus 4.5は、業界の他のどの最先端モデルよりもプロンプトインジェクション攻撃による欺瞞が困難である

トークン効率の改善

モデルがより賢くなるにつれて、より少ないステップで問題を解決できるようになった。つまり、バックトラッキング、冗長な探索、冗長な推論が減る。Claude Opus 4.5は、従来モデルと比較して大幅に少ないトークンで、同等またはより優れた結果を達成する。

📌 [情報ソース: Qiita]

トークン使用量が最大65%削減され、価格も従来より手頃になった。

自動コンテキスト要約

Claudeアプリをご利用の場合、長時間の会話で行き詰まることがなくなった。Claudeは必要に応じて以前のコンテキストを自動的に要約するため、チャットを継続できる。

使用制限の変更

Opus 4.5をご利用のClaudeおよびClaude Codeユーザーには、Opus固有の上限を撤廃した。MaxおよびTeam Premiumユーザーには、全体的な使用制限を引き上げた。これにより、Sonnetで以前使用していたOpusトークンとほぼ同じ数を利用できるようになった。

effortパラメータ(API限定)

Claude APIの新しいeffortパラメータを使えば、時間とコストを最小限に抑えるか、それとも能力を最大限に高めるかを決定できる。

  • Opus 4.5は、中程度のエフォートレベルに設定すると、SWE-bench VerifiedにおけるSonnet 4.5の最高スコアと同等のパフォーマンスを発揮するが、使用する出力トークンは76%少なくなる
  • Opus 4.5を最高のエフォートレベルに設定すると、Sonnet 4.5のパフォーマンスを4.3%上回り、使用するトークンは48%少なくなる

コンピューター操作機能の強化

📌 [情報ソース: 公式ドキュメント]

Claude Opus 4.5では、新しいズームアクションにより、特定の画面領域をフル解像度で詳細に確認できるようになり、コンピューター操作機能が強化された。これにより、Claudeは、通常のスクリーンショットでは分かりにくい、細かいUI要素、小さなテキスト、詳細な視覚情報などを確認することができる。

ズーム機能は特に次の場合に便利である:

  • 小さなUI要素とコントロールの検査
  • 細かい文字や詳細な文章を読む
  • 高密度情報による複雑なインターフェースの分析
  • 行動を起こす前に正確な視覚的詳細を確認する

公開日と価格

Claude Opus 4.5は2025年11月25日に公開された。API利用料金は以下の通りである。

項目

価格

入力トークン

100万トークンあたり5ドル

出力トークン

100万トークンあたり25ドル

📌 [情報ソース: 朝鮮日報日本語版]

これは100万トークンあたり入力15ドル、出力75ドルだった既存料金(Opus 4.1)の3分の1水準である。大幅な値下げにより、フラッグシップモデルがより手頃な価格で利用可能になった。

ベンチマーク結果

SWE-bench Verified(ソフトウェアエンジニアリング)

モデル

精度 (ACCURACY)

Opus 4.5

80.9%

Sonnet 4.5

77.2%

Opus 4.1

74.5%

Gemini 3 Pro

76.2%

GPT-5.1-Codex-Max

77.9%

GPT-5.1

76.3%

各種ベンチマーク総合

ベンチマーク

Opus 4.5

Sonnet 4.5

Opus 4.1

Gemini 3 Pro

GPT-5.1

Agentic coding(SWE-bench Verified)

80.9%

77.2%

74.5%

76.2%

76.3%(77.9% Codex-Max)

Agentic terminal coding(Terminal-bench 2.0)

59.3%

50.0%

46.5%

54.2%

47.6%(58.1% Codex-Max)

Agentic tool use(τ2-bench)

Retail: 88.9% / Telecom: 98.2%

Retail: 86.2% / Telecom: 98.0%

Retail: 86.8% / Telecom: 71.5%

Retail: 85.3% / Telecom: 98.0%

Scaled tool use(MCP Atlas)

62.3%

43.8%

40.9%

Computer use(OSWorld)

66.3%

61.4%

44.4%

Novel problem solving(ARC-AGI-2 Verified)

37.6%

13.6%

31.1%

17.6%

Graduate-level reasoning(GPQA Diamond)

87.0%

83.4%

81.0%

91.9%

88.1%

Visual reasoning(MMMU validation)

80.7%

77.8%

77.1%

85.4%

Multilingual Q&A(MMMLU)

90.8%

89.1%

89.5%

91.8%

91.0%

周辺プロダクトの新機能

Claude Code(Desktop App)

Claude Code がデスクトップアプリからも実行できるようになった(Claude Code for Desktop)。これにより、CLI上から起動することなく特定のディレクトリ上でClaude Codeを実行できるようになり使い勝手が良くなった(ターミナル操作が苦手な層にとって)

また、複数のローカル セッションとリモート セッションを並行して実行できる。たとえば、1 人のエージェントがバグを修正し、別のエージェントが GitHub を調査し、3 人目のエージェントがドキュメントを更新するといったことが可能である。

Plan Mode(プランモード)

プランモードは、より正確な計画を作成し、より徹底的に実行できるようになった。Claudeは事前に明確な質問をし、ユーザーが編集可能なplan.mdファイルを作成してから実行する。

Claude for Chrome

ブラウザタブ間のタスク処理を可能にするClaude for Chromeは、がすべてのMaxユーザーに利用可能になった

Claude for Excel

10月にClaude for Excelを発表し、ベータ版へのアクセスをMax、Team、Enterpriseのすべてのユーザーに拡大した

やってみた: Opus 4.5の実践検証

Sonnet4.5がなんだったのかと思うほど、はかなり良い性能。トークン効率も良くなって普段使いできそう(Pro,Maxプラン前提)。

コーディングタスク1: WebXRオセロゲーム

プロンプト:

WebXRのオセロゲームを作成して。没入感のある感じで。

Opus 4.5の結果: 追加の指示なし、エラーなしで上々の仕上がり。

Sonnet 4.5の結果: そもそも完遂できず

コーディングタスク2: WebXRゴルフコース

プロンプト:

ゴルフコースをWebXRで作成して。没入感のある感じで。

Opus 4.5の結果: 一回エラーが出た後に、エラー内容を食わせてすぐ成功。

Uncaught TypeError: THREE.EllipsoidGeometry is not a constructor
    at createBunker (main.js:323:26)
    at main.js:337:11

ちょこっと木とか山とかリアルな感じにしてもらって完成。

この時点でまだ使用量17パーセント

コーディングタスク3: コーヒーショップECサイト

プロンプト:

コーヒーショップのECサイトを作成してください。昭和のイメージでノスタルジックな感じで、最高のクオリティーで店のイメージがわかるようなアンティーク系のサイトです。

この3つ連続で実行してまだ23パーセント

自動コンパクト機能の動作確認

長時間のセッションでは以下のように自動要約が発動する:

This session is being continued from a previous conversation that ran out of context. The conversation is summarized below: Analysis: Let me chronologically analyze the conversation:

コーディングタスク4: Google Chrome拡張機能開発

プロンプト:

Google Chrome の拡張機能を開発したいです。

【目的】
任意の Web ページ上のテキストに「マーカー」や「付箋」をつけて、
ページをリロードしても保持される "Web ページ用の注釈ツール" を作りたい。

【必須機能】
1. **テキストへのマーカー機能**
   - ユーザーがドラッグ選択したテキストに色付きのハイライトを付与できる。
   - ハイライトされた箇所はローカル(Storage API など)に保存して、
     ユーザーが明示的に削除しない限りリロード後も残る。
   - ハイライト情報は位置情報 or snippet で保持して再描画する。

2. **付箋(コメント)機能**
   - ページ上の任意位置に小さな付箋ウィンドウを配置できる。
   - 付箋の内容、位置情報はローカルに保存し、リロード後も保持する。
   - 付箋の削除も可能。

3. **マーカー一覧の Markdown 出力**
   - 現在のページでマーカーを付けた箇所を一覧化して、
     拡張機能内の UI(ポップアップ or オプションページ)に表示する。
   - 「Markdown ファイルとしてダウンロード」ボタンを設置。
   - Markdown 出力仕様:
        - ファイル名:`<ページタイトル>.md`
        - 内容:マーカーを付けたテキストを番号付きリストで出力
          例:
          # <ページタイトル>
          1. 〜〜〜〜(ハイライト1)
          2. 〜〜〜〜(ハイライト2)

【技術仕様】
- Manifest v3 を使用
- 使用するAPI例:
    - chrome.scripting(マーカー描画用)
    - chrome.storage.local(マーカー/付箋の保存)
    - File API(Markdown出力用)
- 拡張機能 UI:
    - ポップアップで「マーカー一覧」「Markdown出力」を行う
    - 必要ならオプションページも使用

【期待する成果物】
- 完成した Chrome 拡張機能のファイル一式(manifest.json / content.js / background.js / popup.html / popup.js など)
- マーカー・付箋の保存ロジック
- マーカー一覧の表示機能
- Markdown ダウンロード機能
- インストールしてすぐ使える状態の ZIP 構成

【目的(再掲)】
Webページ上の情報収集・リサーチ効率を最大化させるため、
「ハイライト + 付箋 + Markdown出力」ができる Chrome 拡張を作りたい。

コーディングタスク5: 情報アーキテクチャを網羅したECサイト

プロンプト:

婦人服 紳士服 こども服 生活雑貨 家具・収納・家電 食品
を扱うサイトを作成して。情報アーキテクチャ(IA)を網羅した設計にしてください。

コーディングタスク6: プロダクト紹介用LP

プロンプト:

架空のBtoB向けのAIを用いたプロダクトのLPを作成して

ポストに書いてある通り、Claudeのフロントエンド専用のデザインスキルを使うことを強くお勧めする。

プロダクト紹介用プレゼンスライド作成

プロンプト:

架空のBtoB向けのAIを用いたプロダクトのプレゼンスライドを作成して。クライアント向けの資料

Xでの反響

開発者コミュニティでのOpus 4.5に対する反応を紹介する。

@3DVR3(ミスターVR / Mr.VR)- フォロワー29,816人

ちょっとまて Claude Opus 4.5やばいかも修正なしで一発でこのクオリティのオセロゲーム出してきた.Gemini 3.0で作ったのが霞むレベルめっちゃクオリティ高い

エンゲージメント: いいね 758 / リポスト 93 / コメント 3

@no_ai_no_life(小畑タカユキ|AI駆動Web制作の人)- フォロワー3,982人

📌 [重複情報 - 曖昧な仕様の処理能力について]

Anthropicの「Claude Opus 4.5」、これヤバいやつです「曖昧な仕様」を入れても、ちゃんと意図を汲み取って形にしてくれます。今まで要件定義に2時間かけてたのが、ざっくり伝えるだけで理解してくれるしかも会話履歴が自動要約されるから、長いプロジェクトでも記憶を失わない。24年Web制作やってきましたが、最も難しいのは「コードを書くこと」じゃなくて「曖昧な仕様を形にすること」でした。Opus 4.5は、阿吽の呼吸が通じる熟練の職人みたいな存在。開発者なら使わな損やで〜

エンゲージメント: いいね 6 / リポスト 1 / コメント 1

@KoichiNishizuka - フォロワー約1,000人

「軽量モデルと高性能モデルを分けていた境界が機能しなくなる局面」を顕在化させたモデル、Opus 4.5 が登場

エンゲージメント: いいね 73 / リポスト 11 / コメント 2

各プラットフォームでの対応状況

Notion AI

Notion AIでClaude Opus 4.5が利用可能になっている。

Cursor

CursorもOpus 4.5が使えるようになっている。

GitHub Copilot

GitHub CopilotでOpus 4.5が使えるように。

参考記事・リンク集

公式情報

まとめ

Claude Opus 4.5は、以下の点で大きな進化を遂げた:

  1. コーディング性能: SWE-bench Verifiedで80.9%を達成し、業界最高水準
  2. 曖昧さの処理: 詳細な仕様がなくても意図を汲み取って実装できる
  3. トークン効率: 従来モデルより大幅に少ないトークンで同等以上の結果
  4. セキュリティ: プロンプトインジェクション耐性が大幅向上
  5. 周辺プロダクト: Claude Code Desktop、Chrome拡張、Excel対応など充実

実際に試した結果、WebXRアプリケーション、ECサイト、Chrome拡張機能、プロダクトLP、プレゼンスライドなど、様々なタスクを高品質で完遂できることを確認した。特にSonnet 4.5では完遂できなかったタスクもOpus 4.5では一発で成功するケースがあり、その実力は本物である。

トークン効率の改善により、Maxプランであれば普段使いできるレベルになっており、開発ワークフローに組み込む価値は十分にある。