Anthropic、Claude Managed Agentsを大幅拡張―自己改善する新機能

AIエージェントが眠っている間に「夢を見て」過去の失敗を学び直す——そんなSFのような仕組みが、Harveyの完了率を約6倍に押し上げました。Anthropicが2026年5月6日に発表した3つの新機能は、AIが「賢く応える存在」から「組織と共に学ぶ存在」へと変わる転換点を示しています。

Anthropicは2026年5月6日、Claude Managed Agentsの新機能として、ドリーミング(dreaming)をリサーチプレビューで提供開始した。あわせて、アウトカム(outcomes)、マルチエージェント・オーケストレーション、Webhookをパブリックベータで開発者向けに展開する。

ドリーミングは、過去のセッションをレビューし、パターンを抽出してエージェントの自己改善を促す。アウトカムは、ルーブリックに基づき別の採点エージェントが出力を評価する機能で、社内ベンチマークではタスク成功率を最大10ポイント、docxで+8.4%、pptxで+10.1%改善した。

導入事例として、ある条件下ではHarveyは完了率を約6倍に、Wisedocsはレビュー速度を50%向上させる結果となった。NetflixとEvery社のSpiralも活用している。

From: New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration

【編集部解説】

今回の発表は、サンフランシスコで開催されたAnthropicの開発者イベント「Code with Claude」で公開されました。Claude Managed Agents自体が2026年4月にパブリックベータとなったばかりであり、わずか1か月足らずで主要機能を一気に拡張してきた点に、同社の本気度がうかがえます。

最も注目されるのは「ドリーミング(dreaming)」という名称が示す通り、人間が睡眠中に記憶を整理する仕組みになぞらえた設計思想です。AIエージェントは通常、セッションが終われば文脈を失います。ドリーミングは、その「合間」に過去のセッションを横断的に振り返り、共通する失敗パターンや、複数のエージェントが収束したワークフローを抽出して、メモリを再構築する仕組みです。

技術的に重要なのは、これが「コンテキストウィンドウの限界」という大規模言語モデル固有の制約に対する一つの解答になっている点です。エージェントは1回のセッションで扱える情報量に上限がありますが、ドリーミングはその制約をセッション横断の学習で補おうとする設計と言えます。

「アウトカム(outcomes)」については、別の採点エージェントが独立したコンテキストで出力を評価するという「グレーダー・アーキテクチャ」がポイントになります。元のエージェントの推論プロセスに引きずられず、客観的に成果物を判定できる構造が、人間のレビュー工数を削減する鍵になっています。

導入事例の数字にも注目すべきものがあります。Harveyの完了率「約6倍」という改善は、ドリーミング機能の導入によって、エージェントが組織知を蓄積した結果として達成されたものです。モデル自体の刷新ではなく、運用面の工夫でこの差が生まれている点に意味があります。これは、AIの価値が「個々の応答の賢さ」から「継続的な学習と組織への適応」へと移行しつつあることを象徴する数字と言えます。

ポジティブな側面として、法務(Harvey)、メディア配信基盤(Netflix)、ライティング(Spiral by Every)、文書検証(Wisedocs)と、業種を問わず実装が始まっている点は、エージェント技術が研究段階から実務段階へ移行したことを物語ります。特にSpiral by Everyが、軽量モデルのHaikuをリードに、高性能のOpusをサブに据える構成は、コストとパフォーマンスを両立する新しい設計パターンとして参考になります。

一方、潜在的なリスクも見逃せません。エージェントが自律的にメモリを書き換え、自己修正していく仕組みは、「なぜそのように動いたのか」という説明可能性を低下させる可能性があります。AnthropicはClaude Consoleでの全ステップのトレーサビリティを強調していますが、これは裏を返せば、可視化機構がなければブラックボックス化が進む構造とも言えます。

規制への影響も視野に入ります。EU AI Actやアメリカの州法レベルでは、AIの意思決定プロセスの透明性やメモリ管理が論点となりつつあります。自己改善するエージェントは、特に金融や医療など規制業種での導入時に、監査ログや変更履歴の証跡をどう担保するかが問われていくでしょう。

長期的な視点では、今回の発表は「AIエージェントが単発のタスク実行者から、組織の中で記憶を持ち、学習し、協働する存在へ変わる」転換点を示しています。主要なAI各社も類似機能の開発を進めていると報じられており、エージェントのメモリ・オーケストレーション基盤を巡る競争は、今年後半にかけてさらに加速する見通しです。

【用語解説】

Claude Managed Agents
Anthropicが提供する、開発者がAIエージェントを構築・運用するための基盤である。Messages APIを直接利用してエージェントをゼロから構築する代わりに、設定可能なエージェントハーネスとフルマネージド型のインフラを提供する。複数のエージェントが分単位から時間単位で同じプロジェクトに取り組む状況での利用を想定している。

ドリーミング(dreaming)
スケジュール実行されるバックグラウンド処理で、過去のセッションとメモリストアをレビューし、繰り返し発生する失敗、収束したワークフロー、共有された好みなどのパターンを抽出してメモリを再構築する仕組みである。人間が睡眠中に記憶を整理する仕組みになぞらえた設計思想に基づく。

アウトカム(outcomes)
ユーザーがルーブリック(評価基準)を定義し、別の採点エージェントがエージェントの出力をそれに照らして評価する機能である。基準を満たすまでエージェントが自己修正を繰り返す仕組みになっている。

マルチエージェント・オーケストレーション
リードエージェントがタスクを分割し、それぞれを独自のモデル・プロンプト・ツールを持つサブエージェントに並列で委任する仕組みである。サブエージェントは共有ファイルシステム上で協調動作し、結果はリードエージェントに統合される。

ルーブリック(rubric)
評価対象の品質を判定するための、項目別の評価基準表である。教育分野で広く用いられてきた手法で、AI開発では「成功の定義」をエージェントに伝えるための仕様書として機能する。

Webhook(ウェブフック)
特定のイベント発生時に、指定されたURLへHTTPリクエストを自動送信する仕組みである。エージェントの完了通知などを外部システムへリアルタイムに連携できる。

Code with Claude
Anthropicが開催する開発者向けカンファレンスである。今回のManaged Agentsの機能拡張は、サンフランシスコで開催された同イベントで発表された。

EU AI Act
欧州連合が制定したAIに関する包括的な規制法である。AIシステムをリスクレベルに応じて分類し、透明性や説明可能性、監査要件などを定めている。自律的なエージェント技術の運用にも影響する。

【参考リンク】

Anthropic 公式サイト(外部)
Claudeシリーズを開発するAI安全性企業の公式サイト。研究成果や責任あるスケーリングポリシーなどを公開している。

Claude Managed Agents 公式ドキュメント(外部)
Managed Agentsの機能仕様、APIリファレンス、実装ガイドが掲載されている開発者向けドキュメントである。

Claude Managed Agents アクセス申請フォーム(外部)
ドリーミング機能などのリサーチプレビューへのアクセスをリクエストするためのフォームである。

Harvey 公式サイト(外部)
法律業務に特化した生成AIを提供する企業。長文ドラフトや文書作成の自動化でManaged Agentsを活用している。

Spiral by Every 公式サイト(外部)
ライティング支援ツールSpiralの公式サイト。マルチエージェント・オーケストレーションとアウトカムを活用したAPI/CLIを提供している。

Wisedocs 公式サイト(外部)
保険請求や法務関連の医療記録のレビュー・要約を支援するAI企業。Managed Agents上で文書品質チェックエージェントを構築している。

Netflix 公式サイト(外部)
グローバルな動画配信プラットフォーム。プラットフォームチームがビルドログ分析エージェントにマルチエージェント連携を採用している。

Every 公式サイト(外部)
ニュースレター/メディア企業で、Spiralの運営元。AIを活用した複数のソフトウェアプロダクトを展開している。

【参考記事】

Anthropic is letting Claude agents ‘dream’ so they don’t sleep on the job(外部)
SiliconANGLEによる報道。発表が「Code with Claude」開発者カンファレンスで行われたこと、ドリーミングがコンテキストウィンドウの限界への解として位置付けられている点を報じている。

Claude Managed Agents Dreaming Explained (2026)(外部)
Build Fast with AIによる技術解説。Harveyの完了率「約6倍」やアウトカムによる成功率改善の数値の意味と背景を、開発者視点で具体的に分析している。

Anthropic updates Claude Managed Agents with three new features(外部)
9to5Macによる報道。3つの新機能の概要を簡潔にまとめており、Netflixのプラットフォームチームによる活用事例にも触れている。

Anthropic just taught Claude to dream between tasks, and it makes agents meaningfully smarter(外部)
Digital Trendsによる報道。ドリーミングが「セッション間に走るバックグラウンドプロセス」である技術的特性と、開発者の承認ワークフローを整理している。

Anthropic introduces “dreaming” for Claude Managed Agents(外部)
Techzine Globalによる報道。ドリーミングが「セッション中の保持」を担うメモリ機能とは異なり、「セッション間の処理と改善」を担う点を区別して解説している。

Anthropic unveils ‘Dreaming’ feature to help AI agents self-improve(外部)
Roic Newsによる報道。EUおよび米国におけるAIエージェントへの規制動向、競合各社の同種研究の存在など、市場・政策の文脈を含めて報じている。

【関連記事】

Claude Managed Agents｜AIエージェント開発を「数ヶ月から数日」に変える、Anthropicの新インフラ戦略
本記事の前提となる、Claude Managed Agentsのパブリックベータ開始を報じた基礎記事。今回新たに拡張された機能群の出発点を理解できる。

Anthropic「Claude Agent SDK」が長時間稼働AIエージェント問題に挑む
コンテキストウィンドウ制約と長時間タスクのメモリ設計を扱う記事。ドリーミング機能の技術的背景を理解する補助となる。

Code with Claude 2026、東京6月10日開催決定─Anthropicの開発者カンファレンスが3都市同時展開
本記事の発表がなされた「Code with Claude」サンフランシスコ会場と同シリーズの東京開催を伝える記事。

Anthropic×SpaceX提携の衝撃:300MW・22万GPUのColossus 1引き継ぎとClaude Code/API上限引き上げの全貌
同じ2026年5月6日に発表された、Anthropicのインフラ拡張に関する記事。本記事と並行して読むことで全体像が見えてくる。

【編集部後記】

AIエージェントが「夢を見る」と聞いたとき、みなさんはどんな印象を持たれたでしょうか。詩的な比喩のようでいて、実態はセッションをまたいで学習する仕組みのことです。便利になる一方で、「AIが自ら記憶を編集していく」という変化に、少し立ち止まりたくもなります。

職場で同僚AIが昨日の失敗を覚えていたら、あなたはどう感じるでしょうか。任せたい仕事と、自分の手で確かめたい仕事、その境目を意識してみると、これからのAIとの距離感が見えてくるかもしれません。