CORAL: Towards Autonomous Multi-Agent Evolution for Open-End

1. どんなもの？

CORAL（CO-evolving RAtional LLM agents）は、大規模言語モデル（LLM）を基盤とした、自律的なマルチエージェント進化フレームワークです。
オープンエンドな問題解決において、従来の固定されたヒューリスティックやハードコードされた探索ルールに依存せず、エージェントが自律的に探索、反省、協力を行います。
共有永続メモリ、非同期マルチエージェント実行、ハートビートベースの介入といったメカニズムを通じて、長期実行型のエージェントが知識を蓄積し、再利用しながら進化します。
隔離されたワークスペース、評価器の分離、リソース管理、エージェントセッションとヘルス管理などの実用的な安全策も提供し、安定した運用を可能にします。

2. 先行研究と比べてどこがすごい？

既存のLLMベースの進化手法が固定ルールに縛られていたのに対し、CORALはエージェントの自律性を大幅に向上させ、オープンエンド問題に対する「初の」自律的なマルチエージェント進化フレームワークとしています。
数学、アルゴリズム、システム最適化といった多様なタスクにおいて、10タスクで新たなState-of-the-Art（SOTA）を達成しました。
従来の固定進化探索ベースラインと比較して、はるかに少ない評価回数で3〜10倍高い改善率を記録し、効率性を劇的に向上させています。
特に、Anthropicのカーネルエンジニアリングタスクでは、4つの共進化エージェントが既知の最高スコアを1363サイクルから1103サイクルへと大幅に改善しました。

3. 技術や手法の肝はどこ？

**自律的な長期実行エージェント:** 固定された制御ロジックではなく、LLMエージェント自身が環境を探索し、自身の行動を反省し、他のエージェントと協力する能力を持ちます。
**共有永続メモリ:** エージェント間で知識や発見を共有し、長期的に蓄積・再利用することで、効率的な学習と進化を促進します。
**非同期マルチエージェント実行:** 複数のエージェントが並行して独立に動作し、探索の幅と深さを同時に拡大します。
**ハートビートベースの介入:** システムがエージェントの活動を定期的に監視し、必要に応じて介入することで、エージェントの健全な動作と目標への集中を維持します。
**実用的な安全策:** 隔離されたワークスペースや評価器の分離などにより、エージェントの試行錯誤がシステム全体に悪影響を及ぼさないように保護します。

4. どうやって有効だと検証した？

数学的な問題解決、アルゴリズム設計、システム最適化（例: Anthropicのカーネルエンジニアリングタスク）など、多様なオープンエンドなタスクセットでCORALを評価しました。
これらのタスクにおいて、CORALは既存のSOTA手法を上回り、10タスクで新記録を樹立しました。
固定進化探索ベースラインと比較して、CORALは評価回数を大幅に削減しつつ、3〜10倍の改善率を達成できることを示しました。
メカニズム分析を通じて、性能向上が知識の再利用と、マルチエージェント間の探索およびコミュニケーションから生じていることを具体的に示しました。

5. 議論はある？

アブストラクトからは直接的な議論点は読み取れませんが、LLMベースの自律エージェントシステム一般に共通する課題として、計算リソースの要求の高さや、エージェント間の複雑な相互作用による予期せぬ振る舞いの可能性が考えられます。
オープンエンドな発見における「進歩」の客観的な評価基準の確立も、常に議論の対象となり得ます。
提供されている安全策が、どれほどの範囲でエージェントの誤動作や悪意ある行動（もしあれば）を抑制できるか、詳細な分析が求められるでしょう。

6. 次に読むべき論文は？

LLMベースの自律エージェントやマルチエージェントシステムに関する研究（例: Generative Agents: Interactive Simulacra of Human Behavior）。
オープンエンドな探索や進化アルゴリズム、特にLLMを組み込んだものに関する論文。
Anthropicのカーネルエンジニアリングタスクや、同様のシステム最適化ベンチマークに関する論文。
「AutoGPT」や「BabyAGI」など、自律エージェントフレームワークの設計思想や実装に関する論文。

Abstract (原文)

Large language model (LLM)-based evolution is a promising approach for open-ended discovery, where progress requires sustained search and knowledge accumulation. Existing methods still rely heavily on fixed heuristics and hard-coded exploration rules, which limit the autonomy of LLM agents. We present CORAL, the first framework for autonomous multi-agent evolution on open-ended problems. CORAL replaces rigid control with long-running agents that explore, reflect, and collaborate through shared persistent memory, asynchronous multi-agent execution, and heartbeat-based interventions. It also provides practical safeguards, including isolated workspaces, evaluator separation, resource management, and agent session and health management. Evaluated on diverse mathematical, algorithmic, and systems optimization tasks, CORAL sets new state-of-the-art results on 10 tasks, achieving 3-10 times higher improvement rates with far fewer evaluations than fixed evolutionary search baselines across tasks. On Anthropic's kernel engineering task, four co-evolving agents improve the best known score from 1363 to 1103 cycles. Mechanistic analyses further show how these gains arise from knowledge reuse and multi-agent exploration and communication. Together, these results suggest that greater agent autonomy and multi-agent evolution can substantially improve open-ended discovery. Code is available at https://github.com/Human-Agent-Society/CORAL.

CORAL: Towards Autonomous Multi-Agent Evolution for Open-Ended Discovery💻 コードあり

Abstract (原文)