タイムズ・モラノ2026年3月11日 04:56LangChainの新しいフレームワークは、エージェントのハーネスが生のAIモデルをファイルシステム、サンドボックス、メモリ管理を通じて実用化可能なシステムに変える仕組みを解説しています。LangChainは、原始的な言語モデルを自律的な作業エンジンに変換するインフラ層を体系的に解説したエージェントハーネスアーキテクチャの詳細な技術解説を公開しました。このフレームワークは、2026年3月11日にVivek Trivedyによって執筆され、ハーネスエンジニアリングがAIエージェントの性能において重要な差別化要素として浮上していることを背景としています。基本的な考え方は非常にシンプルです:エージェント=モデル+ハーネス。モデル自体に含まれないすべて—システムプロンプト、ツールの実行、オーケストレーションロジック、ミドルウェアフック—はハーネスの責任範囲です。生のモデルは、インタラクション間で状態を維持したり、コードを実行したり、リアルタイムの知識にアクセスしたりできません。ハーネスはこれらのギャップを埋めます。## 開発者にとっての重要性LangChainのTerminal Bench 2.0のリーダーボードデータは、直感に反する結果を示しています。AnthropicのOpus 4.6をClaude Codeで動かした場合、最適化されたサードパーティのハーネスを使用した同じモデルよりもスコアが大きく低いのです。同社は、ハーネスだけを変更し、基盤となるモデルはそのままにして、自社のコーディングエージェントのランキングをトップ30からトップ5に向上させたと主張しています。これは、モデル選定に多大な投資をしながらインフラを軽視しているチームにとって重要なシグナルです。## 技術スタックこのフレームワークは、いくつかのコアなハーネスのプリミティブを特定しています。**ファイルシステム**は基盤層として機能します。耐久性のあるストレージを提供し、セッション間の作業の持続性を可能にし、マルチエージェントアーキテクチャの自然なコラボレーションの場を作り出します。Gitの統合により、バージョン管理やロールバック、実験のブランチ作成も可能です。**サンドボックス**は、エージェント生成コードのセキュリティ問題を解決します。ローカルで実行するのではなく、ハーネスは隔離された環境に接続してコードの実行や依存関係のインストール、タスクの完了を行います。ネットワークの隔離やコマンドの許可リスト化も追加の安全策です。**メモリと検索**は、知識の制限に対処します。AGENTS.mdのような標準は、エージェント起動時にコンテキストに注入され、継続的な学習の一形態を可能にします。これにより、エージェントは一つのセッションから得た知識を永続的に保存し、将来のセッションでアクセスできます。Web検索やContext7のようなツールは、トレーニングカットオフを超えた情報へのアクセスを提供します。## コンテキストの劣化対策このフレームワークは、コンテキストウィンドウがいっぱいになるときに起こるモデルの推論能力の低下(コンテキストロット)に対して、いくつかの仕組みで対処します。コンパクションは、ウィンドウの容量に近づいたときに内容を要約し、オフロードします。ツール呼び出しのオフロードは、大きな出力からノイズを減らすために、ヘッドとテールのトークンだけを保持し、完全な結果はファイルシステムに保存します。スキルは段階的な開示を実装し、必要なときだけツールの説明を読み込み、起動時にコンテキストを乱さないようにします。## 長期的な実行複数のコンテキストウィンドウにまたがる複雑な自律作業には、LangChainはRalphループパターンを提案しています。このハーネスレベルのフックは、モデルの終了試行を捕捉し、クリーンなコンテキストウィンドウに元のプロンプトを再挿入して継続させ、完了目標に向かって進めます。ファイルシステムの状態持続と併用することで、エージェントは長期的なタスクでも一貫性を保つことができます。## トレーニングとフィードバックループClaude CodeやCodexのような製品は、ハーネスをループに組み込んだ後トレーニングを行い、モデルの能力とハーネス設計の密接な連携を実現しています。これには副次的な影響もあり、Codex-5.3のプロンプトガイドは、ファイル編集のためのツールロジックを変更するとパフォーマンスが低下することを指摘しており、特定のハーネス設定に過剰適合している可能性を示唆しています。LangChainは、この研究を深層エージェントライブラリに応用し、共有コードベース上での数百の並列エージェントのオーケストレーションや、ハーネスレベルの失敗モードの自己分析、動的なツールの即時組み立てを模索しています。モデルが計画や自己検証をネイティブに向上させるにつれ、一部のハーネス機能は基本的な能力に吸収される可能性もあります。しかし、同社は、適切に設計されたインフラは、基盤モデルの知能に関係なく価値を持ち続けると主張しています。*画像出典:Shutterstock*
LangChainはAI開発のためのエージェントハーネスアーキテクチャを定義
タイムズ・モラノ
2026年3月11日 04:56
LangChainの新しいフレームワークは、エージェントのハーネスが生のAIモデルをファイルシステム、サンドボックス、メモリ管理を通じて実用化可能なシステムに変える仕組みを解説しています。
LangChainは、原始的な言語モデルを自律的な作業エンジンに変換するインフラ層を体系的に解説したエージェントハーネスアーキテクチャの詳細な技術解説を公開しました。このフレームワークは、2026年3月11日にVivek Trivedyによって執筆され、ハーネスエンジニアリングがAIエージェントの性能において重要な差別化要素として浮上していることを背景としています。
基本的な考え方は非常にシンプルです:エージェント=モデル+ハーネス。モデル自体に含まれないすべて—システムプロンプト、ツールの実行、オーケストレーションロジック、ミドルウェアフック—はハーネスの責任範囲です。生のモデルは、インタラクション間で状態を維持したり、コードを実行したり、リアルタイムの知識にアクセスしたりできません。ハーネスはこれらのギャップを埋めます。
開発者にとっての重要性
LangChainのTerminal Bench 2.0のリーダーボードデータは、直感に反する結果を示しています。AnthropicのOpus 4.6をClaude Codeで動かした場合、最適化されたサードパーティのハーネスを使用した同じモデルよりもスコアが大きく低いのです。同社は、ハーネスだけを変更し、基盤となるモデルはそのままにして、自社のコーディングエージェントのランキングをトップ30からトップ5に向上させたと主張しています。
これは、モデル選定に多大な投資をしながらインフラを軽視しているチームにとって重要なシグナルです。
技術スタック
このフレームワークは、いくつかのコアなハーネスのプリミティブを特定しています。
ファイルシステムは基盤層として機能します。耐久性のあるストレージを提供し、セッション間の作業の持続性を可能にし、マルチエージェントアーキテクチャの自然なコラボレーションの場を作り出します。Gitの統合により、バージョン管理やロールバック、実験のブランチ作成も可能です。
サンドボックスは、エージェント生成コードのセキュリティ問題を解決します。ローカルで実行するのではなく、ハーネスは隔離された環境に接続してコードの実行や依存関係のインストール、タスクの完了を行います。ネットワークの隔離やコマンドの許可リスト化も追加の安全策です。
メモリと検索は、知識の制限に対処します。AGENTS.mdのような標準は、エージェント起動時にコンテキストに注入され、継続的な学習の一形態を可能にします。これにより、エージェントは一つのセッションから得た知識を永続的に保存し、将来のセッションでアクセスできます。Web検索やContext7のようなツールは、トレーニングカットオフを超えた情報へのアクセスを提供します。
コンテキストの劣化対策
このフレームワークは、コンテキストウィンドウがいっぱいになるときに起こるモデルの推論能力の低下(コンテキストロット)に対して、いくつかの仕組みで対処します。コンパクションは、ウィンドウの容量に近づいたときに内容を要約し、オフロードします。ツール呼び出しのオフロードは、大きな出力からノイズを減らすために、ヘッドとテールのトークンだけを保持し、完全な結果はファイルシステムに保存します。スキルは段階的な開示を実装し、必要なときだけツールの説明を読み込み、起動時にコンテキストを乱さないようにします。
長期的な実行
複数のコンテキストウィンドウにまたがる複雑な自律作業には、LangChainはRalphループパターンを提案しています。このハーネスレベルのフックは、モデルの終了試行を捕捉し、クリーンなコンテキストウィンドウに元のプロンプトを再挿入して継続させ、完了目標に向かって進めます。ファイルシステムの状態持続と併用することで、エージェントは長期的なタスクでも一貫性を保つことができます。
トレーニングとフィードバックループ
Claude CodeやCodexのような製品は、ハーネスをループに組み込んだ後トレーニングを行い、モデルの能力とハーネス設計の密接な連携を実現しています。これには副次的な影響もあり、Codex-5.3のプロンプトガイドは、ファイル編集のためのツールロジックを変更するとパフォーマンスが低下することを指摘しており、特定のハーネス設定に過剰適合している可能性を示唆しています。
LangChainは、この研究を深層エージェントライブラリに応用し、共有コードベース上での数百の並列エージェントのオーケストレーションや、ハーネスレベルの失敗モードの自己分析、動的なツールの即時組み立てを模索しています。モデルが計画や自己検証をネイティブに向上させるにつれ、一部のハーネス機能は基本的な能力に吸収される可能性もあります。しかし、同社は、適切に設計されたインフラは、基盤モデルの知能に関係なく価値を持ち続けると主張しています。
画像出典:Shutterstock