CTS-KB

コンテキストエンジニアリング

こんてきすとえんじにありんぐ

Context Engineering コンテキスト設計
#LLM #Claude #プロンプト設計 #AI Agent

LLM の有限な attention budget の中で、最も高シグナルなトークン集合をキュレーションし続ける設計手法。Anthropic が「プロンプトエンジニアリングの自然な進化形」として提唱した。

概要

プロンプト 1 回分の文言を最適化する「プロンプトエンジニアリング」に対し、コンテキストエンジニアリングは 推論の各ターンで「何を context に載せるか/外すか」を継続的にキュレーションする営み。対象は system prompt・ツール定義・会話履歴・Read したファイル内容・メモリ・外部知識など、モデルに届く全トークン。

Anthropic の定義では「望ましい結果を得るための最小限・最高シグナルのトークン集合を見つけること」が目標となる。LLM の attention budget は有限なので、広く取るほど recall が不安定化する(Context Rot)。

プロンプトエンジニアリングとの違い

観点プロンプトエンジニアリングコンテキストエンジニアリング
対象1 回のプロンプト文言推論に届く全トークン
時間軸単発・静的継続・動的(ターン毎に curation)
主な手段指示の言い回し、Few-shot 例示キャッシュ設計、ツール選定、要約、遅延ロード
失敗モード曖昧な回答Context Rot・cache miss・attention 希薄化

代表的な戦略

  • Just-in-time ロード — 常時ロードを最小化し、必要時にだけ Skills や Agents を発火させる
  • 要約と compaction — 古い履歴を要約し、Server-side Compaction やローカル /compact で圧縮
  • 引用先行 — 長文ドキュメントでは、Claude にまず該当箇所を引用させてからタスク実行
  • Prompt Cache の prefix 安定化 — 揮発情報を会話冒頭に置かず、cache 温度を 5 分 TTL 内で維持

関連記事

関連用語

参考資料