コンテキストエンジニアリング

LLM の有限な attention budget の中で、最も高シグナルなトークン集合をキュレーションし続ける設計手法。Anthropic が「プロンプトエンジニアリングの自然な進化形」として提唱した。

概要

プロンプト 1 回分の文言を最適化する「プロンプトエンジニアリング」に対し、コンテキストエンジニアリングは 推論の各ターンで「何を context に載せるか／外すか」を継続的にキュレーションする営み。対象は system prompt・ツール定義・会話履歴・Read したファイル内容・メモリ・外部知識など、モデルに届く全トークン。

Anthropic の定義では「望ましい結果を得るための最小限・最高シグナルのトークン集合を見つけること」が目標となる。LLM の attention budget は有限なので、広く取るほど recall が不安定化する（Context Rot）。

プロンプトエンジニアリングとの違い

観点	プロンプトエンジニアリング	コンテキストエンジニアリング
対象	1 回のプロンプト文言	推論に届く全トークン
時間軸	単発・静的	継続・動的（ターン毎に curation）
主な手段	指示の言い回し、Few-shot 例示	キャッシュ設計、ツール選定、要約、遅延ロード
失敗モード	曖昧な回答	Context Rot・cache miss・attention 希薄化

代表的な戦略

Just-in-time ロード — 常時ロードを最小化し、必要時にだけ Skills や Agents を発火させる
要約と compaction — 古い履歴を要約し、Server-side Compaction やローカル /compact で圧縮
引用先行 — 長文ドキュメントでは、Claude にまず該当箇所を引用させてからタスク実行
Prompt Cache の prefix 安定化 — 揮発情報を会話冒頭に置かず、cache 温度を 5 分 TTL 内で維持

Claude Code 7層ハーネスエンジニアリング — コンテキストエンジニアリングを 7 層のハーネスに具体化した運用例
コンテキスト設計編 — skills / prepare-context / Prompt Cache による実装例
Claude Code ベストプラクティス — CLAUDE.md・skills の配置戦略

参考資料

Effective context engineering for AI agents — Anthropic 公式
Long context prompting tips

概要

プロンプトエンジニアリングとの違い

代表的な戦略

関連記事

関連用語

参考資料