LLM の有限な attention budget の中で、最も高シグナルなトークン集合をキュレーションし続ける設計手法。Anthropic が「プロンプトエンジニアリングの自然な進化形」として提唱した。
概要
プロンプト 1 回分の文言を最適化する「プロンプトエンジニアリング」に対し、コンテキストエンジニアリングは 推論の各ターンで「何を context に載せるか/外すか」を継続的にキュレーションする営み。対象は system prompt・ツール定義・会話履歴・Read したファイル内容・メモリ・外部知識など、モデルに届く全トークン。
Anthropic の定義では「望ましい結果を得るための最小限・最高シグナルのトークン集合を見つけること」が目標となる。LLM の attention budget は有限なので、広く取るほど recall が不安定化する(Context Rot)。
プロンプトエンジニアリングとの違い
| 観点 | プロンプトエンジニアリング | コンテキストエンジニアリング |
|---|---|---|
| 対象 | 1 回のプロンプト文言 | 推論に届く全トークン |
| 時間軸 | 単発・静的 | 継続・動的(ターン毎に curation) |
| 主な手段 | 指示の言い回し、Few-shot 例示 | キャッシュ設計、ツール選定、要約、遅延ロード |
| 失敗モード | 曖昧な回答 | Context Rot・cache miss・attention 希薄化 |
代表的な戦略
- Just-in-time ロード — 常時ロードを最小化し、必要時にだけ Skills や Agents を発火させる
- 要約と compaction — 古い履歴を要約し、Server-side Compaction やローカル
/compactで圧縮 - 引用先行 — 長文ドキュメントでは、Claude にまず該当箇所を引用させてからタスク実行
- Prompt Cache の prefix 安定化 — 揮発情報を会話冒頭に置かず、cache 温度を 5 分 TTL 内で維持
関連記事
- Claude Code 7層ハーネスエンジニアリング — コンテキストエンジニアリングを 7 層のハーネスに具体化した運用例
- コンテキスト設計編 — skills / prepare-context / Prompt Cache による実装例
- Claude Code ベストプラクティス — CLAUDE.md・skills の配置戦略
関連用語
- Context Rot — コンテキストを広げすぎた際の劣化現象
- ハーネスエンジニアリング — コンテキストエンジニアリングを恒久的な運用基盤に落とし込む設計