Memory 与 Context 层

真实作用

Context 决定模型当前能看到什么。Memory 决定模型跨 session 能记住什么。

这两层会直接影响 agent 行为，因此必须可解释、可审计、可回滚。

ContextBuilder 把多种来源合成一次模型请求：

输出：

建议顺序：

global user instructions
project root AGENTS.md
directory-scoped AGENTS.md
session instruction
runtime safety policy

需要明确：

MVP 只做 reviewed memory，不做静默 auto-memory。

evidence
  -> candidate
  -> diff
  -> review
  -> apply | discard
  -> durable memory

每一步都应有事件。

ContextBuilder 必须知道预算：

不要等 provider 报 context too long 才处理。

ContextBuilder + deterministic compaction 是 M4 deliverable。在 M4 完成之前，接入真实 provider (M2-01) 必须先实现硬上限检查：

M2 adapter 在调用 provider 前，估算 prompt_tokens + transcript_tokens 是否超过 ModelProvider.capabilities.maxContextTokens。超过时：
1. 不调用模型 API。
2. SessionEngine 发 turn.completed { stopReason: "error" }，errorCode 体现 “context_overflow”（M2 schema evolution 同步加 errorCode 字段）。
3. 把 budget breakdown 落 telemetry，便于人工分流。
绝不允许让模型 API 返回 4xx/5xx 后才感知超限，因为某些 provider 在 oversize 时会 hang 或返回不确定语义。
M4 落地后，超限会触发 compaction → 重新尝试一次而不是直接报错；该 fallback 取代上述 stop=error。

session.compacted event 必须记录被压缩的 sequence 范围（M4 引入到 schema）。
原始事件可归档但不能删除，replay 仍需可还原压缩前的视图。
Compaction 后再启动新 turn 时，新 turn 的 sequence 从压缩后游标继续递增；compaction 自身的 event 也占用一个 sequence。

Vector memory 有价值，但早期会带来：

所以先做 Markdown/reviewed memory。