# ТЗ: pi-skill-reinject
Extension для [Pi Coding Agent](https://github.com/earendil-works/pi), который отслеживает уже вызванные skills и повторно инжектит их в контекст после auto compaction.
**Статус:** draft
**Репозиторий:** `pi-auto-reinjection`
**Целевая платформа:** upstream Pi (`earendil-works/pi`), не форки (oh-my-pi и т.п.)
---
## 1. Проблема
Pi использует progressive disclosure для skills: в system prompt всегда только name + description, полный `SKILL.md` попадает в контекст через `read` или `/skill:name` ([skills.md](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/docs/skills.md)).
При compaction старые сообщения суммаризуются; полный текст skill-блоков из «сжатой» части истории теряется ([compaction.md](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/docs/compaction.md)). После auto compaction:
- descriptions skills остаются в system prompt;
- модель **не обязана** снова читать `SKILL.md` ([skills.md — «models don't always do this»](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/docs/skills.md));
- встроенного механизма re-inject в upstream Pi нет.
---
## 2. Цель
Универсальный extension, который:
1. **Отслеживает** skills, реально использованные в сессии.
2. **После auto compaction** повторно инжектит их в контекст (как при `/skill:name`).
3. **По умолчанию выключен**; включается командой на уровне сессии или глобально (навсегда).
---
## 3. Не-цели (v1)
- Замена/обёртка стандартного compaction summary.
- Re-inject после **ручного** `/compact` (опционально в v2, см. §8).
- Поддержка oh-my-pi-специфики (`compaction.autoContinue`, snapcompact и т.д.).
- Re-inject skills, которые модель «прочитала» через `read`, но пользователь явно не вызывал — только если включена опция `trackReadPaths` (см. §6.2, по умолчанию `true`).
- Изменения в сторонних extensions (в т.ч. [pi-auto-compact](https://github.com/capyup/pi-auto-compact)) — только опциональная интеграция на нашей стороне с автоопределением (§16).
---
## 4. Ссылки на документацию Pi
| Тема | Ссылка |
|------|--------|
| Extensions (API, события, команды) | [packages/coding-agent/docs/extensions.md](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/docs/extensions.md) |
| Compaction (когда срабатывает, что теряется) | [packages/coding-agent/docs/compaction.md](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/docs/compaction.md) |
| Skills (вызов, формат, progressive disclosure) | [packages/coding-agent/docs/skills.md](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/docs/skills.md) |
| Settings (глобальные / project overrides) | [packages/coding-agent/docs/settings.md](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/docs/settings.md) |
| Примеры extensions | [packages/coding-agent/examples/extensions/](https://github.com/earendil-works/pi/tree/main/packages/coding-agent/examples/extensions) |
| `sendUserMessage` | [send-user-message.ts](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/examples/extensions/send-user-message.ts) |
| Custom compaction hook | [custom-compaction.ts](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/examples/extensions/custom-compaction.ts) |
| `parseSkillBlock` (формат skill-блока) | [agent-session.ts](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/src/core/agent-session.ts) |
| `_expandSkillCommand` (как Pi разворачивает `/skill:name`) | [agent-session.ts](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/src/core/agent-session.ts) |
| Agent Skills standard | [agentskills.io](https://agentskills.io/specification) |
| **pi-auto-compact** (совместимость) | [github.com/capyup/pi-auto-compact](https://github.com/capyup/pi-auto-compact) |
| pi-auto-compact исходник | [extensions/auto-compact.ts](https://github.com/capyup/pi-auto-compact/blob/main/extensions/auto-compact.ts) |
| Inter-extension events | [event-bus.ts example](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/examples/extensions/event-bus.ts) |
| `before_agent_start` (inject message) | [extensions.md — before_agent_start](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/docs/extensions.md) |
---
## 5. Поведение
### 5.1. Режимы включения
Три независимых слоя (приоритет сверху вниз):
| Слой | Хранение | Default | Описание |
|------|----------|---------|----------|
| **Session override** | `pi.appendEntry("skill-reinject:config", …)` | `null` (нет override) | Вкл/выкл только в текущей сессии |
| **Global default** | `~/.pi/agent/settings.json` → `skillReinject.enabled` | `false` | «Навсегда» для всех новых сессий |
| **Effective** | вычисляется | `false` | `sessionOverride ?? globalDefault` |
Команда `/skill-reinject` (см. §7) меняет session override или global default.
**Важно:** session override не переживает `/resume` в другую сессию — восстанавливается из entries этой сессии. Global default читается при `session_start`.
### 5.2. Когда делать re-inject
Триггер: событие extension **`session_compact`** ([extensions.md — session_before_compact / session_compact](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/docs/extensions.md)).
Условия (все должны выполниться):
1. `effectiveEnabled === true`
2. Compaction **не** отменён (`session_compact` успешно отработал)
3. Источник compaction = **auto** (`threshold` или `overflow`), не manual `/compact`
→ см. §8 про детекцию источника
4. Есть хотя бы один tracked skill, **отсутствующий** в kept-части контекста (§6.4)
5. Skill всё ещё зарегистрирован в `resourceLoader` (не удалён с диска)
**Не** делать re-inject:
- при `session_before_compact` с `cancel: true`;
- если список skills для re-inject пуст;
- если агент в момент `session_compact` стримит и `willRetry === true` (overflow recovery) — отложить до `agent_end` или использовать `deliverAs: "followUp"` (§6.5).
### 5.3. Что именно инжектить
Повторять поведение Pi `_expandSkillCommand`: user message с блоком
```xml
References are relative to {baseDir}.
{body без YAML frontmatter}
```
Опционально добавлять служебный суффикс (конфигурируемо):
```text
[skill-reinject] Re-applied after compaction. Follow this skill's workflow.
```
**Не** использовать цепочку `/skill:a /skill:b` в одном сообщении — Pi разворачивает только один `/skill:` на сообщение.
Для N skills при доставке через `sendUserMessage`: отдельное сообщение на skill, порядок = порядок первого вызова в сессии.
При доставке через `before_agent_start` или mid-turn `sendMessage`/`steer` (§6.5, режим `defer`, в т.ч. с [pi-auto-compact](https://github.com/capyup/pi-auto-compact)): **одно** injected message с `customType: "skill-reinject:inject"` и всеми skill-блоками подряд (меньше turn'ов, нет гонки с follow-up).
---
## 6. Отслеживание skills
### 6.1. Структура состояния
```typescript
interface TrackedSkill {
name: string; // frontmatter name
filePath: string; // абсолютный путь к SKILL.md
baseDir: string; // директория skill
firstSeenAt: number; // timestamp
lastSeenAt: number;
sources: Array<"slash" | "skill-block" | "read">;
}
interface ExtensionState {
version: 1;
sessionOverride: boolean | null;
skills: TrackedSkill[]; // dedupe by name, preserve insertion order
lastCompactionSource: "auto" | "manual" | null;
/** Skills, ожидающие re-inject (§6.5): idle → before_agent_start; mid-turn → steer на session_compact */
pendingReinject: string[]; // skill names
}
/** Runtime-only, не персистить */
interface RuntimeFlags {
autoCompactDetected: boolean;
autoCompactIntegration: "auto" | "defer" | "immediate" | "off";
}
```
In-memory кэш + персистенция через `pi.appendEntry` при каждом изменении tracked skills / session override.
### 6.2. Источники детекции
| # | Событие | Условие | `source` |
|---|---------|---------|----------|
| 1 | `input` | `event.text` matches `/^\/skill:([a-z0-9-]+)/` | `slash` |
| 2 | `message_end` (user) | текст содержит ``
4. `/skill-reinject off` → compaction → re-inject не происходит
5. `/skill-reinject global on` → новая сессия → re-inject без `on`
### 12.3. Manual E2E (с pi-auto-compact)
Предусловие: `pi install npm:@capyup/pi-auto-compact` ([README](https://github.com/capyup/pi-auto-compact/blob/main/README.md)).
1. Оба extension загружены; `/skill-reinject on`
2. `/skill-reinject` → status показывает `delivery: defer (pi-auto-compact detected)`
3. `/skill:some-skill` → сессия до срабатывания pi-auto-compact (порог по умолчанию 90% context window)
4. После auto-compaction:
- pi-auto-compact отправляет follow-up (*«Auto-compact ran… Continue…»*);
- агент **продолжает** работу без idle;
- в контексте turn'а есть skill-блок(и) **до** follow-up текста
5. В логах/TUI **нет** ошибки `Agent is already processing` / `Failed to send queued message`
6. Ручной `/compact` → pi-auto-compact **не** шлёт follow-up → re-inject только если `reinjectOnManualCompaction: true`, иначе `pendingReinject` сбрасывается на следующем user prompt
7. Во время compaction пользователь печатает сообщение → pi-auto-compact молчит → re-inject через `before_agent_start` на turn пользователя
---
## 13. Критерии приёмки (v1)
- [ ] Default off; `/skill-reinject on` включает re-inject в сессии
- [ ] `/skill-reinject global on` сохраняет в `~/.pi/agent/settings.json` и переживает restart
- [ ] После **auto** compaction re-injectятся все tracked skills, отсутствующие в kept window
- [ ] После **manual** `/compact` re-inject **не** происходит (при default `reinjectOnManualCompaction: false`)
- [ ] Tracked skills: `/skill:name`, skill-block в user msg, `read` на `SKILL.md`
- [ ] State переживает `/resume` той же сессии
- [ ] Footer status показывает on/off и count
- [ ] Нет duplicate skill blocks для skills уже в kept window (включая `skill-reinject:inject` в kept slice, §6.4)
- [ ] С [pi-auto-compact](https://github.com/capyup/pi-auto-compact): auto-detect, режим `defer`, нет гонки `sendUserMessage`, continue после compaction работает
- [ ] С pi-auto-compact: ручной `/compact` не ломает ни один extension
- [ ] **Два auto compaction подряд** (в т.ч. второй mid-turn без user prompt): после каждого — tracked skills в контексте или явный skip (`skipped-kept` в `debug`); `/skill-reinject` → `last compaction: auto`, не `none` (§8 fallback, §6.5.1 steer)
---
## 14. Будущие улучшения (v2+)
- `reinjectOnManualCompaction: true` как осознанный opt-in
- `session_before_compact`: дописывать в custom summary список active skills
- Опциональный `pi.events` протокол с pi-auto-compact (встраивать skill-блоки в follow-up текст — без PR в capyup не обязателен)
- Pi package на npm (`keywords: ["pi-package"]`)
- Опция re-inject только «последнего активного» skill, а не всех
---
## 15. Риски
| Риск | Митигация |
|------|-----------|
| Re-inject раздувает контекст (N больших skills) | `skillReinject.maxSkills` (default unlimited; soft warn > 3) |
| `sendUserMessage` запускает нежеланный turn | `defer` по умолчанию при pi-auto-compact; иначе `triggerTurn: false` |
| Гонка `sendUserMessage` с pi-auto-compact follow-up | §16: не слать `sendUserMessage` в `session_compact`; idle → `before_agent_start`; mid-turn → `sendMessage`/`steer` (§6.5.1) |
| Нельзя отличить auto/manual без эвристики | input hook на `/compact`; pi-auto-compact manual `/compact` не в его `onComplete` |
| Двойной compaction (Pi default + pi-auto-compact) | документировать; опционально warn в status |
| Pi изменит формат skill block | version в state; тест на `parseSkillBlock` regex |
---
## 16. Совместимость с [@capyup/pi-auto-compact](https://github.com/capyup/pi-auto-compact)
Типичная установка пользователя: `pi install npm:@capyup/pi-auto-compact`. Extension проактивно компактирует на `turn_start` / `turn_end` / emergency `context` и **автоматически продолжает** работу после auto-compaction.
### 16.1. Как работает pi-auto-compact (релевантное нам)
Источник: [extensions/auto-compact.ts](https://github.com/capyup/pi-auto-compact/blob/main/extensions/auto-compact.ts), [README](https://github.com/capyup/pi-auto-compact/blob/main/README.md).
| Аспект | Поведение |
|--------|-----------|
| Триггер compaction | `ctx.compact({ customInstructions, onComplete, onError })` — не ручной `/compact` |
| Follow-up после auto-compact | `onComplete` → `setImmediate(() => { if (ctx.isIdle()) pi.sendUserMessage(AUTO_COMPACT_FOLLOW_UP[phase]); })` |
| Ручной `/compact` | **Не** попадает в их `onComplete` → follow-up **не** отправляется |
| Тексты follow-up | `"Auto-compact ran before this turn. Continue with the current task."` и ещё 3 фазы (mid-turn, emergency, session-resume) |
| Гонки | Специально откладывают follow-up в `setImmediate`, чтобы не проиграть flush `compactionQueuedMessages` Pi |
| Keep budget | `keepRecentPercent` (default 15% context window), не `keepRecentTokens` Pi |
### 16.2. Конфликт без интеграции
Если skill-reinject на `session_compact` вызовет `sendUserMessage` синхронно или в том же `setImmediate`:
1. Агент перестаёт быть idle → pi-auto-compact **не** шлёт follow-up → **сессия замирает** после compaction.
2. Или оба шлют сообщения в одном tick → `"Agent is already processing"` ([комментарий в auto-compact.ts](https://github.com/capyup/pi-auto-compact/blob/main/extensions/auto-compact.ts)).
**Вывод:** при обнаружении pi-auto-compact re-inject **обязан** идти через режим `defer`, не через конкурирующий `sendUserMessage` в `session_compact`. Idle: `before_agent_start`; mid-turn (`!isIdle`): `sendMessage` с `deliverAs: "steer"` (§6.5.1) — тот же инвариант §16.5, без user message.
### 16.3. Целевой совместный flow
```text
turn_start / turn_end / emergency
│
▼
pi-auto-compact: ctx.compact()
│
├── session_before_compact (наш hook: mark source=auto)
├── … Pi summarization …
├── session_compact (наш hook: pendingReinject := skills ∖ kept)
│ │
│ ├── isIdle → pending для before_agent_start
│ └── !isIdle → sendMessage steer (§6.5.1), без follow-up
└── onComplete → setImmediate → if isIdle: sendUserMessage("Auto-compact ran…")
│
▼
prompt() → before_agent_start (наш hook, idle-path)
│
├── inject: … × N ← re-inject (если не steer'нули)
└── user prompt: "Auto-compact ran…" ← kickoff pi-auto-compact
│
▼
agent продолжает с skills + summary + kept tail
```
### 16.4. Автоопределение pi-auto-compact
Без зависимости от npm-пакета и без правок в capyup:
```typescript
function detectPiAutoCompact(pi: ExtensionAPI): boolean {
return pi.getCommands().some((c) => c.name === "auto-compact");
}
```
- Вызывать на `session_start` (`reason: "startup" | "resume" | "reload" | "switch"`).
- Кэшировать в `RuntimeFlags.autoCompactDetected`.
- При `false` → status `delivery: defer (standalone)` или `immediate` по `triggerTurn`.
**Не** полагаться на путь к файлу / `package.json` — только публичный API (`getCommands`).
Опция `skillReinject.autoCompactIntegration`:
| Значение | Поведение |
|----------|-----------|
| `"auto"` (default) | `defer` если `detectPiAutoCompact()`, иначе по `triggerTurn` |
| `"defer"` | idle: `before_agent_start`; mid-turn (`!isIdle`): steer на `session_compact` (§6.5.1); никогда `sendUserMessage` в `session_compact` |
| `"immediate"` | всегда `sendUserMessage` (для отладки; с pi-auto-compact — риск §16.2) |
| `"off"` | игнорировать detect; только `triggerTurn` |
Команда `/skill-reinject integration auto|defer|immediate|off` — session override для `autoCompactIntegration` (персистить в `skill-reinject:config` entry).
### 16.5. Что мы **не** ломаем в pi-auto-compact
| Инвариант | Как обеспечиваем |
|-----------|------------------|
| Follow-up только когда idle | Не вызываем `sendUserMessage` в `session_compact` / `onComplete` tick |
| Follow-up только для своего auto-compact | Не трогаем `ctx.compact()` / `onComplete` |
| Ручной `/compact` без follow-up | Наш `pendingReinject` на manual: либо ждём user prompt (`defer`), либо skip (default) |
| Emergency `context` truncation | `session_compact` всё равно приходит после `ctx.compact()` — тот же `defer` |
### 16.6. Что pi-auto-compact **не** ломает в нас
| Сценарий | Результат |
|----------|-----------|
| Auto-compact + follow-up (idle) | Следующий `before_agent_start` — наш inject; skills в контексте |
| Auto-compact **mid-turn** (`!isIdle`, нет follow-up) | Steer на `session_compact` (§6.5.1); skills до следующего LLM-вызова в том же turn |
| User печатает во время compaction | pi-auto-compact молчит; user prompt → наш inject на его turn (`before_agent_start`) |
| pi-auto-compact `keep-bookends` / `summarize-all` | Kept window определяем по `compactionEntry.firstKeptEntryId` в session branch (§6.4), не по их процентам |
| Два compaction подряд | Каждый `session_compact` пересчитывает `pendingReinject`; source fallback §8; дедуп по kept window включая `skill-reinject:inject` (§6.4) |
| Turn-boundary compact после steer | `before_agent_start` не дублирует inject, если steer уже доставил для `compactionEntry.id` этого compaction |
### 16.7. Coexistence с Pi default auto-compaction
Оба механизма могут сработать в одной сессии (Pi: после `agent_end`; pi-auto-compact: до turn). Рекомендация в README:
- при использовании pi-auto-compact рассмотреть `"compaction.enabled": false` в [settings.json](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/docs/settings.md) или оставить оба — skill-reinject отработает после **каждого** `session_compact`.
Extension **не** отключает чужой compaction; максимум — `ui.notify` hint при первом detect обоих.
### 16.8. Будущий опциональный протокол (v2, не блокирует v1)
Через [`pi.events`](https://github.com/earendil-works/pi/blob/main/packages/coding-agent/docs/extensions.md):
```typescript
// skill-reinject emits (optional, v2):
pi.events.emit("skill-reinject:pending", { skills: ["foo", "bar"] });
// pi-auto-compact could listen and append to follow-up — requires PR upstream
```
v1 **не требует** изменений в pi-auto-compact.
### 16.9. Константы для тестов (follow-up фразы pi-auto-compact)
Скопировать в `auto-compact.ts` как `PI_AUTO_COMPACT_FOLLOW_UP_PREFIXES` для документирования/тестов, **не** для матчинга в runtime v1:
- `"Auto-compact ran before this turn."`
- `"Auto-compact ran mid-turn."`
- `"Emergency auto-compact ran."`
- `"Auto-compact ran on session resume."`
Runtime v1 матчит follow-up **не нужен** — достаточно `pendingReinject` + любой следующий `before_agent_start`.