Інші мови: English | Russian
Побудувати local-first MCP-сервер, який працює як практична довготривала пам'ять для AI coding-агентів.
Сервер має зменшувати повторні витрати токенів за рахунок того, що:
виносить "холодний" контекст з активного prompt
спочатку повертає компактний контекст з посиланням на джерело
відкриває повніші деталі тільки через явний hydration-запит
Що проєкт робить
Чого проєкт не робить
тримає знання проєкту доступними для пошуку на боці MCP
не керує KV-cache хостованих моделей
локально зберігає нотатки та проіндексований Markdown
не замінює внутрішню пам'ять моделі
повертає компактні картки retrieval з provenance
не обіцяє однакову економію для будь-якого репозиторію
підтримує project і cross-project recall
не намагається вирішити всі задачі лише стисканням
Інженери, які працюють у реальних репозиторіях через Claude Code, Codex, Cursor, OpenCode та подібні MCP-клієнти.
Команди, яким потрібне локальне розгортання з низьким операційним оверхедом.
Agent-heavy workflow-и, які багаторазово повертаються до docs, notes, ADR та Markdown knowledge base.
Принцип
Значення
Local-first
Базовий memory loop має працювати на машині розробника
Markdown-first
Human-readable Markdown лишається джерелом істини
Compact-first retrieval
Спочатку повертається найменша корисна відповідь
Hydration on demand
Більші payload-и потрібно запитувати явно
Traceability always
Кожен результат має вказувати на джерело
Easy setup
Інсталяція і підключення мають займати хвилини, а не години
Напрям
Вибір
Мова
Python 3.11+
MCP-фреймворк
офіційний MCP Python SDK
Сховище
локальна файлова система плюс embedded LanceDB
Embeddings
Sentence Transformers з легкою локальною моделлю
Конфіг
environment variables плюс typed settings
Пакування
uv як основний шлях, pip як fallback
Індексувати один або кілька Markdown-root.
Ділити контент за heading-структурою з детермінованими fallback-правилами.
Зберігати source metadata: шлях, heading path, timestamps, tags, checksum і block identity.
Підтримувати incremental re-index тільки для зміненого контенту.
Приймати довільні текстові запити через semantic_search(...).
Повертати компактні картки результатів замість сирих дампів повних файлів.
Тримати видимими provenance, релевантність, confidence і key points.
Явно попереджати про low-confidence або ambiguous retrieval.
Відкривати повніший excerpt тільки тоді, коли компактного retrieval вже недостатньо.
Підтримувати обмежене локальне оточення навколо обраного hit.
Зберігати передбачуваний token budget завдяки явним hydration-викликам.
Зберігати рішення, уроки, handoff-и та reusable patterns.
Писати нотатки з типом, тегами, timestamps і source refs.
Дозволяти явну промоцію з project у global.
Дозволяти deprecate-ити застарілі нотатки без втрати історії.
Показувати health і runtime metadata.
Показувати лічильники сховища й freshness індексу.
Давати швидкий self-test контракт.
Тримати smoke-test інструкції для підтримуваних клієнтів.
Запускати структурні lint-перевірки Markdown-корпусу.
Виявляти биті внутрішні Markdown-посилання.
Виявляти orphan candidates без вхідних і вихідних internal links.
Виявляти дублікати нормалізованих заголовків, які підвищують неоднозначність retrieval.
Інструмент
Для чого
health()
базова перевірка стану
server_info()
runtime, project, storage та install contract
list_scopes()
доступні scopes і режими за замовчуванням
self_test()
швидка перевірка контракту
remember_note(...)
зберегти типізовану нотатку
promote_note(note_id)
скопіювати project-note в reusable global memory
deprecate_note(...)
вивести застаріле знання з активного обігу
semantic_search(...)
дістати компактний контекст
hydrate(...)
відкрити обмежений повніший контекст
index_paths(...)
індексувати або оновити Markdown-root
lint_knowledge_base(...)
запускати структурну перевірку цілісності посилань і узгодженості wiki
Поле
Значення
block_id
стабільний ідентифікатор блока
file_path
шлях до вихідного Markdown
heading_path
ієрархія heading-ів
content_raw
повний вихідний текст
content_compressed
компактне представлення для retrieval
embedding
вектор для пошуку
checksum
виявлення змін
created_at / updated_at
часові metadata
tags
необов'язкові ярлики
source_kind
markdown
Поле
Значення
note_id
ідентифікатор нотатки
title
назва
content
повний текст
note_kind
decision, lesson, handoff або pattern
summary
коротке представлення для retrieval
tags
необов'язкові ярлики
session_id
прив'язка до сесії, коли це релевантно
project_id
власник-проєкт
created_at
час створення
source_refs
provenance-посилання
Цільові Показники Продуктивності
локальний старт має бути комфортним на ноутбуці розробника
перша індексація має вкладатися в нормальний інтерактивний setup
latency пошуку має залишатися інтерактивною для малих і середніх corpus
recall-heavy workflow-и мають зазвичай економити значну частину контексту відносно naive full-file opening
Індексувати тільки явно вибрані шляхи.
За замовчуванням обмежувати розмір output.
Зберігати межі джерела й provenance.
Сприймати notes і retrieval як tool data, а не як абсолютний авторитет.
Уникати прихованих зовнішніх мережевих залежностей для core local flow.
Крок
Очікуваний контракт
Рекомендоване встановлення
uv tool install git+https://github.com/Lexus2016/turbo_quant_memory@v0.2.4
Fallback-встановлення
python -m pip install git+https://github.com/Lexus2016/turbo_quant_memory@v0.2.4
Команда запуску
turbo-memory-mcp serve
Приклад для Claude Code
claude mcp add --scope project tqmemory -- turbo-memory-mcp serve
Еквівалентні приклади
у репозиторії є готові конфіги для Codex, Cursor, OpenCode та Antigravity
Рівень
Покриття
Unit-тести
chunking, IDs, payload contracts, provenance mapping
Integration-тести
flow index -> search -> hydrate, note write-back і knowledge-base lint
Smoke-тести
чиста інсталяція, підключення клієнта, індексація, retrieval, hydration
Benchmarking
repository-level звіт про економію контексту з реальними вимірюваннями
Новий користувач може встановити пакет і підключити його до підтримуваного клієнта за кілька хвилин.
Сервер може індексувати Markdown-файли і шукати їх семантично.
Дефолтний retrieval повертає компактний контекст із джерелом, а не сирі дампи.
Агенти можуть явно hydrate-ити повніший контекст за потреби.
Нотатки можна зберігати, промотувати, deprecate-ити і знаходити пізніше.
Оператор може швидко перевірити health, freshness і стан storage.
Оператор може lint-ити Markdown knowledge base на биті посилання, orphan candidates і duplicate titles.
замінити внутрішні механізми пам'яті самої моделі
заявляти прямий контроль над токен-квантуванням чи hosted KV-cache
будувати enterprise multi-tenant governance у поточному scope
вирішувати всі задачі reasoning лише через стискання
Turbo Quant Memory - це практичний MCP memory layer:
local-first
компактний за замовчуванням
простежуваний у кожному retrieval
явний у момент відкриття повнішого контексту
простий в інсталяції та експлуатації у звичайному workflow розробника