Analyzer Machine — Правила работы для AI агента

Примечание: для локальной агентной работы root-level source of truth теперь находится в AGENTS.md. Этот документ сохраняется как расширенный справочник по режимам и принципам, но при конфликте приоритет у AGENTS.md.

Этот документ содержит все правила работы агента Analyzer Machine. Используйте его как контекст при работе с проектом в OpenAI Codex или других AI-инструментах.

Основные правила (Core Rules)

1. Не выдумывать данные

Не выдумывать данные/цифры/ответы API
Если данных нет — указывать, какая команда/файл нужны
Все цифры должны быть из evidence (workbook, кэш, вывод CLI)

2. Безопасность секретов

Никаких секретов в выводе: токены/ключи/credentials не печатать
Не записывать секреты в репозиторий
Секреты только в переменных окружения (.env файлы, не в git)

3. Расчёты только кодом

Все расчёты (дельты, вклады, топы) должны считаться кодом/скриптами
Не считать "в голове" и не просить LLM считать
LLM используется только для интерпретации результатов кода

4. Аккуратность правок

Любые правки файлов — аккуратно
Не удалять существующее без причины

Мультиклиентность

Каждый сайт = отдельная папка clients/<client_name>/config.yaml
Секреты: только локально (.env или clients/<client_name>/.env.local)
Эти файлы всегда в .gitignore и .cursorindexingignore
Отчёты/артефакты складывать в reports/ и/или reports/<client_name>/

Режимы работы (MODE)

По умолчанию: MODE: OPERATOR

Если пользователь не указывает режим явно, используется MODE: OPERATOR.

MODE: OPERATOR (выполнение анализа, без изменения кода)

Цель: Выполнить расследование используя существующие capabilities, создать evidence-based отчёт.

Жёсткие правила:

НЕ изменять код или документы в режиме OPERATOR
Все цифры/выводы ОБЯЗАТЕЛЬНО должны быть из evidence файлов (raw/norm/workbook), созданных CLI
LLM не должен "считать" метрики; только интерпретировать результаты кода
Никогда не печатать и не логировать секреты (токены, client secrets)

Процесс:

Распарсить запрос пользователя, вывести гипотезы
Сопоставить гипотезы с доступными capabilities из docs/hypotheses/hypothesis_to_data_map.md или capabilities_registry.yaml
Запустить минимальный набор CLI команд для сбора evidence (raw/norm/workbook)
Если команда упала: диагностировать и повторить только операционными шагами (без изменения кода)
Если нужные данные/срез не поддерживаются: вывести "CAPABILITY MISSING" и создать DEV-TICKET:
- какие данные нужны (endpoint/dimensions/metrics/filters)
- ожидаемые CLI команды
- ожидаемые cache/workbook артефакты
- DoD (как проверить)
- затем ОСТАНОВИТЬСЯ (не импровизировать выводы)
Вывод: выполненные команды + пути к evidence + краткий отчёт со ссылками на evidence

MODE: BUILDER (реализация или исправление capabilities)

Цель: Реализовать/исправить capabilities, чтобы режим OPERATOR мог работать.

Жёсткие правила:

Изменения кода разрешены ТОЛЬКО в режиме BUILDER
Каждое изменение должно заканчиваться smoke test (команды для запуска + ожидаемые артефакты)
Обновлять документацию при добавлении/изменении capabilities (если эти документы есть в репозитории):
- docs/spec.md
- docs/api_catalog.md
- docs/hypotheses/hypothesis_to_data_map.md
Никогда не печатать и не логировать секреты

Процесс:

Указать точный scope изменений (какие файлы изменить, почему)
Реализовать минимальные изменения для удовлетворения DEV-TICKET / исправления бага
Запустить smoke tests локально (или предоставить точные команды) и подтвердить артефакты (raw/norm/workbook)
Вернуть краткий changelog (изменённые файлы) + команды для проверки
Затем указать перезапустить в MODE: OPERATOR для реального расследования

Agent Loop (стандарт работы агента)

Обязательная процедура при запросе "проанализируй/разбери/сделай выводы"

Шаг 1: PLAN (сначала)

Переформулировать задачу в 2–4 строки: client, периоды, KPI (трафик/конверсии/ecommerce)
Выбрать существующие capabilities/команды CLI, которые нужны, и перечислить точные команды
Указать, какие артефакты будут созданы автоматически:
- data_cache/<client> — у команды есть флаг --refresh, использовать его по умолчанию
- Если --refresh не поддерживается, продолжить без него (без остановки)
Прочитать созданный workbook(и) из data_cache/<client>/
Во время Run НЕ менять код и документы

Шаг 2: AGENT (выполнение)

Выполнять команды через встроенный терминал
Собирать артефакты в data_cache/ и reports/
Любые цифры/выводы допускаются только если есть "evidence": путь к workbook/кэшу/выводу CLI
Запрещено читать "в голове" и не просить LLM считать
Секреты никогда не печатать и не записывать в репозиторий

Шаг 3: REPORT (интерпретация)

Отчёт должен содержать:

Executive summary — главные выводы (2–3 предложения)
Facts — факты (цифры) с путями к evidence
Drivers — топ вкладов (что больше всего повлияло)
Hypotheses — 5–8 гипотез + какие данные нужны для проверки
Next actions — приоритетные действия

Evidence pack:

Создать reports/<client>/<investigation_name>_evidence.txt со списком путей к workbook и кэшам

Natural Language (естественный язык)

Если пользователь просит анализ (падение/рост/аномалия/разобраться/почему), считать это запросом на Run.

Пользователь НЕ обязан упоминать: runbook, AGENT_LOOP, workbook, data_cache, evidence, команды CLI.

Агент сам подбирает команды и сам управляет файлами/путями/папками по правилам выше.

Структура данных

Workbook файлы

Workbook — это агрегированные результаты анализа, сохранённые в JSON.

Структура:

{
  "meta": {
    "client": "...",
    "counter_id": 12345678,
    "p1_start": "2024-01-01",
    "p1_end": "2024-01-31",
    "p2_start": "2025-01-01",
    "p2_end": "2025-01-31",
    "generated_at": "2025-12-26T12:00:00.000000Z",
    "limit": 50,
    "refresh_used": false
  },
  "totals": {
    "total_visits_p1": 50000.0,
    "total_visits_p2": 40000.0,
    "total_delta_abs": -10000.0,
    "total_delta_pct": -20.0
  },
  "rows": [
    {
      "source": "Search engine traffic",
      "visits_p1": 40000.0,
      "visits_p2": 30000.0,
      "delta_abs": -10000.0,
      "delta_pct": -25.0,
      "contribution_pct": 100.0
    }
  ]
}

Примеры: см. docs/samples/workbook_*.json

Normalized данные

Normalized данные — это нормализованные ответы API, сохранённые в JSON.

Формат: массив объектов

Пример: см. docs/samples/normalized_data_example.json

Доступные команды CLI

Анализ источников трафика

python -m app.cli analyze-sources <client> <p1_start> <p1_end> <p2_start> <p2_end> [--limit N] [--refresh]

Анализ landing pages

python -m app.cli analyze-pages <client> <p1_start> <p1_end> <p2_start> <p2_end> [--limit N] [--refresh]

Анализ landing pages по источнику

python -m app.cli analyze-pages-by-source <client> <p1_start> <p1_end> <p2_start> <p2_end> --source "<source>" [--limit N] [--refresh]

Анализ конверсий по источникам

python -m app.cli analyze-goals-by-source <client> <p1_start> <p1_end> <p2_start> <p2_end> --goal-id <goal_id> [--limit N] [--refresh]

Анализ конверсий по страницам

python -m app.cli analyze-goals-by-page <client> <p1_start> <p1_end> <p2_start> <p2_end> --goal-id <goal_id> [--limit N] [--refresh]

Анализ Google Search Console (запросы)

python -m app.cli analyze-gsc-queries <client> <p1_start> <p1_end> <p2_start> <p2_end> [--limit N] [--refresh]

Анализ Google Search Console (страницы)

python -m app.cli analyze-gsc-pages <client> <p1_start> <p1_end> <p2_start> <p2_end> [--limit N] [--refresh]

Список целей Яндекс.Метрики

python -m app.cli metrika-goals-list <client> [--refresh]

Capabilities Registry

Реестр всех capabilities агента находится в capabilities_registry.yaml.

Каждая capability содержит:

id — уникальный идентификатор
name — человеко-читаемое имя
status — implemented / planned_tier1 / planned_tier2 / planned_tier3
command_template — шаблон CLI команды
artifacts — список артефактов (workbook, cache)
checks_hypotheses — список ID гипотез, которые можно проверить
priority — числовой приоритет

Гипотезы и данные

Маппинг гипотез к данным находится в:

docs/hypotheses/hypothesis_to_data_map.md
docs/hypotheses/seo_hypothesis_library.md

Документация

Полная документация проекта:

docs/AGENT_LOOP.md — стандарт работы агента
docs/spec.md — спецификация проекта
docs/api_catalog.md — каталог API запросов
docs/analysis_rules.md — правила анализа
docs/capability_matrix.md — матрица capabilities
docs/data_sources/ — каталоги источников данных

Ориентиры

Стандарт процесса: docs/AGENT_LOOP.md
Принципы работы: docs/AGENT_LOOP.md
Пример работы агента: docs/agent_example_run.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Analyzer Machine — Правила работы для AI агента

Основные правила (Core Rules)

1. Не выдумывать данные

2. Безопасность секретов

3. Расчёты только кодом

4. Аккуратность правок

Мультиклиентность

Режимы работы (MODE)

По умолчанию: MODE: OPERATOR

MODE: OPERATOR (выполнение анализа, без изменения кода)

MODE: BUILDER (реализация или исправление capabilities)

Agent Loop (стандарт работы агента)

Обязательная процедура при запросе "проанализируй/разбери/сделай выводы"

Шаг 1: PLAN (сначала)

Шаг 2: AGENT (выполнение)

Шаг 3: REPORT (интерпретация)

Natural Language (естественный язык)

Структура данных

Workbook файлы

Normalized данные

Доступные команды CLI

Анализ источников трафика

Анализ landing pages

Анализ landing pages по источнику

Анализ конверсий по источникам

Анализ конверсий по страницам

Анализ Google Search Console (запросы)

Анализ Google Search Console (страницы)

Список целей Яндекс.Метрики

Capabilities Registry

Гипотезы и данные

Документация

Ориентиры

FilesExpand file tree

CODEX_RULES.md

Latest commit

History

CODEX_RULES.md

File metadata and controls

Analyzer Machine — Правила работы для AI агента

Основные правила (Core Rules)

1. Не выдумывать данные

2. Безопасность секретов

3. Расчёты только кодом

4. Аккуратность правок

Мультиклиентность

Режимы работы (MODE)

По умолчанию: MODE: OPERATOR

MODE: OPERATOR (выполнение анализа, без изменения кода)

MODE: BUILDER (реализация или исправление capabilities)

Agent Loop (стандарт работы агента)

Обязательная процедура при запросе "проанализируй/разбери/сделай выводы"

Шаг 1: PLAN (сначала)

Шаг 2: AGENT (выполнение)

Шаг 3: REPORT (интерпретация)

Natural Language (естественный язык)

Структура данных

Workbook файлы

Normalized данные

Доступные команды CLI

Анализ источников трафика

Анализ landing pages

Анализ landing pages по источнику

Анализ конверсий по источникам

Анализ конверсий по страницам

Анализ Google Search Console (запросы)

Анализ Google Search Console (страницы)

Список целей Яндекс.Метрики

Capabilities Registry

Гипотезы и данные

Документация

Ориентиры