Skip to content

Releases: borro/ragcli

v0.4.1

11 Mar 07:07

Choose a tag to compare

Патч-релиз с явным и предсказуемым управлением proxy для всего LLM-трафика в ragcli, включая и chat-запросы, и embeddings.

Что изменилось

В ragcli появилась отдельная настройка proxy для всех HTTP-запросов к LLM backend’у.

Добавлено

  • Новый глобальный флаг --proxy-url
  • Новый глобальный флаг --no-proxy
  • Новая переменная окружения LLM_PROXY_URL
  • Новая переменная окружения LLM_NO_PROXY

Поведение

  • --proxy-url / LLM_PROXY_URL принудительно отправляют все LLM-запросы через указанный proxy URL
  • --no-proxy / LLM_NO_PROXY=true полностью отключают любой proxy для ragcli, включая proxy из окружения
  • Если новые настройки не заданы, ragcli сохраняет стандартное поведение Go через HTTP_PROXY, HTTPS_PROXY и NO_PROXY
  • Одинаковая proxy-логика теперь применяется и к chat completion, и к embeddings
  • Явный proxy override имеет приоритет над системными proxy-настройками окружения

UX и документация

  • Обновлены help-тексты CLI и локализованные описания новых флагов
  • README дополнен примерами использования для Linux и Windows
  • В debug-логах теперь показывается режим proxy без утечки credentials

Валидация и надёжность

  • Некорректный proxy URL теперь приводит к понятной ошибке уже на старте
  • Добавлены тесты на CLI binding, proxy override, no-proxy, fixed proxy и безопасное логирование proxy-адреса

Зачем обновляться

v0.4.1 полезен для корпоративных сетей, Windows-окружений и любых сценариев, где важно не зависеть от неявного поведения HTTP_PROXY и иметь полный контроль над маршрутизацией запросов к LLM.

v0.4.0

10 Mar 21:54

Choose a tag to compare

Крупный релиз с локализацией CLI, переработкой retrieval-слоя для rag и hybrid, и улучшением стабильности tools.

Главное

  • Добавлена локализация интерфейса CLI.
  • Язык теперь определяется автоматически по системной locale и окружению.
  • Важно: локализация зависит от переменных окружения и системной locale, но её можно явно переопределить через --lang или RAGCLI_LANG.
  • Поддерживаются en и ru.
  • Приоритет такой: --langRAGCLI_LANG → автоопределение системной locale → fallback в en.

Что изменилось

  • rag и hybrid переведены на общий retrieval-слой с выделенными shared helpers.
  • Старые retrieval-индексы теперь инвалидируются корректно после изменений формата кеша.
  • Упрощено хранение индекса и добавлен streaming source file вместо лишнего удержания данных в памяти.
  • В rag исправлена публикация temp index files на Windows.
  • В tools orchestration limit увеличен до 20 шагов, а при достижении лимита добавлена принудительная финализация ответа.
  • Упрощён flow auto context length resolution и fallback для map и hybrid.
  • Тесты изолированы от реальных backend’ов и загруженных моделей, чтобы снизить флаки и зависимость от внешнего окружения.

Зачем обновляться

v0.4.0 делает CLI заметно удобнее для реального использования в разных локалях и окружениях, а rag/hybrid становятся стабильнее за счёт более чистого retrieval pipeline и корректной работы с кешами. Для пользователей tools это также обновление на более предсказуемое завершение длинных orchestration-сценариев.

v0.3.2

09 Mar 22:26

Choose a tag to compare

Патч-релиз про более надёжный выбор лимита контекста в map и hybrid, плюс правка CI/coverage.

Что изменилось

  • Добавлено автоопределение context length модели для map (через LM Studio /api/v1/models, с fallback-проверкой по ошибке переполнения контекста).
  • --length теперь работает как строгий override: если флаг/переменная LENGTH заданы, автоопределение не используется.
  • Если автоопределение недоступно, map использует безопасный fallback 10000.
  • hybrid в режиме fallback на map теперь использует ту же логику auto-or-default, чтобы поведение было консистентным.
  • Расширены тесты для резолва context length, caching, warmup-сценария и strict override.
  • Исправлен workflow покрытия в CI (codecov upload и порядок шагов).

Зачем обновляться

v0.3.2 снижает риск ручного подбора --length и делает обработку больших файлов стабильнее на разных OpenAI-compatible backend’ах. При этом для предсказуемых сценариев остаётся полный контроль через явный --length.

v0.3.1

09 Mar 17:53

Choose a tag to compare

Небольшой patch-релиз с улучшением диагностики embedding-ошибок.

Что изменилось

  • ragcli теперь сохраняет и возвращает исходную причину ошибки после исчерпания retry при запросах к embedding endpoint.
  • Вместо общего сообщения об ошибке пользователь получает более полезный контекст, например конкретный 503 или другую ошибку backend'а.

v0.3.0

09 Mar 17:41

Choose a tag to compare

Крупный релиз с новым режимом hybrid для анализа больших файлов и переработкой UX командной строки.

Важное изменение

Если вы раньше использовали --verbose для debug-логов, в v0.3.0 нужно перейти на --debug.

Главное

  • Добавлен новый режим hybrid для grounded large-file analysis.
  • hybrid комбинирует lexical retrieval, semantic retrieval по embeddings, локальное дочитывание контекста и map-style извлечение фактов по найденным регионам.
  • Для rag и hybrid теперь явно задокументированы требования к embedding endpoint (/embeddings).

Улучшения CLI

  • Добавлен пользовательский progress reporting через --verbose во всех CLI-режимах.
  • Debug-логи отделены от пользовательских ошибок.
  • Флаг --verbose в прежнем смысле переименован в --debug.
  • Без --debug ошибки печатаются в stderr кратко и чище, без лишнего debug-шума.

Почему это релиз 0.3.0

Это не просто patch-обновление:

  • появился новый режим работы hybrid;
  • изменилось поведение и семантика CLI-флагов;
  • обновился подход к диагностике и прогрессу выполнения.

v0.2.4

09 Mar 09:11

Choose a tag to compare

Релиз улучшает map-режим и делает вывод ragcli заметно удобнее в терминале.

Что изменилось

  • map переведён с byte/line-based chunking на приблизительные лимиты по токенам.
  • Улучшено поведение map-reduce pipeline:
    • аккуратнее нормализуются и дедуплицируются факты;
    • reduce-фаза лучше сохраняет разные полезные наблюдения и меньше схлопывает смысл;
    • добавлены оценки token budget и более подробная диагностика pipeline.
  • Финальный Markdown-ответ теперь красиво рендерится в интерактивном терминале через glamour.
  • Добавлен --raw для отключения terminal markdown rendering и вывода исходного текста как есть.
  • При выводе в pipe или redirect по-прежнему печатается сырой Markdown без ANSI-оформления.
  • Добавлены тесты для нового chunking, map-поведения и output formatting.

Зачем обновляться

v0.2.4 полезен, если вы используете map на больших текстах и хотите более предсказуемую работу относительно контекстных лимитов модели. Дополнительно CLI стал приятнее для интерактивного использования: ответы в терминале читаются лучше, а для скриптов сохраняется сырой текстовый вывод.

v0.2.3

08 Mar 19:56

Choose a tag to compare

Релиз с фокусом на переработку CLI и улучшение DX при работе с ragcli из терминала.

Что изменилось

  • CLI переведён на urfave/cli v3.
  • Улучшены help-экраны, структура команд и вывод version.
  • Исправлена обработка глобальных флагов и аргументов prompt, включая случаи, когда prompt содержит токены, похожие на флаги.
  • Усилено тестовое покрытие CLI-сценариев: help, version, binding аргументов, нормализация значений и совместимость с prompt parsing.
  • README переработан и приведён в соответствие с актуальным поведением CLI.

Зачем обновляться

v0.2.3 делает интерфейс командной строки более предсказуемым и удобным в повседневном использовании, особенно если ragcli запускается из shell-скриптов, CI или с нетривиальными prompt-аргументами.

v0.2.2

08 Mar 17:55

Choose a tag to compare

Исправили Windows-сборку, чтобы снизить вероятность ложных срабатываний антивируса. Для windows/amd64 убраны -s -w, Linux и macOS без изменений.

v0.2.1

08 Mar 17:44

Choose a tag to compare

Патч-релиз с фокусом на стабильность tools-режима, улучшение диагностики и усиление тестового покрытия.

Что изменилось

  • Улучшено поведение tools-режима при зацикливании или stalled tool loops: теперь CLI корректно завершает работу с финализацией ответа вместо жёсткого сбоя.
  • Улучшены prompt и диагностика в tools, особенно для случаев, когда модели не хватает контекста о подключённом файле.
  • Добавлены дополнительные тесты для tools, rag, input и LLM client.
  • README синхронизирован с текущим поведением и структурой проекта.

Зачем обновляться

v0.2.1 делает agentic file exploration надёжнее в реальных сценариях, где модель может:

  • терять контекст о доступном файле;
  • зацикливаться на вызовах инструментов;
  • нестабильно завершать multi-step tool calling.

Это небольшое, но полезное обновление для тех, кто активно использует ragcli tools в CLI-автоматизации и локальных OpenAI-compatible backends.

v0.2.0

08 Mar 13:00

Choose a tag to compare

ragcli v0.2.0

В v0.2.0 проект получил крупное внутреннее переустройство: CLI стал чище, режимы map, rag и tools оформлены как отдельные subcommands, а кодовая база разбита на более понятные модули. Это релиз про стабилизацию архитектуры, упрощение сопровождения и подготовку к дальнейшему развитию.

ВАЖНО

Аргумент -mode удалён.

Раньше режим работы выбирался через флаг, например:

./ragcli -mode map "..."

Теперь режимы вынесены в отдельные subcommands:

./ragcli map "..."
./ragcli rag "..."
./ragcli tools "..."

Если ragcli используется в скриптах, CI или automation-задачах, вызовы нужно обновить под новый формат CLI.

Что изменилось

  • переработана структура CLI вокруг map, rag и tools
  • вынесен composition root приложения и упрощён dispatch команд
  • упрощено логирование и добавлены lifecycle-логи приложения
  • LLM-клиент переведён на go-openai types и централизованные requester-интерфейсы
  • обновлён README и синхронизирован с текущей архитектурой проекта
  • улучшена организация тестов и внутренних пакетов