qdrant-stand

Учебный стенд Qdrant с предзапечёнными read-only коллекциями для практик по RAG.

Векторизация корпусов происходит на этапе docker build. Финальный образ — обычный qdrant/qdrant с уже залитыми коллекциями внутри. После запуска контейнер слушает порт 6333 и сразу раздаёт коллекции. Студентам выдаётся read_only_api_key, поэтому запись им заблокирована.

Коллекции

Каждая подпапка в corpus/ — отдельный корпус со своим manifest.yml. Как корпуса группируются в коллекции Qdrant — задаётся в config.yml, в секции stand.collections: ключ — имя коллекции, значение — список имён папок-корпусов, документы которых сливаются в эту коллекцию.

Сейчас в стенде:

Имя коллекции	Корпуса внутри	Содержание
`ural_corpus`	`library`	Уральская краеведческая библиотека (XIX — нач. XX вв.)
`it_corpus`	`python_tutorial_ru`, `git_novice_ru`, `shell_novice_ru`, `sql_novice_ru`	Вводный IT-курс на русском: Python, Git, Shell, SQL

Чтобы добавить новый корпус — создайте corpus/<имя_корпуса>/ с manifest.yml и файлами, затем впишите его в stand.collections в config.yml (в существующую коллекцию или в новую) и пересоберите образ.

Параметры всех коллекций

Параметр	Значение
Размерность векторов	`1536`
Distance	`Cosine`
Модель эмбеддингов	`text-embedding-3-small`
`base_url` эмбеддера	`https://llm.inzhenerka-cloud.com/`

Студенты должны эмбедить запросы той же моделью и через тот же base_url, иначе векторы окажутся в другом пространстве и поиск даст мусор.

Сборка

Для сборки нужен OPENAI_API_KEY (используется один раз при индексации, в финальный образ не попадает):

$env:OPENAI_API_KEY = "sk-..."
docker compose build
docker compose up -d

Подключение со стороны студента

from qdrant_client import QdrantClient
from langchain_openai import OpenAIEmbeddings

client = QdrantClient(url="http://<qdrant_stand-host>:6333", api_key="student")

embedder = OpenAIEmbeddings(
    model="text-embedding-3-small",
    base_url="https://llm.inzhenerka-cloud.com/",
    dimensions=1536,
)

query_vec = embedder.embed_query("что такое git rebase и чем отличается от merge")
hits = client.search(collection_name="it_corpus", query_vector=query_vec, limit=5)
for h in hits:
    print(h.score, h.payload["title"], h.payload["chunk_id"])

Доступы

Ключ	Кому	Права
`student` (env `QDRANT__SERVICE__READ_ONLY_API_KEY`)	Студенты	`search`, `scroll`, `retrieve`, `GET /collections/*`
`admin-rotate-me` (env `QDRANT__SERVICE__API_KEY`)	Админ	Все операции

Оба ключа задаются как runtime env-переменные контейнера — это переопределяет дефолты из ENV в Dockerfile без пересборки.

В проде мастер-ключ нужно заменить на длинный случайный (openssl rand -hex 32) и задать через переменные окружения сервиса:

QDRANT__SERVICE__API_KEY=<длинный случайный>
QDRANT__SERVICE__READ_ONLY_API_KEY=student

Локально (docker-compose) — через переменные шелла, docker-compose.yml их подхватывает:

$env:QDRANT_API_KEY = "$(openssl rand -hex 32)"
$env:QDRANT_READ_ONLY_API_KEY = "student"
docker compose up -d

Без переопределения локально работает дефолт admin-rotate-me — он зашит в Dockerfile только чтобы стенд запускался при docker run без env, не используйте его в проде.

CI/CD

В .github/workflows/deploy-image.yml лежит workflow, который на push в main (или вручную через workflow_dispatch):

OPENAI_API_KEY передаётся в build как secret — значение маскируется в логах workflow и не сохраняется в финальном слое образа.

Требуемые GitHub Secrets:

Secret	Назначение
`OPENAI_API_KEY`	Прокидывается как `--build-arg` в builder stage
`COOLIFY_WEBHOOK`	URL webhook'а деплоя
`COOLIFY_TOKEN`	Bearer-токен для webhook'а

Локальная проверка

# Коллекции раздаются студентам
curl -H "api-key: student" http://localhost:6333/collections
curl -H "api-key: student" http://localhost:6333/collections/it_corpus

# Запись заблокирована
curl -X DELETE -H "api-key: student" http://localhost:6333/collections/it_corpus
# -> 403 Forbidden

# Без ключа
curl http://localhost:6333/collections
# -> 401 Unauthorized

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
.github/workflows		.github/workflows
corpus		corpus
scripts		scripts
src/qdrant_stand		src/qdrant_stand
.dockerignore		.dockerignore
.env.example		.env.example
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
NOTICE.md		NOTICE.md
README.md		README.md
config.yml		config.yml
docker-compose.yml		docker-compose.yml
ingest_all.py		ingest_all.py
pyproject.toml		pyproject.toml
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

qdrant-stand

Коллекции

Параметры всех коллекций

Сборка

Подключение со стороны студента

Доступы

CI/CD

Локальная проверка

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

qdrant-stand

Коллекции

Параметры всех коллекций

Сборка

Подключение со стороны студента

Доступы

CI/CD

Локальная проверка

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages