release: bump version to 1.6.0 by ketor · Pull Request #48 · dingodb/dfkv

ketor · 2026-06-19T18:29:21Z

Cuts v1.6.0 — the first release with the direct vLLM connector and the scatter-gather datapath, on top of v1.5.2.

Since v1.5.2

vLLM DfkvStoreConnector (feat(vllm): DfkvStoreConnector — direct vLLM KV connector (GPUDirect RDMA, bypass LMCache) [WIP] #46): KVConnectorBase_V1, stores/loads KV directly over GPUDirect RDMA, occupies the MooncakeStoreConnector slot, bypasses LMCache. Validated on H100 + IB with DeepSeek-V4 (multi kv_cache_group / MLA + SWA), cross-restart + cross-DP prefix hit.
Scatter-gather datapath (feat(vllm): DfkvStoreConnector — direct vLLM KV connector (GPUDirect RDMA, bypass LMCache) [WIP] #46): batch_put_sg/batch_get_auto_sg, QP max_sge 2→30 — one multi-SGE RDMA per chunk (~20× fewer keys / disk reads). Additive; legacy 2-SGE path unchanged.
io_uring async GET (feat(vllm): DfkvStoreConnector — direct vLLM KV connector (GPUDirect RDMA, bypass LMCache) [WIP] #46): opt-in DFKV_SERVER_URING (default off, -DDFKV_WITH_URING).
7 review fixes + 2 regression tests (feat(vllm): DfkvStoreConnector — direct vLLM KV connector (GPUDirect RDMA, bypass LMCache) [WIP] #46): per-item SG failure, recv-thread try/finally hardening, empty-key skip, io_uring EINTR/short-read robustness, true out_lens.
Docs (docs(vllm): DfkvStoreConnector — README + deploy guide + config reference #47): docs/vllm/DEPLOY.md (deploy + config reference + recommended settings), README multi-engine tagline, docs/DEPLOY.md §9 HiCache engine/feature boundary + corrected depth note.

Compatibility

No wire change — kProtoVersion stays 1, so v1.6.0 is line-compatible with v1.5.x (mixed deployments not rejected). The HiCache/SGLang and LMCache paths are unchanged.

Bumps VERSION + CMakeLists.txt only.

New direct vLLM integration + scatter-gather datapath since v1.5.2: - vLLM DfkvStoreConnector (KVConnectorBase_V1, GPUDirect RDMA, bypass LMCache) — dingodb#46 - Scatter-gather batch API (batch_put_sg/batch_get_auto_sg, QP max_sge 2->30): one multi-SGE RDMA per chunk, ~20x fewer keys/disk-reads — dingodb#46 - io_uring async GET serve loop (opt-in DFKV_SERVER_URING, default off) — dingodb#46 - 7 fresh-eyes review fixes (per-item SG failure, recv-thread hardening, empty-key skip, io_uring EINTR/short-read, true out_lens) + 2 regression tests — dingodb#46 - Docs: vLLM deploy guide + config reference, README multi-engine, HiCache boundary — dingodb#47 No wire change (kProtoVersion still 1); v1.5.x compatible. CI green incl. TSan + RDMA datapath.

ketor merged commit b36a3b4 into dingodb:main Jun 19, 2026
6 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

release: bump version to 1.6.0#48

release: bump version to 1.6.0#48
ketor merged 1 commit into
dingodb:mainfrom
ketor:release/v1.6.0

ketor commented Jun 19, 2026

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

ketor commented Jun 19, 2026

Since v1.5.2

Compatibility

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant