+ "File \u001b[0;32m~/miniconda3/envs/issue/lib/python3.10/site-packages/bit_decode-1.0.0.post1-py3.10-linux-x86_64.egg/bit_decode/bit_decode_interface.py:8\u001b[0m\n\u001b[1;32m 5\u001b[0m \u001b[38;5;28;01mimport\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[38;5;21;01mtorch\u001b[39;00m\n\u001b[1;32m 6\u001b[0m \u001b[38;5;28;01mimport\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[38;5;21;01mtorch\u001b[39;00m\u001b[38;5;21;01m.\u001b[39;00m\u001b[38;5;21;01mnn\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[38;5;28;01mas\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[38;5;21;01mnn\u001b[39;00m\n\u001b[0;32m----> 8\u001b[0m \u001b[38;5;28;01mimport\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[38;5;21;01mbit_decode_cuda\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[38;5;28;01mas\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[38;5;21;01mbit_decode_cuda\u001b[39;00m\n\u001b[1;32m 10\u001b[0m \u001b[38;5;28;01mdef\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[38;5;21mkvcache_pack_int\u001b[39m(k_cache: torch\u001b[38;5;241m.\u001b[39mTensor, k_pack: torch\u001b[38;5;241m.\u001b[39mTensor, k_params: torch\u001b[38;5;241m.\u001b[39mTensor,\n\u001b[1;32m 11\u001b[0m v_cache: torch\u001b[38;5;241m.\u001b[39mTensor, v_pack: torch\u001b[38;5;241m.\u001b[39mTensor, v_params: torch\u001b[38;5;241m.\u001b[39mTensor,\n\u001b[1;32m 12\u001b[0m opt_block_table: Optional[torch\u001b[38;5;241m.\u001b[39mTensor] \u001b[38;5;241m=\u001b[39m \u001b[38;5;28;01mNone\u001b[39;00m,\n\u001b[0;32m (...)\u001b[0m\n\u001b[1;32m 16\u001b[0m group_size: \u001b[38;5;28mint\u001b[39m \u001b[38;5;241m=\u001b[39m \u001b[38;5;241m128\u001b[39m,\n\u001b[1;32m 17\u001b[0m num_bits: \u001b[38;5;28mint\u001b[39m \u001b[38;5;241m=\u001b[39m \u001b[38;5;241m4\u001b[39m):\n\u001b[1;32m 19\u001b[0m batch_size, seqlen_k, nheads_k, d \u001b[38;5;241m=\u001b[39m k_cache\u001b[38;5;241m.\u001b[39mshape\n",
0 commit comments