fixed dynamic range in case of subfunc issue and nonmatching ctx, prefill seq_len for prefill_only gpt_oss model

ochougul · ochougul · commit 0ff742cac134 · 2025-11-18T10:23:05.000Z
Signed-off-by: Onkar Chougule &lt;ochougul@qti.qualcomm.com&gt;
diff --git a/QEfficient/transformers/models/gpt_oss/modeling_gpt_oss.py b/QEfficient/transformers/models/gpt_oss/modeling_gpt_oss.py
@@ -663,7 +663,7 @@ def forward(
             }
             if self.sliding_window is not None:
                 sliding_window_len = past_key_value.sliding_window_len
-                short_read_idx = torch.arange(sliding_window_len)
+                short_read_idx = torch.arange(past_key_value.key_cache[self.layer_idx].shape[2])
                 read_idx = short_read_idx + torch.where(
                     position_ids.max() > sliding_window_len - 1, position_ids.max() - sliding_window_len + 1, 0
                 )
diff --git a/QEfficient/transformers/models/modeling_auto.py b/QEfficient/transformers/models/modeling_auto.py
@@ -2800,6 +2800,7 @@ def compile(
                     batch_size=batch_size,
                     kv_cache_batch_size=kv_cache_batch_size,
                     full_batch_size=full_batch_size,
+                    prefill_only=prefill_only,
                 )
             )
         if prefill_only is None or not prefill_only:

Original file line number	Diff line number	Diff line change
`@@ -663,7 +663,7 @@ def forward(`
`663`	`663`	`}`
`664`	`664`	`if self.sliding_window is not None:`
`665`	`665`	`sliding_window_len = past_key_value.sliding_window_len`
`666`		`- short_read_idx = torch.arange(sliding_window_len)`
	`666`	`+ short_read_idx = torch.arange(past_key_value.key_cache[self.layer_idx].shape[2])`
`667`	`667`	`read_idx = short_read_idx + torch.where(`
`668`	`668`	`position_ids.max() > sliding_window_len - 1, position_ids.max() - sliding_window_len + 1, 0`
`669`	`669`	`)`
Original file line number	Diff line number	Diff line change
`@@ -2800,6 +2800,7 @@ def compile(`
`2800`	`2800`	`batch_size=batch_size,`
`2801`	`2801`	`kv_cache_batch_size=kv_cache_batch_size,`
`2802`	`2802`	`full_batch_size=full_batch_size,`
	`2803`	`+ prefill_only=prefill_only,`
`2803`	`2804`	`)`
`2804`	`2805`	`)`
`2805`	`2806`	`if prefill_only is None or not prefill_only:`