unique traces

xzrderek · xzrderek · commit 0dc82c7f4040 · 2025-09-13T23:53:37.000-07:00
diff --git a/eval_protocol/adapters/langfuse.py b/eval_protocol/adapters/langfuse.py
@@ -68,7 +68,7 @@ def get_evaluation_rows(
         from_timestamp: Optional[datetime] = None,
         to_timestamp: Optional[datetime] = None,
         include_tool_calls: bool = True,
-        page_size: int = 30,
+        page_size: int = 30,  # TODO: remove probably
         sleep_between_gets: float = 0.1,
         max_retries: int = 3,
     ) -> List[EvaluationRow]:
diff --git a/eval_protocol/quickstart/llm_judge.py b/eval_protocol/quickstart/llm_judge.py
@@ -36,9 +36,6 @@
         )
     ],
     completion_params=[
-        # {
-        #     "model": "fireworks_ai/accounts/fireworks/models/qwen3-235b-a22b-instruct-2507",
-        # },
         {"model": "gpt-4.1"},
         {
             "max_tokens": 131000,
diff --git a/eval_protocol/quickstart/utils.py b/eval_protocol/quickstart/utils.py
@@ -112,6 +112,7 @@ def split_multi_turn_rows(data: list[EvaluationRow]) -> list[EvaluationRow]:
         List of expanded EvaluationRow objects, one for each assistant message
     """
     expanded_rows = []
+    seen_traces: set[str] = set()
 
     for row in data:
         messages = row.messages
@@ -128,6 +129,12 @@ def split_multi_turn_rows(data: list[EvaluationRow]) -> list[EvaluationRow]:
             messages_before_assistant = messages[:pos]
             assistant_message = messages[pos]
 
+            # In this case, we trace every request, so we need to filter out duplicates
+            curr_trace = "\n".join(serialize_message(m) for m in messages_before_assistant)
+            if curr_trace in seen_traces:
+                continue
+            seen_traces.add(curr_trace)
+
             ground_truth_message = serialize_message(assistant_message)
 
             expanded_rows.append(

Original file line number	Diff line number	Diff line change
`@@ -36,9 +36,6 @@`
`36`	`36`	`)`
`37`	`37`	`],`
`38`	`38`	`completion_params=[`
`39`		`- # {`
`40`		`- # "model": "fireworks_ai/accounts/fireworks/models/qwen3-235b-a22b-instruct-2507",`
`41`		`- # },`
`42`	`39`	`{"model": "gpt-4.1"},`
`43`	`40`	`{`
`44`	`41`	`"max_tokens": 131000,`