simopt-admin
diff --git a/‎scripts/generate_experiment_results.py‎
Lines changed: 2 additions & 2 deletions b/‎scripts/generate_experiment_results.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎simopt/experiment/run_solver.py‎
Lines changed: 144 additions & 0 deletions b/‎simopt/experiment/run_solver.py‎
Lines changed: 144 additions & 0 deletions
@@ -58,12 +58,12 @@ def create_test(problem_name: str, solver_name: str) -> None:
     # Loop through each curve object and convert it into a tuple
     # This is done to avoid packing custom classes into the YAML file
     for i in range(len(myexperiment.objective_curves)):
-        myexperiment.objective_curves[i] = (  # type: ignore
+        myexperiment.objective_curves[i] = (
             myexperiment.objective_curves[i].x_vals,
             myexperiment.objective_curves[i].y_vals,
         )
     for i in range(len(myexperiment.progress_curves)):
-        myexperiment.progress_curves[i] = (  # type: ignore
+        myexperiment.progress_curves[i] = (
             myexperiment.progress_curves[i].x_vals,
             myexperiment.progress_curves[i].y_vals,
         )
 
@@ -0,0 +1,144 @@
+"""Functions for running solvers and collecting their outputs."""
+
+import logging
+import time
+
+import pandas as pd
+from joblib import Parallel, delayed
+
+from mrg32k3a.mrg32k3a import MRG32k3a
+from simopt.problem import Problem
+from simopt.solver import Solver
+
+
+def _trim(df: pd.DataFrame, budget: int) -> pd.DataFrame:
+    """Trim solution history beyond the problem's budget."""
+    df = df.loc[df["budget"] <= budget].copy()
+
+    # Add the latest solution as the final row
+    if df["budget"].iloc[-1] < budget:
+        row = pd.DataFrame.from_records(
+            [{"step": len(df), "solution": df["solution"].iloc[-1], "budget": budget}]
+        )
+        df = pd.concat([df, row], ignore_index=True)
+
+    return df
+
+
+def _set_up_rngs(solver: Solver, problem: Problem, mrep: int) -> None:
+    # Stream 0: reserved for taking post-replications
+    # Stream 1: reserved for bootstrapping
+    # Stream 2: reserved for overhead ...
+    #     Substream 0: rng for random problem instance
+    #     Substream 1: rng for random initial solution x0 and restart solutions
+    #     Substream 2: rng for selecting random feasible solutions
+    #     Substream 3: rng for solver's internal randomness
+    # Streams 3, 4, ..., n_macroreps + 2: reserved for
+    #                                     macroreplications
+    # FIXME: the following rngs seem to be overriden by the solver rngs below
+    rng_list = [MRG32k3a(s_ss_sss_index=[2, i + 1, 0]) for i in range(3)]
+    solver.attach_rngs(rng_list)
+
+    # Create RNGs for simulation
+    simulation_rngs = [
+        MRG32k3a(s_ss_sss_index=[mrep + 3, i, 0]) for i in range(problem.model.n_rngs)
+    ]
+
+    # Create RNGs for the solver
+    solver_rngs = [
+        MRG32k3a(
+            s_ss_sss_index=[
+                mrep + 3,
+                problem.model.n_rngs + i,
+                0,
+            ]
+        )
+        for i in range(len(solver.rng_list))
+    ]
+
+    solver.solution_progenitor_rngs = simulation_rngs
+    solver.rng_list = solver_rngs
+
+
+def _run_mrep(
+    solver: Solver, problem: Problem, mrep: int
+) -> tuple[pd.DataFrame, float]:
+    """Run one macroreplication of the solver on the problem."""
+    logging.debug(
+        f"Macroreplication {mrep}: "
+        f"starting solver {solver.name} on problem {problem.name}."
+    )
+
+    # Set up RNGs
+    _set_up_rngs(solver, problem, mrep)
+
+    # Run solver
+    start = time.perf_counter()
+    df = solver.run(problem)
+    elapsed = time.perf_counter() - start
+    logging.debug(
+        f"Macroreplication {mrep}: "
+        f"finished solver {solver.name} on problem {problem.name} "
+        f"in {elapsed:0.4f} seconds."
+    )
+
+    # Trim results to the problem budget and add macroreplication index
+    df = _trim(df, problem.factors["budget"])
+    df["mrep"] = mrep
+
+    return df, elapsed
+
+
+def run_solver(
+    solver: Solver, problem: Problem, n_macroreps: int, n_jobs: int = -1
+) -> tuple[pd.DataFrame, list[float]]:
+    """Runs the solver on the problem for a given number of macroreplications.
+
+    Args:
+        solver (Solver): The solver to run.
+        problem (Problem): The problem to solve.
+        n_macroreps (int): Number of macroreplications to run.
+        n_jobs (int, optional): Number of jobs to run in parallel. Defaults to -1.
+            -1: use all available cores
+            1: run sequentially
+
+    Raises:
+        ValueError: If `n_macroreps` is not positive.
+    """
+    if n_macroreps <= 0:
+        raise ValueError("number of macroreplications must be positive.")
+
+    logging.info(f"Running solver {solver.name} on problem {problem.name}.")
+    logging.debug("Starting macroreplications")
+
+    if n_jobs == 1:
+        results: list[tuple] = [
+            _run_mrep(solver, problem, i) for i in range(n_macroreps)
+        ]
+    else:
+        results: list[tuple] = Parallel(n_jobs=n_jobs)(
+            delayed(_run_mrep)(solver, problem, i) for i in range(n_macroreps)
+        )  # type: ignore
+
+    dfs = []
+    elapsed_times = []
+    for df, elapsed in results:
+        dfs.append(df)
+        elapsed_times.append(elapsed)
+    df = pd.concat(dfs, ignore_index=True)
+
+    return df, elapsed_times
+
+
+def _to_list(df: pd.DataFrame, column: str) -> list[list]:
+    df = df.sort_values(["mrep", "step"])
+    return [group[column].tolist() for _, group in df.groupby("mrep")]
+
+
+def _from_list(data: list[list], column: str) -> pd.DataFrame:
+    records = [
+        {"mrep": mrep, "step": step, column: value}
+        for mrep, steps in enumerate(data)
+        for step, value in enumerate(steps)
+    ]
+    return pd.DataFrame.from_records(records, columns=["mrep", "step", column])