rerun lplr sim and add tuning with 100 reps and 200 trials

SvenKlaassen · SvenKlaassen · commit 46522acd9afd · 2025-11-26T17:54:40.000+01:00
diff --git a/monte-cover/src/montecover/plm/__init__.py b/monte-cover/src/montecover/plm/__init__.py
@@ -7,6 +7,7 @@
 from montecover.plm.plr_cate import PLRCATECoverageSimulation
 from montecover.plm.plr_gate import PLRGATECoverageSimulation
 from montecover.plm.lplr_ate import LPLRATECoverageSimulation
+from montecover.plm.lplr_ate_tune import LPLRATETuningCoverageSimulation
 
 __all__ = [
     "PLRATECoverageSimulation",
@@ -16,4 +17,5 @@
     "PLRATESensitivityCoverageSimulation",
     "PLRATETuningCoverageSimulation",
     "LPLRATECoverageSimulation",
+    "LPLRATETuningCoverageSimulation",
 ]
diff --git a/monte-cover/src/montecover/plm/lplr_ate.py b/monte-cover/src/montecover/plm/lplr_ate.py
@@ -1,4 +1,3 @@
-import warnings
 from typing import Any, Dict, Optional
 
 import doubleml as dml
@@ -46,7 +45,7 @@ def _calculate_oracle_values(self):
         self.logger.info("Calculating oracle values")
 
         self.oracle_values = dict()
-        self.oracle_values["theta"] = self.dgp_parameters["theta"]
+        self.oracle_values["theta"] = self.dgp_parameters["alpha"]
 
     def run_single_rep(self, dml_data, dml_params) -> Dict[str, Any]:
         """Run a single repetition with the given parameters."""
@@ -64,7 +63,8 @@ def run_single_rep(self, dml_data, dml_params) -> Dict[str, Any]:
             ml_M=ml_M,
             ml_t=ml_t,
             score=score,
-            error_on_convergence_failure= not self._use_failed_scores,)
+            error_on_convergence_failure=(not self._use_failed_scores),
+        )
 
         try:
             dml_model.fit()
diff --git a/monte-cover/src/montecover/plm/lplr_ate_tune.py b/monte-cover/src/montecover/plm/lplr_ate_tune.py
@@ -0,0 +1,160 @@
+from typing import Any, Dict, Optional
+import optuna
+
+import doubleml as dml
+from doubleml.plm.datasets import make_lplr_LZZ2020
+
+from montecover.base import BaseSimulation
+from montecover.utils import create_learner_from_config
+
+
+class LPLRATETuningCoverageSimulation(BaseSimulation):
+    """Simulation class for coverage properties of DoubleMLPLR for ATE estimation."""
+
+    def __init__(
+            self,
+            config_file: str,
+            suppress_warnings: bool = True,
+            log_level: str = "INFO",
+            log_file: Optional[str] = None,
+            use_failed_scores: bool = False,
+    ):
+        super().__init__(
+            config_file=config_file,
+            suppress_warnings=suppress_warnings,
+            log_level=log_level,
+            log_file=log_file,
+        )
+
+        # Calculate oracle values
+        self._calculate_oracle_values()
+        self._use_failed_scores = use_failed_scores
+
+        # for simplicity, we use the same parameter space for all learners
+        def ml_params(trial):
+            return {
+                'n_estimators': trial.suggest_int('n_estimators', 100, 500, step=50),
+                'learning_rate': trial.suggest_float('learning_rate', 1e-3, 0.1, log=True),
+                'min_child_samples': trial.suggest_int('min_child_samples', 20, 100, step=5),
+                'max_depth': trial.suggest_int('max_depth', 3, 10, step=1),
+                'lambda_l1': trial.suggest_float('lambda_l1', 1e-8, 10.0, log=True),
+                'lambda_l2': trial.suggest_float('lambda_l2', 1e-8, 10.0, log=True),
+            }
+
+        self._param_space = {
+            'ml_M': ml_params,
+            'ml_t': ml_params,
+            'ml_m': ml_params,
+            'ml_a': ml_params,
+        }
+
+        self._optuna_settings = {
+            'n_trials': 200,
+            'show_progress_bar': False,
+            'verbosity': optuna.logging.WARNING,  # Suppress Optuna logs
+        }
+
+    def _process_config_parameters(self):
+        """Process simulation-specific parameters from config"""
+        # Process ML models in parameter grid
+        assert "learners" in self.dml_parameters, "No learners specified in the config file"
+
+        required_learners = ["ml_m", "ml_M", "ml_t"]
+        for learner in self.dml_parameters["learners"]:
+            for ml in required_learners:
+                assert ml in learner, f"No {ml} specified in the config file"
+
+    def _calculate_oracle_values(self):
+        """Calculate oracle values for the simulation."""
+        self.logger.info("Calculating oracle values")
+
+        self.oracle_values = dict()
+        self.oracle_values["theta"] = self.dgp_parameters["alpha"]
+
+    def run_single_rep(self, dml_data, dml_params) -> Dict[str, Any]:
+        """Run a single repetition with the given parameters."""
+        # Extract parameters
+        learner_config = dml_params["learners"]
+        learner_m_name, ml_m = create_learner_from_config(learner_config["ml_m"])
+        learner_M_name, ml_M = create_learner_from_config(learner_config["ml_M"])
+        learner_t_name, ml_t = create_learner_from_config(learner_config["ml_t"])
+        score = dml_params["score"]
+
+        model_inputs = {
+            "obj_dml_data": dml_data,
+            "ml_m": ml_m,
+            "ml_M": ml_M,
+            "ml_t": ml_t,
+            "score": score,
+            "error_on_convergence_failure": not self._use_failed_scores,
+
+        }
+        # Model
+        dml_model = dml.DoubleMLLPLR(**model_inputs)
+        dml_model_tuned = dml.DoubleMLLPLR(**model_inputs)
+        dml_model_tuned.tune_ml_models(
+            ml_param_space=self._param_space,
+            optuna_settings=self._optuna_settings,
+        )
+
+        result = {
+            "coverage": [],
+        }
+
+        for model in [dml_model, dml_model_tuned]:
+            try:
+                model.fit()
+            except RuntimeError as e:
+                self.logger.info(f"Exception during fit: {e}")
+                return None
+
+            for level in self.confidence_parameters["level"]:
+                level_result = dict()
+                level_result["coverage"] = self._compute_coverage(
+                    thetas=model.coef,
+                    oracle_thetas=self.oracle_values["theta"],
+                    confint=model.confint(level=level),
+                    joint_confint=None,
+                )
+
+                # add parameters to the result
+                for res in level_result.values():
+                    res.update(
+                        {
+                            "Learner m": learner_m_name,
+                            "Learner M": learner_M_name,
+                            "Learner t": learner_t_name,
+                            "Score": score,
+                            "level": level,
+                            "Tuned": model is dml_model_tuned,
+                        }
+                    )
+                for key, res in level_result.items():
+                    result[key].append(res)
+
+        return result
+
+    def summarize_results(self):
+        """Summarize the simulation results."""
+        self.logger.info("Summarizing simulation results")
+
+        # Group by parameter combinations
+        groupby_cols = ["Learner m", "Learner M", "Learner t", "Score", "level", "Tuned"]
+        aggregation_dict = {
+            "Coverage": "mean",
+            "CI Length": "mean",
+            "Bias": "mean",
+            "repetition": "count",
+        }
+
+        # Aggregate results (possibly multiple result dfs)
+        result_summary = dict()
+        for result_name, result_df in self.results.items():
+            result_summary[result_name] = result_df.groupby(groupby_cols).agg(aggregation_dict).reset_index()
+            self.logger.debug(f"Summarized {result_name} results")
+
+        return result_summary
+
+    def _generate_dml_data(self, dgp_params) -> dml.DoubleMLData:
+        """Generate data for the simulation."""
+        return make_lplr_LZZ2020(**dgp_params)
diff --git a/results/plm/lplr_ate_config.yml b/results/plm/lplr_ate_config.yml
@@ -4,7 +4,7 @@ simulation_parameters:
   random_seed: 42
   n_jobs: -2
 dgp_parameters:
-  theta:
+  alpha:
   - 0.5
   n_obs:
   - 500
diff --git a/results/plm/lplr_ate_coverage.csv b/results/plm/lplr_ate_coverage.csv
@@ -1,13 +1,13 @@
 Learner m,Learner M,Learner t,Score,level,Coverage,CI Length,Bias,repetition
-LGBM Regr.,LGBM Clas.,LGBM Regr.,instrument,0.9,0.872,0.6540916267945179,0.17501445022837125,500
-LGBM Regr.,LGBM Clas.,LGBM Regr.,instrument,0.95,0.928,0.7793982455949509,0.17501445022837125,500
-LGBM Regr.,LGBM Clas.,LGBM Regr.,nuisance_space,0.9,0.88,0.598241346108922,0.15586913796966942,500
-LGBM Regr.,LGBM Clas.,LGBM Regr.,nuisance_space,0.95,0.946,0.7128485314583201,0.15586913796966942,500
-LassoCV,Logistic,LassoCV,instrument,0.9,0.856,0.5890452894815547,0.16482024691605957,500
-LassoCV,Logistic,LassoCV,instrument,0.95,0.924,0.7018907541253692,0.16482024691605957,500
-LassoCV,Logistic,LassoCV,nuisance_space,0.9,0.868,0.5820699058557912,0.1507959338822808,500
-LassoCV,Logistic,LassoCV,nuisance_space,0.95,0.93,0.6935790718815301,0.1507959338822808,500
-RF Regr.,RF Clas.,RF Regr.,instrument,0.9,0.884,0.39484117997902796,0.09883032061915417,500
-RF Regr.,RF Clas.,RF Regr.,instrument,0.95,0.95,0.4704822846799266,0.09883032061915417,500
-RF Regr.,RF Clas.,RF Regr.,nuisance_space,0.9,0.886,0.38499391911236014,0.09772003875711463,500
-RF Regr.,RF Clas.,RF Regr.,nuisance_space,0.95,0.94,0.45874854963578754,0.09772003875711463,500
+LGBM Regr.,LGBM Clas.,LGBM Regr.,instrument,0.9,0.866,0.6573798859045776,0.17600558265832575,500
+LGBM Regr.,LGBM Clas.,LGBM Regr.,instrument,0.95,0.936,0.7833164479942107,0.17600558265832575,500
+LGBM Regr.,LGBM Clas.,LGBM Regr.,nuisance_space,0.9,0.89,0.5881153537384244,0.15332249272864673,500
+LGBM Regr.,LGBM Clas.,LGBM Regr.,nuisance_space,0.95,0.936,0.700782667342079,0.15332249272864673,500
+LassoCV,Logistic,LassoCV,instrument,0.9,0.858,0.5897233516083383,0.16268441455635813,500
+LassoCV,Logistic,LassoCV,instrument,0.95,0.916,0.7026987149834061,0.16268441455635813,500
+LassoCV,Logistic,LassoCV,nuisance_space,0.9,0.8937875751503006,0.576947311075238,0.1492081384708213,499
+LassoCV,Logistic,LassoCV,nuisance_space,0.95,0.9278557114228457,0.6874751237169234,0.1492081384708213,499
+RF Regr.,RF Clas.,RF Regr.,instrument,0.9,0.902,0.39485055228075816,0.09886061010323771,500
+RF Regr.,RF Clas.,RF Regr.,instrument,0.95,0.942,0.4704934524662526,0.09886061010323771,500
+RF Regr.,RF Clas.,RF Regr.,nuisance_space,0.9,0.892,0.38461199091029774,0.09604302638290617,500
+RF Regr.,RF Clas.,RF Regr.,nuisance_space,0.95,0.942,0.4582934541133308,0.09604302638290617,500
diff --git a/results/plm/lplr_ate_metadata.csv b/results/plm/lplr_ate_metadata.csv
@@ -1,2 +1,2 @@
 DoubleML Version,Script,Date,Total Runtime (minutes),Python Version,Config File
-0.11.dev0,LPLRATECoverageSimulation,2025-11-18 03:13,39.79484195311864,3.12.9,scripts/plm/lplr_ate_config.yml
+0.12.dev0,LPLRATECoverageSimulation,2025-11-26 13:24,14.800051196416218,3.12.9,scripts/plm/lplr_ate_config.yml
diff --git a/results/plm/lplr_ate_tune_config.yml b/results/plm/lplr_ate_tune_config.yml
@@ -0,0 +1,29 @@
+simulation_parameters:
+  repetitions: 100
+  max_runtime: 19800
+  random_seed: 42
+  n_jobs: -2
+dgp_parameters:
+  alpha:
+  - 0.5
+  n_obs:
+  - 500
+  dim_x:
+  - 20
+learner_definitions:
+  lgbm: &id001
+    name: LGBM Regr.
+  lgbm-class: &id002
+    name: LGBM Clas.
+dml_parameters:
+  learners:
+  - ml_m: *id001
+    ml_M: *id002
+    ml_t: *id001
+  score:
+  - nuisance_space
+  - instrument
+confidence_parameters:
+  level:
+  - 0.95
+  - 0.9
diff --git a/results/plm/lplr_ate_tune_coverage.csv b/results/plm/lplr_ate_tune_coverage.csv
@@ -0,0 +1,9 @@
+Learner m,Learner M,Learner t,Score,level,Tuned,Coverage,CI Length,Bias,repetition
+LGBM Regr.,LGBM Clas.,LGBM Regr.,instrument,0.9,False,0.91,0.9117258212067718,0.240354871477558,100
+LGBM Regr.,LGBM Clas.,LGBM Regr.,instrument,0.9,True,0.95,0.8692681775643711,0.2054770002796413,100
+LGBM Regr.,LGBM Clas.,LGBM Regr.,instrument,0.95,False,0.98,1.0863883229855305,0.240354871477558,100
+LGBM Regr.,LGBM Clas.,LGBM Regr.,instrument,0.95,True,0.96,1.0357969201737371,0.2054770002796413,100
+LGBM Regr.,LGBM Clas.,LGBM Regr.,nuisance_space,0.9,False,0.91,0.7841573908306078,0.18430486050109982,100
+LGBM Regr.,LGBM Clas.,LGBM Regr.,nuisance_space,0.9,True,0.86,0.7221800622589235,0.1665060542122647,100
+LGBM Regr.,LGBM Clas.,LGBM Regr.,nuisance_space,0.95,False,0.95,0.9343811625885382,0.18430486050109982,100
+LGBM Regr.,LGBM Clas.,LGBM Regr.,nuisance_space,0.95,True,0.93,0.8605306205900738,0.1665060542122647,100
diff --git a/results/plm/lplr_ate_tune_metadata.csv b/results/plm/lplr_ate_tune_metadata.csv
@@ -0,0 +1,2 @@
+DoubleML Version,Script,Date,Total Runtime (minutes),Python Version,Config File
+0.12.dev0,LPLRATETuningCoverageSimulation,2025-11-26 17:47,44.12576818863551,3.12.9,scripts/plm/lplr_ate_tune_config.yml
diff --git a/scripts/plm/lplr_ate_config.yml b/scripts/plm/lplr_ate_config.yml
@@ -7,7 +7,7 @@ simulation_parameters:
   n_jobs: -2
 
 dgp_parameters:
-  theta: [0.5] # Treatment effect
+  alpha: [0.5] # Treatment effect
   n_obs: [500] # Sample size
   dim_x: [20] # Number of covariates
 
diff --git a/scripts/plm/lplr_ate_tune.py b/scripts/plm/lplr_ate_tune.py
@@ -0,0 +1,14 @@
+from montecover.plm import LPLRATETuningCoverageSimulation
+
+# Create and run simulation with config file
+sim = LPLRATETuningCoverageSimulation(
+    config_file="scripts/plm/lplr_ate_tune_config.yml",
+    log_level="INFO",
+    log_file="logs/plm/lplr_ate_tune_sim.log",
+)
+print("Calling file")
+sim.run_simulation()
+sim.save_results(output_path="results/plm/", file_prefix="lplr_ate_tune")
+
+# Save config file for reproducibility
+sim.save_config("results/plm/lplr_ate_tune_config.yml")
diff --git a/scripts/plm/lplr_ate_tune_config.yml b/scripts/plm/lplr_ate_tune_config.yml
@@ -0,0 +1,31 @@
+# Simulation parameters for LPLR ATE Coverage
+
+simulation_parameters:
+  repetitions: 100
+  max_runtime: 19800 # 5.5 hours in seconds
+  random_seed: 42
+  n_jobs: -2
+
+dgp_parameters:
+  alpha: [0.5] # Treatment effect
+  n_obs: [500] # Sample size
+  dim_x: [20] # Number of covariates
+
+# Define reusable learner configurations
+learner_definitions:
+  lgbm: &lgbm
+    name: "LGBM Regr."
+
+  lgbm-class: &lgbm-class
+    name: "LGBM Clas."
+
+dml_parameters:
+  learners:
+    - ml_m: *lgbm
+      ml_M: *lgbm-class
+      ml_t: *lgbm
+
+  score: ["nuisance_space", "instrument"]
+
+confidence_parameters:
+  level: [0.95, 0.90] # Confidence levels

Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,2 @@`
`1`	`1`	`DoubleML Version,Script,Date,Total Runtime (minutes),Python Version,Config File`
`2`		`-0.11.dev0,LPLRATECoverageSimulation,2025-11-18 03:13,39.79484195311864,3.12.9,scripts/plm/lplr_ate_config.yml`
	`2`	`+0.12.dev0,LPLRATECoverageSimulation,2025-11-26 13:24,14.800051196416218,3.12.9,scripts/plm/lplr_ate_config.yml`
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,2 @@`
	`1`	`+DoubleML Version,Script,Date,Total Runtime (minutes),Python Version,Config File`
	`2`	`+0.12.dev0,LPLRATETuningCoverageSimulation,2025-11-26 17:47,44.12576818863551,3.12.9,scripts/plm/lplr_ate_tune_config.yml`