fix: static prediction only can load previous model from source_record_id and save model for each prediction

Tonny@Home · Tonny@Home · commit 2194d1d451ea · 2026-03-21T12:27:14.000+08:00
diff --git a/quantpits/scripts/static_train.py b/quantpits/scripts/static_train.py
@@ -367,6 +367,7 @@ def run_predict_only(args, targets):
         predict_single_model,
         print_model_table,
         make_model_key,
+        resolve_model_key,
         PREDICTION_OUTPUT_DIR,
         RECORD_OUTPUT_FILE,
     )
@@ -388,8 +389,13 @@ def run_predict_only(args, targets):
 
     # 检查哪些模型在源记录中存在
     source_models = source_records.get('models', {})
-    available = {k: v for k, v in targets.items() if k in source_models}
-    missing = {k: v for k, v in targets.items() if k not in source_models}
+    available = {}
+    missing = {}
+    for k, v in targets.items():
+        if resolve_model_key(k, source_models, default_mode='static'):
+            available[k] = v
+        else:
+            missing[k] = v
 
     if missing:
         print(f"\n⚠️  以下模型不在源训练记录中，将跳过:")
@@ -466,15 +472,17 @@ def run_predict_only(args, targets):
     print("📊 Predict-Only 完成")
     print("=" * 60)
 
-    succeeded = [m for m in new_records['models']]
+    succeeded = [m for m in available if m in new_performances]
     print(f"  ✅ 成功: {len(succeeded)} 个模型")
     for name in succeeded:
         perf = new_performances.get(name, {})
         ic = perf.get('IC_Mean', 'N/A')
         icir = perf.get('ICIR', 'N/A')
         ic_str = f"{ic:.4f}" if isinstance(ic, float) else ic
         icir_str = f"{icir:.4f}" if isinstance(icir, float) else icir
-        print(f"    {name}: IC={ic_str}, ICIR={icir_str}")
+        
+        model_key = make_model_key(name, 'static')
+        print(f"    {model_key}: IC={ic_str}, ICIR={icir_str}")
 
     if failed_models:
         print(f"  ❌ 失败: {len(failed_models)} 个模型")
diff --git a/quantpits/utils/train_utils.py b/quantpits/utils/train_utils.py
@@ -1116,12 +1116,14 @@ def predict_single_model(model_name, model_info, params, experiment_name,
 
     # 检查模型是否存在于源记录中
     source_models = source_records.get('models', {})
-    if model_name not in source_models:
+    resolved_key = resolve_model_key(model_name, source_models, default_mode='static')
+    
+    if not resolved_key:
         result['error'] = f"模型 '{model_name}' 不在源训练记录中，无法加载已有模型"
         print(f"!!! Error: {result['error']}")
         return result
 
-    source_record_id = source_models[model_name]
+    source_record_id = source_models[resolved_key]
     source_experiment = source_records.get('experiment_name', 'Weekly_Production_Train')
 
     from qlib.utils import init_instance_by_config
@@ -1134,11 +1136,31 @@ def predict_single_model(model_name, model_info, params, experiment_name,
     try:
         # 1. 从源 recorder 加载模型
         print(f"[{model_name}] Loading model from source recorder...")
-        source_recorder = R.get_recorder(
-            recorder_id=source_record_id,
-            experiment_name=source_experiment
-        )
-        model = source_recorder.load_object("model.pkl")
+        
+        # 稳健加载：如果在当前 recorder 里没找到 model.pkl，则根据 source_record_id tag 向上溯源
+        current_id = source_record_id
+        current_exp = source_experiment
+        model = None
+        for _ in range(10):
+            source_recorder = R.get_recorder(
+                recorder_id=current_id,
+                experiment_name=current_exp
+            )
+            try:
+                model = source_recorder.load_object("model.pkl")
+                break
+            except Exception:
+                tags = source_recorder.list_tags()
+                if 'source_record_id' in tags and 'source_experiment' in tags:
+                    print(f"    [Fallback] model.pkl 不在 {current_id} 中，正在向上溯源到 {tags['source_record_id']}...")
+                    current_id = tags['source_record_id']
+                    current_exp = tags['source_experiment']
+                else:
+                    raise ValueError(f"model.pkl not found in {current_id} and no parent tags available.")
+                    
+        if model is None:
+            raise ValueError(f"Exceeded max traceback depth of 10 for {model_name}.")
+            
         print(f"[{model_name}] Model loaded successfully")
 
         # 2. 构建新的 dataset（使用新日期范围）
@@ -1176,6 +1198,10 @@ def predict_single_model(model_name, model_info, params, experiment_name,
                 r_obj = init_instance_by_config(r_cfg, recorder=recorder)
                 r_obj.generate()
 
+            # 重点修复：必须把模型也存入新的 recorder 里面，
+            # 否则下一个周期如果继续做仅预测，会因为上个仅预测的记录中没有 model.pkl 而失败
+            recorder.save_objects(**{"model.pkl": model})
+
             # 获取 IC 指标
             performance = {}
             try: