ForgeOpus
diff --git a/‎.gitignore‎
Lines changed: 2 additions & 0 deletions b/‎.gitignore‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎ModelForge/app.py‎
Lines changed: 1 addition & 1 deletion b/‎ModelForge/app.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎ModelForge/cli.py‎
Lines changed: 1 addition & 1 deletion b/‎ModelForge/cli.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎ModelForge/services/training_service.py‎
Lines changed: 0 additions & 6 deletions b/‎ModelForge/services/training_service.py‎
Lines changed: 0 additions & 6 deletions
diff --git a/‎ModelForge/strategies/qlora_strategy.py‎
Lines changed: 62 additions & 26 deletions b/‎ModelForge/strategies/qlora_strategy.py‎
Lines changed: 62 additions & 26 deletions
@@ -23,3 +23,5 @@ ModelForge.egg-info/
 unsloth_compiled_cache/*
 # MkDocs build directory
 site/
+.claude/
+*/.claude/*
@@ -54,7 +54,7 @@ async def lifespan(app: FastAPI):
 app = FastAPI(
     title="ModelForge",
     description="Modular fine-tuning platform with support for multiple providers and strategies",
-    version="2.0.0",
+    version="v2",
     lifespan=lifespan,
 )
 
 
@@ -60,7 +60,7 @@ def main():
     print(" |_|  |_|\\___/ \\__,_|\\___|_|_| \\___/|_|  \\__, |\\___| ")
     print("                                          __/ |      ")
     print("                                         |___/       ")
-    print("\n ModelForge v2.0 - Modular Fine-Tuning Platform")
+    print("\n ModelForge v2.0 - No-code Fine-Tuning Platform")
     print("=" * 80 + "\n")
 
     # Check HuggingFace login
 
@@ -218,8 +218,6 @@ def train_model(
                     max_seq_length=config.get("max_seq_length", 2048),
                 )
                 tokenizer.eos_token = tokenizer.eos_token or tokenizer.sep_token
-                # Store eos_token in config for use by training strategies
-                config["eos_token"] = tokenizer.eos_token
             else:
                 model = provider.load_model(
                     model_id=config["model_name"],
@@ -228,8 +226,6 @@ def train_model(
                 )
                 tokenizer = provider.load_tokenizer(config["model_name"])
                 tokenizer.eos_token = tokenizer.eos_token or tokenizer.sep_token
-                # Store eos_token in config for use by training strategies
-                config["eos_token"] = tokenizer.eos_token
 
             # Auto-detect and correct precision settings to prevent Unsloth errors
             config = self._auto_detect_precision_settings(model, config)
@@ -306,8 +302,6 @@ def train_model(
                 logger.info(f"Calculated max_steps: {total_steps} (epochs={num_epochs}, examples={num_examples}, effective_batch={effective_batch_size})")
 
             tokenizer.eos_token = tokenizer.eos_token or tokenizer.sep_token
-            # Store eos_token in config for use by training strategies
-            config["eos_token"] = tokenizer.eos_token
 
             # Get metrics function
             metrics_fn = MetricsCalculator.get_metrics_fn_for_task(
 
@@ -6,13 +6,13 @@
 from peft import LoraConfig, get_peft_model, TaskType, prepare_model_for_kbit_training
 
 # Import unsloth first to prevent EOS token corruption
-# This must come before TRL imports to ensure proper tokenizer initialization
+# This must come before transformers imports to ensure proper tokenizer initialization
 try:
     import unsloth
 except ImportError:
     pass
 
-from trl import SFTTrainer, SFTConfig
+from transformers import Trainer, TrainingArguments, DataCollatorForLanguageModeling
 
 from ..logging_config import logger
 
@@ -87,21 +87,26 @@ def prepare_model(self, model: Any, config: Dict) -> Any:
 
     def prepare_dataset(self, dataset: Any, tokenizer: Any, config: Dict) -> Any:
         """
-        Prepare dataset for QLoRA by consolidating all fields into a single 'text' field.
+        Prepare dataset for QLoRA by tokenizing text and creating labels.
 
         Args:
             dataset: Pre-formatted dataset with task-specific fields
-            tokenizer: Tokenizer instance (for EOS token)
-            config: Configuration dictionary (contains task type)
+            tokenizer: Tokenizer instance
+            config: Configuration dictionary (contains task type, max_seq_length)
 
         Returns:
-            Dataset with consolidated 'text' field
+            Dataset with tokenized fields: input_ids, attention_mask, labels
         """
         logger.info(f"Preparing dataset for QLoRA: {len(dataset)} examples")
 
         # Get EOS token with SEP fallback
         eos_token = tokenizer.eos_token or tokenizer.sep_token or ""
         task = config.get("task", "text-generation")
+        max_seq_length = config.get("max_seq_length", 2048)
+
+        # Handle max_seq_length = -1 (use model's maximum)
+        if max_seq_length == -1:
+            max_seq_length = 2048  # Fallback default
 
         def create_text_field(example):
             """Consolidate all fields into a single 'text' field with EOS token."""
@@ -139,10 +144,40 @@ def create_text_field(example):
 
             return {"text": text}
 
-        # Apply transformation and remove original columns
-        dataset = dataset.map(create_text_field, remove_columns=dataset.column_names, num_proc=1)
+        # Step 1: Create text field
+        dataset = dataset.map(
+            create_text_field,
+            remove_columns=dataset.column_names,
+            num_proc=1
+        )
+
+        # Step 2: Tokenize text
+        def tokenize_function(examples):
+            """Tokenize text and create labels for causal LM."""
+            # Tokenize with truncation and padding
+            tokenized = tokenizer(
+                examples["text"],
+                truncation=True,
+                max_length=max_seq_length,
+                padding="max_length",  # Pad to max_length for consistency
+                return_tensors=None,  # Return lists, not tensors (datasets handles this)
+            )
+
+            # For causal LM: labels = input_ids
+            # The model will shift internally for next-token prediction
+            tokenized["labels"] = tokenized["input_ids"].copy()
+
+            return tokenized
+
+        # Apply tokenization
+        dataset = dataset.map(
+            tokenize_function,
+            batched=True,
+            remove_columns=["text"],  # Remove text field, keep only tokenized
+            num_proc=1,
+        )
 
-        logger.info(f"Dataset prepared with consolidated 'text' field: {len(dataset)} examples")
+        logger.info(f"Dataset tokenized: {len(dataset)} examples with max_length={max_seq_length}")
         return dataset
 
     def create_trainer(
@@ -155,23 +190,23 @@ def create_trainer(
         callbacks: list = None,
     ) -> Any:
         """
-        Create SFTTrainer with QLoRA-specific optimizations.
+        Create Trainer with QLoRA-specific optimizations.
 
         Args:
             model: Prepared model with QLoRA
-            train_dataset: Training dataset
-            eval_dataset: Evaluation dataset
+            train_dataset: Tokenized training dataset
+            eval_dataset: Tokenized evaluation dataset
             tokenizer: Tokenizer instance
             config: Training configuration
             callbacks: Training callbacks
 
         Returns:
-            SFTTrainer instance
+            Trainer instance
         """
-        logger.info("Creating SFTTrainer with QLoRA optimizations")
+        logger.info("Creating Trainer with QLoRA optimizations")
 
         # QLoRA-optimized training arguments
-        training_args = SFTConfig(
+        training_args = TrainingArguments(
             output_dir=config.get("output_dir", "./checkpoints"),
             num_train_epochs=config.get("num_train_epochs", 1),
             # QLoRA can use larger batch sizes due to memory efficiency
@@ -194,32 +229,33 @@ def create_trainer(
             lr_scheduler_type=config.get("lr_scheduler_type", "cosine"),
             report_to="tensorboard",
             logging_dir=config.get("logging_dir", "./training_logs"),
-            max_seq_length=config.get("max_seq_length", None),
-            packing=config.get("packing", False),
             # Gradient checkpointing for memory efficiency
             gradient_checkpointing=config.get("gradient_checkpointing", True),
             gradient_checkpointing_kwargs={"use_reentrant": False},
             # Evaluation settings
-            evaluation_strategy="steps" if eval_dataset else "no",
+            eval_strategy="steps" if eval_dataset else "no",
             eval_steps=config.get("eval_steps", 100),
             save_strategy="steps",
             load_best_model_at_end=True if eval_dataset else False,
             metric_for_best_model="eval_loss" if eval_dataset else None,
-            # Use tokenizer's EOS token instead of corrupted placeholder
-            eos_token=config.get("eos_token"),
-            # Disable completion_only_loss to avoid conflicts
-            completion_only_loss=False,
             # Disable distributed training for Unsloth (required when using device_map='auto')
             ddp_find_unused_parameters=False,
+            use_cache=False,
         )
 
-        # Create trainer (dataset has been formatted to 'text' field in prepare_dataset)
-        trainer = SFTTrainer(
+        # Create data collator for causal language modeling
+        data_collator = DataCollatorForLanguageModeling(
+            tokenizer=tokenizer,
+            mlm=False,  # Causal LM
+        )
+
+        # Create standard Trainer
+        trainer = Trainer(
             model=model,
+            args=training_args,
             train_dataset=train_dataset,
             eval_dataset=eval_dataset,
-            args=training_args,
-            processing_class=tokenizer,
+            data_collator=data_collator,
             callbacks=callbacks or [],
         )
Original file line number	Diff line number	Diff line change
`@@ -54,7 +54,7 @@ async def lifespan(app: FastAPI):`
`54`	`54`	`app = FastAPI(`
`55`	`55`	`title="ModelForge",`
`56`	`56`	`description="Modular fine-tuning platform with support for multiple providers and strategies",`
`57`		`- version="2.0.0",`
	`57`	`+ version="v2",`
`58`	`58`	`lifespan=lifespan,`
`59`	`59`	`)`
`60`	`60`