Spaces:

Tonic
/

SmolFactory

Running

Tonic commited on 15 days ago

Commit

81f39f1

1 Parent(s): b4f1cb3

adds parameters to medical config

Files changed (2) hide show

config/train_gpt_oss_custom.py CHANGED Viewed

@@ -203,6 +203,7 @@ class GPTOSSEnhancedCustomConfig:
     dataloader_num_workers: int = 4  # Number of data loading workers
     dataloader_pin_memory: bool = True  # Pin memory for faster GPU transfer
     dataloader_prefetch_factor: int = 2  # Prefetch factor for data loading
     # Memory Management
     max_memory_per_gpu: Optional[str] = None  # e.g., "80GB", "40GB"

     dataloader_num_workers: int = 4  # Number of data loading workers
     dataloader_pin_memory: bool = True  # Pin memory for faster GPU transfer
     dataloader_prefetch_factor: int = 2  # Prefetch factor for data loading
+    dataset_num_proc: Optional[int] = None  # Parallel CPU processes for datasets map/filter ops
     # Memory Management
     max_memory_per_gpu: Optional[str] = None  # e.g., "80GB", "40GB"

config/train_gpt_oss_medical_o1_sft.py CHANGED Viewed

@@ -78,7 +78,6 @@ config = GPTOSSEnhancedCustomConfig(
     dataloader_num_workers=4,
     dataloader_pin_memory=True,
     dataloader_prefetch_factor=2,
-    dataset_num_proc=4,
     group_by_length=True,
     remove_unused_columns=True,
@@ -87,8 +86,8 @@ config = GPTOSSEnhancedCustomConfig(
     # ============================================================================
     use_lora=True,
     lora_config={
-        "r": 8,
-        "lora_alpha": 16,
         "lora_dropout": 0.05,
         "target_modules": "all-linear",
         "target_parameters": [

     dataloader_num_workers=4,
     dataloader_pin_memory=True,
     dataloader_prefetch_factor=2,
     group_by_length=True,
     remove_unused_columns=True,
     # ============================================================================
     use_lora=True,
     lora_config={
+        "r": 16,
+        "lora_alpha": 32,
         "lora_dropout": 0.05,
         "target_modules": "all-linear",
         "target_parameters": [