Spaces:

eerrffuunn
/

gpusemeval

Runtime error

App Files Files Community

Mohammaderfan koupaei commited on Dec 17, 2024

Commit

b5e09fa

1 Parent(s): af37d71

second

Browse files

Files changed (1) hide show

app.py +55 -42

app.py CHANGED Viewed

@@ -4,6 +4,7 @@ from pathlib import Path
 import os
 import torch
 from transformers import set_seed
 # Set environment variables for memory optimization
 os.environ['PYTORCH_CUDA_ALLOC_CONF'] = 'max_split_size_mb:128'
@@ -17,6 +18,15 @@ from scripts.config.config import TrainingConfig
 from scripts.data_processing.data_preparation import AdvancedNarrativeProcessor
 from scripts.training.trainer import NarrativeTrainer
 def setup_logging():
     """Setup logging configuration"""
     logging.basicConfig(
@@ -31,6 +41,9 @@ def main():
     logger = setup_logging()
     logger.info("Initializing training process...")
     # Set random seeds for reproducibility
     set_seed(42)
     torch.manual_seed(42)
@@ -43,49 +56,49 @@ def main():
         logger.info(f"CUDA available. Using GPU: {torch.cuda.get_device_name(0)}")
         logger.info(f"Available GPU memory: {torch.cuda.get_device_properties(0).total_memory / 1024**3:.2f} GB")
-    # Load and process the dataset
-    annotations_file = "./data/subtask-2-annotations.txt"
-    raw_dir = "./data/raw"
-    logger.info("Loading and processing dataset...")
-    processor = AdvancedNarrativeProcessor(
-        annotations_file=annotations_file,
-        raw_dir=raw_dir
-    )
-    processed_data = processor.load_and_process_data()
-    # Create datasets
-    train_dataset = NarrativeDataset(processed_data['train'])
-    val_dataset = NarrativeDataset(processed_data['val'])
-    logger.info(f"Loaded dataset with {len(train_dataset)} training samples and {len(val_dataset)} validation samples.")
-    # Initialize model
-    logger.info("Initializing the model...")
-    model = NarrativeClassifier(
-        num_labels=train_dataset.get_num_labels(),
-        model_name="microsoft/deberta-v3-large"
-    )
-    # Define optimized training configuration
-    config = TrainingConfig(
-        output_dir=Path("./output"),
-        num_epochs=5,
-        batch_size=4,  # Reduced batch size for memory
-        learning_rate=2e-5,
-        warmup_ratio=0.1,
-        weight_decay=0.01,
-        max_grad_norm=1.0,
-        eval_steps=50,
-        save_steps=50,
-        fp16=True,  # Enable mixed precision
-        gradient_accumulation_steps=4,  # Gradient accumulation
-        max_length=256  # Reduced sequence length
-    )
-    logger.info("Training configuration:")
-    for key, value in vars(config).items():
-        logger.info(f"  {key}: {value}")
     try:
         # Initialize trainer
         trainer = NarrativeTrainer(
             model=model,

 import os
 import torch
 from transformers import set_seed
+import subprocess
 # Set environment variables for memory optimization
 os.environ['PYTORCH_CUDA_ALLOC_CONF'] = 'max_split_size_mb:128'
 from scripts.data_processing.data_preparation import AdvancedNarrativeProcessor
 from scripts.training.trainer import NarrativeTrainer
+def setup_spacy():
+    """Ensure spaCy model is installed"""
+    try:
+        import spacy
+        spacy.load("en_core_web_sm")
+    except OSError:
+        print("Downloading spaCy model...")
+        subprocess.run(["python", "-m", "spacy", "download", "en_core_web_sm"], check=True)
 def setup_logging():
     """Setup logging configuration"""
     logging.basicConfig(
     logger = setup_logging()
     logger.info("Initializing training process...")
+    # Setup spaCy
+    setup_spacy()
     # Set random seeds for reproducibility
     set_seed(42)
     torch.manual_seed(42)
         logger.info(f"CUDA available. Using GPU: {torch.cuda.get_device_name(0)}")
         logger.info(f"Available GPU memory: {torch.cuda.get_device_properties(0).total_memory / 1024**3:.2f} GB")
     try:
+        # Load and process the dataset
+        annotations_file = "./data/subtask-2-annotations.txt"
+        raw_dir = "./data/raw"
+        logger.info("Loading and processing dataset...")
+        processor = AdvancedNarrativeProcessor(
+            annotations_file=annotations_file,
+            raw_dir=raw_dir
+        )
+        processed_data = processor.load_and_process_data()
+        # Create datasets
+        train_dataset = NarrativeDataset(processed_data['train'])
+        val_dataset = NarrativeDataset(processed_data['val'])
+        logger.info(f"Loaded dataset with {len(train_dataset)} training samples and {len(val_dataset)} validation samples.")
+        # Initialize model
+        logger.info("Initializing the model...")
+        model = NarrativeClassifier(
+            num_labels=train_dataset.get_num_labels(),
+            model_name="microsoft/deberta-v3-large"
+        )
+        # Define optimized training configuration
+        config = TrainingConfig(
+            output_dir=Path("./output"),
+            num_epochs=5,
+            batch_size=4,  # Reduced batch size for memory
+            learning_rate=2e-5,
+            warmup_ratio=0.1,
+            weight_decay=0.01,
+            max_grad_norm=1.0,
+            eval_steps=50,
+            save_steps=50,
+            fp16=True,  # Enable mixed precision
+            gradient_accumulation_steps=4,  # Gradient accumulation
+            max_length=256  # Reduced sequence length
+        )
+        logger.info("Training configuration:")
+        for key, value in vars(config).items():
+            logger.info(f"  {key}: {value}")
         # Initialize trainer
         trainer = NarrativeTrainer(
             model=model,