Spaces:

cheberle
/

testtrain

Sleeping

App Files Files Community

cheberle commited on Jan 17

Commit

4d35d17

1 Parent(s): b9cf68a

f

Browse files

Files changed (1) hide show

app.py +17 -7

app.py CHANGED Viewed

@@ -1,9 +1,9 @@
 import gradio as gr
-import torch
 from datasets import Dataset
 from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments, Trainer
 import pandas as pd
 from huggingface_hub import login
 def train_model(file, hf_token):
     try:
@@ -16,20 +16,27 @@ def train_model(file, hf_token):
         df = pd.read_csv(file.name)
         dataset = Dataset.from_pandas(df)
-        # Model setup
         model_name = "facebook/opt-125m"
         tokenizer = AutoTokenizer.from_pretrained(model_name)
-        model = AutoModelForCausalLM.from_pretrained(model_name)
         # Training configuration
         training_args = TrainingArguments(
             output_dir="./results",
             num_train_epochs=3,
-            per_device_train_batch_size=2,
             learning_rate=3e-5,
             save_strategy="epoch",
             push_to_hub=True,
-            hub_token=hf_token
         )
         # Initialize trainer
@@ -43,6 +50,9 @@ def train_model(file, hf_token):
         # Run training
         trainer.train()
         return "Training completed successfully!"
     except Exception as e:
@@ -57,8 +67,8 @@ demo = gr.Interface(
     ],
     outputs="text",
     title="Product Classifier Training",
-    description="Upload your CSV data to train a product classifier model."
 )
 if __name__ == "__main__":
-    demo.launch()

 import gradio as gr
 from datasets import Dataset
 from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments, Trainer
 import pandas as pd
 from huggingface_hub import login
+import torch
 def train_model(file, hf_token):
     try:
         df = pd.read_csv(file.name)
         dataset = Dataset.from_pandas(df)
+        # Model setup - force CPU
         model_name = "facebook/opt-125m"
+        device_map = "cpu"  # Force CPU usage
         tokenizer = AutoTokenizer.from_pretrained(model_name)
+        model = AutoModelForCausalLM.from_pretrained(
+            model_name,
+            device_map=device_map,
+            torch_dtype=torch.float32  # Use float32 for CPU
+        )
         # Training configuration
         training_args = TrainingArguments(
             output_dir="./results",
             num_train_epochs=3,
+            per_device_train_batch_size=1,  # Reduced for CPU
             learning_rate=3e-5,
             save_strategy="epoch",
             push_to_hub=True,
+            hub_token=hf_token,
+            no_cuda=True,  # Force CPU usage
+            report_to="none"  # Disable wandb logging
         )
         # Initialize trainer
         # Run training
         trainer.train()
+        # Push to hub
+        model.push_to_hub(f"cheberle/product-classifier-{pd.Timestamp.now().strftime('%Y%m%d')}")
         return "Training completed successfully!"
     except Exception as e:
     ],
     outputs="text",
     title="Product Classifier Training",
+    description="Upload your CSV data to train a product classifier model on CPU."
 )
 if __name__ == "__main__":
+    demo.launch(share=False)