Spaces:

rootxhacker
/

llama3-diffusion

Running on Zero

rootxhacker commited on Jun 14

Commit

d301ee1

verified ·

1 Parent(s): 18fda8a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -560,24 +560,25 @@ def chat_function(message, history, mode, progress=gr.Progress()):
     try:
         # Load model (this will run on GPU when GPU is allocated)
-        progress(0.05, description="Loading model on GPU...")
         tok, mod, dev = load_model()
         # Create appropriate generator
         if mode == "Quality (Slower, Better)":
             generator = QualityGenerator(tok, mod, dev)
-            progress(0.1, description="Initializing quality mode...")
         else:
             generator = SpeedGenerator(tok, mod, dev)
-            progress(0.1, description="Initializing speed mode...")
         # Generate response with progress callback
-        def progress_callback(pct, desc):
-            progress(pct, description=desc)
         response, stats = generator.generate(message, progress_callback)
-        progress(1.0, description="Complete!")
         # Create performance info
         perf_info = f"""**⚡ Performance Stats:**

     try:
         # Load model (this will run on GPU when GPU is allocated)
+        progress(0.05)
         tok, mod, dev = load_model()
         # Create appropriate generator
         if mode == "Quality (Slower, Better)":
             generator = QualityGenerator(tok, mod, dev)
+            progress(0.1)
         else:
             generator = SpeedGenerator(tok, mod, dev)
+            progress(0.1)
         # Generate response with progress callback
+        def progress_callback(pct, status_msg):
+            progress(pct)
+            # We'll show status in the performance display instead
         response, stats = generator.generate(message, progress_callback)
+        progress(1.0)
         # Create performance info
         perf_info = f"""**⚡ Performance Stats:**