Spaces:

zetavg
/

LLaMA-LoRA-Tuner-UI-Demo

Runtime error

App Files Files Community

zetavg commited on Apr 24, 2023

Commit

6947876

unverified ·

1 Parent(s): b606ad0

finetune loss chart: use steps as the x axis if possible

Browse files

Files changed (4) hide show

llama_lora/globals.py +2 -1
llama_lora/ui/finetune/training.py +37 -13
llama_lora/ui/trainer_callback.py +2 -0
llama_lora/utils/sample_evenly.py +15 -0

llama_lora/globals.py CHANGED Viewed

@@ -5,7 +5,7 @@ import psutil
 import math
 from typing import Any, Dict, List, Optional, Tuple, Union
 from numba import cuda
 import nvidia_smi
@@ -47,6 +47,7 @@ class Global:
     training_status_text: str = ""
     training_eta_predictor = ETAPredictor()
     training_eta: Union[int, None] = None
     train_output: Union[None, Any] = None
     train_output_str: Union[None, str] = None
     training_params_info_text: str = ""

 import math
 from typing import Any, Dict, List, Optional, Tuple, Union
+from transformers import TrainingArguments
 from numba import cuda
 import nvidia_smi
     training_status_text: str = ""
     training_eta_predictor = ETAPredictor()
     training_eta: Union[int, None] = None
+    training_args: Union[TrainingArguments, None] = None
     train_output: Union[None, Any] = None
     train_output_str: Union[None, str] = None
     training_params_info_text: str = ""

llama_lora/ui/finetune/training.py CHANGED Viewed

@@ -12,11 +12,13 @@ import pandas as pd
 import gradio as gr
 from huggingface_hub import try_to_load_from_cache, snapshot_download
 from ...config import Config
 from ...globals import Global
 from ...models import clear_cache, unload_models
 from ...utils.prompter import Prompter
 from ..trainer_callback import (
     UiTrainerCallback, reset_training_status,
     update_training_states, set_train_output
@@ -202,26 +204,31 @@ def do_train(
                 train_data = prompter.get_train_data_from_dataset(data)
                 if Config.ui_dev_mode:
                     message = "Currently in UI dev mode, not doing the actual training."
                     message += f"\n\nArgs: {json.dumps(finetune_args, indent=2)}"
                     message += f"\n\nTrain data (first 5):\n{json.dumps(train_data[:5], indent=2)}"
                     print(message)
-                    total_steps = 300
                     log_history = []
                     initial_loss = 2
                     loss_decay_rate = 0.8
-                    for i in range(300):
                         if (Global.should_stop_training):
                             break
                         current_step = i + 1
-                        total_epochs = 3
-                        current_epoch = i / 100
-                        if (i > 20):
-                            loss = initial_loss * math.exp(-loss_decay_rate * current_epoch)
                             log_history.append({
                                 'loss': loss,
                                 'learning_rate': 0.0001,
@@ -424,7 +431,10 @@ def render_loss_plot():
     if len(Global.training_log_history) <= 2:
         return (gr.Column.update(visible=False), gr.Plot.update(visible=False))
-    training_log_history = Global.training_log_history
     loss_data = [
         {
@@ -436,6 +446,12 @@ def render_loss_plot():
         and 'epoch' in item
     ]
     source = pd.DataFrame(loss_data)
     highlight = alt.selection(
@@ -443,12 +459,20 @@ def render_loss_plot():
         on='mouseover', fields=['type'], nearest=True
     )
-    base = alt.Chart(source).encode(  # type: ignore
-        x='epoch:Q',
-        y='loss:Q',
-        color='type:N',
-        tooltip=['type:N', 'loss:Q', 'epoch:Q']
-    )
     points = base.mark_circle().encode(
         opacity=alt.value(0)

 import gradio as gr
 from huggingface_hub import try_to_load_from_cache, snapshot_download
+from transformers import TrainingArguments
 from ...config import Config
 from ...globals import Global
 from ...models import clear_cache, unload_models
 from ...utils.prompter import Prompter
+from ...utils.sample_evenly import sample_evenly
 from ..trainer_callback import (
     UiTrainerCallback, reset_training_status,
     update_training_states, set_train_output
                 train_data = prompter.get_train_data_from_dataset(data)
                 if Config.ui_dev_mode:
+                    Global.training_args = TrainingArguments(
+                        logging_steps=logging_steps, output_dir=""
+                    )
                     message = "Currently in UI dev mode, not doing the actual training."
                     message += f"\n\nArgs: {json.dumps(finetune_args, indent=2)}"
                     message += f"\n\nTrain data (first 5):\n{json.dumps(train_data[:5], indent=2)}"
                     print(message)
+                    total_epochs = epochs
+                    total_steps = len(train_data) * epochs
                     log_history = []
                     initial_loss = 2
                     loss_decay_rate = 0.8
+                    for i in range(total_steps):
                         if (Global.should_stop_training):
                             break
                         current_step = i + 1
+                        current_epoch = i / (total_steps / total_epochs)
+                        if (current_step % logging_steps == 0):
+                            loss = initial_loss * \
+                                math.exp(-loss_decay_rate * current_epoch)
                             log_history.append({
                                 'loss': loss,
                                 'learning_rate': 0.0001,
     if len(Global.training_log_history) <= 2:
         return (gr.Column.update(visible=False), gr.Plot.update(visible=False))
+    max_elements = 5000
+    training_log_history = sample_evenly(
+        Global.training_log_history, max_elements=max_elements)
+    logging_steps = Global.training_args and Global.training_args.logging_steps
     loss_data = [
         {
         and 'epoch' in item
     ]
+    use_steps = False
+    if len(Global.training_log_history) <= max_elements and logging_steps:
+        for index, item in enumerate(loss_data):
+            item["step"] = index * logging_steps
+        use_steps = True
     source = pd.DataFrame(loss_data)
     highlight = alt.selection(
         on='mouseover', fields=['type'], nearest=True
     )
+    if use_steps:
+        base = alt.Chart(source).encode(  # type: ignore
+            x='step:Q',
+            y='loss:Q',
+            color='type:N',
+            tooltip=['type:N', 'loss:Q', 'step:Q', 'epoch:Q']
+        )
+    else:
+        base = alt.Chart(source).encode(  # type: ignore
+            x='epoch:Q',
+            y='loss:Q',
+            color='type:N',
+            tooltip=['type:N', 'loss:Q', 'epoch:Q']
+        )
     points = base.mark_circle().encode(
         opacity=alt.value(0)

llama_lora/ui/trainer_callback.py CHANGED Viewed

@@ -22,6 +22,7 @@ def reset_training_status():
     Global.training_status_text = ""
     Global.training_eta_predictor = ETAPredictor()
     Global.training_eta = None
     Global.train_output = None
     Global.train_output_str = None
     Global.training_params_info_text = ""
@@ -102,6 +103,7 @@ class UiTrainerCallback(TrainerCallback):
             traceback.print_exc()
     def on_epoch_begin(self, args, state, control, **kwargs):
         self._on_progress(args, state, control)
     def on_step_end(self, args, state, control, **kwargs):

     Global.training_status_text = ""
     Global.training_eta_predictor = ETAPredictor()
     Global.training_eta = None
+    Global.training_args = None
     Global.train_output = None
     Global.train_output_str = None
     Global.training_params_info_text = ""
             traceback.print_exc()
     def on_epoch_begin(self, args, state, control, **kwargs):
+        Global.training_args = args
         self._on_progress(args, state, control)
     def on_step_end(self, args, state, control, **kwargs):

llama_lora/utils/sample_evenly.py ADDED Viewed

	@@ -0,0 +1,15 @@

+import numpy as np
+from typing import List, Any, Iterator
+def sample_evenly_it(input_list: List[Any], max_elements: int = 1000) -> Iterator[Any]:
+    if len(input_list) <= max_elements:
+        yield from input_list
+    else:
+        step = len(input_list) / max_elements
+        indices = np.arange(0, len(input_list), step).astype(int)
+        yield from (input_list[i] for i in indices)
+def sample_evenly(input_list: List[Any], max_elements: int = 1000) -> List[Any]:
+    return list(sample_evenly_it(input_list, max_elements))