Spaces:

henry000
/

YOLO

Running

App Files Files Community

henry000 commited on Nov 6, 2024

Commit

4be6676

1 Parent(s): 2522f72

✨ [Add] a momentum schedule for wramup epoch

Browse files

Files changed (2) hide show

yolo/tools/solver.py +3 -1
yolo/utils/model_utils.py +25 -2

yolo/tools/solver.py CHANGED Viewed

@@ -84,7 +84,9 @@ class TrainModel(ValidateModel):
         return self.train_loader
     def on_train_epoch_start(self):
-        self.trainer.optimizers[0].next_epoch(ceil(len(self.train_loader) / self.trainer.world_size))
         self.vec2box.update(self.cfg.image_size)
     def training_step(self, batch, batch_idx):

         return self.train_loader
     def on_train_epoch_start(self):
+        self.trainer.optimizers[0].next_epoch(
+            ceil(len(self.train_loader) / self.trainer.world_size), self.current_epoch
+        )
         self.vec2box.update(self.cfg.image_size)
     def training_step(self, batch, batch_idx):

yolo/utils/model_utils.py CHANGED Viewed

@@ -15,6 +15,22 @@ from yolo.utils.bounding_box_utils import Anc2Box, Vec2Box, bbox_nms, transform_
 from yolo.utils.logger import logger
 class ExponentialMovingAverage:
     def __init__(self, model: torch.nn.Module, decay: float):
         self.model = model
@@ -57,9 +73,15 @@ def create_optimizer(model: YOLO, optim_cfg: OptimizerConfig) -> Optimizer:
         {"params": norm_params, "momentum": 0.8, "weight_decay": 0},
     ]
-    def next_epoch(self, batch_num):
         self.min_lr = self.max_lr
         self.max_lr = [param["lr"] for param in self.param_groups]
         self.batch_num = batch_num
         self.batch_idx = 0
@@ -68,7 +90,8 @@ def create_optimizer(model: YOLO, optim_cfg: OptimizerConfig) -> Optimizer:
         lr_dict = dict()
         for lr_idx, param_group in enumerate(self.param_groups):
             min_lr, max_lr = self.min_lr[lr_idx], self.max_lr[lr_idx]
-            param_group["lr"] = min_lr + (self.batch_idx) * (max_lr - min_lr) / self.batch_num
             lr_dict[f"LR/{lr_idx}"] = param_group["lr"]
         return lr_dict

 from yolo.utils.logger import logger
+def lerp(start: float, end: float, step: Union[int, float], total: int = 1):
+    """
+    Linearly interpolates between start and end values.
+    Parameters:
+        start (float): The starting value.
+        end (float): The ending value.
+        step (int): The current step in the interpolation process.
+        total (int): The total number of steps.
+    Returns:
+        float: The interpolated value.
+    """
+    return start + (end - start) * step / total
 class ExponentialMovingAverage:
     def __init__(self, model: torch.nn.Module, decay: float):
         self.model = model
         {"params": norm_params, "momentum": 0.8, "weight_decay": 0},
     ]
+    def next_epoch(self, batch_num, epoch_idx):
         self.min_lr = self.max_lr
         self.max_lr = [param["lr"] for param in self.param_groups]
+        # TODO: load momentum from config instead a fix number
+        #       0.937: Start Momentum
+        #       0.8  : Normal Momemtum
+        #       3    : The warm up epoch num
+        self.min_mom = lerp(0.937, 0.8, max(epoch_idx, 3), 3)
+        self.max_mom = lerp(0.937, 0.8, max(epoch_idx + 1, 3), 3)
         self.batch_num = batch_num
         self.batch_idx = 0
         lr_dict = dict()
         for lr_idx, param_group in enumerate(self.param_groups):
             min_lr, max_lr = self.min_lr[lr_idx], self.max_lr[lr_idx]
+            param_group["lr"] = lerp(min_lr, max_lr, self.batch_idx, self.batch_num)
+            param_group["momentum"] = lerp(self.min_mom, self.max_mom, self.batch_idx, self.batch_num)
             lr_dict[f"LR/{lr_idx}"] = param_group["lr"]
         return lr_dict