Spaces:

henry000
/

YOLO

Running

henry000 commited on Nov 21, 2024

Commit

89a6526

1 Parent(s): b48b975

🚑️ [Fix] broadcast of EMA and sync_dist only in val

Files changed (2) hide show

yolo/tools/solver.py CHANGED Viewed

@@ -63,9 +63,11 @@ class ValidateModel(BaseModel):
     def on_validation_epoch_end(self):
         epoch_metrics = self.metric.compute()
         del epoch_metrics["classes"]
-        self.log_dict(epoch_metrics, prog_bar=True, rank_zero_only=True)
         self.log_dict(
-            {"PyCOCO/AP @ .5:.95": epoch_metrics["map"], "PyCOCO/AP @ .5": epoch_metrics["map_50"]}, rank_zero_only=True
         )
         self.metric.reset()
@@ -101,10 +103,9 @@ class TrainModel(ValidateModel):
             prog_bar=True,
             on_epoch=True,
             batch_size=batch_size,
-            sync_dist=True,
             rank_zero_only=True,
         )
-        self.log_dict(lr_dict, prog_bar=False, logger=True, on_epoch=False, sync_dist=True, rank_zero_only=True)
         return loss * batch_size
     def configure_optimizers(self):

     def on_validation_epoch_end(self):
         epoch_metrics = self.metric.compute()
         del epoch_metrics["classes"]
+        self.log_dict(epoch_metrics, prog_bar=True, sync_dist=True, rank_zero_only=True)
         self.log_dict(
+            {"PyCOCO/AP @ .5:.95": epoch_metrics["map"], "PyCOCO/AP @ .5": epoch_metrics["map_50"]},
+            sync_dist=True,
+            rank_zero_only=True,
         )
         self.metric.reset()
             prog_bar=True,
             on_epoch=True,
             batch_size=batch_size,
             rank_zero_only=True,
         )
+        self.log_dict(lr_dict, prog_bar=False, logger=True, on_epoch=False, rank_zero_only=True)
         return loss * batch_size
     def configure_optimizers(self):

yolo/utils/model_utils.py CHANGED Viewed

@@ -53,8 +53,7 @@ class EMA(Callback):
     def on_validation_start(self, trainer: "Trainer", pl_module: "LightningModule"):
         for param, ema_param in zip(pl_module.ema.parameters(), self.ema_parameters):
             param.data.copy_(ema_param)
-            if dist.is_initialized():
-                dist.broadcast(param, src=0)
     @rank_zero_only
     @no_grad()

     def on_validation_start(self, trainer: "Trainer", pl_module: "LightningModule"):
         for param, ema_param in zip(pl_module.ema.parameters(), self.ema_parameters):
             param.data.copy_(ema_param)
+            trainer.strategy.broadcast(param)
     @rank_zero_only
     @no_grad()