Spaces:

henry000
/

YOLO

Running

App Files Files Community

Martin Cerman

mcerman-enlite commited on Oct 2, 2024

Commit

dea5a8a

unverified ·

1 Parent(s): 8228669

🔨 [FIX] Fixes memory leak (#83)

Browse files

* Fixes memory leak

* Changed total_loss to use float type and adjusted collection of loss

---------

Co-authored-by: Martin Cerman <[email protected]>

Files changed (1) hide show

yolo/tools/solver.py +2 -2

yolo/tools/solver.py CHANGED Viewed

@@ -86,7 +86,7 @@ class ModelTrainer:
     def train_one_epoch(self, dataloader):
         self.model.train()
-        total_loss = defaultdict(lambda: torch.tensor(0.0, device=self.device))
         total_samples = 0
         self.optimizer.next_epoch(len(dataloader))
         for batch_size, images, targets, *_ in dataloader:
@@ -96,7 +96,7 @@ class ModelTrainer:
             for loss_name, loss_val in loss_each.items():
                 if self.use_ddp:  # collecting loss for each batch
                     distributed.all_reduce(loss_val, op=distributed.ReduceOp.AVG)
-                total_loss[loss_name] += loss_val * batch_size
             total_samples += batch_size
             self.progress.one_batch(loss_each)

     def train_one_epoch(self, dataloader):
         self.model.train()
+        total_loss = defaultdict(float)
         total_samples = 0
         self.optimizer.next_epoch(len(dataloader))
         for batch_size, images, targets, *_ in dataloader:
             for loss_name, loss_val in loss_each.items():
                 if self.use_ddp:  # collecting loss for each batch
                     distributed.all_reduce(loss_val, op=distributed.ReduceOp.AVG)
+                total_loss[loss_name] += loss_val.item() * batch_size
             total_samples += batch_size
             self.progress.one_batch(loss_each)