Spaces:

tidalove
/

yolox

Sleeping

App Files Files Community

Feng Wang commited on Mar 6, 2022

Commit

0c109d5

1 Parent(s): 6bae5e0

feat(utils): freeze module (#1156)

Browse files

Files changed (7) hide show

README.md +1 -0
docs/freeze_module.md +37 -0
tests/__init__.py +2 -0
tests/utils/test_model_utils.py +107 -0
yolox/core/trainer.py +6 -5
yolox/exp/yolox_base.py +1 -0
yolox/utils/model_utils.py +85 -6

README.md CHANGED Viewed

@@ -188,6 +188,7 @@ python -m yolox.tools.eval -n  yolox-s -c yolox_s.pth -b 1 -d 1 --conf 0.001 --f
 *  [Training on custom data](docs/train_custom_data.md)
 *  [Manipulating training image size](docs/manipulate_training_image_size.md)
 </details>

 *  [Training on custom data](docs/train_custom_data.md)
 *  [Manipulating training image size](docs/manipulate_training_image_size.md)
+*  [Freezing model](docs/freeze_module.md)
 </details>

docs/freeze_module.md ADDED Viewed

	@@ -0,0 +1,37 @@

+# Freeze module
+This page guide users to freeze module in YOLOX.
+Exp controls everything in YOLOX, so let's start from creating an Exp object.
+## 1. Create your own expermiment object
+We take an example of YOLOX-S model on COCO dataset to give a more clear guide.
+Import the config you want (or write your own Exp object inherit from `yolox.exp.BaseExp`).
+```python
+from yolox.exp.default.yolox_s import Exp as MyExp
+```
+## 2. Override `get_model` method
+Here is a simple code to freeze backbone (FPN not included) of module.
+```python
+class Exp(MyExp):
+    def get_model(self):
+        from yolox.utils import freeze_module
+        model = super().get_model()
+        freeze_module(model.backbone.backbone)
+        return model
+```
+if you only want to freeze FPN, `freeze_module(model.backbone)` might help.
+## 3. Train
+Suppose that the path of your Exp  is `/path/to/my_exp.py`, use the following command to train your model.
+```bash
+python3 -m yolox.tools.train -f /path/to/my_exp.py
+```
+For more details of training, run the following command.
+```bash
+python3 -m yolox.tools.train --help
+```

tests/__init__.py ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ #!/usr/bin/env python3
2	+ # -- coding:utf-8 --

tests/utils/test_model_utils.py ADDED Viewed

	@@ -0,0 +1,107 @@

+#!/usr/bin/env python3
+# -*- coding:utf-8 -*-
+# Copyright (c) Megvii, Inc. and its affiliates.
+import unittest
+import torch
+from torch import nn
+from yolox.utils import adjust_status, freeze_module
+from yolox.exp import get_exp
+class TestModelUtils(unittest.TestCase):
+    def setUp(self):
+        self.model: nn.Module = get_exp(exp_name="yolox-s").get_model()
+    def test_model_state_adjust_status(self):
+        data = torch.ones(1, 10, 10, 10)
+        # use bn since bn changes state during train/val
+        model = nn.BatchNorm2d(10)
+        prev_state = model.state_dict()
+        modes = [False, True]
+        results = [True, False]
+        # test under train/eval mode
+        for mode, result in zip(modes, results):
+            with adjust_status(model, training=mode):
+                model(data)
+            model_state = model.state_dict()
+            self.assertTrue(len(model_state) == len(prev_state))
+            self.assertEqual(
+                result,
+                all([torch.allclose(v, model_state[k]) for k, v in prev_state.items()])
+            )
+        # test recurrsive context case
+        prev_state = model.state_dict()
+        with adjust_status(model, training=False):
+            with adjust_status(model, training=False):
+                model(data)
+        model_state = model.state_dict()
+        self.assertTrue(len(model_state) == len(prev_state))
+        self.assertTrue(
+            all([torch.allclose(v, model_state[k]) for k, v in prev_state.items()])
+        )
+    def test_model_effect_adjust_status(self):
+        # test context effect
+        self.model.train()
+        with adjust_status(self.model, training=False):
+            for module in self.model.modules():
+                self.assertFalse(module.training)
+        # all training after exit
+        for module in self.model.modules():
+            self.assertTrue(module.training)
+        # only backbone set to eval
+        self.model.backbone.eval()
+        with adjust_status(self.model, training=False):
+            for module in self.model.modules():
+                self.assertFalse(module.training)
+        for name, module in self.model.named_modules():
+            if "backbone" in name:
+                self.assertFalse(module.training)
+            else:
+                self.assertTrue(module.training)
+    def test_freeze_module(self):
+        model = nn.Sequential(
+            nn.Conv2d(3, 10, 1),
+            nn.BatchNorm2d(10),
+            nn.ReLU(),
+        )
+        data = torch.rand(1, 3, 10, 10)
+        model.train()
+        assert isinstance(model[1], nn.BatchNorm2d)
+        before_states = model[1].state_dict()
+        freeze_module(model[1])
+        model(data)
+        after_states = model[1].state_dict()
+        self.assertTrue(
+            all([torch.allclose(v, after_states[k]) for k, v in before_states.items()])
+        )
+        # yolox test
+        self.model.train()
+        for module in self.model.modules():
+            self.assertTrue(module.training)
+        freeze_module(self.model, "backbone")
+        for module in self.model.backbone.modules():
+            self.assertFalse(module.training)
+        for p in self.model.backbone.parameters():
+            self.assertFalse(p.requires_grad)
+        for module in self.model.head.modules():
+            self.assertTrue(module.training)
+        for p in self.model.head.parameters():
+            self.assertTrue(p.requires_grad)
+if __name__ == "__main__":
+    unittest.main()

yolox/core/trainer.py CHANGED Viewed

@@ -16,6 +16,7 @@ from yolox.utils import (
     MeterBuffer,
     ModelEMA,
     WandbLogger,
     all_reduce_norm,
     get_local_rank,
     get_model_info,
@@ -169,7 +170,6 @@ class Trainer:
             self.ema_model.updates = self.max_iter * self.start_epoch
         self.model = model
-        self.model.train()
         self.evaluator = self.exp.get_evaluator(
             batch_size=self.args.batch_size, is_distributed=self.is_distributed
@@ -320,13 +320,14 @@ class Trainer:
             if is_parallel(evalmodel):
                 evalmodel = evalmodel.module
-        ap50_95, ap50, summary = self.exp.eval(
-            evalmodel, self.evaluator, self.is_distributed
-        )
         update_best_ckpt = ap50_95 > self.best_ap
         self.best_ap = max(self.best_ap, ap50_95)
-        self.model.train()
         if self.rank == 0:
             if self.args.logger == "tensorboard":
                 self.tblogger.add_scalar("val/COCOAP50", ap50, self.epoch + 1)

     MeterBuffer,
     ModelEMA,
     WandbLogger,
+    adjust_status,
     all_reduce_norm,
     get_local_rank,
     get_model_info,
             self.ema_model.updates = self.max_iter * self.start_epoch
         self.model = model
         self.evaluator = self.exp.get_evaluator(
             batch_size=self.args.batch_size, is_distributed=self.is_distributed
             if is_parallel(evalmodel):
                 evalmodel = evalmodel.module
+        with adjust_status(evalmodel, training=False):
+            ap50_95, ap50, summary = self.exp.eval(
+                evalmodel, self.evaluator, self.is_distributed
+            )
         update_best_ckpt = ap50_95 > self.best_ap
         self.best_ap = max(self.best_ap, ap50_95)
         if self.rank == 0:
             if self.args.logger == "tensorboard":
                 self.tblogger.add_scalar("val/COCOAP50", ap50, self.epoch + 1)

yolox/exp/yolox_base.py CHANGED Viewed

@@ -124,6 +124,7 @@ class Exp(BaseExp):
         self.model.apply(init_yolo)
         self.model.head.initialize_biases(1e-2)
         return self.model
     def get_data_loader(

         self.model.apply(init_yolo)
         self.model.head.initialize_biases(1e-2)
+        self.model.train()
         return self.model
     def get_data_loader(

yolox/utils/model_utils.py CHANGED Viewed

@@ -2,7 +2,9 @@
 # -*- coding:utf-8 -*-
 # Copyright (c) Megvii Inc. All rights reserved.
 from copy import deepcopy
 import torch
 import torch.nn as nn
@@ -13,11 +15,12 @@ __all__ = [
     "fuse_model",
     "get_model_info",
     "replace_module",
 ]
-def get_model_info(model, tsize):
     stride = 64
     img = torch.zeros((1, 3, stride, stride), device=next(model.parameters()).device)
     flops, params = profile(deepcopy(model), inputs=(img,), verbose=False)
@@ -28,8 +31,18 @@ def get_model_info(model, tsize):
     return info
-def fuse_conv_and_bn(conv, bn):
-    # Fuse convolution and batchnorm layers https://tehnokv.com/posts/fusing-batchnorm-and-conv/
     fusedconv = (
         nn.Conv2d(
             conv.in_channels,
@@ -63,7 +76,15 @@ def fuse_conv_and_bn(conv, bn):
     return fusedconv
-def fuse_model(model):
     from yolox.models.network_blocks import BaseConv
     for m in model.modules():
@@ -74,7 +95,7 @@ def fuse_model(model):
     return model
-def replace_module(module, replaced_module_type, new_module_type, replace_func=None):
     """
     Replace given type in module to a new type. mostly used in deploy.
@@ -104,3 +125,61 @@ def replace_module(module, replaced_module_type, new_module_type, replace_func=N
                 model.add_module(name, new_child)
     return model

 # -*- coding:utf-8 -*-
 # Copyright (c) Megvii Inc. All rights reserved.
+import contextlib
 from copy import deepcopy
+from typing import Sequence
 import torch
 import torch.nn as nn
     "fuse_model",
     "get_model_info",
     "replace_module",
+    "freeze_module",
+    "adjust_status",
 ]
+def get_model_info(model: nn.Module, tsize: Sequence[int]) -> str:
     stride = 64
     img = torch.zeros((1, 3, stride, stride), device=next(model.parameters()).device)
     flops, params = profile(deepcopy(model), inputs=(img,), verbose=False)
     return info
+def fuse_conv_and_bn(conv: nn.Conv2d, bn: nn.BatchNorm2d) -> nn.Conv2d:
+    """
+    Fuse convolution and batchnorm layers.
+    check more info on https://tehnokv.com/posts/fusing-batchnorm-and-conv/
+    Args:
+        conv (nn.Conv2d): convolution to fuse.
+        bn (nn.BatchNorm2d): batchnorm to fuse.
+    Returns:
+        nn.Conv2d: fused convolution behaves the same as the input conv and bn.
+    """
     fusedconv = (
         nn.Conv2d(
             conv.in_channels,
     return fusedconv
+def fuse_model(model: nn.Module) -> nn.Module:
+    """fuse conv and bn in model
+    Args:
+        model (nn.Module): model to fuse
+    Returns:
+        nn.Module: fused model
+    """
     from yolox.models.network_blocks import BaseConv
     for m in model.modules():
     return model
+def replace_module(module, replaced_module_type, new_module_type, replace_func=None) -> nn.Module:
     """
     Replace given type in module to a new type. mostly used in deploy.
                 model.add_module(name, new_child)
     return model
+def freeze_module(module: nn.Module, name=None) -> nn.Module:
+    """freeze module inplace
+    Args:
+        module (nn.Module): module to freeze.
+        name (str, optional): name to freeze. If not given, freeze the whole module.
+            Note that fuzzy match is not supported. Defaults to None.
+    Examples:
+        freeze the backbone of model
+        >>> freeze_moudle(model.backbone)
+        or freeze the backbone of model by name
+        >>> freeze_moudle(model, name="backbone")
+    """
+    for param_name, parameter in module.named_parameters():
+        if name is None or name in param_name:
+            parameter.requires_grad = False
+    # ensure module like BN and dropout are freezed
+    for module_name, sub_module in module.named_modules():
+        # actually there are no needs to call eval for every single sub_module
+        if name is None or name in module_name:
+            sub_module.eval()
+    return module
+@contextlib.contextmanager
+def adjust_status(module: nn.Module, training: bool = False) -> nn.Module:
+    """Adjust module to training/eval mode temporarily.
+    Args:
+        module (nn.Module): module to adjust status.
+        training (bool): training mode to set. True for train mode, False fro eval mode.
+    Examples:
+        >>> with adjust_status(model, training=False):
+        ...     model(data)
+    """
+    status = {}
+    def backup_status(module):
+        for m in module.modules():
+            # save prev status to dict
+            status[m] = m.training
+            m.training = training
+    def recover_status(module):
+        for m in module.modules():
+            # recover prev status from dict
+            m.training = status.pop(m)
+    backup_status(module)
+    yield module
+    recover_status(module)