Spaces:

xiang-wuu
/

yolov5

Runtime error

App Files Files Community

Ayush Chaurasia

glenn-jocher commited on Nov 14, 2021

Commit

540ef0d

unverified ·

1 Parent(s): 80cfaf4

W&B refactor, handle exceptions, CI example (#5618)

Browse files

* handle exceptions| attempt CI

* update

* Pre-commit manual run

* yaml one-liner

* Update ci-testing.yml

* Comment W&B CI

Leave as example for future separate CI

* Update ci-testing.yml

Co-authored-by: Glenn Jocher <[email protected]>

Files changed (3) hide show

.github/workflows/ci-testing.yml +4 -1
utils/loggers/wandb/log_dataset.py +4 -0
utils/loggers/wandb/wandb_utils.py +11 -5

.github/workflows/ci-testing.yml CHANGED Viewed

@@ -51,12 +51,15 @@ jobs:
         run: |
           python -m pip install --upgrade pip
           pip install -qr requirements.txt -f https://download.pytorch.org/whl/cpu/torch_stable.html
-          pip install -q onnx tensorflow-cpu keras==2.6.0  # for export
           python --version
           pip --version
           pip list
         shell: bash
       - name: Download data
         run: |
           # curl -L -o tmp.zip https://github.com/ultralytics/yolov5/releases/download/v1.0/coco128.zip

         run: |
           python -m pip install --upgrade pip
           pip install -qr requirements.txt -f https://download.pytorch.org/whl/cpu/torch_stable.html
+          pip install -q onnx tensorflow-cpu keras==2.6.0  # wandb  # extras
           python --version
           pip --version
           pip list
         shell: bash
+      # - name: W&B login
+      #   run: wandb login 345011b3fb26dc8337fd9b20e53857c1d403f2aa
       - name: Download data
         run: |
           # curl -L -o tmp.zip https://github.com/ultralytics/yolov5/releases/download/v1.0/coco128.zip

utils/loggers/wandb/log_dataset.py CHANGED Viewed

@@ -2,11 +2,15 @@ import argparse
 from wandb_utils import WandbLogger
 WANDB_ARTIFACT_PREFIX = 'wandb-artifact://'
 def create_dataset_artifact(opt):
     logger = WandbLogger(opt, None, job_type='Dataset Creation')  # TODO: return value unused
 if __name__ == '__main__':

 from wandb_utils import WandbLogger
+from utils.general import LOGGER
 WANDB_ARTIFACT_PREFIX = 'wandb-artifact://'
 def create_dataset_artifact(opt):
     logger = WandbLogger(opt, None, job_type='Dataset Creation')  # TODO: return value unused
+    if not logger.wandb:
+        LOGGER.info("install wandb using `pip install wandb` to log the dataset")
 if __name__ == '__main__':

utils/loggers/wandb/wandb_utils.py CHANGED Viewed

@@ -17,7 +17,7 @@ if str(ROOT) not in sys.path:
     sys.path.append(str(ROOT))  # add ROOT to PATH
 from utils.datasets import LoadImagesAndLabels, img2label_paths
-from utils.general import check_dataset, check_file
 try:
     import wandb
@@ -203,7 +203,7 @@ class WandbLogger():
         config_path = self.log_dataset_artifact(opt.data,
                                                 opt.single_cls,
                                                 'YOLOv5' if opt.project == 'runs/train' else Path(opt.project).stem)
-        print("Created dataset config file ", config_path)
         with open(config_path, errors='ignore') as f:
             wandb_data_dict = yaml.safe_load(f)
         return wandb_data_dict
@@ -316,7 +316,7 @@ class WandbLogger():
         model_artifact.add_file(str(path / 'last.pt'), name='last.pt')
         wandb.log_artifact(model_artifact,
                            aliases=['latest', 'last', 'epoch ' + str(self.current_epoch), 'best' if best_model else ''])
-        print("Saving model artifact on epoch ", epoch + 1)
     def log_dataset_artifact(self, data_file, single_cls, project, overwrite_config=False):
         """
@@ -368,7 +368,7 @@ class WandbLogger():
         Useful for - referencing artifacts for evaluation.
         """
         self.val_table_path_map = {}
-        print("Mapping dataset")
         for i, data in enumerate(tqdm(self.val_table.data)):
             self.val_table_path_map[data[3]] = data[0]
@@ -488,7 +488,13 @@ class WandbLogger():
             with all_logging_disabled():
                 if self.bbox_media_panel_images:
                     self.log_dict["BoundingBoxDebugger"] = self.bbox_media_panel_images
-                wandb.log(self.log_dict)
                 self.log_dict = {}
                 self.bbox_media_panel_images = []
             if self.result_artifact:

     sys.path.append(str(ROOT))  # add ROOT to PATH
 from utils.datasets import LoadImagesAndLabels, img2label_paths
+from utils.general import LOGGER, check_dataset, check_file
 try:
     import wandb
         config_path = self.log_dataset_artifact(opt.data,
                                                 opt.single_cls,
                                                 'YOLOv5' if opt.project == 'runs/train' else Path(opt.project).stem)
+        LOGGER.info(f"Created dataset config file {config_path}")
         with open(config_path, errors='ignore') as f:
             wandb_data_dict = yaml.safe_load(f)
         return wandb_data_dict
         model_artifact.add_file(str(path / 'last.pt'), name='last.pt')
         wandb.log_artifact(model_artifact,
                            aliases=['latest', 'last', 'epoch ' + str(self.current_epoch), 'best' if best_model else ''])
+        LOGGER.info(f"Saving model artifact on epoch {epoch + 1}")
     def log_dataset_artifact(self, data_file, single_cls, project, overwrite_config=False):
         """
         Useful for - referencing artifacts for evaluation.
         """
         self.val_table_path_map = {}
+        LOGGER.info("Mapping dataset")
         for i, data in enumerate(tqdm(self.val_table.data)):
             self.val_table_path_map[data[3]] = data[0]
             with all_logging_disabled():
                 if self.bbox_media_panel_images:
                     self.log_dict["BoundingBoxDebugger"] = self.bbox_media_panel_images
+                try:
+                    wandb.log(self.log_dict)
+                except BaseException as e:
+                    LOGGER.info(f"An error occurred in wandb logger. The training will proceed without interruption. More info\n{e}")
+                    self.wandb_run.finish()
+                    self.wandb_run = None
                 self.log_dict = {}
                 self.bbox_media_panel_images = []
             if self.result_artifact: