feat(darknet): add Darknet53/FastDarknet53

zjykzj · May 18, 2023 · 2c772aa · 2c772aa
1 parent 4bb2aef
commit 2c772aa
Show file tree

Hide file tree

Showing 3 changed files with 200 additions and 2 deletions.
diff --git a/darknet/darknet.py → darknet/darknet19.py b/darknet/darknet.py → darknet/darknet19.py
diff --git a/darknet/darknet53.py b/darknet/darknet53.py
@@ -0,0 +1,188 @@
+# -*- coding: utf-8 -*-
+
+"""
+@date: 2023/1/7 下午12:26
+@file: darknet.py
+@author: zj
+@description: 
+"""
+
+import torch
+from torch import nn
+
+
+class ConvBNAct(nn.Module):
+
+    def __init__(self, in_ch: int, out_ch: int, kernel_size: int, stride: int):
+        super().__init__()
+        pad = (kernel_size - 1) // 2
+        # H_out = floor((H_in + 2 * Pad - Dilate * (Kernel - 1) - 1) / Stride + 1)
+        #       = floor((H_in + 2 * (Kernel - 1) // 2 - Dilate * (Kernel - 1) - 1) / Stride + 1)
+
+        self.conv = nn.Conv2d(in_channels=in_ch,
+                              out_channels=out_ch,
+                              kernel_size=(kernel_size, kernel_size),
+                              stride=(stride, stride),
+                              padding=pad,
+                              bias=False)
+        self.norm = nn.BatchNorm2d(out_ch)
+        self.act = nn.LeakyReLU(0.1, inplace=False)
+
+    def forward(self, x):
+        x = self.conv(x)
+        x = self.norm(x)
+        x = self.act(x)
+
+        return x
+
+
+class ResBlock(nn.Module):
+
+    def __init__(self, ch, num_blocks=1, shortcut=True):
+
+        super().__init__()
+        self.shortcut = shortcut
+        self.module_list = nn.ModuleList()
+        for i in range(num_blocks):
+            self.module_list.append(nn.Sequential(
+                # 1x1卷积，通道数减半，不改变空间尺寸
+                ConvBNAct(ch, ch // 2, 1, 1),
+                # 3x3卷积，通道数倍增，恢复原始大小，不改变空间尺寸
+                ConvBNAct(ch // 2, ch, 3, 1)
+            ))
+
+    def forward(self, x):
+        for module in self.module_list:
+            h = x
+            h = module(h)
+            x = x + h if self.shortcut else h
+        return x
+
+
+class DownSample(nn.Module):
+
+    def __init__(self, in_ch=32, out_ch=64, kernel_size=3, stride=2, num_blocks=1, shortcut=True):
+        super(DownSample, self).__init__()
+        self.conv = ConvBNAct(in_ch=in_ch, out_ch=out_ch, kernel_size=kernel_size, stride=stride)
+        self.res_block = ResBlock(ch=out_ch, num_blocks=num_blocks, shortcut=shortcut)
+
+    def forward(self, x):
+        x = self.conv(x)
+        x = self.res_block(x)
+
+        return x
+
+
+def make_stage(stage_cfg):
+    in_ch, out_ch, kernel_size, stride, num_blocks = stage_cfg
+    return DownSample(in_ch=in_ch, out_ch=out_ch, kernel_size=kernel_size, stride=stride, num_blocks=num_blocks)
+
+
+class Backbone(nn.Module):
+    cfg = {
+        'stage1': [32, 64, 3, 2, 1],
+        'stage2': [64, 128, 3, 2, 2],
+        'stage3': [128, 256, 3, 2, 8],
+        'stage4': [256, 512, 3, 2, 8],
+        'stage5': [512, 1024, 3, 2, 4],
+    }
+
+    fast_cfg = {
+        'stage1': [32, 64, 3, 2, 1],
+        'stage2': [64, 128, 3, 2, 1],
+        'stage3': [128, 256, 3, 2, 1],
+        'stage4': [256, 512, 3, 2, 1],
+        'stage5': [512, 1024, 3, 2, 1],
+    }
+
+    def __init__(self, in_channel=3, is_fast=False):
+        super(Backbone, self).__init__()
+        self.stem = ConvBNAct(in_ch=in_channel, out_ch=32, kernel_size=3, stride=1)
+
+        if is_fast:
+            cfg = self.fast_cfg
+        else:
+            cfg = self.cfg
+
+        self.stage1 = make_stage(cfg['stage1'])
+        self.stage2 = make_stage(cfg['stage2'])
+        self.stage3 = make_stage(cfg['stage3'])
+        self.stage4 = make_stage(cfg['stage4'])
+        self.stage5 = make_stage(cfg['stage5'])
+
+    def forward(self, x):
+        x = self.stem(x)
+
+        x = self.stage1(x)
+        x = self.stage2(x)
+        x = self.stage3(x)
+        x = self.stage4(x)
+        x = self.stage5(x)
+        return x
+
+
+class Darknet53(nn.Module):
+
+    def __init__(self, in_channel=3, num_classes=1000):
+        super(Darknet53, self).__init__()
+        self.backbone = Backbone(in_channel=in_channel, is_fast=False)
+        self.pool = nn.AdaptiveAvgPool2d((1, 1))
+        self.classifier = nn.Linear(1024, num_classes)
+
+    def forward(self, x):
+        x = self.backbone(x)
+        x = self.pool(x)
+        x = x.reshape(x.shape[:2])
+
+        x = self.classifier(x)
+        return x
+
+
+class FastDarknet53(nn.Module):
+
+    def __init__(self, in_channel=3, num_classes=1000):
+        super(FastDarknet53, self).__init__()
+        self.backbone = Backbone(in_channel=in_channel, is_fast=True)
+        self.pool = nn.AdaptiveAvgPool2d((1, 1))
+        self.classifier = nn.Linear(1024, num_classes)
+
+    def forward(self, x):
+        x = self.backbone(x)
+        x = self.pool(x)
+        x = x.reshape(x.shape[:2])
+
+        x = self.classifier(x)
+        return x
+
+
+if __name__ == '__main__':
+    data = torch.randn(1, 3, 224, 224)
+
+    print("=> Darknet53")
+    m = Darknet53(in_channel=3, num_classes=1000)
+    ckpt_path = 'weights/darknet59_224/model_best.pth.tar'
+    state_dict = torch.load(ckpt_path, map_location='cpu')
+    if 'state_dict' in state_dict:
+        state_dict = state_dict['state_dict']
+    state_dict = {k.replace('module.', ''): v for k, v in state_dict.items()}  # strip the names
+
+    m.load_state_dict(state_dict, strict=True)
+
+    m.train()
+    output = m(data)
+    print(output.shape)
+
+    m.eval()
+    output = m(data)
+    print(output.shape)
+
+    print("=> FastDarknet53")
+    m = FastDarknet53(in_channel=3, num_classes=1000)
+
+    m.train()
+    output = m(data)
+    print(output.shape)
+
+    m.eval()
+    output = m(data)
+    print(output.shape)
diff --git a/darknet/main_amp.py b/darknet/main_amp.py
@@ -47,6 +47,8 @@ def parse():
                          and callable(models.__dict__[name]))
     model_names.append('darknet19')
     model_names.append('fastdarknet19')
+    model_names.append('darknet53')
+    model_names.append('fastdarknet53')
 
     parser = argparse.ArgumentParser(description='PyTorch ImageNet Training')
     parser.add_argument('data', metavar='DIR',
@@ -148,12 +150,20 @@ def main():
     #     model = models.__dict__[args.arch]()
     if args.arch == 'darknet19':
         print("=> creating model Darknet19")
-        from darknet import Darknet19
+        from darknet19 import Darknet19
         model = Darknet19(num_classes=1000)
     elif args.arch == 'fastdarknet19':
         print("=> creating model FastDarknet19")
-        from darknet import FastDarknet19
+        from darknet19 import FastDarknet19
         model = FastDarknet19(num_classes=1000)
+    elif args.arch == 'fastdarknet19':
+        print("=> creating model Darknet53")
+        from darknet53 import Darknet53
+        model = Darknet53(num_classes=1000)
+    elif args.arch == 'fastdarknet19':
+        print("=> creating model FastDarknet53")
+        from darknet53 import FastDarknet53
+        model = FastDarknet53(num_classes=1000)
     else:
         raise ValueError(f"{args.arch} doesn't supports")