Spaces:

ahmedghani
/

Image-Classification-on-CIFAR10

Build error

App Files Files Community

ahmedghani commited on Dec 3, 2022

Commit

18fc351

1 Parent(s): e8f5478

adding model files

Browse files

Files changed (27) hide show

README.md +1 -1
Resnet101.py +98 -0
app.py +75 -0
requirements.txt +5 -0
resnet101_ckpt.pth +3 -0
samples/car1.jpg +0 -0
samples/car2.jpeg +0 -0
samples/car3.jpg +0 -0
samples/car4.jpg +0 -0
samples/car5.jpg +0 -0
samples/cat1.jpg +0 -0
samples/cat2.jpg +0 -0
samples/cat3.jpeg +0 -0
samples/cat4.png +0 -0
samples/cat5.jpg +0 -0
samples/dog1.jpeg +0 -0
samples/dog2.jpg +0 -0
samples/dog3.jpg +0 -0
samples/dog4.jpg +0 -0
samples/dog5.jpg +0 -0
samples/horse1.jpg +0 -0
samples/horse2.jpg +0 -0
samples/horse3.jpeg +0 -0
samples/horse4.jpg +0 -0
samples/horse5.jpg +0 -0
samples/not-found.jpg +0 -0
train.py +125 -0

README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 ---
 title: Image Classification On CIFAR10
-emoji: 🔥
 colorFrom: pink
 colorTo: blue
 sdk: gradio

 ---
 title: Image Classification On CIFAR10
+emoji: 📷
 colorFrom: pink
 colorTo: blue
 sdk: gradio

Resnet101.py ADDED Viewed

	@@ -0,0 +1,98 @@

+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+from PIL import Image
+import torchvision.transforms as transforms
+class BasicBlock(nn.Module):
+    expansion = 1
+    def __init__(self, in_planes, planes, stride=1):
+        super(BasicBlock, self).__init__()
+        self.conv1 = nn.Conv2d(in_planes, planes, kernel_size=3, stride=stride, padding=1, bias=False)
+        self.bn1 = nn.BatchNorm2d(planes)
+        self.conv2 = nn.Conv2d(planes, planes, kernel_size=3, stride=1, padding=1, bias=False)
+        self.bn2 = nn.BatchNorm2d(planes)
+        self.shortcut = nn.Sequential()
+        if stride != 1 or in_planes != self.expansion*planes:
+            self.shortcut = nn.Sequential(
+                nn.Conv2d(in_planes, self.expansion*planes, kernel_size=1, stride=stride, bias=False),
+                nn.BatchNorm2d(self.expansion*planes)
+            )
+    def forward(self, x):
+        out = F.relu(self.bn1(self.conv1(x)))
+        out = self.bn2(self.conv2(out))
+        out += self.shortcut(x)
+        out = F.relu(out)
+        return out
+class Bottleneck(nn.Module):
+    expansion = 4
+    def __init__(self, in_planes, planes, stride=1):
+        super(Bottleneck, self).__init__()
+        self.conv1 = nn.Conv2d(in_planes, planes, kernel_size=1, bias=False)
+        self.bn1 = nn.BatchNorm2d(planes)
+        self.conv2 = nn.Conv2d(planes, planes, kernel_size=3, stride=stride, padding=1, bias=False)
+        self.bn2 = nn.BatchNorm2d(planes)
+        self.conv3 = nn.Conv2d(planes, self.expansion*planes, kernel_size=1, bias=False)
+        self.bn3 = nn.BatchNorm2d(self.expansion*planes)
+        self.shortcut = nn.Sequential()
+        if stride != 1 or in_planes != self.expansion*planes:
+            self.shortcut = nn.Sequential(
+                nn.Conv2d(in_planes, self.expansion*planes, kernel_size=1, stride=stride, bias=False),
+                nn.BatchNorm2d(self.expansion*planes)
+            )
+    def forward(self, x):
+        out = F.relu(self.bn1(self.conv1(x)))
+        out = F.relu(self.bn2(self.conv2(out)))
+        out = self.bn3(self.conv3(out))
+        out += self.shortcut(x)
+        out = F.relu(out)
+        return out
+class ResNet(nn.Module):
+    def __init__(self, block, num_blocks, num_classes=10):
+        super(ResNet, self).__init__()
+        self.in_planes = 64
+        self.conv1 = nn.Conv2d(3, 64, kernel_size=3, stride=1, padding=1, bias=False)
+        self.bn1 = nn.BatchNorm2d(64)
+        self.layer1 = self._make_layer(block, 64, num_blocks[0], stride=1)
+        self.layer2 = self._make_layer(block, 128, num_blocks[1], stride=2)
+        self.layer3 = self._make_layer(block, 256, num_blocks[2], stride=2)
+        self.layer4 = self._make_layer(block, 512, num_blocks[3], stride=2)
+        self.linear = nn.Linear(512*block.expansion, num_classes)
+        if block == BasicBlock:
+            self.name = "resnet" + str(sum(num_blocks) * 2 + 2)
+        else:
+            self.name = "resnet" + str(sum(num_blocks) * 3 + 2)
+    def _make_layer(self, block, planes, num_blocks, stride):
+        strides = [stride] + [1]*(num_blocks-1)
+        layers = []
+        for stride in strides:
+            layers.append(block(self.in_planes, planes, stride))
+            self.in_planes = planes * block.expansion
+        return nn.Sequential(*layers)
+    def forward(self, x):
+        out = F.relu(self.bn1(self.conv1(x)))
+        out = self.layer1(out)
+        out = self.layer2(out)
+        out = self.layer3(out)
+        out = self.layer4(out)
+        out = F.avg_pool2d(out, 4)
+        out = out.view(out.size(0), -1)
+        out = self.linear(out)
+        return out
+def ResNet101():
+    return ResNet(Bottleneck, [3,4,23,3])

app.py ADDED Viewed

	@@ -0,0 +1,75 @@

+from Resnet101 import *
+import gradio as gr
+from PIL import Image
+print("Loading Resnet101 model...")
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+model = torch.load("resnet101_ckpt.pth", map_location=device)
+net = ResNet101()
+net.to(device)
+net = torch.nn.DataParallel(net)
+net.load_state_dict(model['net'])
+print("Model loaded")
+print("Device: ", device)
+# Define a transform to convert the image to tensor
+transform = transforms.Compose([
+        transforms.Resize([32, 32]),
+        transforms.ToTensor(),
+        transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
+    ])
+def predict_image(image):
+    # Convert the image to PyTorch tensor
+    img_tensor = transform(Image.fromarray(image))
+    img_tensor.to(device)
+    with torch.no_grad():
+        outputs = net(img_tensor[None, ...])
+        _, predicted = outputs.max(1)
+        classes = ['plane', 'car', 'bird', 'cat', 'deer',
+           'dog', 'frog', 'horse', 'ship', 'truck']
+        res = classes[predicted[0].item()]
+        print("Predicted class: ", res)
+        if res == 'car':
+            return Image.open("samples/car2.jpeg"), Image.open("samples/car3.jpg"), Image.open("samples/car4.jpg"), Image.open("samples/car5.jpg")
+        elif res == 'cat':
+            return Image.open("samples/cat2.jpg"), Image.open("samples/cat3.jpeg"), Image.open("samples/cat4.png"), Image.open("samples/cat5.jpg")
+        elif res == 'dog':
+            return Image.open("samples/dog2.jpg"), Image.open("samples/dog3.jpg"), Image.open("samples/dog4.jpg"), Image.open("samples/dog5.jpg")
+        elif res == 'horse':
+            return Image.open("samples/horse2.jpg"), Image.open("samples/horse3.jpeg"), Image.open("samples/horse4.jpg"), Image.open("samples/horse5.jpg")
+        else:
+            return Image.open("samples/not-found.jpg"), Image.open("samples/not-found.jpg"), Image.open("samples/not-found.jpg"), Image.open("samples/not-found.jpg")
+def set_example_image(example: list) -> dict:
+    return gr.Image.update(value=example[0])
+demo = gr.Blocks()
+with demo:
+    gr.Markdown('''
+    <center>
+    <h1>Image Classification trained on Resnet101</h1>
+    <p>
+    Image classification model trained on Resnet101. The dataset used is the CIFAR-10 dataset.
+    It will detect 4 classes of images: car, cat, dog and horse. Then it will show you 4 images of the same class.
+    </p>
+    </center>
+    ''')
+    with gr.Row():
+        input_image = gr.Image(label="Input image")
+    with gr.Row():
+        output_imgs = [gr.Image(label='Closest Image 1', type='numpy', interactive=False),
+                        gr.Image(label='Closest Image 2', type='numpy', interactive=False),
+                        gr.Image(label='Closest Image 3', type='numpy', interactive=False),
+                        gr.Image(label='Closest Image 4', type='numpy', interactive=False)]
+    button = gr.Button("Classifier")
+    with gr.Row():
+        example_images = gr.Dataset(components=[input_image],
+                                    samples=[["samples/cat1.jpg"], ["samples/car1.jpg"], ["samples/dog1.jpeg"], ["samples/horse1.jpg"]])
+    example_images.click(fn=set_example_image, inputs=example_images, outputs=example_images.components)
+    button.click(predict_image, inputs=input_image, outputs=output_imgs)
+demo.launch(debug=True)

requirements.txt ADDED Viewed

	@@ -0,0 +1,5 @@

+torch
+torchvision
+torchaudio
+opencv-python
+gradio

resnet101_ckpt.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:57f0c7486996c89c17d88249ab1a3620da4affb29f9dfa86917bf96028a8b0bc
+size 170593359

samples/car1.jpg ADDED Viewed

samples/car2.jpeg ADDED Viewed

samples/car3.jpg ADDED Viewed

samples/car4.jpg ADDED Viewed

samples/car5.jpg ADDED Viewed

samples/cat1.jpg ADDED Viewed

samples/cat2.jpg ADDED Viewed

samples/cat3.jpeg ADDED Viewed

samples/cat4.png ADDED Viewed

samples/cat5.jpg ADDED Viewed

samples/dog1.jpeg ADDED Viewed

samples/dog2.jpg ADDED Viewed

samples/dog3.jpg ADDED Viewed

samples/dog4.jpg ADDED Viewed

samples/dog5.jpg ADDED Viewed

samples/horse1.jpg ADDED Viewed

samples/horse2.jpg ADDED Viewed

samples/horse3.jpeg ADDED Viewed

samples/horse4.jpg ADDED Viewed

samples/horse5.jpg ADDED Viewed

samples/not-found.jpg ADDED Viewed

train.py ADDED Viewed

	@@ -0,0 +1,125 @@

+'''Train CIFAR10 with PyTorch.'''
+import torch
+import torch.nn as nn
+import torch.optim as optim
+import torch.nn.functional as F
+import torch.backends.cudnn as cudnn
+import torchvision
+import torchvision.transforms as transforms
+import os
+from Resnet101 import *
+device = 'cuda' if torch.cuda.is_available() else 'cpu'
+best_acc = 0  # best test accuracy
+start_epoch = 0  # start from epoch 0 or last checkpoint epoch
+end_epoch  = 300
+resume = False
+# Data
+print('==> Preparing data..')
+transform_train = transforms.Compose([
+    transforms.RandomCrop(32, padding=4),
+    transforms.RandomHorizontalFlip(),
+    transforms.ToTensor(),
+    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
+])
+transform_test = transforms.Compose([
+    transforms.ToTensor(),
+    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
+])
+trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform_train)
+trainloader = torch.utils.data.DataLoader(trainset, batch_size=128, shuffle=True, num_workers=2)
+testset = torchvision.datasets.CIFAR10(root='./data', train=False, download=True, transform=transform_test)
+testloader = torch.utils.data.DataLoader(testset, batch_size=100, shuffle=False, num_workers=2)
+classes = ('plane', 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck')
+# Model
+print('==> Building model..')
+net = ResNet101()
+net_name = net.name
+save_path = './checkpoint/{0}_ckpt.pth'.format(net.name)
+net = net.to(device)
+if device == 'cuda':
+    net = torch.nn.DataParallel(net)
+    cudnn.benchmark = True
+if resume:
+    # Load best checkpoint trained last time.
+    print('==> Resuming from checkpoint..')
+    assert os.path.isdir('checkpoint'), 'Error: no checkpoint directory found!'
+    checkpoint = torch.load(save_path)
+    net.load_state_dict(checkpoint['net'])
+    best_acc = checkpoint['acc']
+    start_epoch = checkpoint['epoch']
+criterion = nn.CrossEntropyLoss()
+optimizer = optim.SGD(net.parameters(), lr=0.1, momentum=0.9, weight_decay=5e-4)
+scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=70, gamma=0.1)
+# Training
+def train(epoch):
+    print('\nEpoch: %d' % epoch)
+    net.train()
+    train_loss = 0
+    correct = 0
+    total = 0
+    for batch_idx, (inputs, targets) in enumerate(trainloader):
+        inputs, targets = inputs.to(device), targets.to(device)
+        optimizer.zero_grad()
+        outputs = net(inputs)
+        loss = criterion(outputs, targets)
+        loss.backward()
+        optimizer.step()
+        train_loss += loss.item()
+        _, predicted = outputs.max(1)
+        total += targets.size(0)
+        correct += predicted.eq(targets).sum().item()
+        print('Loss: %.3f | Acc: %.3f%% (%d/%d)' % (train_loss/(batch_idx+1), 100.*correct/total, correct, total))
+def test(epoch):
+    global best_acc
+    net.eval()
+    test_loss = 0
+    correct = 0
+    total = 0
+    with torch.no_grad():
+        for batch_idx, (inputs, targets) in enumerate(testloader):
+            inputs, targets = inputs.to(device), targets.to(device)
+            outputs = net(inputs)
+            loss = criterion(outputs, targets)
+            test_loss += loss.item()
+            _, predicted = outputs.max(1)
+            total += targets.size(0)
+            correct += predicted.eq(targets).sum().item()
+            print('Loss: %.3f | Acc: %.3f%% (%d/%d)' % (test_loss/(batch_idx+1), 100.*correct/total, correct, total))
+    # Save checkpoint.
+    acc = 100.*correct/total
+    if acc > best_acc:
+        print('Saving ' + net_name + ' ..')
+        state = {
+            'net': net.state_dict(),
+            'acc': acc,
+            'epoch': epoch,
+        }
+        if not os.path.isdir('checkpoint'):
+            os.mkdir('checkpoint')
+        torch.save(state, save_path)
+        best_acc = acc
+for epoch in range(start_epoch, end_epoch):
+    train(epoch)
+    test(epoch)
+    scheduler.step()
+print("\nTesting best accuracy:", best_acc)