Spaces:

atiwari751
/

ResNet50-image-classifier-app

Sleeping

App Files Files Community

atiwari751 commited on Jan 4

Commit

15b2f03

unverified ·

2 Parent(s): d79160e 6e2d47c

Merge pull request #2 from shrits-ai/main

Browse files

Files changed (4) hide show

.gitignore +2 -0
README.md +26 -0
resnet_execute.py +125 -26
tmppl87qjev/_remote_module_non_scriptable.py +81 -0

.gitignore CHANGED Viewed

@@ -3,4 +3,6 @@ data/
 __pycache__
 ResNet 50_Model.xlsx
 ~$ResNet 50_Model.xlsx

 __pycache__
 ResNet 50_Model.xlsx
 ~$ResNet 50_Model.xlsx
+checkpoint.pth

README.md CHANGED Viewed

@@ -6,6 +6,32 @@
 ## Data Augmentations
 ## Model Results

 ## Data Augmentations
+To enhance the model's robustness and generalization capabilities, we apply a series of data augmentations to the training dataset. These augmentations are inspired by the original ResNet paper and implemented using the albumentations library. The augmentations include random resized cropping, horizontal flipping, and color jittering, followed by normalization. These transformations help the model learn invariant features and improve performance on unseen data.
+### Augmentations and Hyperparameters
+1. **Random Resized Crop:**
+   - Height: 224
+   - Width: 224
+   - Scale: (0.08, 1.0)
+   - Aspect Ratio: (3/4, 4/3)
+   - Probability: 1.0
+2. **Horizontal Flip:**
+   - Probability: 0.5
+3. **Color Jitter:**
+   - Brightness: 0.4
+   - Contrast: 0.4
+   - Saturation: 0.4
+   - Hue: 0.1
+   - Probability: 0.8
+4. **Normalization:**
+   - Mean: (0.485, 0.456, 0.406)
+   - Standard Deviation: (0.229, 0.224, 0.225)
+These augmentations are applied only to the training dataset, while the test dataset undergoes resizing and normalization to ensure consistent evaluation metrics.
 ## Model Results

resnet_execute.py CHANGED Viewed

@@ -8,39 +8,55 @@ from resnet_model import ResNet50
 from tqdm import tqdm
 from torchvision import datasets
 from checkpoint import save_checkpoint, load_checkpoint
 # Define transformations
-transform = transforms.Compose([
-    transforms.Resize(256),  # Resize the smaller side to 256 pixels while keeping aspect ratio
-    transforms.CenterCrop(224),  # Then crop to 224x224 pixels from the center
-    transforms.ToTensor(),
-    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])  # ImageNet normalization
 ])
 # Train dataset and loader
-trainset = datasets.ImageFolder(root='/mnt/imagenet/ILSVRC/Data/CLS-LOC/train', transform=transform)
-trainloader = DataLoader(trainset, batch_size=128, shuffle=True, num_workers=16, pin_memory=True)
-testset = datasets.ImageFolder(root='/mnt/imagenet/ILSVRC/Data/CLS-LOC/val', transform=transform )
-testloader = DataLoader(testset, batch_size=1000, shuffle=False, num_workers=16, pin_memory=True)
 # Initialize model, loss function, and optimizer
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model = ResNet50()
 model = torch.nn.DataParallel(model)
 model = model.to(device)
 criterion = nn.CrossEntropyLoss()
 optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9, weight_decay=5e-4)
 # Training function
 from torch.amp import autocast
-from tqdm import tqdm
 def train(model, device, train_loader, optimizer, criterion, epoch, accumulation_steps=4):
     model.train()
     running_loss = 0.0
-    correct = 0
     total = 0
     pbar = tqdm(train_loader)
@@ -58,24 +74,28 @@ def train(model, device, train_loader, optimizer, criterion, epoch, accumulation
             optimizer.zero_grad()
         running_loss += loss.item() * accumulation_steps
-        _, predicted = outputs.max(1)
         total += targets.size(0)
-        correct += predicted.eq(targets).sum().item()
-        pbar.set_description(desc=f'Epoch {epoch} | Loss: {running_loss / (batch_idx + 1):.4f} | Accuracy: {100. * correct / total:.2f}%')
         if (batch_idx + 1) % 50 == 0:
             torch.cuda.empty_cache()
-    return 100. * correct / total
 # Testing function
 def test(model, device, test_loader, criterion):
     model.eval()
     test_loss = 0
-    correct = 0
     total = 0
     with torch.no_grad():
         for inputs, targets in test_loader:
@@ -84,13 +104,22 @@ def test(model, device, test_loader, criterion):
             loss = criterion(outputs, targets)
             test_loss += loss.item()
-            _, predicted = outputs.max(1)
             total += targets.size(0)
-            correct += predicted.eq(targets).sum().item()
-    test_accuracy = 100.*correct/total
-    print(f'Test Loss: {test_loss/len(test_loader):.4f}, Accuracy: {test_accuracy:.2f}%')
-    return test_accuracy, test_loss/len(test_loader)
 # Main execution
 if __name__ == '__main__':
@@ -105,10 +134,19 @@ if __name__ == '__main__':
     except FileNotFoundError:
         print("No checkpoint found, starting from scratch.")
-    for epoch in range(1, 6):  # 20 epochs
-        train_accuracy = train(model, device, trainloader, optimizer, criterion, epoch)
-        test_accuracy, test_loss = test(model, device, testloader, criterion)
-        print(f'Epoch {epoch} | Train Accuracy: {train_accuracy:.2f}% | Test Accuracy: {test_accuracy:.2f}%')
         if test_loss < best_loss:
             best_loss = test_loss
             patience_counter = 0
@@ -119,3 +157,64 @@ if __name__ == '__main__':
         if patience_counter >= patience:
             print("Early stopping triggered. Training terminated.")
             break

 from tqdm import tqdm
 from torchvision import datasets
 from checkpoint import save_checkpoint, load_checkpoint
+import matplotlib.pyplot as plt
+from torchvision.utils import make_grid
+import albumentations as A
+from albumentations.pytorch import ToTensorV2
+import numpy as np
+from torchsummary import summary
 # Define transformations
+train_transform = A.Compose([
+    A.RandomResizedCrop(height=224, width=224, scale=(0.08, 1.0), ratio=(3/4, 4/3), p=1.0),
+    A.HorizontalFlip(p=0.5),
+    A.ColorJitter(brightness=0.4, contrast=0.4, saturation=0.4, hue=0.1, p=0.8),
+    A.Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225)),
+    ToTensorV2()
+])
+test_transform = A.Compose([
+    A.Resize(height=256, width=256),
+    A.CenterCrop(height=224, width=224),
+    A.Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225)),
+    ToTensorV2()
 ])
 # Train dataset and loader
+trainset = datasets.ImageFolder(root='/mnt/imagenet/ILSVRC/Data/CLS-LOC/train', transform=lambda img: train_transform(image=np.array(img))['image'])
+trainloader = DataLoader(trainset, batch_size=128, shuffle=True, num_workers=8, pin_memory=True)
+testset = datasets.ImageFolder(root='/mnt/imagenet/ILSVRC/Data/CLS-LOC/val', transform=lambda img: test_transform(image=np.array(img))['image'])
+testloader = DataLoader(testset, batch_size=500, shuffle=False, num_workers=8, pin_memory=True)
 # Initialize model, loss function, and optimizer
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+print( device )
 model = ResNet50()
 model = torch.nn.DataParallel(model)
 model = model.to(device)
+summary(model, input_size=(3, 224, 224))
 criterion = nn.CrossEntropyLoss()
 optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9, weight_decay=5e-4)
 # Training function
 from torch.amp import autocast
 def train(model, device, train_loader, optimizer, criterion, epoch, accumulation_steps=4):
     model.train()
     running_loss = 0.0
+    correct1 = 0
+    correct5 = 0
     total = 0
     pbar = tqdm(train_loader)
             optimizer.zero_grad()
         running_loss += loss.item() * accumulation_steps
+        _, predicted = outputs.topk(5, 1, True, True)
         total += targets.size(0)
+        correct1 += predicted[:, :1].eq(targets.view(-1, 1).expand_as(predicted[:, :1])).sum().item()
+        correct5 += predicted.eq(targets.view(-1, 1).expand_as(predicted)).sum().item()
+        pbar.set_description(desc=f'Epoch {epoch} | Loss: {running_loss / (batch_idx + 1):.4f} | Top-1 Acc: {100. * correct1 / total:.2f} | Top-5 Acc: {100. * correct5 / total:.2f}')
         if (batch_idx + 1) % 50 == 0:
             torch.cuda.empty_cache()
+    return 100. * correct1 / total, 100. * correct5 / total, running_loss / len(train_loader)
 # Testing function
 def test(model, device, test_loader, criterion):
     model.eval()
     test_loss = 0
+    correct1 = 0
+    correct5 = 0
     total = 0
+    misclassified_images = []
+    misclassified_labels = []
+    misclassified_preds = []
     with torch.no_grad():
         for inputs, targets in test_loader:
             loss = criterion(outputs, targets)
             test_loss += loss.item()
+            _, predicted = outputs.topk(5, 1, True, True)
             total += targets.size(0)
+            correct1 += predicted[:, :1].eq(targets.view(-1, 1).expand_as(predicted[:, :1])).sum().item()
+            correct5 += predicted.eq(targets.view(-1, 1).expand_as(predicted)).sum().item()
+            # Collect misclassified samples
+            for i in range(inputs.size(0)):
+                if targets[i] not in predicted[i, :1]:
+                    misclassified_images.append(inputs[i].cpu())
+                    misclassified_labels.append(targets[i].cpu())
+                    misclassified_preds.append(predicted[i, :1].cpu())
+    test_accuracy1 = 100. * correct1 / total
+    test_accuracy5 = 100. * correct5 / total
+    print(f'Test Loss: {test_loss/len(test_loader):.4f}, Top-1 Accuracy: {test_accuracy1:.2f}, Top-5 Accuracy: {test_accuracy5:.2f}')
+    return test_accuracy1, test_accuracy5, test_loss / len(test_loader), misclassified_images, misclassified_labels, misclassified_preds
 # Main execution
 if __name__ == '__main__':
     except FileNotFoundError:
         print("No checkpoint found, starting from scratch.")
+    # Store results for each epoch
+    results = []
+    learning_rates = []
+    for epoch in range(1, 26):  # 20 epochs
+        train_accuracy1, train_accuracy5, train_loss = train(model, device, trainloader, optimizer, criterion, epoch)
+        test_accuracy1, test_accuracy5, test_loss, misclassified_images, misclassified_labels, misclassified_preds = test(model, device, testloader, criterion)
+        print(f'Epoch {epoch} | Train Top-1 Acc: {train_accuracy1:.2f} | Train Top-5 Acc: {train_accuracy5:.2f} | Test Top-1 Acc: {test_accuracy1:.2f} | Test Top-5 Acc: {test_accuracy5:.2f}')
+        # Append results for this epoch
+        results.append((epoch, train_accuracy1, train_accuracy5, test_accuracy1, test_accuracy5, train_loss, test_loss))
+        learning_rates.append(optimizer.param_groups[0]['lr'])
         if test_loss < best_loss:
             best_loss = test_loss
             patience_counter = 0
         if patience_counter >= patience:
             print("Early stopping triggered. Training terminated.")
             break
+        # Only process misclassified samples after the last epoch
+        if epoch == 25:
+            # Display or process misclassified samples
+            if misclassified_images:
+                print("\nDisplaying some misclassified samples from the last epoch:")
+                misclassified_grid = make_grid(misclassified_images[:16], nrow=4, normalize=True, scale_each=True)
+                plt.figure(figsize=(8, 8))
+                plt.imshow(misclassified_grid.permute(1, 2, 0))
+                plt.title("Misclassified Samples")
+                plt.axis('off')
+                plt.show()
+    # Print the Top-1 accuracy results in a tab-separated format
+    print("\nEpoch\tTrain Top-1 Accuracy\tTest Top-1 Accuracy")
+    for epoch, train_acc1, test_acc1, *_ in results:
+        print(f"{epoch}\t{train_acc1:.2f}\t{test_acc1:.2f}")
+    # Plotting
+    epochs = [r[0] for r in results]
+    train_acc1 = [r[1] for r in results]
+    train_acc5 = [r[2] for r in results]
+    test_acc1 = [r[3] for r in results]
+    test_acc5 = [r[4] for r in results]
+    train_losses = [r[5] for r in results]
+    test_losses = [r[6] for r in results]
+    plt.figure(figsize=(12, 8))
+    plt.subplot(2, 2, 1)
+    plt.plot(epochs, train_acc1, label='Train Top-1 Acc')
+    plt.plot(epochs, test_acc1, label='Test Top-1 Acc')
+    plt.xlabel('Epoch')
+    plt.ylabel('Accuracy')
+    plt.legend()
+    plt.title('Top-1 Accuracy')
+    plt.subplot(2, 2, 2)
+    plt.plot(epochs, train_acc5, label='Train Top-5 Acc')
+    plt.plot(epochs, test_acc5, label='Test Top-5 Acc')
+    plt.xlabel('Epoch')
+    plt.ylabel('Accuracy')
+    plt.legend()
+    plt.title('Top-5 Accuracy')
+    plt.subplot(2, 2, 3)
+    plt.plot(epochs, train_losses, label='Train Loss')
+    plt.plot(epochs, test_losses, label='Test Loss')
+    plt.xlabel('Epoch')
+    plt.ylabel('Loss')
+    plt.legend()
+    plt.title('Loss')
+    plt.subplot(2, 2, 4)
+    plt.plot(epochs, learning_rates, label='Learning Rate')
+    plt.xlabel('Epoch')
+    plt.ylabel('Learning Rate')
+    plt.legend()
+    plt.title('Learning Rate')
+    plt.tight_layout()
+    plt.show()

tmppl87qjev/_remote_module_non_scriptable.py ADDED Viewed

	@@ -0,0 +1,81 @@

+from typing import *
+import torch
+import torch.distributed.rpc as rpc
+from torch import Tensor
+from torch._jit_internal import Future
+from torch.distributed.rpc import RRef
+from typing import Tuple  # pyre-ignore: unused import
+module_interface_cls = None
+def forward_async(self, *args, **kwargs):
+    args = (self.module_rref, self.device, self.is_device_map_set, *args)
+    kwargs = {**kwargs}
+    return rpc.rpc_async(
+        self.module_rref.owner(),
+        _remote_forward,
+        args,
+        kwargs,
+    )
+def forward(self, *args, **kwargs):
+    args = (self.module_rref, self.device, self.is_device_map_set, *args)
+    kwargs = {**kwargs}
+    ret_fut = rpc.rpc_async(
+        self.module_rref.owner(),
+        _remote_forward,
+        args,
+        kwargs,
+    )
+    return ret_fut.wait()
+_generated_methods = [
+    forward_async,
+    forward,
+]
+def _remote_forward(
+    module_rref: RRef[module_interface_cls], device: str, is_device_map_set: bool, *args, **kwargs):
+    module = module_rref.local_value()
+    device = torch.device(device)
+    if device.type != "cuda":
+        return module.forward(*args, **kwargs)
+    # If the module is on a cuda device,
+    # move any CPU tensor in args or kwargs to the same cuda device.
+    # Since torch script does not support generator expression,
+    # have to use concatenation instead of
+    # ``tuple(i.to(device) if isinstance(i, Tensor) else i for i in *args)``.
+    args = (*args,)
+    out_args: Tuple[()] = ()
+    for arg in args:
+        arg = (arg.to(device),) if isinstance(arg, Tensor) else (arg,)
+        out_args = out_args + arg
+    kwargs = {**kwargs}
+    for k, v in kwargs.items():
+        if isinstance(v, Tensor):
+            kwargs[k] = kwargs[k].to(device)
+    if is_device_map_set:
+        return module.forward(*out_args, **kwargs)
+    # If the device map is empty, then only CPU tensors are allowed to send over wire,
+    # so have to move any GPU tensor to CPU in the output.
+    # Since torch script does not support generator expression,
+    # have to use concatenation instead of
+    # ``tuple(i.cpu() if isinstance(i, Tensor) else i for i in module.forward(*out_args, **kwargs))``.
+    ret: Tuple[()] = ()
+    for i in module.forward(*out_args, **kwargs):
+        i = (i.cpu(),) if isinstance(i, Tensor) else (i,)
+        ret = ret + i
+    return ret