Spaces:

Muthukamalan
/

UnsolvedMNIST

Sleeping

App Files Files Community

Muthukamalan commited on Jul 3, 2024

Commit

7c9474f

1 Parent(s): af3a445

lightning code

Browse files

Files changed (3) hide show

model/__init__.py +2 -0
model/mnist_model.py +93 -0
model/model.py +155 -0

model/__init__.py ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ from .model import LitMNISTModel
2	+ from .mnist_model import Net

model/mnist_model.py ADDED Viewed

	@@ -0,0 +1,93 @@

+import torch
+from torch import nn
+from torch.nn import functional as F
+from typing import Any,List,Tuple,Dict
+class Net(nn.Module):
+    def __init__(self,config:Dict):
+        super(Net,self).__init__()
+        DROPOUT= config.get('dropout_rate',0.01)
+        BIAS   = config.get('bias',False)
+        self.conv1 = nn.Sequential(
+            nn.Conv2d(in_channels=1,out_channels=8,kernel_size=3,stride=1,padding=1,bias=BIAS),
+            nn.ReLU(),
+            nn.BatchNorm2d(8),
+            nn.Dropout2d(p=DROPOUT),
+            nn.Conv2d(in_channels=8,out_channels=10,kernel_size=3,stride=1,padding=1,bias=BIAS),
+            nn.ReLU(),
+            nn.BatchNorm2d(10),
+            nn.Dropout2d(p=DROPOUT),
+            nn.Conv2d(in_channels=10,out_channels=10,kernel_size=3,stride=1,padding=1,bias=BIAS),
+            nn.ReLU(),
+            nn.BatchNorm2d(10),
+            nn.Dropout2d(p=DROPOUT),
+        )
+        self.trans1 = nn.Sequential(
+            nn.MaxPool2d( kernel_size =2 , stride =2 , padding =1 ),
+            nn.Conv2d(in_channels=10,out_channels=8,kernel_size=1,bias=BIAS,padding=1),
+        )
+        self.conv2 =nn.Sequential(
+            nn.Conv2d(in_channels=8,out_channels=10,kernel_size=3,stride=1,padding=1,bias=BIAS),
+            nn.BatchNorm2d(10),
+            nn.ReLU(),
+            nn.Dropout2d(p=DROPOUT),
+            nn.Conv2d(in_channels=10,out_channels=12,kernel_size=3,stride=1,padding=1,bias=BIAS),
+            nn.BatchNorm2d(12),
+            nn.ReLU(),
+            nn.Dropout2d(p=DROPOUT),
+            nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1,bias=BIAS),
+            nn.BatchNorm2d(12),
+            nn.ReLU(),
+            nn.Dropout2d(p=DROPOUT),
+        )
+        self.trans2 = nn.Sequential(
+            nn.MaxPool2d( kernel_size =2 , stride =2 , padding =1 ),
+            nn.Conv2d(in_channels=12,out_channels=8,kernel_size=1,bias=BIAS),
+            nn.BatchNorm2d(8),
+        )
+        self.conv3 = nn.Sequential(
+            nn.Conv2d(in_channels=8,out_channels=10,kernel_size=3,stride=1,padding=1,bias=BIAS),
+            nn.BatchNorm2d(10),
+            nn.ReLU(),
+            nn.Dropout2d(p=DROPOUT),
+            nn.Conv2d(in_channels=10,out_channels=12,kernel_size=3,stride=1,padding=1,bias=BIAS),
+            nn.ReLU(),
+            nn.BatchNorm2d(12),
+            nn.Dropout2d(p=DROPOUT),
+        )
+        self.trans3 = nn.Sequential(
+            nn.Conv2d(in_channels=12,out_channels=10,kernel_size=1,bias=BIAS),
+            nn.MaxPool2d( kernel_size =2 , stride =2 , padding =0 ),
+            nn.BatchNorm2d(10),
+        )
+        self.out4 = nn.Sequential(
+            nn.Conv2d(in_channels=10 ,out_channels=10, kernel_size=3,stride=1,padding=1,bias=BIAS),
+            nn.AvgPool2d(kernel_size=3)  #(1*1*10)
+        )
+    def forward(self,x):
+        x = self.trans1( self.conv1(x) )
+        x = self.trans2( self.conv2(x) )
+        x = self.trans3( self.conv3(x) )
+        x = self.out4(x)
+        x = x.view(-1,10)
+        return F.log_softmax(x,dim=1)

model/model.py ADDED Viewed

	@@ -0,0 +1,155 @@

+from typing import Any,List,Tuple,Dict
+import torch
+from torch import nn
+from torch.nn import functional as F
+from torchvision.utils import make_grid
+from torch.optim import Optimizer,Adam,SGD
+from lightning import LightningModule
+from torchmetrics import Accuracy,F1Score,AUROC,ConfusionMatrix
+device = torch.device('cuda') if torch.cuda.is_available() else torch.device('cpu')
+torch.set_default_device( device= device  )
+from .mnist_model import Net
+__all__: List[str] = ["LitMNISTModel"]
+class LitMNISTModel(LightningModule):
+    def __init__(
+            self,
+            learning_rate:float = 3e-4,
+            num_classes:int = 10,
+            dropout_rate:float=0.01,
+            bias:bool=False,
+            momentum:float =.9,
+            *args: Any,
+            **kwargs: Any
+    ) -> None:
+        super().__init__()
+        self.save_hyperparameters()
+        self.learning_rate:float = learning_rate
+        self.num_class:int       = num_classes
+        self.momentum:float      = momentum
+        # metric
+        ## Accuracy
+        self.train_accuracy = Accuracy(task="multiclass", num_classes=num_classes)
+        self.val_accuracy   = Accuracy(task="multiclass", num_classes=num_classes)
+        self.test_accuracy   = Accuracy(task="multiclass", num_classes=num_classes)
+        ## F1 Score
+        self.train_f1 = F1Score(task="multiclass", num_classes=num_classes)
+        self.val_f1   = F1Score(task="multiclass", num_classes=num_classes)
+        self.test_f1   = F1Score(task="multiclass", num_classes=num_classes)
+        ## Model
+        self.model = Net(config={'dropout_rate':dropout_rate, 'bias':bias})
+    def forward(self, x) -> Any:
+        return self.model(x)
+    def training_step(self, batch,batch_idx, *args: Any, **kwargs: Any) -> torch.Tensor:
+        x,y = batch
+        logits = self(x)
+        loss = F.nll_loss(logits,y)
+        preds = torch.argmax(logits,dim=1)
+        acc = self.train_accuracy(preds,y)
+        f1  = self.train_f1(preds,y)
+        self.log("train/loss",loss,prog_bar=True,on_epoch=True,on_step=True,logger=self.trainer.logger)
+        self.log("train/acc",acc,prog_bar=True,on_epoch=False,on_step=True,logger=self.trainer.logger)
+        self.log("train/train_f1",f1,prog_bar=True,on_epoch=False,on_step=True,logger=self.trainer.logger)
+        if batch_idx==0:
+            grid = make_grid(x)
+            self.logger.experiment.add_image("train_imgs",grid,self.current_epoch)
+        return {
+            'loss':loss,
+            'logits':logits,
+            'preds':preds
+        }
+    def validation_step(self,batch,batch_idx, *args: Any, **kwargs: Any) -> torch.Tensor :
+        x,y = batch
+        logits = self(x)
+        loss = F.nll_loss(logits,y)
+        preds = torch.argmax(logits,dim=1)
+        acc = self.val_accuracy(preds,y)
+        f1  = self.val_f1(preds,y)
+        self.log("val/loss",loss,prog_bar=True,on_epoch=True,on_step=True,logger=self.trainer.logger)
+        self.log("val/acc",acc,prog_bar=True,on_epoch=True,on_step=True,logger=self.trainer.logger)
+        self.log("val/val_f1",f1,prog_bar=True,on_epoch=True,on_step=False,logger=self.trainer.logger)
+        if batch_idx==0:
+            grid = make_grid(x)
+            self.logger.experiment.add_image("val_imgs",grid,self.current_epoch)
+        return {
+            'loss':loss,
+            'logits':logits,
+            'preds':preds
+        }
+    def predict_step(self,x:torch.Tensor, *args: Any, **kwargs: Any) -> torch.Tensor:
+        with torch.no_grad():
+            logits = self(x)
+            probs,indices = torch.max( F.softmax(logits,dim=1), dim=1)
+            return {
+                'prob':probs,
+                'predict':indices
+            }
+    def test_step(self,batch):
+        x,y = batch
+        logits = self(x)
+        loss = F.nll_loss(logits,y)
+        preds = torch.argmax(logits,dim=1)
+        acc = self.test_accuracy(preds,y)
+        f1  = self.test_f1(preds,y)
+        self.log("test/loss",loss,prog_bar=True,on_epoch=True,on_step=True,logger=self.trainer.logger)
+        self.log("test/acc",acc,prog_bar=True,on_epoch=True,on_step=True,logger=self.trainer.logger)
+        self.log("test/test_f1",f1,prog_bar=True,on_epoch=True,on_step=False,logger=self.trainer.logger)
+        return {
+            'loss':loss,
+            'logits':logits,
+            'preds':preds
+        }
+    def configure_optimizers(self):
+        # optimizer = SGD(self.parameters(),lr=self.learning_rate,momentum=self.momentum)
+        # Reduce LR ON Plateau
+        # scheduler = torch.optim.lr_scheduler.ReduceLROnPlateau(optimizer=optimizer,factor=.1,patience=2,verbose=True)
+        # return {
+        #     "optimizer": optimizer,
+        #     "lr_scheduler": scheduler,
+        #     "monitor": 'val/loss',
+        #     'interval':'step',
+        #     "frequency": 15
+        # }
+        optimizer = Adam(self.parameters(),lr=1e3)
+        scheduler = torch.optim.lr_scheduler.OneCycleLR(
+                                    optimizer=optimizer,
+                                    max_lr=1e2*self.learning_rate,
+                                    total_steps=self.trainer.estimated_stepping_batches,
+                                    pct_start=.3,
+                                    cycle_momentum=True,
+                                    div_factor =100,
+                                    final_div_factor = 1e10,
+                                    verbose = False,
+                                    three_phase=True
+                                    )
+        return ([optimizer],[scheduler])