codewithdark
/

latent-recurrent-depth-lm

Text Generation

latent_recurrent_depth

feature-extraction

Model card Files Files and versions

codewithdark commited on Feb 25

Commit

2a4e4bc

·

verified ·

1 Parent(s): 0b515c5

Update Model/latent_Recurrent.py

Files changed (1) hide show

Model/latent_Recurrent.py +21 -21

Model/latent_Recurrent.py CHANGED Viewed

@@ -1,22 +1,22 @@
-import torch
-import torch.nn as nn
-import torch.nn.functional as F
-from typing import Optional, Tuple
-from Model.prelude_Block import PreludeBlock
-from Model.recurrent_Block import RecurrentBlock
-from Model.codaBlock import CodaBlock
-# Full Latent Recurrent Depth Model
-class LatentRecurrentDepthLM(nn.Module):
-    def __init__(self, vocab_size: int, d_model: int, num_heads: int, dropout: float = 0.1):
-        super().__init__()
-        self.prelude = PreludeBlock(vocab_size, d_model, num_heads, dropout)
-        self.recurrent = RecurrentBlock(d_model, num_heads, dropout)
-        self.coda = CodaBlock(d_model, vocab_size)
-    def forward(self, x: torch.Tensor, num_iterations: int, mask: Optional[torch.Tensor] = None) -> torch.Tensor:
-        hidden = self.prelude(x, mask)
-        recurrent_state = torch.zeros_like(hidden)
-        for _ in range(num_iterations):
-            hidden, recurrent_state = self.recurrent(hidden, recurrent_state, mask)
         return self.coda(hidden)

+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+from typing import Optional, Tuple
+from prelude_Block import PreludeBlock
+from recurrent_Block import RecurrentBlock
+from codaBlock import CodaBlock
+# Full Latent Recurrent Depth Model
+class LatentRecurrentDepthLM(nn.Module):
+    def __init__(self, vocab_size: int, d_model: int, num_heads: int, dropout: float = 0.1):
+        super().__init__()
+        self.prelude = PreludeBlock(vocab_size, d_model, num_heads, dropout)
+        self.recurrent = RecurrentBlock(d_model, num_heads, dropout)
+        self.coda = CodaBlock(d_model, vocab_size)
+    def forward(self, x: torch.Tensor, num_iterations: int, mask: Optional[torch.Tensor] = None) -> torch.Tensor:
+        hidden = self.prelude(x, mask)
+        recurrent_state = torch.zeros_like(hidden)
+        for _ in range(num_iterations):
+            hidden, recurrent_state = self.recurrent(hidden, recurrent_state, mask)
         return self.coda(hidden)