Spaces:

AlexK-PL
/

Tacotron2_GST_eng

Sleeping

App Files Files Community

AlexK-PL commited on Sep 4, 2023

Commit

2fe470f

1 Parent(s): 689b3d3

Delete loss_scaler.py

Browse files

Files changed (1) hide show

loss_scaler.py +0 -79

loss_scaler.py DELETED Viewed

@@ -1,79 +0,0 @@
-class LossScaler:
-    def __init__(self, scale=1):
-        self.cur_scale = scale
-    # `params` is a list / generator of torch.Variable
-    def has_overflow(self, params):
-        return False
-    # `x` is a torch.Tensor
-    def _has_inf_or_nan(x):
-        return False
-    # `overflow` is boolean indicating whether we overflowed in gradient
-    def update_scale(self, overflow):
-        pass
-    @property
-    def loss_scale(self):
-        return self.cur_scale
-    def scale_gradient(self, module, grad_in, grad_out):
-        return tuple(self.loss_scale * g for g in grad_in)
-    def backward(self, loss):
-        scaled_loss = loss*self.loss_scale
-        scaled_loss.backward()
-class DynamicLossScaler:
-    def __init__(self,
-                 init_scale=2**32,
-                 scale_factor=2.,
-                 scale_window=1000):
-        self.cur_scale = init_scale
-        self.cur_iter = 0
-        self.last_overflow_iter = -1
-        self.scale_factor = scale_factor
-        self.scale_window = scale_window
-    # `params` is a list / generator of torch.Variable
-    def has_overflow(self, params):
-        for p in params:
-            if p.grad is not None and DynamicLossScaler._has_inf_or_nan(p.grad.data):
-                return True
-        return False
-    # `x` is a torch.Tensor
-    def _has_inf_or_nan(x):
-        cpu_sum = float(x.float().sum())
-        if cpu_sum == float('inf') or cpu_sum == -float('inf') or cpu_sum != cpu_sum:
-            return True
-        return False
-    # `overflow` is boolean indicating whether we overflowed in gradient
-    def update_scale(self, overflow):
-        if overflow:
-            #self.cur_scale /= self.scale_factor
-            self.cur_scale = max(self.cur_scale/self.scale_factor, 1)
-            self.last_overflow_iter = self.cur_iter
-        else:
-            if (self.cur_iter - self.last_overflow_iter) % self.scale_window == 0:
-                self.cur_scale *= self.scale_factor
-#        self.cur_scale = 1
-        self.cur_iter += 1
-    @property
-    def loss_scale(self):
-        return self.cur_scale
-    def scale_gradient(self, module, grad_in, grad_out):
-        return tuple(self.loss_scale * g for g in grad_in)
-    def backward(self, loss):
-        scaled_loss = loss*self.loss_scale
-        scaled_loss.backward()