RemFx

Sleeping

App Files Files Community

mattricesound commited on Jan 27, 2023

Commit

c7f4805

1 Parent(s): 9072475

Fix chunk sample indices

Browse files

Files changed (2) hide show

config.yaml +1 -2
remfx/datasets.py +11 -6

config.yaml CHANGED Viewed

@@ -26,8 +26,7 @@ datamodule:
     sample_rate: ${sample_rate}
     root: ${oc.env:DATASET_ROOT}
     length: ${length}
-    chunk_size_in_sec: 6
-    num_chunks: 10
   val_split: 0.2
   batch_size: 16
   num_workers: 8

     sample_rate: ${sample_rate}
     root: ${oc.env:DATASET_ROOT}
     length: ${length}
+    chunk_size_in_sec: 3
   val_split: 0.2
   batch_size: 16
   num_workers: 8

remfx/datasets.py CHANGED Viewed

@@ -27,6 +27,7 @@ class GuitarFXDataset(Dataset):
         self.dry_files = []
         self.chunks = []
         self.labels = []
         self.root = Path(root)
         self.chunk_size_in_sec = chunk_size_in_sec
@@ -34,6 +35,7 @@ class GuitarFXDataset(Dataset):
             effect_types = [
                 d.name for d in self.root.iterdir() if d.is_dir() and d != "Clean"
             ]
         for i, effect in enumerate(effect_types):
             for pickup in Path(self.root / effect).iterdir():
                 wet_files = sorted(list(pickup.glob("*.wav")))
@@ -45,9 +47,11 @@ class GuitarFXDataset(Dataset):
                 self.labels += [i] * len(wet_files)
                 for audio_file in wet_files:
                     chunk_starts = create_sequential_chunks(
-                        audio_file, self.chunk_size_in_sec, self.num_chunks
                     )
                     self.chunks += chunk_starts
         print(
             f"Found {len(self.wet_files)} wet files and {len(self.dry_files)} dry files.\n"
             f"Total chunks: {len(self.chunks)}"
@@ -59,15 +63,16 @@ class GuitarFXDataset(Dataset):
     def __getitem__(self, idx):
         # Load effected and "clean" audio
-        song_idx = idx // self.num_chunks
         x, sr = torchaudio.load(self.wet_files[song_idx])
         y, sr = torchaudio.load(self.dry_files[song_idx])
         effect_label = self.labels[song_idx]  # Effect label
-        chunk_indices = self.chunks[idx]
-        chunk_size_in_samples = self.chunk_size * sr
-        x = x[:, chunk_indices[0] : chunk_indices[0] + chunk_size_in_samples]
-        y = y[:, chunk_indices[0] : chunk_indices[0] + chunk_size_in_samples]
         resampled_x = self.resampler(x)
         resampled_y = self.resampler(y)

         self.dry_files = []
         self.chunks = []
         self.labels = []
+        self.song_idx = []
         self.root = Path(root)
         self.chunk_size_in_sec = chunk_size_in_sec
             effect_types = [
                 d.name for d in self.root.iterdir() if d.is_dir() and d != "Clean"
             ]
+        current_file = 0
         for i, effect in enumerate(effect_types):
             for pickup in Path(self.root / effect).iterdir():
                 wet_files = sorted(list(pickup.glob("*.wav")))
                 self.labels += [i] * len(wet_files)
                 for audio_file in wet_files:
                     chunk_starts = create_sequential_chunks(
+                        audio_file, self.chunk_size_in_sec
                     )
                     self.chunks += chunk_starts
+                    self.song_idx += [current_file] * len(chunk_starts)
+                    current_file += 1
         print(
             f"Found {len(self.wet_files)} wet files and {len(self.dry_files)} dry files.\n"
             f"Total chunks: {len(self.chunks)}"
     def __getitem__(self, idx):
         # Load effected and "clean" audio
+        print("HEY")
+        song_idx = self.song_idx[idx]
         x, sr = torchaudio.load(self.wet_files[song_idx])
         y, sr = torchaudio.load(self.dry_files[song_idx])
         effect_label = self.labels[song_idx]  # Effect label
+        chunk_start = self.chunks[idx]
+        chunk_size_in_samples = self.chunk_size_in_sec * sr
+        x = x[:, chunk_start : chunk_start + chunk_size_in_samples]
+        y = y[:, chunk_start : chunk_start + chunk_size_in_samples]
         resampled_x = self.resampler(x)
         resampled_y = self.resampler(y)