Spaces:

rc19477
/

dev_only_useless

Sleeping

roychao19477 commited on 12 days ago

Commit

8c03ebe

1 Parent(s): 7d86927

Test on lengths

Files changed (1) hide show

app.py CHANGED Viewed

@@ -64,7 +64,7 @@ from scipy.io import wavfile
 from avse_code import run_avse
 # Load face detector
-model = YOLO("yolov8n-face.pt").cuda()  # assumes CUDA available
 from decord import VideoReader, cpu
@@ -79,11 +79,12 @@ avse_model = AVSEModule()
 #avse_state_dict = torch.load("ckpts/ep215_0906.oat.ckpt")
 avse_state_dict = torch.load("ckpts/ep220_0908.oat.ckpt")
 avse_model.load_state_dict(avse_state_dict, strict=True)
-avse_model.to("cuda")
 avse_model.eval()
 @spaces.GPU
 def run_avse_inference(video_path, audio_path):
     estimated = run_avse(video_path, audio_path)
     # Load audio
     #noisy, _ = sf.read(audio_path, dtype='float32')  # (N, )
@@ -147,6 +148,7 @@ def extract_faces(video_file):
             break
         # Inference
         results = model(frame, verbose=False)[0]
         for box in results.boxes:
             # version 1

 from avse_code import run_avse
 # Load face detector
+model = YOLO("yolov8n-face.pt")  # assumes CUDA available
 from decord import VideoReader, cpu
 #avse_state_dict = torch.load("ckpts/ep215_0906.oat.ckpt")
 avse_state_dict = torch.load("ckpts/ep220_0908.oat.ckpt")
 avse_model.load_state_dict(avse_state_dict, strict=True)
+#avse_model.to("cuda")
 avse_model.eval()
 @spaces.GPU
 def run_avse_inference(video_path, audio_path):
+    avse_model.to("cuda")
     estimated = run_avse(video_path, audio_path)
     # Load audio
     #noisy, _ = sf.read(audio_path, dtype='float32')  # (N, )
             break
         # Inference
+        model = model.cuda()
         results = model(frame, verbose=False)[0]
         for box in results.boxes:
             # version 1