Spaces:

wedyanessam
/

Real_Time_Interactive_Avatar_v2

Runtime error

App Files Files Community

wedyanessam commited on May 28

Commit

f71a8b3

verified ·

1 Parent(s): df3d223

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -7

app.py CHANGED Viewed

@@ -5,12 +5,12 @@ from pathlib import Path
 import argparse
 import gradio as gr
-# ✅ تشغيل سكربت تحميل الموديلات إذا الموديلات مو موجودة
 if not os.path.exists("./models/fantasytalking_model.ckpt"):
     print("🛠️ جاري تحميل النماذج عبر download_models.py ...")
     subprocess.run(["python", "download_models.py"])
-# ✅ إعداد المسارات للمشروع
 sys.path.append(os.path.abspath("."))
 # ✅ استيراد المكونات
@@ -19,11 +19,11 @@ from LLM.llm import generate_reply
 from TTS_X.tts import generate_voice
 from FantasyTalking.infer import load_models, main
-# ✅ ثابتات النموذج (بالمسارات الجديدة)
 args_template = argparse.Namespace(
     fantasytalking_model_path="./models/fantasytalking_model.ckpt",
     wav2vec_model_dir="./models/wav2vec2-base-960h",
-    wan_model_dir="./models/Wan2.1-I2V-14B-720P",  # لو رجعتي تستخدمي Wan
     image_path="",
     audio_path="",
     prompt="",
@@ -44,8 +44,14 @@ print("🚀 جاري تحميل FantasyTalking و Wav2Vec...")
 pipe, fantasytalking, wav2vec_processor, wav2vec = load_models(args_template)
 print("✅ تم التحميل!")
-# ✅ دالة توليد الفيديو
 def generate_video(image_path, audio_path, prompt, output_dir="./output"):
     args = argparse.Namespace(
         **vars(args_template),
         image_path=image_path,
@@ -53,18 +59,28 @@ def generate_video(image_path, audio_path, prompt, output_dir="./output"):
         prompt=prompt,
         output_dir=output_dir
     )
-    return main(args, pipe, fantasytalking, wav2vec_processor, wav2vec)
-# ✅ دالة خط الأنابيب الكامل
 def full_pipeline(user_audio, user_image):
     print("🎤 تحويل الصوت إلى نص...")
     user_text = speech_to_text(user_audio)
     print("💬 توليد الرد...")
     reply = generate_reply(user_text)
     print("🔊 تحويل الرد إلى صوت...")
     reply_audio_path = generate_voice(reply)
     print("📽️ توليد الفيديو...")
     Path("./output").mkdir(parents=True, exist_ok=True)
@@ -74,6 +90,7 @@ def full_pipeline(user_audio, user_image):
         prompt=reply
     )
     return user_text, reply, reply_audio_path, video_path
 # ✅ واجهة Gradio
@@ -97,3 +114,5 @@ with gr.Blocks(title="🧠 صوتك يحرك صورة!") as demo:
               outputs=[user_text, reply_text, reply_audio, video_output])
 demo.launch(inbrowser=True, share=True)

 import argparse
 import gradio as gr
+# ✅ تحميل الموديلات لو ما كانت موجودة
 if not os.path.exists("./models/fantasytalking_model.ckpt"):
     print("🛠️ جاري تحميل النماذج عبر download_models.py ...")
     subprocess.run(["python", "download_models.py"])
+# ✅ إعداد المسارات
 sys.path.append(os.path.abspath("."))
 # ✅ استيراد المكونات
 from TTS_X.tts import generate_voice
 from FantasyTalking.infer import load_models, main
+# ✅ إعداد ثوابت الموديل
 args_template = argparse.Namespace(
     fantasytalking_model_path="./models/fantasytalking_model.ckpt",
     wav2vec_model_dir="./models/wav2vec2-base-960h",
+    wan_model_dir="./models/Wan2.1-I2V-14B-720P",
     image_path="",
     audio_path="",
     prompt="",
 pipe, fantasytalking, wav2vec_processor, wav2vec = load_models(args_template)
 print("✅ تم التحميل!")
+# ✅ توليد الفيديو - مع طباعة Debug
 def generate_video(image_path, audio_path, prompt, output_dir="./output"):
+    print(f"[🎨] generate_video() بدأ التشغيل")
+    print(f"[📁] image_path: {image_path}")
+    print(f"[📁] audio_path: {audio_path}")
+    print(f"[💬] prompt: {prompt}")
+    print(f"[📁] output_dir: {output_dir}")
     args = argparse.Namespace(
         **vars(args_template),
         image_path=image_path,
         prompt=prompt,
         output_dir=output_dir
     )
+    video_path = main(args, pipe, fantasytalking, wav2vec_processor, wav2vec)
+    print(f"[✅] generate_video() انتهى، الفيديو محفوظ هنا: {video_path}")
+    return video_path
+# ✅ خط الأنابيب الكامل - مع طباعة Debug
 def full_pipeline(user_audio, user_image):
+    print("[🚀] full_pipeline() بدأ التشغيل")
+    print(f"[🔊] ملف الصوت المُدخل: {user_audio}")
+    print(f"[🖼️] ملف الصورة المُدخلة: {user_image}")
     print("🎤 تحويل الصوت إلى نص...")
     user_text = speech_to_text(user_audio)
+    print(f"[📝] النص المستخرج من الصوت: {user_text}")
     print("💬 توليد الرد...")
     reply = generate_reply(user_text)
+    print(f"[🤖] الرد المُولد: {reply}")
     print("🔊 تحويل الرد إلى صوت...")
     reply_audio_path = generate_voice(reply)
+    print(f"[🔊] مسار الصوت المُولد: {reply_audio_path}")
     print("📽️ توليد الفيديو...")
     Path("./output").mkdir(parents=True, exist_ok=True)
         prompt=reply
     )
+    print(f"[✅] full_pipeline() انتهى، الفيديو النهائي هنا: {video_path}")
     return user_text, reply, reply_audio_path, video_path
 # ✅ واجهة Gradio
               outputs=[user_text, reply_text, reply_audio, video_output])
 demo.launch(inbrowser=True, share=True)