Spaces:

JabriA
/

MyIVR

Sleeping

App Files Files Community

JabriA commited on Jan 17

Commit

3785854

1 Parent(s): 61e1f2a

Add Darija transcription and topic extraction app3

Browse files

Files changed (1) hide show

app.py +26 -21

app.py CHANGED Viewed

@@ -23,39 +23,44 @@ def transcribe_audio(audio_path):
     transcription = processor.batch_decode(predicted_ids)[0]
     return transcription
-# Function to filter text by keywords
-def filter_text_by_keywords(text, keywords):
-    keyword_list = keywords.split(",")
-    filtered_sentences = [
-        sentence for sentence in text.split(". ") if any(keyword.strip().lower() in sentence.lower() for keyword in keyword_list)
-    ]
-    return ". ".join(filtered_sentences) if filtered_sentences else text
-# Function to transcribe and summarize
-def transcribe_and_summarize(audio_file, keywords):
     transcription = transcribe_audio(audio_file)
-    filtered_text = filter_text_by_keywords(transcription, keywords)
-    summary = summarizer(filtered_text, max_length=100, min_length=30, do_sample=False)[0]["summary_text"]
-    return transcription, summary
 # Gradio Interface
-inputs = [
-    gr.Audio(type="filepath", label="Upload your audio file"),
-    gr.Textbox(label="Enter Keywords (comma-separated)", placeholder="e.g., customer, service, retention")
-]
 outputs = [
     gr.Textbox(label="Transcription"),
-    gr.Textbox(label="Summary")
 ]
 app = gr.Interface(
-    fn=transcribe_and_summarize,
     inputs=inputs,
     outputs=outputs,
-    title="Moroccan Darija Audio Transcription and Summarization",
     description=(
-        "Upload an audio file in Moroccan Darija to get its transcription and a summarized version. "
-        "Specify relevant keywords (comma-separated) to filter the transcription before summarization."
     )
 )

     transcription = processor.batch_decode(predicted_ids)[0]
     return transcription
+# Function to analyze topics from summary
+def analyze_topics(summary):
+    if "customer service" in summary.lower():
+        return "Customer Service"
+    elif "retention" in summary.lower():
+        return "Retention"
+    else:
+        return "Unknown"
+# Function to transcribe, summarize, and analyze topics
+def transcribe_summarize_analyze(audio_file):
+    # Transcription
     transcription = transcribe_audio(audio_file)
+    # Summarization
+    summary = summarizer(transcription, max_length=100, min_length=30, do_sample=False)[0]["summary_text"]
+    # Topic Analysis
+    topic = analyze_topics(summary)
+    return transcription, summary, topic
 # Gradio Interface
+inputs = gr.Audio(type="filepath", label="Upload your audio file")
 outputs = [
     gr.Textbox(label="Transcription"),
+    gr.Textbox(label="Summary"),
+    gr.Textbox(label="Topic")
 ]
 app = gr.Interface(
+    fn=transcribe_summarize_analyze,
     inputs=inputs,
     outputs=outputs,
+    title="Moroccan Darija Audio Analysis",
     description=(
+        "Upload an audio file in Moroccan Darija to get its transcription, a summarized version, "
+        "and the detected topic (Customer Service or Retention)."
     )
 )