Spaces:

Detomo
/

voice-japanese

Build error

vumichien commited on Mar 31, 2022

Commit

5eb8f47

1 Parent(s): 01d02b4

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -18,25 +18,29 @@ def process_audio_file(file):
     return inputs
-def transcribe(file):
     inputs = process_audio_file(file)
     with torch.no_grad():
         output_logit = model(inputs.input_values, attention_mask=inputs.attention_mask).logits
     pred_ids = torch.argmax(output_logit, dim=-1)
-    return processor.batch_decode(pred_ids)[0]
 description = "A simple interface to transcribe from spoken Japanese to Hiragana."
 article = "Author: <a href=\"https://huggingface.co/vumichien\">Vu Minh Chien</a>."
-inputs = [gr.inputs.Audio(source="microphone", type='filepath', optional=True)
-          ]
 examples = [["samples/BASIC5000_0001.wav"],
             ["samples/BASIC5000_0005.wav"]
         ]
 iface = gr.Interface(
     fn=transcribe,
     inputs=inputs,
-    outputs="text",
     layout="horizontal",
     theme="huggingface",
     title="Transcribe Japanese audio to Hiragana",
@@ -44,5 +48,6 @@ iface = gr.Interface(
     article=article,
     allow_flagging='never',
     examples=examples,
 )
 iface.launch(enable_queue=True, share=True)

     return inputs
+def transcribe(file, state=""):
     inputs = process_audio_file(file)
     with torch.no_grad():
         output_logit = model(inputs.input_values, attention_mask=inputs.attention_mask).logits
     pred_ids = torch.argmax(output_logit, dim=-1)
+    text = processor.batch_decode(pred_ids)[0]
+    state += text + " "
+    return state, state
 description = "A simple interface to transcribe from spoken Japanese to Hiragana."
 article = "Author: <a href=\"https://huggingface.co/vumichien\">Vu Minh Chien</a>."
+inputs = [gr.inputs.Audio(source="microphone", type="filepath", optional=True),
+            "state"]
+outputs = ["textbox", "state"]
 examples = [["samples/BASIC5000_0001.wav"],
             ["samples/BASIC5000_0005.wav"]
         ]
 iface = gr.Interface(
     fn=transcribe,
     inputs=inputs,
+    outputs=outputs,
     layout="horizontal",
     theme="huggingface",
     title="Transcribe Japanese audio to Hiragana",
     article=article,
     allow_flagging='never',
     examples=examples,
+    live=True,
 )
 iface.launch(enable_queue=True, share=True)