Spaces:

Mister56
/

VQA_app

Running

App Files Files Community

Mister56 commited on Oct 16, 2024

Commit

6195896

verified ·

1 Parent(s): cf4577a

Update app.py

Browse files

Files changed (1) hide show

app.py +5 -23

app.py CHANGED Viewed

@@ -8,14 +8,6 @@ import torch
 import argparse
 from transformers import AutoModel, AutoTokenizer
-# README, How to run demo on different devices
-# For Nvidia GPUs.
-# python web_demo_2.5.py --device cuda
-# For Mac with MPS (Apple silicon or AMD GPUs).
-# PYTORCH_ENABLE_MPS_FALLBACK=1 python web_demo_2.5.py --device mps
 # Argparser
 parser = argparse.ArgumentParser(description='demo')
 parser.add_argument('--device', type=str, default='cuda', help='cuda or mps')
@@ -24,7 +16,7 @@ device = args.device
 assert device in ['cuda', 'mps']
 # Load model
-model_path = 'openbmb/MiniCPM-Llama3-V-2_5'
 if 'int4' in model_path:
     if device == 'mps':
         print('Error: running int4 model with bitsandbytes on Mac is not supported right now.')
@@ -38,7 +30,7 @@ model.eval()
 ERROR_MSG = "Error, please retry"
-model_name = 'MiniCPM-V 2.5'
 form_radio = {
     'choices': ['Beam Search', 'Sampling'],
@@ -222,22 +214,12 @@ def regenerate_button_clicked(_question, _chat_bot, _app_cfg, params_form, num_b
 with gr.Blocks() as demo:
     with gr.Row():
-        with gr.Column(scale=1, min_width=300):
-            params_form = create_component(form_radio, comp='Radio')
-            with gr.Accordion("Beam Search") as beams_according:
-                num_beams = create_component(num_beams_slider)
-                repetition_penalty = create_component(repetition_penalty_slider)
-            with gr.Accordion("Sampling") as sampling_according:
-                top_p = create_component(top_p_slider)
-                top_k = create_component(top_k_slider)
-                temperature = create_component(temperature_slider)
-                repetition_penalty_2 = create_component(repetition_penalty_slider2)
-            regenerate = create_component({'value': 'Regenerate'}, comp='Button')
-        with gr.Column(scale=3, min_width=500):
             app_session = gr.State({'sts':None,'ctx':None,'img':None})
             bt_pic = gr.Image(label="Upload an image to start")
-            chat_bot = gr.Chatbot(label=f"Chat with {model_name}")
             txt_message = gr.Textbox(label="Input text")
             regenerate.click(
                 regenerate_button_clicked,

 import argparse
 from transformers import AutoModel, AutoTokenizer
 # Argparser
 parser = argparse.ArgumentParser(description='demo')
 parser.add_argument('--device', type=str, default='cuda', help='cuda or mps')
 assert device in ['cuda', 'mps']
 # Load model
+model_path = 'openbmb/MiniCPM-Llama3-V-2'
 if 'int4' in model_path:
     if device == 'mps':
         print('Error: running int4 model with bitsandbytes on Mac is not supported right now.')
 ERROR_MSG = "Error, please retry"
+model_name = 'MiniCPM-V 2'
 form_radio = {
     'choices': ['Beam Search', 'Sampling'],
 with gr.Blocks() as demo:
     with gr.Row():
+        with gr.Column(scale=2, min_width=300):
             app_session = gr.State({'sts':None,'ctx':None,'img':None})
             bt_pic = gr.Image(label="Upload an image to start")
             txt_message = gr.Textbox(label="Input text")
+        with gr.Column(scale=2, min_width=300):
+            chat_bot = gr.Chatbot(label=f"Chat with {model_name}")
             regenerate.click(
                 regenerate_button_clicked,