zenz-v2.5-medium-space

Sleeping

App Files Files Community

Miwa-Keita commited on Mar 9

Commit

0594435

verified ·

1 Parent(s): 1d4dce2

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -7

app.py CHANGED Viewed

@@ -14,16 +14,16 @@ snapshot_download(
     ignore_patterns=["optimizer.pt", "checkpoint*"],  # いらないファイルを無視
 )
-# モデルのロード
-model_path = os.path.join(model_dir, "pytorch_model.bin")  # 必要なモデルファイル
-model = torch.load(model_path, map_location="cpu")
 # 入力を調整する関数
 def preprocess_input(user_input):
     prefix = "\uEE00"  # 前に付与する文字列
     suffix = "\uEE01"  # 後ろに付与する文字列
     processed_input = prefix + user_input + suffix
-    return model(processed_input)
 # 出力を調整する関数
 def postprocess_output(model_output):
@@ -33,12 +33,28 @@ def postprocess_output(model_output):
         return model_output.split(suffix)[1]
     return model_output
-# インターフェースを定義
 iface = gr.Interface(
-    fn=lambda x: postprocess_output(preprocess_input(x)),
     inputs=gr.Textbox(label="変換する文字列（カタカナ）"),
     outputs=gr.Textbox(label="変換結果"),
-    title="ニューラルかな漢字変換モデルzenz-v1のデモ",
     description="変換したい文字列をカタカナを入力してください"
 )

     ignore_patterns=["optimizer.pt", "checkpoint*"],  # いらないファイルを無視
 )
+# モデルとトークナイザーのロード（GPT-2 アーキテクチャ）
+tokenizer = AutoTokenizer.from_pretrained(model_dir)
+model = AutoModelForCausalLM.from_pretrained(model_dir, torch_dtype=torch.float32)
 # 入力を調整する関数
 def preprocess_input(user_input):
     prefix = "\uEE00"  # 前に付与する文字列
     suffix = "\uEE01"  # 後ろに付与する文字列
     processed_input = prefix + user_input + suffix
+    return processed_input
 # 出力を調整する関数
 def postprocess_output(model_output):
         return model_output.split(suffix)[1]
     return model_output
+# 変換関数
+def generate_text(user_input):
+    processed_input = preprocess_input(user_input)
+    # テキストをトークン化
+    inputs = tokenizer(processed_input, return_tensors="pt")
+    # モデルで生成
+    outputs = model.generate(**inputs, max_length=100)
+    # 出力のデコード
+    decoded_output = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    # 出力の整形
+    return postprocess_output(decoded_output)
+# Gradio インターフェース
 iface = gr.Interface(
+    fn=generate_text,
     inputs=gr.Textbox(label="変換する文字列（カタカナ）"),
     outputs=gr.Textbox(label="変換結果"),
+    title="ニューラルかな漢字変換モデル zenZ-v1 のデモ",
     description="変換したい文字列をカタカナを入力してください"
 )