asrใฎๆ–‡ๅญ—่ตทใ“ใ—็ตๆžœใ‚’็”จใ„ใฆ่ชคๅญ—ใ‚’ไฟฎๆญฃใ™ใ‚‹ใŸใ‚ใซไฝœๆˆใ—ใŸใƒขใƒ‡ใƒซใงใ™ใ€‚
ไธปใซใƒ‡ใƒผใ‚ฟใ‚ปใƒƒใƒˆๆ•ดๅฝขใซ็‰นๅŒ–ใ•ใ›ใŸใƒขใƒ‡ใƒซใงใ™ใ€‚
ใƒซใƒผใƒซใƒ™ใƒผใ‚นใงใฏใชใ„่ชคๅญ—ไฟฎๆญฃใ‚’่กŒใ†ใ“ใจใŒใงใใ‚‹ใ“ใจใ‚’็›ฎๆŒ‡ใ—ใฆใ„ใพใ™ใ€‚

ไฝฟใ„ๆ–นใฏไธ‹่จ˜ใ‚ณใƒผใƒ‰ใ‚’ๅ‚็…งใ—ใฆใใ ใ•ใ„ใ€‚

# ๅ‡บๅŠ›ใฎใ‚นใ‚ณใ‚ขใ‚’ๅซใ‚ใฆ็”Ÿๆˆใ™ใ‚‹
import os
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, TextStreamer


# CUDAใƒ‡ใƒใ‚คใ‚นใฎ่จญๅฎš
os.environ["CUDA_VISIBLE_DEVICES"] = "0"

# ใƒขใƒ‡ใƒซใจใƒˆใƒผใ‚ฏใƒŠใ‚คใ‚ถใƒผใฎใƒ‡ใ‚ฃใƒฌใ‚ฏใƒˆใƒช
MODEL_DIRECTORY = ("swdq/ASR-Fixer")


def load_model_and_tokenizer():
    tokenizer = AutoTokenizer.from_pretrained(MODEL_DIRECTORY)
    model = AutoModelForCausalLM.from_pretrained(
        MODEL_DIRECTORY,
        device_map="auto",
        use_auth_token=True,
        torch_dtype=torch.float16,
    )
    return tokenizer, model


def generate_text(prompt, tokenizer, model):
    streamer = TextStreamer(tokenizer, skip_prompt=False)
    inputs = tokenizer(prompt, return_tensors="pt").to("cuda")

    # ๅ‡บๅŠ›ใฎใ‚นใ‚ณใ‚ขใ‚’ๅซใ‚ใฆ็”Ÿๆˆใ™ใ‚‹
    outputs = model.generate(
        input_ids=inputs["input_ids"],
        attention_mask=inputs["attention_mask"],
        max_new_tokens=500,
        min_new_tokens=1,
        do_sample=True,
        top_k=1,
        repetition_penalty=1.0,
        temperature=0.1,
        use_cache=True,
        bos_token_id=tokenizer.bos_token_id,
        eos_token_id=tokenizer.eos_token_id,
        streamer=streamer,
    )

    return tokenizer.decode(outputs[0], skip_special_tokens=True)


"""ใƒกใ‚คใƒณใƒซใƒผใƒ—้–ขๆ•ฐ"""
tokenizer, model = load_model_and_tokenizer()

text = "ใ‚Œใ‚ใ‚Œใ‚โ€ฆใ˜ใ‚…ใ‚‹ใ‚‹โ€ฆใ“ใฎใŠใกใ‚“ใกใ‚“ใชใ‚‰โ€ฆใกใ‚…ใฑใ€ใกใ‚…ใ‚‹โ€ฆใกใ‚ƒใ‚“ใจใƒžใƒžใฎ่จ€ใ†ใ“ใจ่žใ‘ใพใกใ‚…ใ‚ˆโ€ฆ"
initial_prompt = f"ASR: {text} ๆญฃ่งฃ: "
generated_text = generate_text(initial_prompt, tokenizer, model)
result = generated_text.split("ๆญฃ่งฃ: ", 1)[-1].strip()
print(text)
print(result)

ไพ‹(ใƒ‡ใƒผใ‚ฟใ‚ปใƒƒใƒˆใซใชใ„ใƒ†ใ‚ญใ‚นใƒˆ)
asr ใ‚Œใ‚ใ‚Œใ‚โ€ฆใ˜ใ‚…ใ‚‹ใ‚‹โ€ฆใ“ใฎใŠใกใ‚“ใกใ‚“ใชใ‚‰โ€ฆใกใ‚…ใฑใ€ใกใ‚…ใ‚‹โ€ฆใกใ‚ƒใ‚“ใจใƒžใƒžใฎ่จ€ใ†ใ“ใจ่žใ‘ใพใกใ‚…ใ‚ˆโ€ฆ
true ใ‚Œใ‚ใ‚Œใ‚โ€ฆใกใ‚…ใ‚‹ใ‚‹โ€ฆใ“ใฎใŠใกใ‚“ใกใ‚“ใชใ‚‰โ€ฆใกใ‚…ใฑใ€ใกใ‚…ใ‚‹โ€ฆใกใ‚ƒใ‚“ใจใƒžใƒžใฎ่จ€ใ†ใ“ใจใ€่žใ‘ใพใกใ‚…ใ‚ˆโ€ฆ
asr ่งฆใ‚‰ใ‚Œใ‚‹ใจใดใใฃใจใ™ใ‚‹ๆฐ—ๆŒใกใŒใ‚ใ‹ใ‚Šใพใ—ใŸ ใใ™ใใฃใŸใ„ใ‚ˆใ†ใชโ€ฆๆฐ—ๆŒใกใ„ใ„ใ‚ˆใ†ใชโ€ฆใ‚“ใฃโ€ฆ
true ่งฆใ‚‰ใ‚Œใ‚‹ใจใ€ใดใใฃใจใ™ใ‚‹ๆฐ—ๆŒใกใŒใ‚ใ‹ใ‚Šใพใ—ใŸโ€ฆใใ™ใใฃใŸใ„ใ‚ˆใ†ใชโ€ฆๆฐ—ๆŒใกใ„ใ„ใ‚ˆใ†ใชโ€ฆใ‚“ใฃโ€ฆ
asr ใˆใธใธโ€ฆ็งใฎใŠๅฃใงใ€ใงใ™ใ‘ใฉโ€ฆ ใ‚ใฏใฏโ€ฆใฃใฆใ‹ใ€ใ‚ใฏโ€ฆใ‚„ใฃใฑใ‚Šใ€็ตๆง‹ๅ‹ƒใฃใกใ‚ƒใฃใฆใพใ™ใ‚ˆใญใ€ใ“ใ‚Œใ€‚
true ใˆใธใธโ€ฆ็งใฎใŠๅฃใงใ€ใงใ™ใ‘ใฉโ€ฆใ‚ใฏใฏโ€ฆใฃใฆใ‹ใ€ใ‚ใฏใฏโ€ฆใ‚„ใฃใฑใ‚Šใ€็ตๆง‹ๅ‹ƒใฃใกใ‚ƒใฃใฆใพใ™ใ‚ˆใญใ€ใ“ใ‚Œใ€‚
asr ๅŠใกใ‚ƒใพใ€ใŠใฃใ€ใŠใฃใ€ใŠใ‚›ใฃใ€ใŠใฃใ€ใŠใŠใฃใ€ใ‚คใ‚ฐโ€ฆใƒƒใ€ใŠใ‰ใ€ใŠใŠใ‚›ใŠใ‚›ใŠใ‰ใ‰ใƒƒใƒƒ!
true ๅŠใกใ‚ƒใพใ€ใŠใฃใ€ใŠใฃใ€ใŠใ‰ใฃใ€ใŠใŠใฃใ€ใ‚คใ‚ฐโ€ฆใƒƒใ€ใŠใ‰ใ€ใŠใ‰ใ€ใŠใ‰ใ‰ใŠใŠใ‰ใ‰ใŠใŠใ‰ใ‰ใŠใŠใ‰ใ‰ใŠใŠใ‰ใŠใŠใƒƒใƒƒ!
asr ใ•ใ‚ใ•ใ‚ใ€ใŠใกใ‚“ใฝๅ‡บใ—ใŸใ‚“ใ ใ‹ใ‚‰ใ€ๆฌกใฏไพฟๅ™จใซๅ‰ฅใ„ใฆใ€ใŠใ—ใฃใ“ใ‚ทใƒฃใƒผใฃใฆใ—ใกใ‚ƒใŠ
true ใ•ใ‚ใ•ใ‚ใ€ใŠใกใ‚“ใฝๅ‡บใ—ใŸใ‚“ใ ใ‹ใ‚‰ใ€ๆฌกใฏไพฟๅ™จใซๅ‰ฅใ„ใฆใ€ใŠใ—ใฃใ“ใ—ใ‚ƒใƒผใฃใฆใ—ใกใ‚ƒใŠ
asr ๅ‡บใ—ใฆๅ‡บใ—ใฆใ€ใ‚ถใƒผใƒกใƒณๅ‡บใ—ใฆใ€ใ–ใƒผใ‚ใ‚“ๅ‡บใ—ใฆใ€‚
true ๅ‡บใ—ใฆๅ‡บใ—ใฆใ€ใ‚ถใƒผใƒกใƒณๅ‡บใ—ใฆใ€ใ‚ถใƒผใƒกใƒณๅ‡บใ—ใฆใ€‚
asr ใ–ใƒผใ‚ใƒผใ‚“ใ€ใ›ใƒผใˆใ ็ฒพๅญใ€ใพใฃใ—ใ‚ใ‚’็Ž‰ใ•ใใ—โ€ฆใ„ใฃใฑใ„็œ‰ใฎ่ถณใซใถใฃใ‹ใ‘ใฆใใ ใ•ใ„ใ€‚
true ใ–ใƒผใ‚ใƒผใ‚“ใ€ใ›ใƒผใˆใ

modelใฏLocal-Novel-LLM-project/Vecteus-v1ใ‚’sftใง็‹ฌ่‡ชใƒ‡ใƒผใ‚ฟใ‚ปใƒƒใƒˆใ‚’็”จใ„ใฆ่จ“็ทดใ—ใพใ—ใŸใ€‚

image/png

Downloads last month
5
Safetensors
Model size
7.24B params
Tensor type
FP16
ยท
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.
The model cannot be deployed to the HF Inference API: The model has no library tag.

Model tree for swdq/ASR-Fixer

Finetuned
(2)
this model
Quantizations
1 model

Dataset used to train swdq/ASR-Fixer