Spaces:

allekssandr
/

Kek-bot

Sleeping

App Files Files Community

allekssandr commited on Feb 3

Commit

ccac5b1

verified ·

1 Parent(s): 00830f6

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -157

app.py CHANGED Viewed

@@ -1,163 +1,16 @@
-import logging
-import os
-from platform import system
-from dotenv import load_dotenv
-from huggingface_hub import HfApi, HfFolder
-from humanfriendly.terminal import output
-from telegram import Update
-from telegram.ext import ApplicationBuilder, CommandHandler, MessageHandler, filters, CallbackContext
-from transformers import AutoModelForCausalLM, AutoTokenizer
-import torch
-load_dotenv()
-TOKEN = os.getenv("TELEGRAM_TOKEN")
-HF_TOKEN = os.getenv("HF_TOKEN")
-MAX_LENGTH_REQUEST = 1024
-MAX_NEW_TOKENS = 128
-MAX_LENGTH_RESPONSE = 100
-TEST_ENV=os.getenv("TEST_ENV")
-# Настройка логирования
-logging.basicConfig(
-    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
-    level=logging.INFO
 )
-logger = logging.getLogger(__name__)
-logger.info(f"TEST_ENV= {TEST_ENV}")
-# Логин через токен
-try:
-    api = HfApi()
-    HfFolder.save_token(HF_TOKEN)
-except Exception as e:
-    logger.error(f"Ошибка авторизации токена: {str(e)}")
-    raise
-rugpt3large_based_on_gpt2_model_name = "ai-forever/rugpt3large_based_on_gpt2"
-rugpt3small_based_on_gpt2_model_name = "ai-forever/rugpt3small_based_on_gpt2"
-sber_rugpt3small_based_on_gpt2_model_name = "sberbank-ai/rugpt3small_based_on_gpt2"
-phi_mini_instruct_GGUF_model_name = "bartowski/Phi-3.5-mini-instruct-GGUF"
-# Инициализация модели
-try:
-    model_name = phi_mini_instruct_GGUF_model_name # Меньшая модель
-    tokenizer = AutoTokenizer.from_pretrained(model_name, padding_side="left")
-    model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")
-    logger.info("Модель успешно загружена")
-except Exception as e:
-    logger.error(f"Ошибка загрузки модели: {str(e)}")
-    raise
-# Настройка устройства
-device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
-model.to(device)
-logger.info(f"Используемое устройство: {device}")
-# Контекст диалога (упрощенная версия)
-chat_contexts = {}
-def get_chat_context(chat_id):
-    if chat_id not in chat_contexts:
-        chat_contexts[chat_id] = {"history": []}
-    return chat_contexts[chat_id]
-MAX_HISTORY_LENGTH = 10
-def add_to_chat_history(chat_id, user_input, bot_response):
-    context = get_chat_context(chat_id)
-    context["history"].append({"user": user_input, "bot": bot_response})
-    if len(context["history"]) > MAX_HISTORY_LENGTH:
-        context["history"] = context["history"][-MAX_HISTORY_LENGTH:]
-async def start(update: Update, context: CallbackContext) -> None:
-    """Обработчик команды /start"""
-    await update.message.reply_text('🚀 Привет! Я РУССКИЙ! :) бот.')
-async def handle_message(update: Update, context: CallbackContext) -> None:
-    """Обработка текстовых сообщений"""
-    try:
-        user_input = update.message.text
-        chat_id = update.message.chat_id
-        user_name = update.message.from_user.username
-        logger.info(f"Получено сообщение: {user_input}")
-        # Получаем контекст чата
-        context = get_chat_context(chat_id)
-        # Формируем входной текст с учетом истории
-        input_text = ""
-        for msg in context["history"]:
-            input_text += f"Пользователь: {msg['user']}\nБот: {msg['bot']}"
-        tokenizer.pad_token = tokenizer.eos_token
-        # Генерация промта
-        system_prompt = "Ответ должен быть точным и кратким."
-        # system_prompt = ""
-        # prompt = f"{system_prompt} Вопрос: {user_input}; Ответ: "
-        prompt = f"{system_prompt}\n {user_input}\n"
-        logger.info(f"Промт: {prompt}")
-        # Генерация ответа
-        inputs = tokenizer(
-            prompt,
-            return_tensors="pt",  # Возвращает PyTorch тензоры
-            # truncation=True,  # Обрезает текст, если он превышает max_length
-            # add_special_tokens=True,  # Добавляет специальные токены (например, [CLS], [SEP])
-        ).to(device)
-        outputs = model.generate(
-            inputs.input_ids,
-            max_new_tokens=60,
-            no_repeat_ngram_size=3,
-            repetition_penalty=1.5,
-            do_sample=True,
-            top_k=100,
-            top_p=0.3,
-            temperature=0.4,
-            stop_strings=['<s>'],
-            tokenizer=tokenizer,
-        )
-        # Декодирование ответа
-        # response = list(map(tokenizer.decode, outputs))[0]
-        response = tokenizer.batch_decode(outputs[:, inputs.input_ids.shape[1]:], skip_special_tokens=True)[0]
-        logger.info(f"Ответ: {response}")
-        if not response:
-            response = "🤔 Пока не знаю, что ответить. Можете переформулировать вопрос?"
-        # Отправка ответа
-        await update.message.reply_text(response, parse_mode=None)
-        add_to_chat_history(chat_id, user_input, response)
-    except Exception as e:
-        logger.error(f"Ошибка обработки сообщения: {str(e)}")
-        await update.message.reply_text("❌ Произошла ошибка при обработке запроса")
-def app() -> None:
-    try:
-        application = ApplicationBuilder().token(TOKEN).build()
-        application.add_handler(CommandHandler("start", start))
-        application.add_handler(MessageHandler(filters.TEXT & ~filters.COMMAND, handle_message))
-        application.add_error_handler(error)
-        logger.info("Бот запущен")
-        application.run_polling()
-    except Exception as e:
-        logger.error(f"Ошибка запуска бота: {str(e)}")
-async def error(update: Update, context: CallbackContext) -> None:
-    logger.error(f'Ошибка: {context.error}')
 if __name__ == '__app__':
     app()

+from llama_cpp import Llama
+llm = Llama.from_pretrained(
+	repo_id="microsoft/Phi-3-mini-4k-instruct-gguf",
+	filename="Phi-3-mini-4k-instruct-fp16.gguf",
 )
+output = llm(
+	"Once upon a time,",
+	max_tokens=512,
+	echo=True
+)
+print(output)
 if __name__ == '__app__':
     app()