Spaces:

jikoni
/

llamaSMS

Sleeping

Tri4 commited on Aug 11, 2024

Commit

7c5a24d

verified ·

1 Parent(s): ca6fb15

Update main.py

Files changed (1) hide show

main.py CHANGED Viewed

@@ -1,7 +1,7 @@
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 from flask import Flask, request, jsonify
-import os
 import torch
 app = Flask(__name__)
@@ -10,22 +10,23 @@ print("Hello welcome to Sema AI", flush=True)  # Flush to ensure immediate outpu
 @app.route("/")
 def hello():
     return "hello 🤗, Welcome to Sema AI Chat Service."
 # Get Hugging Face credentials from environment variables
-email = os.getenv('HF_EMAIL')
-password = os.getenv('HF_PASS')
-GEMMA_TOKEN = os.getenv("GEMMA_TOKEN")
-if not (email and password and GEMMA_TOKEN):
-    print("No dependencies", flush=True)
 model_id = "google/gemma-2-2b-it"
 device = "cuda:0" if torch.cuda.is_available() else "cpu"
-tokenizer = AutoTokenizer.from_pretrained(model_id)
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
     device_map="auto",
-    torch_dtype=torch.float16
 )
 app_pipeline = pipeline(
@@ -44,7 +45,6 @@ def generate_text():
     top_k = data.get("top_k", 50)
     top_p = data.get("top_p", 0.95)
-    # Generate text using the pipeline
     try:
         outputs = app_pipeline(
             prompt,

 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 from flask import Flask, request, jsonify
 import torch
+import os
 app = Flask(__name__)
 @app.route("/")
 def hello():
     return "hello 🤗, Welcome to Sema AI Chat Service."
 # Get Hugging Face credentials from environment variables
+HF_TOKEN = os.getenv('HF_TOKEN')
+if not HF_TOKEN:
+    print("Missing Hugging Face token", flush=True)
 model_id = "google/gemma-2-2b-it"
 device = "cuda:0" if torch.cuda.is_available() else "cpu"
+# Load tokenizer and model with authentication token
+tokenizer = AutoTokenizer.from_pretrained(model_id, use_auth_token=HF_TOKEN)
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
     device_map="auto",
+    torch_dtype=torch.float16,
+    use_auth_token=HF_TOKEN
 )
 app_pipeline = pipeline(
     top_k = data.get("top_k", 50)
     top_p = data.get("top_p", 0.95)
     try:
         outputs = app_pipeline(
             prompt,