Spaces:

Ehrii
/

sentiment-analysis

Running

App Files Files Community

sentiment-analysis / main.py

Ehrii

Update main.py

f1c88da verified 22 days ago

raw

history blame contribute delete

2.5 kB

	import os
	from fastapi import FastAPI
	from pydantic import BaseModel
	from transformers import pipeline, AutoTokenizer
	from langdetect import detect, DetectorFactory

	# Ensure consistent language detection results
	DetectorFactory.seed = 0

	# Set Hugging Face cache directory to a writable location
	os.environ["HF_HOME"] = "/tmp/huggingface"
	os.makedirs(os.environ["HF_HOME"], exist_ok=True)

	app = FastAPI()

	# Load the original tokenizer from the base model
	original_tokenizer = AutoTokenizer.from_pretrained("tabularisai/multilingual-sentiment-analysis")

	hf_token = os.getenv("HF_TOKEN")

	# Load the fine-tuned model and pass the tokenizer explicitly
	multilingual_model = pipeline(
	"sentiment-analysis",
	model="Ehrii/sentiment",
	tokenizer=original_tokenizer,
	token=hf_token
	)

	# English model remains unchanged
	english_model = pipeline("sentiment-analysis", model="siebert/sentiment-roberta-large-english")

	class SentimentRequest(BaseModel):
	text: str

	class SentimentResponse(BaseModel):
	original_text: str
	language_detected: str
	sentiment: str
	confidence_score: float

	def detect_language(text):
	try:
	return detect(text)
	except Exception:
	return "unknown"

	@app.get("/")
	def home():
	return {"message": "Sentiment Analysis API is running!"}

	@app.post("/analyze/", response_model=SentimentResponse)
	def analyze_sentiment(request: SentimentRequest):
	text = request.text
	language = detect_language(text)

	# Choose the appropriate model based on language
	if language == "en":
	result = english_model(text)
	else:
	result = multilingual_model(text)

	# Debugging: Print model output
	print("Model Output:", result)

	# Handle label mapping if model uses generic labels
	label_map = {
	"LABEL_0": "negative",
	"LABEL_1": "positive",
	"LABEL_2": "neutral",
	"0": "negative",
	"1": "positive",
	"2": "neutral",
	"NEGATIVE": "negative",
	"POSITIVE": "positive",
	"NEUTRAL": "neutral",
	}

	# Ensure label exists and map it correctly
	sentiment_label = result[0]["label"].upper() # Convert to uppercase for consistency
	sentiment = label_map.get(sentiment_label, sentiment_label).lower() # Default fallback

	return SentimentResponse(
	original_text=text,
	language_detected=language,
	sentiment=sentiment, # Always "positive" or "negative"
	confidence_score=result[0]["score"],
	)