|
--- |
|
language: ko |
|
license: mit |
|
tags: |
|
- sentiment |
|
- korean |
|
- finance |
|
- binary-classification |
|
- text-classification |
|
datasets: |
|
- custom |
|
pipeline_tag: text-classification |
|
widget: |
|
- text: "환율 급등 우려로 시장 불안이 커지고 있다." |
|
- text: "주가 상승 기대감에 투자심리가 개선되고 있다." |
|
--- |
|
|
|
# FinBERT Sentiment KO (Binary) - `finbert-sentiment-ko-binary` |
|
|
|
🧠 **FinBERT 기반 한국어 감정 분석 이진 분류 모델 (긍정/부정)** |
|
|
|
이 모델은 `snunlp/KR-FinBERT-SC`를 기반으로 파인튜닝된 모델로, **환율 뉴스에 대한 긍정/부정 감정 분류**를 수행합니다. |
|
`중립` 라벨은 제외하고, 오직 긍정(1)과 부정(0) 두 가지 감정만 예측하도록 학습되었습니다. |
|
|
|
--- |
|
|
|
## 🔧 모델 구조 |
|
|
|
- **Base model**: [`snunlp/KR-FinBERT-SC`](https://huggingface.co/snunlp/KR-FinBERT-SC) |
|
- **Task**: Text Classification (Binary Sentiment) |
|
- **Classes**: |
|
- `0`: 부정 (Negative) |
|
- `1`: 긍정 (Positive) |
|
|
|
--- |
|
|
|
## 📊 성능 평가 |
|
|
|
테스트셋 기준 성능 (42개 샘플): |
|
|
|
| Metric | Score | |
|
|----------------|-------| |
|
| Accuracy | 0.95 | |
|
| Precision (부정) | 0.92 | |
|
| Recall (부정) | 1.00 | |
|
| F1-score (부정) | 0.96 | |
|
| Precision (긍정) | 1.00 | |
|
| Recall (긍정) | 0.89 | |
|
| F1-score (긍정) | 0.94 | |
|
|
|
--- |
|
|
|
## 🧪 사용 예시 |
|
|
|
```python |
|
from transformers import pipeline |
|
|
|
classifier = pipeline("text-classification", model="DataWizardd/finbert-sentiment-binary") |
|
|
|
print(classifier("환율 급등 우려로 시장 불안이 커지고 있다.")) |
|
# 출력 예시: [{'label': 'LABEL_0', 'score': 0.98}] ← 부정 |
|
|
|
print(classifier("환율 급락이 예상된다.")) |
|
# 출력 예시: [{'label': 'LABEL_1', 'score': 0.95}] ← 긍정 |
|
|