|
--- |
|
license: mit |
|
language: |
|
- tr |
|
metrics: |
|
- accuracy |
|
- f1 |
|
pipeline_tag: token-classification |
|
tags: |
|
- ner |
|
- turkish-ner |
|
- turkish |
|
- nlp |
|
--- |
|
|
|
Bu model "https://github.com/stefan-it/turkish-bert" base alınarak geliştirilmiş bir NER(Varlık ismi tanıma) modelidir. |
|
|
|
|
|
## Eğitim ve validasyon verisi |
|
|
|
Fine-tune işlemi için TDD-NER-202112-CC-001 veri seti kullanılmıştır. |
|
|
|
@article{tur-etal-2003-milliyet, |
|
title={A statistical information extraction system for Turkish}, |
|
volume={9}, |
|
DOI={10.1017/S135132490200284X}, |
|
number={2}, |
|
journal={Natural Language Engineering}, |
|
publisher={Cambridge University Press}, |
|
author={Tür, Gökhan and Hakkani-Tür, Dilek and Oflazer, Kemal}, |
|
year={2003}, |
|
pages={181–210} |
|
} |
|
|
|
|
|
### Hiperparametreler |
|
|
|
custom_labels = ["O","B-LOC","I-LOC","B-ORG","I-ORG","B-PER","I-PER"] |
|
|
|
model_args = { |
|
"train_batch_size": 32, |
|
"eval_batch_size": 32, |
|
"num_train_epochs": 3, |
|
"seed":1, |
|
"save_steps": 625, |
|
"overwrite_output_dir": True, |
|
"output_dir": "/content/Model" |
|
} |
|
|
|
### Nasıl Kullanılacağı |
|
|
|
``` |
|
from transformers import pipeline |
|
|
|
pipe = pipeline("token-classification", model="Gorengoz/bert-based-Turkish-NER") |
|
pipe("Entity X'in müşteri hizmetleri hızlı ve etkili, Entity Y'nin ürün kalitesi çok kötü.",aggregation_strategy = "simple"") |
|
|
|
``` |