xuandin commited on
Commit
e4ba0fe
·
verified ·
1 Parent(s): 0949d9f

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +26 -3
README.md CHANGED
@@ -28,6 +28,7 @@ license: mit
28
 
29
  ## Usage Example
30
 
 
31
  ```python
32
  # Install semviqa
33
  !pip install semviqa
@@ -37,11 +38,11 @@ from transformers import AutoTokenizer
37
  from semviqa.ser.qatc_model import QATCForQuestionAnswering
38
  import torch
39
 
40
- tokenizer = AutoTokenizer.from_pretrained("xuandin/semviqa-qatc-vi-mrc-large-viwikifc")
41
- model = QATCForQuestionAnswering.from_pretrained("xuandin/semviqa-qatc-vi-mrc-large-viwikifc")
42
  claim = "Chiến tranh với Campuchia đã kết thúc trước khi Việt Nam thống nhất."
43
  context = "Sau khi thống nhất, Việt Nam tiếp tục gặp khó khăn do sự sụp đổ và tan rã của đồng minh Liên Xô cùng Khối phía Đông, các lệnh cấm vận của Hoa Kỳ, chiến tranh với Campuchia, biên giới giáp Trung Quốc và hậu quả của chính sách bao cấp sau nhiều năm áp dụng. Năm 1986, Đảng Cộng sản ban hành cải cách đổi mới, tạo điều kiện hình thành kinh tế thị trường và hội nhập sâu rộng. Cải cách đổi mới kết hợp cùng quy mô dân số lớn đưa Việt Nam trở thành một trong những nước đang phát triển có tốc độ tăng trưởng thuộc nhóm nhanh nhất thế giới, được coi là Hổ mới châu Á dù cho vẫn gặp phải những thách thức như tham nhũng, tội phạm gia tăng, ô nhiễm môi trường và phúc lợi xã hội chưa đầy đủ. Ngoài ra, giới bất đồng chính kiến, chính phủ một số nước phương Tây và các tổ chức theo dõi nhân quyền có quan điểm chỉ trích hồ sơ nhân quyền của Việt Nam liên quan đến các vấn đề tôn giáo, kiểm duyệt truyền thông, hạn chế hoạt động ủng hộ nhân quyền cùng các quyền tự do dân sự."
44
-
45
  inputs = tokenizer(claim, context, return_tensors="pt", truncation=True, max_length=512)
46
 
47
  with torch.no_grad():
@@ -59,6 +60,28 @@ print(evidence)
59
  # evidence: Sau khi thống nhất, Việt Nam tiếp tục gặp khó khăn do sự sụp đổ và tan rã của đồng minh Liên Xô cùng Khối phía Đông, các lệnh cấm vận của Hoa Kỳ, chiến tranh với Campuchia, biên giới giáp Trung Quốc và hậu quả của chính sách bao cấp sau nhiều năm áp dụng.
60
  ```
61
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
62
  ---
63
 
64
  ## **Evaluation Results**
 
28
 
29
  ## Usage Example
30
 
31
+ Direct Model Usage
32
  ```python
33
  # Install semviqa
34
  !pip install semviqa
 
38
  from semviqa.ser.qatc_model import QATCForQuestionAnswering
39
  import torch
40
 
41
+ tokenizer = AutoTokenizer.from_pretrained("SemViQA/qatc-vimrc-viwikifc")
42
+ model = QATCForQuestionAnswering.from_pretrained("SemViQA/qatc-vimrc-viwikifc")
43
  claim = "Chiến tranh với Campuchia đã kết thúc trước khi Việt Nam thống nhất."
44
  context = "Sau khi thống nhất, Việt Nam tiếp tục gặp khó khăn do sự sụp đổ và tan rã của đồng minh Liên Xô cùng Khối phía Đông, các lệnh cấm vận của Hoa Kỳ, chiến tranh với Campuchia, biên giới giáp Trung Quốc và hậu quả của chính sách bao cấp sau nhiều năm áp dụng. Năm 1986, Đảng Cộng sản ban hành cải cách đổi mới, tạo điều kiện hình thành kinh tế thị trường và hội nhập sâu rộng. Cải cách đổi mới kết hợp cùng quy mô dân số lớn đưa Việt Nam trở thành một trong những nước đang phát triển có tốc độ tăng trưởng thuộc nhóm nhanh nhất thế giới, được coi là Hổ mới châu Á dù cho vẫn gặp phải những thách thức như tham nhũng, tội phạm gia tăng, ô nhiễm môi trường và phúc lợi xã hội chưa đầy đủ. Ngoài ra, giới bất đồng chính kiến, chính phủ một số nước phương Tây và các tổ chức theo dõi nhân quyền có quan điểm chỉ trích hồ sơ nhân quyền của Việt Nam liên quan đến các vấn đề tôn giáo, kiểm duyệt truyền thông, hạn chế hoạt động ủng hộ nhân quyền cùng các quyền tự do dân sự."
45
+
46
  inputs = tokenizer(claim, context, return_tensors="pt", truncation=True, max_length=512)
47
 
48
  with torch.no_grad():
 
60
  # evidence: Sau khi thống nhất, Việt Nam tiếp tục gặp khó khăn do sự sụp đổ và tan rã của đồng minh Liên Xô cùng Khối phía Đông, các lệnh cấm vận của Hoa Kỳ, chiến tranh với Campuchia, biên giới giáp Trung Quốc và hậu quả của chính sách bao cấp sau nhiều năm áp dụng.
61
  ```
62
 
63
+ Using TF-IDF and QATC Combination with Confidence Threshold
64
+ ```python
65
+ import torch
66
+ from transformers import AutoTokenizer
67
+ from semviqa.ser.qatc_model import QATCForQuestionAnswering
68
+ from semviqa.ser.ser_eval import extract_evidence_tfidf_qatc
69
+
70
+ device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
71
+
72
+ tokenizer = AutoTokenizer.from_pretrained("SemViQA/qatc-vimrc-viwikifc")
73
+ model = QATCForQuestionAnswering.from_pretrained("SemViQA/qatc-vimrc-viwikifc").to(device)
74
+
75
+ claim = "Chiến tranh với Campuchia đã kết thúc trước khi Việt Nam thống nhất."
76
+ context = "Sau khi thống nhất, Việt Nam tiếp tục gặp khó khăn do sự sụp đổ và tan rã của đồng minh Liên Xô cùng Khối phía Đông, các lệnh cấm vận của Hoa Kỳ, chiến tranh với Campuchia, biên giới giáp Trung Quốc và hậu quả của chính sách bao cấp sau nhiều năm áp dụng. Năm 1986, Đảng Cộng sản ban hành cải cách đổi mới, tạo điều kiện hình thành kinh tế thị trường và hội nhập sâu rộng. Cải cách đổi mới kết hợp cùng quy mô dân số lớn đưa Việt Nam trở thành một trong những nước đang phát triển có tốc độ tăng trưởng thuộc nhóm nhanh nhất thế giới, được coi là Hổ mới châu Á dù cho vẫn gặp phải những thách thức như tham nhũng, tội phạm gia tăng, ô nhiễm môi trường và phúc lợi xã hội chưa đầy đủ. Ngoài ra, giới bất đồng chính kiến, chính phủ một số nước phương Tây và các tổ chức theo dõi nhân quyền có quan điểm chỉ trích hồ sơ nhân quyền của Việt Nam liên quan đến các vấn đề tôn giáo, kiểm duyệt truyền thông, hạn chế hoạt động ủng hộ nhân quyền cùng các quyền tự do dân sự."
77
+
78
+ evidence = extract_evidence_tfidf_qatc(
79
+ claim, context, model, tokenizer, device, confidence_threshold=0.5, length_ratio_threshold=0.6
80
+ )
81
+
82
+ print(evidence)
83
+ # evidence: sau khi thống nhất việt nam tiếp tục gặp khó khăn do sự sụp đổ và tan rã của đồng minh liên xô cùng khối phía đông các lệnh cấm vận của hoa kỳ chiến tranh với campuchia biên giới giáp trung quốc và hậu quả của chính sách bao cấp sau nhiều năm áp dụng
84
+ ```
85
  ---
86
 
87
  ## **Evaluation Results**