senmasa commited on
Commit
027bf3e
·
verified ·
1 Parent(s): 20c802d

End of training

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 384,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,568 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:46095
8
+ - loss:MultipleNegativesRankingLoss
9
+ base_model: intfloat/multilingual-e5-small
10
+ widget:
11
+ - source_sentence: Bulog Sudah Serap 328 Ribu Ton Beras tapi Ada Masalah. Perum Bulog
12
+ telah menyerap 633 ribu ton setara gabah atau 329 ribu ton setara beras. Direktur
13
+ Utama Perum Bulog Bayu Krisnamurthi mengungkapkan masih ada sejumlah kendala yang
14
+ dihadapi dalam proses penyerapan ini. Pertama, adalah periode panen pendek tetapi
15
+ jumlah panen banyak. Bayu mengatakan hal ini membuat petani lama mengantri agar
16
+ padi yang dihasilkan bisa masuk ke proses pengering Bulog maupun penggilingan
17
+ mitra Bulog. "Dengan jumlah yang banyak, tapi waktu yang pendek. Sehingga semua
18
+ rebutan, rebutan untuk masuk ke Bulog maupun penggilingan padi," kata Bayu di
19
+ Bulog Corporate University Kamis (25/4/2024). ADVERTISEMENT SCROLL TO CONTINUE
20
+ WITH CONTENT "Waktu yang pendek ini menimbulkan kendala di mesin pengering. Karena
21
+ pada saat yang sama mataharinya masih ada dan tiada seperti sore hari ini. Jadi
22
+ mau dijemur pakai lantai jemur sangat tergantung sinar matahari, padahal mataharinya
23
+ mendung, kadang hujan," sambungnya. Sementara masalah kedua, adalah dampak dari
24
+ dari situasi pupuk di tahun 2023 dan awal tahun 2024. Gara-gara hal itu, komposisi
25
+ ketersediaan pupuk tidak optimal, hal itu pun berpengaruh terhadap tidak optimalnya
26
+ kualitas gabah petani. "Jadi pecahnya banyak, kuningnya banyak. Ini nggak masuk
27
+ ke tabel persyaratan mutu yang telah ditetapkan. Tapi kalau untuk kadar air kami
28
+ terpaksa menegakkan disiplin, (sedangkan) kalau untuk yang lain itu kami berusaha
29
+ mencari cara atau solusinya," ucapnya. Hingga saat ini, Bayu pun menjelaskan bahwa
30
+ Bulog memiliki stok beras cukup banyak. Jumlahnya berkisar di angka 1,457 juta
31
+ ton. "Jumlah yang agak banyak ini terjadi karena program bantuan pangan belum
32
+ berjalan, masih menunggu update data. Mudah-mudahan dalam minggu ini segera selesai,
33
+ dan nanti kita segera salurkan bantuan pangan itu dalam sisa bulan Mei-Juni, untuk
34
+ 3 bulan jumlahnya," ujar dia.
35
+ sentences:
36
+ - Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat
37
+ yang dapat meningkatkan citra atau reputasi Kementerian Pertanian?
38
+ - Seberapa netral artikel ini? Apakah artikel ini hanya menyajikan fakta atau informasi
39
+ tanpa memberikan opini atau emosi terhadap rumah sakit (rs)?
40
+ - Seberapa netral artikel ini? Apakah artikel ini hanya menyajikan fakta atau informasi
41
+ tanpa memberikan opini atau emosi terhadap Kementerian Pertanian?
42
+ - source_sentence: Kepala BNPP Hadiri Pembukaan Turnamen Olahraga Antar Instansi.
43
+ Acara yang digelar di Jakarta ini diikuti berbagai lembaga pemerintah untuk mempererat
44
+ tali silaturahmi.
45
+ sentences:
46
+ - Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan
47
+ atau menciptakan persepsi buruk terhadap Kepolisian Nasional Indonesia (Polri)?
48
+ - Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat
49
+ yang dapat meningkatkan citra atau reputasi Badan Nasional Pengelola Perbatasan?
50
+ - Seberapa netral artikel ini? Apakah artikel ini hanya menyajikan fakta atau informasi
51
+ tanpa memberikan opini atau emosi terhadap Badan Nasional Pengelola Perbatasan?
52
+ - source_sentence: 'KKP perkuat pengawasan penangkapan ikan ilegal di perbatasan.
53
+ JAKARTA (ANTARA) - Direktorat Jendral (Ditjen) Pengawasan Sumber Daya Kelautan
54
+ dan Perikanan (PSDKP) Kementerian Kelautan dan Perikanan (KKP) memperkuat pengawasan
55
+ penangkapan ikan ilegal atau illegal fishing di wilayah perbatasan dengan mengalokasikan
56
+ anggaran sebesar Rp1,14 triliun. "Untuk memberantas illegal fishing oleh kapal
57
+ asing di Selat Malaka, laut Natuna Utara dan laut Sulawesi," kata Direktur Jenderal
58
+ PSDKP KKP Adin Nurawaluddin saat dihubungi ANTARA, di Jakarta, Senin. Adin mengatakan
59
+ PSDKP juga melakukan pengawasan terhadap kepatuhan kapal-kapal ikan Indonesia
60
+ agar penangakapan ikan sesuai dengan regulasi untuk melaporkan hasil tangkap ikan
61
+ guna menjaga keberlanjutan potensi ikan. "Harus melaporkan hasil tangkapan ikannya
62
+ dalam rangka memastikan data potensi perikanan tangkap pasca produksi untuk menjaga
63
+ keberlanjutan potensi perikanan," kata dia. Selain itu, kata Adin PSDKP juga mengalokasikan
64
+ anggaran untuk melaksanakan pengawasan sumber daya kelautan seperti pengawasan
65
+ terhadap wilayah pesisir dan pulau-pulau kecil, pengawasan pemanfaatan ruang laut
66
+ dan reklamasi tanpa izin, dan pengawasan d estructive fishing atau penangkapan
67
+ ikan dengan cara merusak dengan bom ikan, bahan kimia dan listrik. Selanjutnya,
68
+ pihaknya juga melakukan pengawasan terhadap si stem komunikasi kabel laut (SKKL)
69
+ , pengawasan b arang muatan kapal tenggelam (BMKT) dan pengawasan pencemaran di
70
+ laut. Diketahui, KKP mendapatkan anggaran 2024 sebesar Rp7,04 triliun yang kemudian
71
+ mendapatkan tambahan anggaran pada sebesar Rp57,1 miliar. Dari total anggaran
72
+ yang didapat, pihaknya akan mengalokasikan sebesar Rp659,66 miliar untuk Sekretariat
73
+ Jenderal (Setjen), kemudian Inspektorat Jenderal sebesar Rp87,25 miliar, Direktorat
74
+ Jenderal (Ditjen) Perikanan Tangkap sebesar Rp946,54 miliar. Serta Ditjen Perikanan
75
+ Budi Daya sebesar Rp1,22 triliun, Ditjen Pengawasan Sumber Daya Kelautan dan Perikanan
76
+ (PSDKP) sebesar Rp 1,14 triliun, Ditjen Penguatan Daya Saing Produk Kelautan dan
77
+ Perikanan (PDSKP) Rp386,88 miliar. Ditjen Pengelolaan Kelautan dan Ruang Laut
78
+ sebesar Rp657,63 miliar, sementara untuk Badan Penyuluhan dan Pengembangan Sumber
79
+ Daya Manusia Kelautan dan Perikanan sebesar Rp1,47 triliun serta Badan Pengendalian
80
+ dan Pengawasan Mutu Hasil Kelautan dan Perikanan sebesar Rp529,61 miliar. Luhut
81
+ ingatkan pengelolaan laut harus perhatikan aspek keberlanjutan KKP: 91 persen
82
+ nelayan dan pengusaha perikanan tahu aplikasi "e-PIT" Pewarta: Erlangga Bregas
83
+ Prakoso Editor: Sella Panduarsa Gareta COPYRIGHT © ANTARA 2023'
84
+ sentences:
85
+ - Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat
86
+ yang dapat meningkatkan citra atau reputasi Adin Nurawaluddin?
87
+ - Seberapa netral artikel ini? Apakah artikel ini hanya menyajikan fakta atau informasi
88
+ tanpa memberikan opini atau emosi terhadap Pemerintah Provinsi DKI Jakarta?
89
+ - Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan
90
+ atau menciptakan persepsi buruk terhadap Adin Nurawaluddin?
91
+ - source_sentence: 'Ciri-ciri Snack Tidak Sehat untuk Anak, Salah Satunya Tinggi Gula.
92
+ KabarDKI.com - Camilan atau snack untuk anak banyak beredar di pasaran. Banyak
93
+ ciri-ciri yang dapat dikenali dari snack yang tidak sehat (unhealthy snack) ini.
94
+ dr. Melanie Rakhmi Mantu, SpA (K), Mkes, dokter spesialis tumbuh kembang anak
95
+ menjelaskan ciri-ciri snack tidak sehat, beberapa di antaranya mengandung gula
96
+ dan garam yang tinggi. "Kalau unhealthy snack itu mengandung garam, gula, sodium
97
+ yang tinggi. Pilihan makanan tergantung dari orangtuanya yang memilihkan snack
98
+ untuk anak. Untuk efeknya terhadap kesehatan, makanan yang fresh, rendah garam,
99
+ gula, sodium, mengandung vitamin dan mineral, " kata dr. Melanie dalam acara \''Mengungkap
100
+ Bahaya Peredaran Produk Pangan Impor llegal Asal China yang Luput dari Pengawasan:
101
+ Membangun Kesadaran dan Perlindungan Kesehatan Anak\'' yang digelar Yayasan Lembaga
102
+ Konsumen Indonesia (YLKI) dan Sekjen Koalisi Perlindungan Kesehatan Masyarakat
103
+ (KOPMAS), Rabu, 23 Oktober 2024. Sementara itu Sekjen KOPMAS, Yuli Supriati mengungkapkan
104
+ peredaran makanan impor memicu sejumlah keracunan. "Peredaran makanan dan minuman
105
+ impor China yang minim pengawasan/tidak ada izin BPOM ilegal memicu sejumlah kasus
106
+ keracunan pada anak, " katanya. Pit. Ketua Pengurus Harian YLKI, Dra Indah Sukaningsih
107
+ punya harapan terhadap pemerintahan Prabowo-Gibran. Menurutnya seharusnya ada
108
+ kementerian khusus yang menangani perlindungan konsumen. "Harusnya ada kementerian
109
+ khusus perlindungan konsumen, kan seharusnya itu yang diperhatikan. Dari prespektif
110
+ YLKI, harusnya ada SOP nya. Kalau kita menduga impor ini tidak sehat, perlu di
111
+ survey, bahwa ini tidak sehat," terangnya. \n\n\nBerita Pilihan\n\n\n\n\n\n\n\n\n\n\n5
112
+ Jurus Ampuh Atasi Bau Badan, Dijamin Wangi Seharian!\n\n\n\n\n\n\n\n\n\n\n\n\n\nDeteksi
113
+ Kanker Lebih Akurat lewat Biograph Vision Quadra PET/CT Scanner, Pertama di Asia\n\n\n\n\n\n\n\n\n\n\n\n\n\nHapus
114
+ Stigma Negatif Tehadap ODHIV, KPA Jakarta Selatan Lakukan Ini\n\n\n\n\n\n\n\n
115
+ Disamping itu, dirinya menyambut baik adanya program makan gratis yang digaungkan
116
+ pemerintah., " Program ini cukup bagus apabila orangtuanya bekerja, anak-anak
117
+ bisa mendapatkan gizi yang seimbang, daripada harus jajan di luar, " katanya.
118
+ ***, Berita Pilihan 5 Jurus Ampuh Atasi Bau Badan, Dijamin Wangi Seharian! Deteksi
119
+ Kanker Lebih Akurat lewat Biograph Vision Quadra PET/CT Scanner, Pertama di Asia
120
+ Hapus Stigma Negatif Tehadap ODHIV, KPA Jakarta Selatan Lakukan Ini'
121
+ sentences:
122
+ - Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat
123
+ yang dapat meningkatkan citra atau reputasi sekretaris jenderal koalisi perlindungan
124
+ kesehatan masyarakat (kopmas)?
125
+ - Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan
126
+ atau menciptakan persepsi buruk terhadap sekretaris jenderal koalisi perlindungan
127
+ kesehatan masyarakat (kopmas)?
128
+ - Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan
129
+ atau menciptakan persepsi buruk terhadap timnas u-17?
130
+ - source_sentence: Warganet Kaitkan Zulkifli Hasan dengan Kasus Impor Gula, Kejagung
131
+ langsung Pasang Badan!. JAKARTA, ExtraNews – Kasus korupsi impor gula makin memanas
132
+ dengan diramaikannya linimasa Twitter (X) yang dipenuhi beragam komentar atas
133
+ kasus korupsi itu. Sebagaimana diketahui, Thomas Trikasih Lembong atau Tom Lembong
134
+ ditetapkan Kejaksaan Agung sebagai tersangka dalam dugaan korupsi impor gula pada
135
+ 2015. Jaksa menjerat Menteri Perdagangan atau Mendag periode 2015-2016 itu membuat
136
+ kebijakan impor gula yang merugikan negara senilai Rp 400 miliar. Sejumlah netizen
137
+ Indonesia tampaknya tidak puas kalau cuma Tom Lembong yang di jadikan tersangka
138
+ atas korupsi impor gula itu, dan berharap penegak hukum untuk memeriksa Mentri
139
+ Perdagangan era Jokowi terutama Mendag Zulkifli Hasan. Di ketahui Menteri Perdagangan
140
+ terakhir di era Presiden Joko Widodo Zulkifli Hasan yang juga Ketua Umum Partai
141
+ Amanat Nasional itu pada 2023 mengimpor gula sebanyak 5,06 juta ton. Nampak di
142
+ tangkapan layar Twitter (X) tanggapan kaum netizen yang berharap Zulkifli Hasan
143
+ juga di periksa terkait kebijakan impor gula pada saat menjabat sebagai Mentri
144
+ Perdagangan dan menjadi trending topik dan mendapat beraneka ragam tanggapan dari
145
+ kaum netizen Indonesia. “Impor gula Zulkifli Hasan 18 juta ton, ini impornya 3x
146
+ lipat yang dilakukan oleh Tom Lembong. Kalo berdasarkan laporan masyarakat, ini
147
+ lebih gila laporannya. Segera prosessss!!!! “ tulis pengguna akun @har*m*nAZ “Kapan
148
+ impor gula Zulkifli Hasan 18 juta ton diusut, ini impornya 3x lipat yang dilakukan
149
+ oleh Tom Lembong Kasus Zulhas kalau diusut mungkin lebih mengerikan,” tulis pengguna
150
+ @Ca**hum “Banyak yg lupa bhw Airlangga,Dito yg bahkan ada bukti di kembalikan
151
+ uangnya itu tdk tersentuh sampai sekarang. Zulkifli Hasan terkait korupsi kasus
152
+ “GULA”. Kalaulah Tom Lembong bersalah, jelas sekali hukum kita masih jauh dari
153
+ kata adil, karna hanya menyasar lawan” politik saja,” tulis pengguna @sim*nj*nta9*ico
154
+ impor gula Zulkifli Hasan 18 juta ton, ini impornya 3x lipat yang dilakukan oleh
155
+ Tom Lembong. Kalo berdasarkan laporan masyarakat, ini lebih gila laporannya. Segera
156
+ prosessss!!!! pic.twitter.com/CcD62G9bG7 — Hariman Amir (@HarimanAz) October 31,
157
+ 2024 Sementara itu ramainya warganet yang mulai mengkaitkan kasus Tom Lembong
158
+ ke Zulkifli Hasan (zulhas) rupanya mendapatkan respon dari Kejaksaan Agung. Melalui
159
+ rilis resmi Kejaksaan Agung pada 2023 lalu menyatakan bahwa mereka tidak akan
160
+ memanggil kembali Menteri Perdagangan periode 2022-2024 Zulkifli Hasan sebagai
161
+ sebagai saksi terkait kasus dugaan korupsi penyalahgunaan kewenangan dalam kegiatan
162
+ importasi gula tersebut. Menurut Kepala Pusat Penerangan Hukum (Kapuspenkum) Kejagung,
163
+ Ketut Sumedana, tidak ada keterkaitan Menteri Zulkifli Hasan dalam perkara dimaksud.
164
+ Dijelaskan Ketut, perkara yang sedang ditangani Kejagung adalah penyelewengan
165
+ kebijakan yang telah dilaksanakan sejak tahun 2015. “Adapun perkara dimaksud tidak
166
+ ada kaitannya dengan kebijakan Menteri Perdagangan Zulkifli Hasan yang dilantik
167
+ pada bulan Juni 2022. Oleh karena tidak adanya hubungan dengan penanganan perkara
168
+ tersebut, Menteri Perdagangan Zulkifli Hasan tidak akan dilakukan pemanggilan
169
+ sebagai saksi dalam perkara dimaksud,” jelas Ketut dalam keterangan resminya pada
170
+ Jumat 6 Oktober 2023 lalu. (*)
171
+ sentences:
172
+ - Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat
173
+ yang dapat meningkatkan citra atau reputasi Marshanda?
174
+ - Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat
175
+ yang dapat meningkatkan citra atau reputasi presiden joko widodo?
176
+ - Seberapa netral artikel ini? Apakah artikel ini hanya menyajikan fakta atau informasi
177
+ tanpa memberikan opini atau emosi terhadap presiden joko widodo?
178
+ pipeline_tag: sentence-similarity
179
+ library_name: sentence-transformers
180
+ metrics:
181
+ - cosine_accuracy
182
+ model-index:
183
+ - name: SentenceTransformer based on intfloat/multilingual-e5-small
184
+ results:
185
+ - task:
186
+ type: triplet
187
+ name: Triplet
188
+ dataset:
189
+ name: Unknown
190
+ type: unknown
191
+ metrics:
192
+ - type: cosine_accuracy
193
+ value: 0.4019196971745302
194
+ name: Cosine Accuracy
195
+ ---
196
+
197
+ # SentenceTransformer based on intfloat/multilingual-e5-small
198
+
199
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-small](https://huggingface.co/intfloat/multilingual-e5-small) on the preskripsi-sentiment-analysis-dataset-for-embedding-ft dataset. It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
200
+
201
+ ## Model Details
202
+
203
+ ### Model Description
204
+ - **Model Type:** Sentence Transformer
205
+ - **Base model:** [intfloat/multilingual-e5-small](https://huggingface.co/intfloat/multilingual-e5-small) <!-- at revision fd1525a9fd15316a2d503bf26ab031a61d056e98 -->
206
+ - **Maximum Sequence Length:** 512 tokens
207
+ - **Output Dimensionality:** 384 dimensions
208
+ - **Similarity Function:** Cosine Similarity
209
+ - **Training Dataset:**
210
+ - preskripsi-sentiment-analysis-dataset-for-embedding-ft
211
+ <!-- - **Language:** Unknown -->
212
+ <!-- - **License:** Unknown -->
213
+
214
+ ### Model Sources
215
+
216
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
217
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
218
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
219
+
220
+ ### Full Model Architecture
221
+
222
+ ```
223
+ SentenceTransformer(
224
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
225
+ (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
226
+ (2): Normalize()
227
+ )
228
+ ```
229
+
230
+ ## Usage
231
+
232
+ ### Direct Usage (Sentence Transformers)
233
+
234
+ First install the Sentence Transformers library:
235
+
236
+ ```bash
237
+ pip install -U sentence-transformers
238
+ ```
239
+
240
+ Then you can load this model and run inference.
241
+ ```python
242
+ from sentence_transformers import SentenceTransformer
243
+
244
+ # Download from the 🤗 Hub
245
+ model = SentenceTransformer("masa-research/me5-small-preskripsi-embedding-pos-neg")
246
+ # Run inference
247
+ sentences = [
248
+ 'Warganet Kaitkan Zulkifli Hasan dengan Kasus Impor Gula, Kejagung langsung Pasang Badan!. JAKARTA, ExtraNews – Kasus korupsi impor gula makin memanas dengan diramaikannya linimasa Twitter (X) yang dipenuhi beragam komentar atas kasus korupsi itu. Sebagaimana diketahui, Thomas Trikasih Lembong atau Tom Lembong ditetapkan Kejaksaan Agung sebagai tersangka dalam dugaan korupsi impor gula pada 2015. Jaksa menjerat Menteri Perdagangan atau Mendag periode 2015-2016 itu membuat kebijakan impor gula yang merugikan negara senilai Rp 400 miliar. Sejumlah netizen Indonesia tampaknya tidak puas kalau cuma Tom Lembong yang di jadikan tersangka atas korupsi impor gula itu, dan berharap penegak hukum untuk memeriksa Mentri Perdagangan era Jokowi terutama Mendag Zulkifli Hasan. Di ketahui Menteri Perdagangan terakhir di era Presiden Joko Widodo Zulkifli Hasan yang juga Ketua Umum Partai Amanat Nasional itu pada 2023 mengimpor gula sebanyak 5,06 juta ton. Nampak di tangkapan layar Twitter (X) tanggapan kaum netizen yang berharap Zulkifli Hasan juga di periksa terkait kebijakan impor gula pada saat menjabat sebagai Mentri Perdagangan dan menjadi trending topik dan mendapat beraneka ragam tanggapan dari kaum netizen Indonesia. “Impor gula Zulkifli Hasan 18 juta ton, ini impornya 3x lipat yang dilakukan oleh Tom Lembong. Kalo berdasarkan laporan masyarakat, ini lebih gila laporannya. Segera prosessss!!!! “ tulis pengguna akun @har*m*nAZ “Kapan impor gula Zulkifli Hasan 18 juta ton diusut, ini impornya 3x lipat yang dilakukan oleh Tom Lembong Kasus Zulhas kalau diusut mungkin lebih mengerikan,” tulis pengguna @Ca**hum “Banyak yg lupa bhw Airlangga,Dito yg bahkan ada bukti di kembalikan uangnya itu tdk tersentuh sampai sekarang. Zulkifli Hasan terkait korupsi kasus “GULA”. Kalaulah Tom Lembong bersalah, jelas sekali hukum kita masih jauh dari kata adil, karna hanya menyasar lawan” politik saja,” tulis pengguna @sim*nj*nta9*ico impor gula Zulkifli Hasan 18 juta ton, ini impornya 3x lipat yang dilakukan oleh Tom Lembong. Kalo berdasarkan laporan masyarakat, ini lebih gila laporannya. Segera prosessss!!!! pic.twitter.com/CcD62G9bG7 — Hariman Amir (@HarimanAz) October 31, 2024 Sementara itu ramainya warganet yang mulai mengkaitkan kasus Tom Lembong ke Zulkifli Hasan (zulhas) rupanya mendapatkan respon dari Kejaksaan Agung. Melalui rilis resmi Kejaksaan Agung pada 2023 lalu menyatakan bahwa mereka tidak akan memanggil kembali Menteri Perdagangan periode 2022-2024 Zulkifli Hasan sebagai sebagai saksi terkait kasus dugaan korupsi penyalahgunaan kewenangan dalam kegiatan importasi gula tersebut. Menurut Kepala Pusat Penerangan Hukum (Kapuspenkum) Kejagung, Ketut Sumedana, tidak ada keterkaitan Menteri Zulkifli Hasan dalam perkara dimaksud. Dijelaskan Ketut, perkara yang sedang ditangani Kejagung adalah penyelewengan kebijakan yang telah dilaksanakan sejak tahun 2015. “Adapun perkara dimaksud tidak ada kaitannya dengan kebijakan Menteri Perdagangan Zulkifli Hasan yang dilantik pada bulan Juni 2022. Oleh karena tidak adanya hubungan dengan penanganan perkara tersebut, Menteri Perdagangan Zulkifli Hasan tidak akan dilakukan pemanggilan sebagai saksi dalam perkara dimaksud,” jelas Ketut dalam keterangan resminya pada Jumat 6 Oktober 2023 lalu. (*)',
249
+ 'Seberapa netral artikel ini? Apakah artikel ini hanya menyajikan fakta atau informasi tanpa memberikan opini atau emosi terhadap presiden joko widodo?',
250
+ 'Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat yang dapat meningkatkan citra atau reputasi presiden joko widodo?',
251
+ ]
252
+ embeddings = model.encode(sentences)
253
+ print(embeddings.shape)
254
+ # [3, 384]
255
+
256
+ # Get the similarity scores for the embeddings
257
+ similarities = model.similarity(embeddings, embeddings)
258
+ print(similarities.shape)
259
+ # [3, 3]
260
+ ```
261
+
262
+ <!--
263
+ ### Direct Usage (Transformers)
264
+
265
+ <details><summary>Click to see the direct usage in Transformers</summary>
266
+
267
+ </details>
268
+ -->
269
+
270
+ <!--
271
+ ### Downstream Usage (Sentence Transformers)
272
+
273
+ You can finetune this model on your own dataset.
274
+
275
+ <details><summary>Click to expand</summary>
276
+
277
+ </details>
278
+ -->
279
+
280
+ <!--
281
+ ### Out-of-Scope Use
282
+
283
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
284
+ -->
285
+
286
+ ## Evaluation
287
+
288
+ ### Metrics
289
+
290
+ #### Triplet
291
+
292
+ * Evaluated with [<code>TripletEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.TripletEvaluator)
293
+
294
+ | Metric | Value |
295
+ |:--------------------|:-----------|
296
+ | **cosine_accuracy** | **0.4019** |
297
+
298
+ <!--
299
+ ## Bias, Risks and Limitations
300
+
301
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
302
+ -->
303
+
304
+ <!--
305
+ ### Recommendations
306
+
307
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
308
+ -->
309
+
310
+ ## Training Details
311
+
312
+ ### Training Dataset
313
+
314
+ #### preskripsi-sentiment-analysis-dataset-for-embedding-ft
315
+
316
+ * Dataset: preskripsi-sentiment-analysis-dataset-for-embedding-ft
317
+ * Size: 46,095 training samples
318
+ * Columns: <code>artikel</code>, <code>positive</code>, and <code>negative_1</code>
319
+ * Approximate statistics based on the first 1000 samples:
320
+ | | artikel | positive | negative_1 |
321
+ |:--------|:-------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|
322
+ | type | string | string | string |
323
+ | details | <ul><li>min: 32 tokens</li><li>mean: 439.08 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 24 tokens</li><li>mean: 28.16 tokens</li><li>max: 78 tokens</li></ul> | <ul><li>min: 27 tokens</li><li>mean: 31.16 tokens</li><li>max: 81 tokens</li></ul> |
324
+ * Samples:
325
+ | artikel | positive | negative_1 |
326
+ |:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------|
327
+ | <code>Apa Kabar Elkan Baggott Setelah Absen 10 Bulan dari Timnas Indonesia? Lagi Terapi Cedera Pergelangan Kaki dan Segera Comeback. Bola.com, Blackpool - Cedera pergelangan kaki Elkan Baggott hampir sembuh. Bek berusia 22 tahun itu segera kembali bermain untuk Blackpool FC di kasta ketiga Liga Inggris? Elkan Baggott telah absen membela Blackpool sejak Agustus 2024 akibat cedera pergelangan kaki yang membuatnya baru bermain empat kali pada musim ini. Penampilan terakhir Elkan Baggott di Blackpool terjadi pada 24 Agustus 2024, ketika bermain imbang 4-4 melawan Cambridge United dalam matchday ketiga League One 2024/2025. Elkan Baggott sedang menjalani peminjaman di Blackpool selama semusim dari Ipswich Town. Pemain kelahiran Bangkok, Thailand, itu diperkirakan akan kembali membela Blackpool kontra Liverpool U-21 dalam EFL Trophy 2024/2025 pada 7 November 2024. "Elkan Baggott menjalani sesi latihan pertamanya, jadi senang bisa melihatnya kembali bersama tim," ujar pelatih Blackpool, Stephen Dob...</code> | <code>Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan atau menciptakan persepsi buruk terhadap timnas indonesia?</code> | <code>Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat yang dapat meningkatkan citra atau reputasi timnas indonesia?</code> |
328
+ | <code>Di Balik Penangkapan Terduga Teroris di 3 Wilayah Jawa Timur dan NTB. KOMPAS.com- Detasemen Khusus (Densus) 88 Antiteror Mabes Polri menangkap sejumlah terduga teroris di Nusa Tenggara Barat dan Jawa Timur, beberapa hari terakhir. Mulanya penangkapan dilakukan terhadap MT di Bima, NTB pada 31 Mei 2023. Dari keterangan Mabes Polri, MT difasilitasi untuk berangkat ke Yaman dan bergabung dengan organisasi AQAP (cabang AlQaedah). Selanjutnya, berdasarkan pengembangan, Densus menangkap sejumlah terduga teroris lainnya. Pada Jumat (2/6/2023) pagi Densus menangkap ABU, terduga teroris di Jalan Kalimas Madya III Nyamplungan, Kecamatan Pabean Cantian, Surabaya, Jawa Timur. "Diamankan 07.30 WIB, setahu saya di rumahnya," kata Ketua RT M. Abri, Sabtu (3/6/2023). Setelah penangkapan tersebut dilakukan penggeledahan di rumah ABU. Abri yang turut serta dalam penggeledahan mengatakan polisi menyita sejumlah buku, busur, dan anak panah. "Iya ada panah. Ujungnya memang sangat tajam. Tapi tadi saya liha...</code> | <code>Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan atau menciptakan persepsi buruk terhadap MT?</code> | <code>Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat yang dapat meningkatkan citra atau reputasi MT?</code> |
329
+ | <code>Dirjen Imigrasi Enggan Salahkan Siapapun Soal Peretasan: Sesama Bus Kota Enggak Boleh Saling Menyalip. JAKARTA, KOMPAS.com - Direktur Jenderal (Dirjen) Imigrasi Silmy Karim enggan menyalahkan siapa pun atas peristiwa gangguan sistem pelayanan imigrasi, yang terjadi karena peretasan Pusat Data Nasional (PDN). Menurutnya, ia tak berwenang untuk menilai kementerian/lembaga lain atas peristiwa peretasan yang terjadi. "Ya enggak mungkin saya gitu (menilai)," kata Silmy dalam konferensi pers di kawasan Jakarta Selatan, Jumat (28/6/2024). "Sudah lah, sesama bus kota enggak boleh saling menyalip," tambahnya. Ia menambahkan, hanya pakar di luar kementerian/lembaga yang berhak menilai atas peristiwa yang terjadi. Termasuk, siapa yang patut bertanggungjawab atas peristiwa ini. "Itu yang bisa ngomong kayak gitu pengamat, bisa lah. Saya enggak bisa," tegas Silmy. Sebelumnya, muncul petisi online untuk meminta Menkominfo Budi Arie Setiadi mundur karena dianggap tak bisa menyelesaikan PDN yang disera...</code> | <code>Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan atau menciptakan persepsi buruk terhadap Budi Arie Setiadi?</code> | <code>Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat yang dapat meningkatkan citra atau reputasi Budi Arie Setiadi?</code> |
330
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
331
+ ```json
332
+ {
333
+ "scale": 20.0,
334
+ "similarity_fct": "cos_sim"
335
+ }
336
+ ```
337
+
338
+ ### Evaluation Dataset
339
+
340
+ #### preskripsi-sentiment-analysis-dataset-for-embedding-ft
341
+
342
+ * Dataset: preskripsi-sentiment-analysis-dataset-for-embedding-ft
343
+ * Size: 14,794 evaluation samples
344
+ * Columns: <code>artikel</code>, <code>positive</code>, and <code>negative_1</code>
345
+ * Approximate statistics based on the first 1000 samples:
346
+ | | artikel | positive | negative_1 |
347
+ |:--------|:-------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|
348
+ | type | string | string | string |
349
+ | details | <ul><li>min: 18 tokens</li><li>mean: 432.85 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 24 tokens</li><li>mean: 30.76 tokens</li><li>max: 49 tokens</li></ul> | <ul><li>min: 24 tokens</li><li>mean: 30.36 tokens</li><li>max: 52 tokens</li></ul> |
350
+ * Samples:
351
+ | artikel | positive | negative_1 |
352
+ |:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
353
+ | <code>Capai NZE, PLN EPI kembangkan energi bersih basis ekonomi kerakyatan. Lewat teknologi co-firing (bahan bakar alternatif) di PLTU, PLN EPI mengembangkan ekosistem biomassa yang justru banyak melibatkan masyarakat sehingga program transisi ini juga mendorong perekonomian rakyat Jakarta (ANTARA) - Sekretaris Perusahaan PLN Energi Primer Indonesia (PLN EPI) Mamit Setiawan mengatakan PLN EPI mengambil peran penting dalam era transisi energi saat ini dengan mengembangkan energi bersih berbasis ekonomi kerakyatan. Program transisi energi selain mencapai pengurangan emisi juga sekaligus menjadi katalisator pertumbuhan ekonomi, sehingga PLN EPI sebagai Subholding PT PLN (Persero) mengambil bagian penting dalam agenda ini. "Lewat teknologi co-firing (bahan bakar alternatif) di PLTU, PLN EPI mengembangkan ekosistem biomassa yang justru banyak melibatkan masyarakat sehingga program transisi ini juga mendorong perekonomian rakyat," kata Mamit di Jakarta, Senin. Sebagai perusahaan yang menjamin paso...</code> | <code>Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat yang dapat meningkatkan citra atau reputasi Pembangkit Listrik Tenaga Uap (PLTU)?</code> | <code>Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan atau menciptakan persepsi buruk terhadap Pembangkit Listrik Tenaga Uap (PLTU)?</code> |
354
+ | <code>Mahasiswa UNS ikut menggali potensi energi baru terbarukan. Melihat krisis sumber daya energi nonterbarukan makin mendesak dunia untuk mencari alternatif energi yang berkelanjutan. Solo (ANTARA) - Mahasiswa Universitas Sebelas Maret (UNS) Surakarta berupaya ikut menggali potensi energi baru terbarukan dengan membuat penelitian yang menggabungkan sistem pemantauan berbasis yaw dengan teknologi Internet of Things (IoT). Ketua tim Alif Ilham, di Solo, Jawa Tengah, Rabu, mengatakan sistem pemantauan berbasis yaw ini dirancang untuk memonitor kinerja Horizontal Axis Wind Turbine (HAWT) secara realtime. Ia mengatakan penelitian dilakukan karena melihat krisis sumber daya energi nonterbarukan makin mendesak dunia untuk mencari alternatif energi yang berkelanjutan. "Dari data kebutuhan Indonesia, 50,3 persen listrik yang digunakan masih berasal dari energi nonterbarukan, yaitu batu bara," katanya. Menurut dia, salah satu solusi yang menjanjikan adalah energi angin. Energi ini dapat diubah menj...</code> | <code>Seberapa netral artikel ini? Apakah artikel ini hanya menyajikan fakta atau informasi tanpa memberikan opini atau emosi terhadap BRIN (Badan Riset dan Inovasi Nasional)?</code> | <code>Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat yang dapat meningkatkan citra atau reputasi BRIN (Badan Riset dan Inovasi Nasional)?</code> |
355
+ | <code>Mengapa Manufaktur Terpuruk dan Apa Urgensinya?. Tema terpuruknya manufaktur di Tanah Air menjadi salah satu pemberitaan media massa pekan ini. Hal ini berawal dari rilis S&amp;P tentang Purchasing Manager Indeks (PMI) Indonesia periode Agustus 2024 pada 2 September 2024. Intinya, indeks Indonesia terpuruk makin dalam di bawah batas minimal indikasi ekspansi. Namun apa yang sebenarnya terjadi? Mengapa demikian? Dan apa urgensinya bagi perekonomian nasional? Apa yang Anda pelajari dari artikel ini? 1.Apa yang terjadi dengan manufaktur? 2.Apa konsekuensinya bagi buruh? 3.Apa pentingnya manufaktur bagi perekonomian Indonesia? PMI Indonesia pada Agustus 2024 melanjutkan kontraksi yang sudah terjadi sejak Juli 2024. PMI manufaktur Indonesia di periode ini anjlok ke 48,9. Angka di bawah 50 menunjukkan kondisi kontraksi. Pada Juli, indeksnya adalah 49,3. Artinya, kontraksi pada Agustus kian dalam. Padahal, sebelumnya, manufaktur Indonesia dalam posisi ekspansi selama 34 bulan berturut-turut. ...</code> | <code>Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan atau menciptakan persepsi buruk terhadap Ekonomi Indonesia?</code> | <code>Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat yang dapat meningkatkan citra atau reputasi Ekonomi Indonesia?</code> |
356
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
357
+ ```json
358
+ {
359
+ "scale": 20.0,
360
+ "similarity_fct": "cos_sim"
361
+ }
362
+ ```
363
+
364
+ ### Training Hyperparameters
365
+ #### Non-Default Hyperparameters
366
+
367
+ - `eval_strategy`: steps
368
+ - `per_device_train_batch_size`: 16
369
+ - `per_device_eval_batch_size`: 16
370
+ - `learning_rate`: 2e-05
371
+ - `num_train_epochs`: 1
372
+ - `warmup_ratio`: 0.1
373
+ - `push_to_hub`: True
374
+ - `hub_model_id`: masa-research/me5-small-preskripsi-embedding-pos-neg
375
+ - `batch_sampler`: no_duplicates
376
+
377
+ #### All Hyperparameters
378
+ <details><summary>Click to expand</summary>
379
+
380
+ - `overwrite_output_dir`: False
381
+ - `do_predict`: False
382
+ - `eval_strategy`: steps
383
+ - `prediction_loss_only`: True
384
+ - `per_device_train_batch_size`: 16
385
+ - `per_device_eval_batch_size`: 16
386
+ - `per_gpu_train_batch_size`: None
387
+ - `per_gpu_eval_batch_size`: None
388
+ - `gradient_accumulation_steps`: 1
389
+ - `eval_accumulation_steps`: None
390
+ - `torch_empty_cache_steps`: None
391
+ - `learning_rate`: 2e-05
392
+ - `weight_decay`: 0.0
393
+ - `adam_beta1`: 0.9
394
+ - `adam_beta2`: 0.999
395
+ - `adam_epsilon`: 1e-08
396
+ - `max_grad_norm`: 1.0
397
+ - `num_train_epochs`: 1
398
+ - `max_steps`: -1
399
+ - `lr_scheduler_type`: linear
400
+ - `lr_scheduler_kwargs`: {}
401
+ - `warmup_ratio`: 0.1
402
+ - `warmup_steps`: 0
403
+ - `log_level`: passive
404
+ - `log_level_replica`: warning
405
+ - `log_on_each_node`: True
406
+ - `logging_nan_inf_filter`: True
407
+ - `save_safetensors`: True
408
+ - `save_on_each_node`: False
409
+ - `save_only_model`: False
410
+ - `restore_callback_states_from_checkpoint`: False
411
+ - `no_cuda`: False
412
+ - `use_cpu`: False
413
+ - `use_mps_device`: False
414
+ - `seed`: 42
415
+ - `data_seed`: None
416
+ - `jit_mode_eval`: False
417
+ - `use_ipex`: False
418
+ - `bf16`: False
419
+ - `fp16`: False
420
+ - `fp16_opt_level`: O1
421
+ - `half_precision_backend`: auto
422
+ - `bf16_full_eval`: False
423
+ - `fp16_full_eval`: False
424
+ - `tf32`: None
425
+ - `local_rank`: 0
426
+ - `ddp_backend`: None
427
+ - `tpu_num_cores`: None
428
+ - `tpu_metrics_debug`: False
429
+ - `debug`: []
430
+ - `dataloader_drop_last`: False
431
+ - `dataloader_num_workers`: 0
432
+ - `dataloader_prefetch_factor`: None
433
+ - `past_index`: -1
434
+ - `disable_tqdm`: False
435
+ - `remove_unused_columns`: True
436
+ - `label_names`: None
437
+ - `load_best_model_at_end`: False
438
+ - `ignore_data_skip`: False
439
+ - `fsdp`: []
440
+ - `fsdp_min_num_params`: 0
441
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
442
+ - `fsdp_transformer_layer_cls_to_wrap`: None
443
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
444
+ - `deepspeed`: None
445
+ - `label_smoothing_factor`: 0.0
446
+ - `optim`: adamw_torch
447
+ - `optim_args`: None
448
+ - `adafactor`: False
449
+ - `group_by_length`: False
450
+ - `length_column_name`: length
451
+ - `ddp_find_unused_parameters`: None
452
+ - `ddp_bucket_cap_mb`: None
453
+ - `ddp_broadcast_buffers`: False
454
+ - `dataloader_pin_memory`: True
455
+ - `dataloader_persistent_workers`: False
456
+ - `skip_memory_metrics`: True
457
+ - `use_legacy_prediction_loop`: False
458
+ - `push_to_hub`: True
459
+ - `resume_from_checkpoint`: None
460
+ - `hub_model_id`: masa-research/me5-small-preskripsi-embedding-pos-neg
461
+ - `hub_strategy`: every_save
462
+ - `hub_private_repo`: None
463
+ - `hub_always_push`: False
464
+ - `gradient_checkpointing`: False
465
+ - `gradient_checkpointing_kwargs`: None
466
+ - `include_inputs_for_metrics`: False
467
+ - `include_for_metrics`: []
468
+ - `eval_do_concat_batches`: True
469
+ - `fp16_backend`: auto
470
+ - `push_to_hub_model_id`: None
471
+ - `push_to_hub_organization`: None
472
+ - `mp_parameters`:
473
+ - `auto_find_batch_size`: False
474
+ - `full_determinism`: False
475
+ - `torchdynamo`: None
476
+ - `ray_scope`: last
477
+ - `ddp_timeout`: 1800
478
+ - `torch_compile`: False
479
+ - `torch_compile_backend`: None
480
+ - `torch_compile_mode`: None
481
+ - `dispatch_batches`: None
482
+ - `split_batches`: None
483
+ - `include_tokens_per_second`: False
484
+ - `include_num_input_tokens_seen`: False
485
+ - `neftune_noise_alpha`: None
486
+ - `optim_target_modules`: None
487
+ - `batch_eval_metrics`: False
488
+ - `eval_on_start`: False
489
+ - `use_liger_kernel`: False
490
+ - `eval_use_gather_object`: False
491
+ - `average_tokens_across_devices`: False
492
+ - `prompts`: None
493
+ - `batch_sampler`: no_duplicates
494
+ - `multi_dataset_batch_sampler`: proportional
495
+
496
+ </details>
497
+
498
+ ### Training Logs
499
+ | Epoch | Step | Training Loss | Validation Loss | cosine_accuracy |
500
+ |:------:|:----:|:-------------:|:---------------:|:---------------:|
501
+ | 0.0347 | 100 | 2.2799 | 3.0897 | 0.6039 |
502
+ | 0.0694 | 200 | 1.0007 | 3.7314 | 0.6032 |
503
+ | 0.1041 | 300 | 0.6538 | 3.9361 | 0.6031 |
504
+ | 0.2083 | 600 | 0.8024 | 4.0135 | 0.6029 |
505
+ | 0.3124 | 900 | 0.7212 | 4.2401 | 0.6025 |
506
+ | 0.4165 | 1200 | 0.9165 | 4.3140 | 0.6034 |
507
+ | 0.5207 | 1500 | 0.8918 | 4.6178 | 0.6033 |
508
+ | 0.6248 | 1800 | 0.8376 | 4.6052 | 0.6034 |
509
+ | 0.7289 | 2100 | 0.9715 | 2.9251 | 0.4035 |
510
+ | 0.8330 | 2400 | 0.4864 | 3.3840 | 0.4045 |
511
+ | 0.9372 | 2700 | 0.4698 | 3.7879 | 0.4019 |
512
+
513
+
514
+ ### Framework Versions
515
+ - Python: 3.11.11
516
+ - Sentence Transformers: 3.3.1
517
+ - Transformers: 4.47.1
518
+ - PyTorch: 2.5.1+cu124
519
+ - Accelerate: 1.2.1
520
+ - Datasets: 3.2.0
521
+ - Tokenizers: 0.21.0
522
+
523
+ ## Citation
524
+
525
+ ### BibTeX
526
+
527
+ #### Sentence Transformers
528
+ ```bibtex
529
+ @inproceedings{reimers-2019-sentence-bert,
530
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
531
+ author = "Reimers, Nils and Gurevych, Iryna",
532
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
533
+ month = "11",
534
+ year = "2019",
535
+ publisher = "Association for Computational Linguistics",
536
+ url = "https://arxiv.org/abs/1908.10084",
537
+ }
538
+ ```
539
+
540
+ #### MultipleNegativesRankingLoss
541
+ ```bibtex
542
+ @misc{henderson2017efficient,
543
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
544
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
545
+ year={2017},
546
+ eprint={1705.00652},
547
+ archivePrefix={arXiv},
548
+ primaryClass={cs.CL}
549
+ }
550
+ ```
551
+
552
+ <!--
553
+ ## Glossary
554
+
555
+ *Clearly define terms in order to be accessible across audiences.*
556
+ -->
557
+
558
+ <!--
559
+ ## Model Card Authors
560
+
561
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
562
+ -->
563
+
564
+ <!--
565
+ ## Model Card Contact
566
+
567
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
568
+ -->
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.3.1",
4
+ "transformers": "4.47.1",
5
+ "pytorch": "2.5.1+cu124"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }