hongkeon commited on
Commit
327e0d7
·
verified ·
1 Parent(s): c3478f5

Upload README.md with huggingface_hub

Browse files
Files changed (1) hide show
  1. README.md +218 -0
README.md ADDED
@@ -0,0 +1,218 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - af
4
+ - ar
5
+ - az
6
+ - be
7
+ - bg
8
+ - bn
9
+ - ca
10
+ - ceb
11
+ - cs
12
+ - cy
13
+ - da
14
+ - de
15
+ - el
16
+ - en
17
+ - es
18
+ - et
19
+ - eu
20
+ - fa
21
+ - fi
22
+ - fr
23
+ - gl
24
+ - gu
25
+ - he
26
+ - hi
27
+ - hr
28
+ - ht
29
+ - hu
30
+ - hy
31
+ - id
32
+ - is
33
+ - it
34
+ - ja
35
+ - jv
36
+ - ka
37
+ - kk
38
+ - km
39
+ - kn
40
+ - ko
41
+ - ky
42
+ - lo
43
+ - lt
44
+ - lv
45
+ - mk
46
+ - ml
47
+ - mn
48
+ - mr
49
+ - ms
50
+ - my
51
+ - ne
52
+ - nl
53
+ - 'no'
54
+ - pa
55
+ - pl
56
+ - pt
57
+ - qu
58
+ - ro
59
+ - ru
60
+ - si
61
+ - sk
62
+ - sl
63
+ - so
64
+ - sq
65
+ - sr
66
+ - sv
67
+ - sw
68
+ - ta
69
+ - te
70
+ - th
71
+ - tl
72
+ - tr
73
+ - uk
74
+ - ur
75
+ - vi
76
+ - yo
77
+ - zh
78
+ library_name: sentence-transformers
79
+ tags:
80
+ - korean
81
+ - sentence-transformers
82
+ - transformers
83
+ - multilingual
84
+ - sentence-similarity
85
+ - feature-extraction
86
+ - llama-cpp
87
+ - gguf-my-repo
88
+ base_model: upskyy/bge-m3-korean
89
+ datasets: []
90
+ metrics:
91
+ - pearson_cosine
92
+ - spearman_cosine
93
+ - pearson_manhattan
94
+ - spearman_manhattan
95
+ - pearson_euclidean
96
+ - spearman_euclidean
97
+ - pearson_dot
98
+ - spearman_dot
99
+ - pearson_max
100
+ - spearman_max
101
+ widget:
102
+ - source_sentence: 이집트 군대가 형제애를 단속하다
103
+ sentences:
104
+ - 이집트의 군대가 무슬림 형제애를 단속하다
105
+ - 아르헨티나의 기예르모 코리아와 네덜란드의 마틴 버커크의 또 다른 준결승전도 매력적이다.
106
+ - 그것이 사실일 수도 있다고 생각하는 것은 재미있다.
107
+ - source_sentence: 오, 그리고 다시 결혼은 근본적인 인권이라고 주장한다.
108
+ sentences:
109
+ - 특히 결혼은 근본적인 인권이라고 말한 후에.
110
+ - 해변에 있는 흑인과 그의 개...
111
+ - 이란은 핵 프로그램이 평화적인 목적을 위한 것이라고 주장한다
112
+ - source_sentence: 두 사람이 계단을 올라가 건물 안으로 들어간다
113
+ sentences:
114
+ - 글쎄, 나는 우리가 꽤 나빠진 사이트 목록을 만들었고 일부를 정리해야한다는 일부 사이트에서 알았고 지금 법은 슈퍼 펀드이며 당신이 아무리간에
115
+ 독성 폐기물을 일으킨 사람이라면 누구나 알고 있습니다. 결국 당신이 아는 사람은 누구나 땅에 손상을 입혔거나 모두가 기여해야한다는 것을 알고
116
+ 있습니다. 그리고 우리가이 돈을 정리하기 위해 수퍼 펀드 거래를 가져 왔을 때 많은 돈을 벌었습니다. 모든 것을 꺼내서 다시 실행하면 다른
117
+ 지역을 채울 수 있습니다. 음. 확실히 셔먼 시설과 같은 더 나은 솔루션을 가지고있는 것 같습니다. 기름 통에 넣은 다음 시멘트가 깔려있는
118
+ 곳에서 밀봉하십시오.
119
+ - 한 사람이 계단을 올라간다.
120
+ - 두 사람이 함께 계단을 올라간다.
121
+ - source_sentence: 그래, 내가 알아차린 적이 있어
122
+ sentences:
123
+ - 나는 알아차리지 못했다.
124
+ - 이것은 내가 영국의 아서 안데르센 사업부의 파트너인 짐 와디아를 아서 안데르센 경영진이 선택한 것보다 래리 웨인바흐를 안데르센 월드와이드의
125
+ 경영 파트너로 승계하기 위해 안데르센 컨설팅 사업부(현재의 엑센츄어라고 알려져 있음)의 전 관리 파트너인 조지 샤힌에 대한 지지를 표명했을
126
+ 때 가장 명백했다.
127
+ - 나는 메모했다.
128
+ - source_sentence: 여자가 전화를 하는 동안 두 남자가 돈을 위해 악기를 연주한다.
129
+ sentences:
130
+ - 마이크에 대고 노래를 부르고 베이스를 연주하는 남자.
131
+ - 빨대를 사용하는 아이
132
+ - 돈을 위해 악기를 연주하는 사람들
133
+ pipeline_tag: sentence-similarity
134
+ model-index:
135
+ - name: upskyy/bge-m3-korean
136
+ results:
137
+ - task:
138
+ type: semantic-similarity
139
+ name: Semantic Similarity
140
+ dataset:
141
+ name: sts dev
142
+ type: sts-dev
143
+ metrics:
144
+ - type: pearson_cosine
145
+ value: 0.8740181295716805
146
+ name: Pearson Cosine
147
+ - type: spearman_cosine
148
+ value: 0.8723737976913686
149
+ name: Spearman Cosine
150
+ - type: pearson_manhattan
151
+ value: 0.8593266961329962
152
+ name: Pearson Manhattan
153
+ - type: spearman_manhattan
154
+ value: 0.8687629058449345
155
+ name: Spearman Manhattan
156
+ - type: pearson_euclidean
157
+ value: 0.8597907936339472
158
+ name: Pearson Euclidean
159
+ - type: spearman_euclidean
160
+ value: 0.8693987158996017
161
+ name: Spearman Euclidean
162
+ - type: pearson_dot
163
+ value: 0.8683777071455441
164
+ name: Pearson Dot
165
+ - type: spearman_dot
166
+ value: 0.8665500024614361
167
+ name: Spearman Dot
168
+ - type: pearson_max
169
+ value: 0.8740181295716805
170
+ name: Pearson Max
171
+ - type: spearman_max
172
+ value: 0.8723737976913686
173
+ name: Spearman Max
174
+ ---
175
+
176
+ # hongkeon/bge-m3-korean-Q8_0-GGUF
177
+ This model was converted to GGUF format from [`upskyy/bge-m3-korean`](https://huggingface.co/upskyy/bge-m3-korean) using llama.cpp via the ggml.ai's [GGUF-my-repo](https://huggingface.co/spaces/ggml-org/gguf-my-repo) space.
178
+ Refer to the [original model card](https://huggingface.co/upskyy/bge-m3-korean) for more details on the model.
179
+
180
+ ## Use with llama.cpp
181
+ Install llama.cpp through brew (works on Mac and Linux)
182
+
183
+ ```bash
184
+ brew install llama.cpp
185
+
186
+ ```
187
+ Invoke the llama.cpp server or the CLI.
188
+
189
+ ### CLI:
190
+ ```bash
191
+ llama-cli --hf-repo hongkeon/bge-m3-korean-Q8_0-GGUF --hf-file bge-m3-korean-q8_0.gguf -p "The meaning to life and the universe is"
192
+ ```
193
+
194
+ ### Server:
195
+ ```bash
196
+ llama-server --hf-repo hongkeon/bge-m3-korean-Q8_0-GGUF --hf-file bge-m3-korean-q8_0.gguf -c 2048
197
+ ```
198
+
199
+ Note: You can also use this checkpoint directly through the [usage steps](https://github.com/ggerganov/llama.cpp?tab=readme-ov-file#usage) listed in the Llama.cpp repo as well.
200
+
201
+ Step 1: Clone llama.cpp from GitHub.
202
+ ```
203
+ git clone https://github.com/ggerganov/llama.cpp
204
+ ```
205
+
206
+ Step 2: Move into the llama.cpp folder and build it with `LLAMA_CURL=1` flag along with other hardware-specific flags (for ex: LLAMA_CUDA=1 for Nvidia GPUs on Linux).
207
+ ```
208
+ cd llama.cpp && LLAMA_CURL=1 make
209
+ ```
210
+
211
+ Step 3: Run inference through the main binary.
212
+ ```
213
+ ./llama-cli --hf-repo hongkeon/bge-m3-korean-Q8_0-GGUF --hf-file bge-m3-korean-q8_0.gguf -p "The meaning to life and the universe is"
214
+ ```
215
+ or
216
+ ```
217
+ ./llama-server --hf-repo hongkeon/bge-m3-korean-Q8_0-GGUF --hf-file bge-m3-korean-q8_0.gguf -c 2048
218
+ ```