GbrlOl commited on
Commit
5e2fd13
·
verified ·
1 Parent(s): 7e9bd10

Add new SentenceTransformer model

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 384,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,587 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:442
8
+ - loss:CoSENTLoss
9
+ base_model: sentence-transformers/all-MiniLM-L6-v2
10
+ widget:
11
+ - source_sentence: qué tipo de comportamiento mecanico presenta el depósito en condiciones
12
+ estaticas y pseudoestaticas?
13
+ sentences:
14
+ - "Plan de Cierre PAG Planta Catemu \nCompañía Explotadora de Minas (CEMIN) \n \n\
15
+ \ Rev. 0 | 20-04-18 155 | 158 \n11 INFORMACIÓN ESTRATÉGICA \n \nLa Planta Catemu\
16
+ \ no cuenta con información técnica que sea considerada de utilidad pública, tal\
17
+ \ como la \nrelativa a infraestructura, monumentos nacionales, según la definició\
18
+ \ n de la ley N°17.288, sitios de valor \nantropológico, arqueológico, histórico\
19
+ \ y, en general, los pertenecientes al patrimonio arquitectónico y \nnatural.\
20
+ \ \n \nEn efecto, La Planta Catemu en sus proyectos aprobados en el Sistema de\
21
+ \ Evaluación de Impacto Ambiental \n(SEIA), declara la ausencia de sitios de interés\
22
+ \ público en esta materia."
23
+ - "5.6 Cronograma de Cierre \n \nLa planificación del cierre de la Pl anta Catemu\
24
+ \ considera el cese de actividades a finales del año 20 30. En \ntérminos generales\
25
+ \ se comenzará con la ejecución de las medidas asociadas a las obras mineras (pilas\
26
+ \ de \nlixiviación y depósitos de ripios), además del desarme y desmontaje de\
27
+ \ los equip os principales, para luego \ndar paso a la demolición de hormigones\
28
+ \ y desmantelamiento de estructuras de acero. Finamente el cierre \nconsidera\
29
+ \ el manejo de residuos, la limpieza del sector, el cierre de accesos y la colocación\
30
+ \ de señalética de \nadvertencia de peligro. Permaneciendo sólo aquellas áreas\
31
+ \ necesarias para apoyar las actividades de post -\ncierre. \n \nSe estima que\
32
+ \ la fase de cierre tendrá una duración de 2 años concluyendo a finales del año\
33
+ \ 20 32. Después \nde ejecutar la etapa de cierre se iniciará una etapa de inspecciones\
34
+ \ y mantenimiento post-cierre. \n \nA continuación en la Tabla 5.13 se muestra\
35
+ \ el cronograma de cierre de las instalaciones de la Planta Catemu. \n \nTabla\
36
+ \ 5.13: Cronograma de Cierre \nCategoría Instalación 2016 ... 2030 2031 2032 2033\
37
+ \ … \nInstalaciones \nprincipales \nPila de lixiviación estática \
38
+ \ \nPila de lixiviación dinámica \nDepósito de ripios N°1 \
39
+ \ \nDepósito de ripios N°2 \nDepósito de ripios N°3"
40
+ - "De los resultados del modelo, se puede observar que la cota superior del enrocado\
41
+ \ es \nsiempre superior a la cota de agua asociada a un periodo de retorno de\
42
+ \ 10.000 años. Se \nrecomienda, para toda la extensión de la defensa fluvial colindante\
43
+ \ al río La Ligua, aumentar su \naltura en 0,5 m, con la finalidad de establecer\
44
+ \ una revancha apropiada. Por otra parte, con respecto \na la longitud del enrocado\
45
+ \ de protección, se recomienda extenderlo hasta la intersección con el \ncerro\
46
+ \ aledaño, para así resguardar todo el perímetro del depósito y además asegurar\
47
+ \ el cierre del \nacceso al tranque por río. \n- El diseño del vertedero y la\
48
+ \ piscina de emergencia, están diseñados para cumplir cabalmente su \nfunción.\
49
+ \ Como primera obra a proyectar en la cubeta, se considera la construcción de\
50
+ \ un pretil a lo \nlargo de todo el perímetro de ésta. El diseño de este vertedero\
51
+ \ considera evacuar un caudal \neventual igual a 0,5 m3/s, el cual finalmente\
52
+ \ descarga en una piscina de emergencia que posee una \ncapacidad de 3.000 m3,\
53
+ \ aproximadamente. \nLa Estabilidad del Talud, como se ha abordado en este estudio,\
54
+ \ garantiza la estabilidad del muro de \nacuerdo a las exigencias del D.S. 248/07.\
55
+ \ \nEl costo estimado de las obras de Cierre del Tranque de Relave N°4 es de\
56
+ \ U$ 1.710.359, estos no incluyen \nlos costos indirectos del proyecto ni contingencias.\
57
+ \ \nLos costos asumidos están en dólares, el valor del dólar asumido, corresponde\
58
+ \ a 509,02 pesos chilenos. \nCon estas obras, más el estudio desarrollado por\
59
+ \ GEOMET S.A., este Proyecto de Cierre garantiza la \nestabilidad física y química\
60
+ \ del Tranque de Relave N°4."
61
+ - source_sentence: ¿Se utilizaron antecedentes geológicos?
62
+ sentences:
63
+ - "La vida útil para esta RCA corresponde a 7 años de vida útil. \n \nProducto de\
64
+ \ las actividades de exploración, se estableció un nuevo depósito de mineral de\
65
+ \ oro y \nplata, el cual result ó técnica y económicamente factible de ser explotado.\
66
+ \ Las reservas de mineral \nde este depósito hacienden a 192.000 toneladas con\
67
+ \ un contenido estimado de 10.400 onzas de \noro, las cuales fueron explotadas\
68
+ \ mediante el desarrollo de un nuevo rajo abierto denominado \nQuillota. El ritmo\
69
+ \ de extracción del rajo Quillota corresponden a aproximadamente 30.000 \ntoneladas\
70
+ \ de mineral por mes (unas 150.000 toneladas de material mes) durante un periodo\
71
+ \ de 1 \naño y para la explotación de este rajo se habilitó un botadero de estéril.\
72
+ \ La explotación del rajo \nQuillota en Mina Guanaco no aumento en el procesamiento\
73
+ \ de minerales en Planta, el cual se \nmantuvo ent re las 750 a 2.000 toneladas\
74
+ \ de mineral fresco por día. Esta DIA fue aprobada \nmediante la RCA N° 209/2012,\
75
+ \ entregando una vida útil para esta RCA de 13 meses, considerando \nsu construcción.\
76
+ \ \n \nLas instalaciones que conforman la Faena Miner a Guanaco actualmente, se\
77
+ \ presentan en la \nsiguiente Tabla, desglosadas de acuerdo a la agrupación de\
78
+ \ instalaciones. \n \nTabla 1. Instalaciones Minera Guanaco \nMinas \n1 Mina\
79
+ \ Rajo Defensa \n2 Mina Rajo Perseverancia \n3 Mina Rajo Dumbo \n4 Mina Rajo Quillota\
80
+ \ \n5 Mina Subterránea Cachinalito \nBotaderos"
81
+ - "41 \nvigente, se asocia con un 30 % de la gravedad, el que a su vez corresponde\
82
+ \ a grado de riesgo \nsísmico medio - alto. \n \n5.1.11. Patrimonio cultural y\
83
+ \ arqueológico \n \nComo resultado de la inspección visual del terreno, realizado\
84
+ \ en el marco de la DIA Reapertura \nMina Guanaco, en el área del proyecto se\
85
+ \ detectó 10 sitios arqueológicos, clasificados en dos \ntipos de evidencia arqueológica\
86
+ \ según su cronología, distinguiéndose sitios prehispánicos e \nhistóricos. \n\
87
+ \ \nSe encontraron dos hallazgos prehispánicos, se trata de campamentos que presentan\
88
+ \ \nabundantes desechos de talla lítica e instrumentos formalizados como puntas\
89
+ \ de proyectil, \ncuchillos y raspadores que señalan actividades de caza y destazamiento\
90
+ \ de presas. Estos \nhallazgos, tanto por el tipo de evidencia como por su moderada\
91
+ \ densidad, permite interpretarlos \ncomo campamentos esporádicos asociados a\
92
+ \ la circulación de grupos durante el período \nFormativo (1500 aC - 600 dC).\
93
+ \ \n \nLas evidencias arqueológicas históricas se dividen en asentamientos mayores\
94
+ \ y estructuras \nmenores. Los asentamientos mayores están asociados a la producción\
95
+ \ minera de carácter \nindustrial del área minera de Guanaco, que se remontan\
96
+ \ hasta el siglo XIX. Aquí se incluyen el \npoblado y el cementerio en las inmediaciones\
97
+ \ del sector Cachinales, y el cementerio entre el \nRajo Dumbo y el Campamento\
98
+ \ Soledad. \n \nLas estructuras menores (demarcatorias y campamentos pirquineros),\
99
+ \ debido a su \nausencia/mezcla de evidencias materiales culturales, no permiten\
100
+ \ definir una cronología \nprecisa, pero están asociados a una explotación minera\
101
+ \ artesanal del distrito Guanaco, \nefectuada desde fines del siglo XIX hasta\
102
+ \ una época más reciente."
103
+ - "Esta área se encuentra bajo el predominio de un clima árido que, en conjunto\
104
+ \ con \nlos suelos en lo que se refiere a nivel trófico (fertilidad) y estructura,\
105
+ \ conforman un sistema físico \naltamente restrictivo para el desarrollo biológico\
106
+ \ imponiendo en las especies una necesaria \nespecialización. En efecto, el área\
107
+ \ se podría definir como un despoblado biológico con nula \npresencia de especies\
108
+ \ de flora y una extrema pobreza de fauna. \n \nDe acuerdo a lo establecido en\
109
+ \ la Línea de Base del EIA del Proyecto Tostación de \nConcentrados Faena Soledad,\
110
+ \ presentado a las autoridades en 2000, el área de influencia en \ntorno al yacimiento\
111
+ \ Guanaco y Soledad se encuentra desprovista de vegetación: la única unidad \n\
112
+ vegetal cartografiable se encuentra a aproximadamente 5 kilómetros al sur éstos\
113
+ \ sitios. \nEn Marzo de 2006 y Febrero de 2007 se llevaron a cabo dos campañas\
114
+ \ de terreno cuyo objetivo \nfue caracterizar desde el punto de vista biótico\
115
+ \ las áreas relacionadas con el Proyecto (línea \nbase): área Mina y las áreas\
116
+ \ de las quebradas Pastos Largos, Las Mulas, Punta del Viento y \nVaritas. \n\
117
+ En este estudio se constató que el área de la Mina, perten eciente a la formación\
118
+ \ vegetal \ndenominada “Desierto interior de Taltal”, posee una baja diversidad\
119
+ \ botánica y una escasa \ncobertura (menos de un 5%) y se caracteriza por presentar\
120
+ \ casi exclusivamente formaciones en \nparche de herbáceas de tipo anual y de\
121
+ \ subarbustos dispersos. Entre las hierbas se aprecia una \ndominancia notable\
122
+ \ de Portulacaceae ( Cistanthe celosioides ) que se acompaña con algunos \nindividuos\
123
+ \ dispersos de Chenopodiaceae. Esta asociación, está complementada a su vez, por"
124
+ - source_sentence: ¿Cuál es la altura del muro de confinamiento?
125
+ sentences:
126
+ - "De los resultados del modelo, se puede observar que la cota superior del enrocado\
127
+ \ es \nsiempre superior a la cota de agua asociada a un periodo de retorno de\
128
+ \ 10.000 años. Se \nrecomienda, para toda la extensión de la defensa fluvial colindante\
129
+ \ al río La Ligua, aumentar su \naltura en 0,5 m, con la finalidad de establecer\
130
+ \ una revancha apropiada. Por otra parte, con respecto \na la longitud del enrocado\
131
+ \ de protección, se recomienda extenderlo hasta la intersección con el \ncerro\
132
+ \ aledaño, para así resguardar todo el perímetro del depósito y además asegurar\
133
+ \ el cierre del \nacceso al tranque por río. \n- El diseño del vertedero y la\
134
+ \ piscina de emergencia, están diseñados para cumplir cabalmente su \nfunción.\
135
+ \ Como primera obra a proyectar en la cubeta, se considera la construcción de\
136
+ \ un pretil a lo \nlargo de todo el perímetro de ésta. El diseño de este vertedero\
137
+ \ considera evacuar un caudal \neventual igual a 0,5 m3/s, el cual finalmente\
138
+ \ descarga en una piscina de emergencia que posee una \ncapacidad de 3.000 m3,\
139
+ \ aproximadamente. \nLa Estabilidad del Talud, como se ha abordado en este estudio,\
140
+ \ garantiza la estabilidad del muro de \nacuerdo a las exigencias del D.S. 248/07.\
141
+ \ \nEl costo estimado de las obras de Cierre del Tranque de Relave N°4 es de\
142
+ \ U$ 1.710.359, estos no incluyen \nlos costos indirectos del proyecto ni contingencias.\
143
+ \ \nLos costos asumidos están en dólares, el valor del dólar asumido, corresponde\
144
+ \ a 509,02 pesos chilenos. \nCon estas obras, más el estudio desarrollado por\
145
+ \ GEOMET S.A., este Proyecto de Cierre garantiza la \nestabilidad física y química\
146
+ \ del Tranque de Relave N°4."
147
+ - "Plan de Cierre PAG Planta Catemu \nCompañía Explotadora de Minas (CEMIN) \n \n\
148
+ \ \n Rev. 0 | 20-04-18 70 | 158 \nTabla 5.2: Medidas de cierre derivadas de la\
149
+ \ evaluación de riesgos \nRiesgo evaluado \nMedidas asociadas a \nmantener la\
150
+ \ estabilidad de la \ninstalación \nMedidas asociadas a la \ndisminución del riesgo\
151
+ \ a las \npersonas \nMedidas asociadas a la \ndisminución del riesgo al \nmedioambiente\
152
+ \ \nFalla del talud a causa de un \nsismo \nEstabilización (reperfilamiento) \n\
153
+ de taludes \nCierre de accesos e instalación \nde señalética \nEstabilización\
154
+ \ (reperfilamiento) \nde taludes \nFalla del talud a causa de \nerosión hídrica\
155
+ \ \nEstabilización (reperfilamiento) \nde taludes \nCierre de accesos e instalación\
156
+ \ \nde señalética \nEstabilización (reperfilamiento) \nde taludes \nContaminación\
157
+ \ de aguas \nsubterráneas a causa de \ninfiltración de DAR \nLavado de la pila\
158
+ \ con agua \nInstalación de una capa de \nlimos arcillosos en los taludes y \n\
159
+ superficie \nInstalación de una capa de \nlimos arcillosos en los taludes y \n\
160
+ superficie \nContaminación de agua \nsuperficial a causa de una \ncrecida/inundación\
161
+ \ \nNo se contemplan medidas No se contemplan medidas No se contemplan medidas\
162
+ \ \nContaminación atmosférica por \nmaterial particulado \nsuspendido por el viento\
163
+ \ \nInstalación de una capa de \nlimos arcillosos en los taludes y \nsuperficie\
164
+ \ \nInstalación de una capa de \nlimos arcillosos en los taludes y \nsuperficie\
165
+ \ \nInstalación de una capa de \nlimos arcillosos en los taludes y \nsuperficie\
166
+ \ \n \n \n5.3.1.2 Depósito de ripios N°1 \n \nEn el Anexo F se adjunta el desarrollo\
167
+ \ de la evaluación de riesgo para el depósito de ripios N°1, además de \nsus respectivas\
168
+ \ planillas."
169
+ - "13 La medida “lavado de ripios con agua” corresponde a un compromiso adquirido\
170
+ \ por medio de las Resoluciones de \nCalificación Ambiental N°1564/2007 y N°095/2011,\
171
+ \ de los Proyectos “Ampliación I Planta Catemu” y “Ampliación II Planta \nCatemu”\
172
+ \ respectivamente."
173
+ - source_sentence: ¿Existen antecedentes hidrogeológicos?
174
+ sentences:
175
+ - "En el Anexo E se adjunta un plano con la ubicación \nde los tranques de relaves\
176
+ \ antiguos. \n \n \nFigura 5.14: Localización de los tranques de relaves antiguos\
177
+ \ \n \nLos tranques se han mantenido estables desde que dejaron de operar hace\
178
+ \ más de 30 años, y no presentan \ngeneración de drenajes ácidos según el informe\
179
+ \ adjunto en el Anexo F y lo que se señala a continuación. \n \
180
+ \ \n5 Diseño informado a la autoridad ambiental\
181
+ \ a través del Proyecto “Ampliación I Planta Catemu”, y aprobado por la RCA N°\
182
+ \ 1564/2009."
183
+ - "Asimismo, la empresa instalará las señalizaciones necesarias \npreviniendo sobre\
184
+ \ los posibles riesgos de ingreso a botaderos, \nrajos y mina subterránea. \n\
185
+ Pila de Lixiviación \nDetención de la aplicación de solución. \n Lavado de pilas\
186
+ \ con lixiviado residual recirculado al cual se le \nagrega agua fresca, proceso\
187
+ \ cuyo objetivo es destruir el cianuro \nresidual por aireación y exposición a\
188
+ \ la radiación ultravioleta. \nRemoción de las bombas y tuberías externas de la\
189
+ \ pila y limpieza \ndel área."
190
+ - "El drenaje tiene por objetivo principal controlar la acidez producida por los\
191
+ \ químicos \nusados en la fa ena y reacciones químicas secundarias. El tratamiento\
192
+ \ busca precipitar \nsustancias reactivas o metales pesados, los cuales formarán\
193
+ \ un lodo en fondo de la \npiscina de emergencia. Los reactivos que se pueden\
194
+ \ utilizar en las piscinas de emergencia \nserán cal o soda cáustica. El lodo\
195
+ \ formado es un residuo que se debe tratar y acopiar \nsegún el DS 148, por lo\
196
+ \ que una empresa debidamente acreditada se encargará de su \nretiro y disposición\
197
+ \ final. \n \nEn las canaletas que conducirán el agua de drenaje de las pilas\
198
+ \ a las p iscinas de \nemergencias, se colocará piedra caliza. Esta canaleta con\
199
+ \ piedra caliza por donde fluye el \nagua proveniente de las pilas, disminuye\
200
+ \ la acidez del agua, proporcionando la entrada \nde microorganismo reductores\
201
+ \ y descomponedores. Este sistema se man tendrá \ncambiando la piedra caliza la\
202
+ \ cual reacciona y precipita los metales sobre ella cuando se \ndetecte que ha\
203
+ \ perdido su efectividad original."
204
+ - source_sentence: ¿Qué medidas incorpora el plan de cierre aprobado en el año 2010?
205
+ sentences:
206
+ - "15 metros de espesor \nsobre una superficie de 31.410 m2 m3 \n4.711,50\
207
+ \ \n \n0,17 \n \n796,63 \nCosto del material (limos)\
208
+ \ \nEstimación del costo del material a \nutilizar para el cubrimiento del \n\
209
+ depósito \ngl \n1,00 \n \n833,91 \n \n\
210
+ 833,91 \nDisposición de estrato de suelo vegetal \nsobre la superficie y taludes\
211
+ \ del depósito \nCapa de 0,3 metros de espesor sobre \nuna superficie de 31.410\
212
+ \ m2 m3 \n9.423,00 \n \n0,17 \n \n1.593,25\
213
+ \ \nNivelación de la superficie del depósito \n(tipo \"domo\") \nNivelación en\
214
+ \ una superficie estimada \nde 31.410 m2 m2 \n31.410,00 \n \
215
+ \ \n0,01 \n \n369,97 \nCierre de accesos Pretil de 1,5 m de\
216
+ \ altura y 3 m de m3"
217
+ - "P or lo tanto, en atención a \nlos puntos precedentes, la elaboración de este\
218
+ \ plan de cierre está focalizada en cumplir con los \nrequerimientos establecidos\
219
+ \ en el Régimen Transitorio de la Ley de C ierre y las guías \nmetodológicas desarrolladas\
220
+ \ por SERNAGEOMIN a este respecto, realizando una valorización del \núltimo plan\
221
+ \ aprobado bajo la Resolución Nº 0687 del 03 de Agosto de 2010 de SERNAGEOMIN.\
222
+ \ \n \nEl plan de cierre incorpora las medidas presentadas en el plan de cierre\
223
+ \ aprobado el año 2010, los \ncompromisos ambientales emanados de la tramitación\
224
+ \ de proyectos en el Sistema de Evaluación \nde Impacto Ambiental (SEIA), y los\
225
+ \ compromisos de cierre establecidos en las resoluciones \notorgadas por SERNAGEOMIN\
226
+ \ a la faena de Guanaco Compañía Minera. \n \nPosterior a la entrada en vigencia\
227
+ \ de la Ley 19.300 de Bases Generales de Medio Ambiente, \nGuanaco Compañía Minera\
228
+ \ ha presentado 4 proyectos los cuales mejoran, modifican o amplían \nprocesos\
229
+ \ mineros de la faena."
230
+ - "Plan de Cierre PAG Planta Catemu \nCompañía Explotadora de Minas (CEMIN) \n \n\
231
+ \ \n Rev. 0 | 20-04-18 102 | 158 \n \nx. Cierre de accesos \nSe construirán pretiles\
232
+ \ para bloquear lo s caminos de acceso a las áreas donde se desarrollen actividades\
233
+ \ de \ndesmantelamiento y demolición. Los pretiles se construirán con material\
234
+ \ disponible en el lugar y tendrán \nuna altura mínima de 1,5 metros y un ángulo\
235
+ \ de talud no inferior a 33° o 1,5:1,0 (H :V). El trabajo se realizará \nbásicamente\
236
+ \ con excavadora y se contempla la construcción de 1 pretil por acceso. \n \n\
237
+ xi. Instalación de señalética \nSe considera instalar letreros empotrados de concreto\
238
+ \ u otro material duradero, advirtiendo sobre el peligro \nde traspa sar los pretiles\
239
+ \ que se construirán en el camino de acceso a las áreas donde se desarrollen \n\
240
+ actividades de desmantelamiento y demolición. Se considera la instalación de 1\
241
+ \ letrero por cada bloqueo de \nacceso. \n \nxii. Limpieza de suelos contaminados\
242
+ \ \nDespués del cese de las operaciones se realizará una identificación y evaluación\
243
+ \ de los suelos que presenten \ncontaminación en superficie producto de derrames\
244
+ \ de sustancias peligrosas, como ácido, aceites y petróleo. \nDichos suelos serán\
245
+ \ analizados mediante muestras represe ntativas para determinar el tipo de \n\
246
+ contaminantes y la concentración en el suelo y la extensión del área o volumen\
247
+ \ afectado. \n \nLos suelos en los cuales se hayan producido derrames de ácido\
248
+ \ sulfúrico y/o soluciones ácidas del proceso \nserán removidos hasta u na profundidad\
249
+ \ mínima de 0,3 metros para evitar que queden suelos ácidos en \nsuperficie."
250
+ pipeline_tag: sentence-similarity
251
+ library_name: sentence-transformers
252
+ ---
253
+
254
+ # SentenceTransformer based on sentence-transformers/all-MiniLM-L6-v2
255
+
256
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/all-MiniLM-L6-v2](https://huggingface.co/sentence-transformers/all-MiniLM-L6-v2) on the json dataset. It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
257
+
258
+ ## Model Details
259
+
260
+ ### Model Description
261
+ - **Model Type:** Sentence Transformer
262
+ - **Base model:** [sentence-transformers/all-MiniLM-L6-v2](https://huggingface.co/sentence-transformers/all-MiniLM-L6-v2) <!-- at revision fa97f6e7cb1a59073dff9e6b13e2715cf7475ac9 -->
263
+ - **Maximum Sequence Length:** 256 tokens
264
+ - **Output Dimensionality:** 384 dimensions
265
+ - **Similarity Function:** Cosine Similarity
266
+ - **Training Dataset:**
267
+ - json
268
+ <!-- - **Language:** Unknown -->
269
+ <!-- - **License:** Unknown -->
270
+
271
+ ### Model Sources
272
+
273
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
274
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
275
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
276
+
277
+ ### Full Model Architecture
278
+
279
+ ```
280
+ SentenceTransformer(
281
+ (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: BertModel
282
+ (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
283
+ (2): Normalize()
284
+ )
285
+ ```
286
+
287
+ ## Usage
288
+
289
+ ### Direct Usage (Sentence Transformers)
290
+
291
+ First install the Sentence Transformers library:
292
+
293
+ ```bash
294
+ pip install -U sentence-transformers
295
+ ```
296
+
297
+ Then you can load this model and run inference.
298
+ ```python
299
+ from sentence_transformers import SentenceTransformer
300
+
301
+ # Download from the 🤗 Hub
302
+ model = SentenceTransformer("GbrlOl/finetune-embedding-all-MiniLM-L6-v2-geotechnical-test-v1")
303
+ # Run inference
304
+ sentences = [
305
+ '¿Qué medidas incorpora el plan de cierre aprobado en el año 2010?',
306
+ 'P or lo tanto, en atención a \nlos puntos precedentes, la elaboración de este plan de cierre está focalizada en cumplir con los \nrequerimientos establecidos en el Régimen Transitorio de la Ley de C ierre y las guías \nmetodológicas desarrolladas por SERNAGEOMIN a este respecto, realizando una valorización del \núltimo plan aprobado bajo la Resolución Nº 0687 del 03 de Agosto de 2010 de SERNAGEOMIN. \n \nEl plan de cierre incorpora las medidas presentadas en el plan de cierre aprobado el año 2010, los \ncompromisos ambientales emanados de la tramitación de proyectos en el Sistema de Evaluación \nde Impacto Ambiental (SEIA), y los compromisos de cierre establecidos en las resoluciones \notorgadas por SERNAGEOMIN a la faena de Guanaco Compañía Minera. \n \nPosterior a la entrada en vigencia de la Ley 19.300 de Bases Generales de Medio Ambiente, \nGuanaco Compañía Minera ha presentado 4 proyectos los cuales mejoran, modifican o amplían \nprocesos mineros de la faena.',
307
+ '15 metros de espesor \nsobre una superficie de 31.410 m2 m3 \n4.711,50 \n \n0,17 \n \n796,63 \nCosto del material (limos) \nEstimación del costo del material a \nutilizar para el cubrimiento del \ndepósito \ngl \n1,00 \n \n833,91 \n \n833,91 \nDisposición de estrato de suelo vegetal \nsobre la superficie y taludes del depósito \nCapa de 0,3 metros de espesor sobre \nuna superficie de 31.410 m2 m3 \n9.423,00 \n \n0,17 \n \n1.593,25 \nNivelación de la superficie del depósito \n(tipo "domo") \nNivelación en una superficie estimada \nde 31.410 m2 m2 \n31.410,00 \n \n0,01 \n \n369,97 \nCierre de accesos Pretil de 1,5 m de altura y 3 m de m3',
308
+ ]
309
+ embeddings = model.encode(sentences)
310
+ print(embeddings.shape)
311
+ # [3, 384]
312
+
313
+ # Get the similarity scores for the embeddings
314
+ similarities = model.similarity(embeddings, embeddings)
315
+ print(similarities.shape)
316
+ # [3, 3]
317
+ ```
318
+
319
+ <!--
320
+ ### Direct Usage (Transformers)
321
+
322
+ <details><summary>Click to see the direct usage in Transformers</summary>
323
+
324
+ </details>
325
+ -->
326
+
327
+ <!--
328
+ ### Downstream Usage (Sentence Transformers)
329
+
330
+ You can finetune this model on your own dataset.
331
+
332
+ <details><summary>Click to expand</summary>
333
+
334
+ </details>
335
+ -->
336
+
337
+ <!--
338
+ ### Out-of-Scope Use
339
+
340
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
341
+ -->
342
+
343
+ <!--
344
+ ## Bias, Risks and Limitations
345
+
346
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
347
+ -->
348
+
349
+ <!--
350
+ ### Recommendations
351
+
352
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
353
+ -->
354
+
355
+ ## Training Details
356
+
357
+ ### Training Dataset
358
+
359
+ #### json
360
+
361
+ * Dataset: json
362
+ * Size: 442 training samples
363
+ * Columns: <code>query</code>, <code>sentence</code>, and <code>label</code>
364
+ * Approximate statistics based on the first 442 samples:
365
+ | | query | sentence | label |
366
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------|
367
+ | type | string | string | int |
368
+ | details | <ul><li>min: 9 tokens</li><li>mean: 24.66 tokens</li><li>max: 69 tokens</li></ul> | <ul><li>min: 48 tokens</li><li>mean: 239.65 tokens</li><li>max: 256 tokens</li></ul> | <ul><li>0: ~59.05%</li><li>1: ~40.95%</li></ul> |
369
+ * Samples:
370
+ | query | sentence | label |
371
+ |:---------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
372
+ | <code>¿Es estable el depósito?</code> | <code>28 <br>Tabla 25. Coordenadas ubicación deposito de Relaves Seco <br>Vértice Coordenadas UTM/WGS84 <br>Norte Este <br>1 7.224.729,00 446.092,78 <br>2 7.224.893,63 445.986,67 <br>3 7.225.276,95 446.247,94 <br>4 7.225.279,81 446.252,38 <br>5 7.225.293,73 446.491,54 <br>6 7.225.281,47 446.503,49 <br>7 7.224.830,32 446,463,09 <br>8 7.224.748,09 446.386,62 <br>9 7.224,745,05 446,357,42 <br> <br>El material depositado será compactado al alcanzar 0,5 m de altura. <br>La forma del depósito considera un espacio de 10 m entre el borde de éste y el pie de la pila. <br>La superficie basal del depósito será de 216.457 m2 y se cargará en 2 niveles, el primero de 10 <br>m de altura y el segundo de 5 m de altura. Los taludes serán 4: 1 (H:V), con un banco de <br>estabilidad de 5 m de ancho como mínimo. La superficie de la corona será paralela a la <br>superficie del depósito. <br>Tabla 26.</code> | <code>0</code> |
373
+ | <code>¿Es estable el depósito?</code> | <code>La superficie de la corona será paralela a la <br>superficie del depósito. <br>Tabla 26. Características geométricas del depósito de relaves seco <br>Parámetro Valor <br>Capacidad final del deposito 2,54 M m3/4,07 M ton <br>Área basal del deposito 216.457 m2 <br>Altura nivel 1 10 m <br>Altura nivel 2 5 m <br>Talud de depositación entre bermas 4:1 (H:V) <br>Pendiente final de la corona del depósito (pendiente <br>entre 1 y 3%) <br>Paralela a superficie <br>mejorada <br>Ancho del banco de estabilidad 5m (min) <br>Elevación máxima de corona 2.796 m.s.n.m. <br>Elevación mínima de corona 2770 m.s.n.m <br> <br>Los materiales de empréstito a utilizar en el depósito de relaves corresponden al material <br>destinado a: <br>• Construcción del muro; corresponden a 34,437 m3 estimados de material de lastre de <br>tamaños máximos superiores a 12”. <br>• Recubrimiento de canaletas de aguas lluvias; consistente en 785 m3 de material de <br>grava angulosa, con tamaño de 4” promedio. <br>Tabla 27. Características del depósito de relaves secos <br>Parámetro Valor <br>S...</code> | <code>0</code> |
374
+ | <code>¿Cuál es la elevación máxima de la corona del depósito?</code> | <code>La superficie de la corona será paralela a la <br>superficie del depósito. <br>Tabla 26. Características geométricas del depósito de relaves seco <br>Parámetro Valor <br>Capacidad final del deposito 2,54 M m3/4,07 M ton <br>Área basal del deposito 216.457 m2 <br>Altura nivel 1 10 m <br>Altura nivel 2 5 m <br>Talud de depositación entre bermas 4:1 (H:V) <br>Pendiente final de la corona del depósito (pendiente <br>entre 1 y 3%) <br>Paralela a superficie <br>mejorada <br>Ancho del banco de estabilidad 5m (min) <br>Elevación máxima de corona 2.796 m.s.n.m. <br>Elevación mínima de corona 2770 m.s.n.m <br> <br>Los materiales de empréstito a utilizar en el depósito de relaves corresponden al material <br>destinado a: <br>• Construcción del muro; corresponden a 34,437 m3 estimados de material de lastre de <br>tamaños máximos superiores a 12”. <br>• Recubrimiento de canaletas de aguas lluvias; consistente en 785 m3 de material de <br>grava angulosa, con tamaño de 4” promedio. <br>Tabla 27. Características del depósito de relaves secos <br>Parámetro Valor <br>S...</code> | <code>1</code> |
375
+ * Loss: [<code>CoSENTLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cosentloss) with these parameters:
376
+ ```json
377
+ {
378
+ "scale": 20.0,
379
+ "similarity_fct": "pairwise_cos_sim"
380
+ }
381
+ ```
382
+
383
+ ### Training Hyperparameters
384
+ #### Non-Default Hyperparameters
385
+
386
+ - `per_device_train_batch_size`: 16
387
+ - `per_device_eval_batch_size`: 16
388
+ - `learning_rate`: 2e-05
389
+ - `num_train_epochs`: 100
390
+ - `warmup_ratio`: 0.1
391
+ - `fp16`: True
392
+ - `batch_sampler`: no_duplicates
393
+
394
+ #### All Hyperparameters
395
+ <details><summary>Click to expand</summary>
396
+
397
+ - `overwrite_output_dir`: False
398
+ - `do_predict`: False
399
+ - `eval_strategy`: no
400
+ - `prediction_loss_only`: True
401
+ - `per_device_train_batch_size`: 16
402
+ - `per_device_eval_batch_size`: 16
403
+ - `per_gpu_train_batch_size`: None
404
+ - `per_gpu_eval_batch_size`: None
405
+ - `gradient_accumulation_steps`: 1
406
+ - `eval_accumulation_steps`: None
407
+ - `torch_empty_cache_steps`: None
408
+ - `learning_rate`: 2e-05
409
+ - `weight_decay`: 0.0
410
+ - `adam_beta1`: 0.9
411
+ - `adam_beta2`: 0.999
412
+ - `adam_epsilon`: 1e-08
413
+ - `max_grad_norm`: 1.0
414
+ - `num_train_epochs`: 100
415
+ - `max_steps`: -1
416
+ - `lr_scheduler_type`: linear
417
+ - `lr_scheduler_kwargs`: {}
418
+ - `warmup_ratio`: 0.1
419
+ - `warmup_steps`: 0
420
+ - `log_level`: passive
421
+ - `log_level_replica`: warning
422
+ - `log_on_each_node`: True
423
+ - `logging_nan_inf_filter`: True
424
+ - `save_safetensors`: True
425
+ - `save_on_each_node`: False
426
+ - `save_only_model`: False
427
+ - `restore_callback_states_from_checkpoint`: False
428
+ - `no_cuda`: False
429
+ - `use_cpu`: False
430
+ - `use_mps_device`: False
431
+ - `seed`: 42
432
+ - `data_seed`: None
433
+ - `jit_mode_eval`: False
434
+ - `use_ipex`: False
435
+ - `bf16`: False
436
+ - `fp16`: True
437
+ - `fp16_opt_level`: O1
438
+ - `half_precision_backend`: auto
439
+ - `bf16_full_eval`: False
440
+ - `fp16_full_eval`: False
441
+ - `tf32`: None
442
+ - `local_rank`: 0
443
+ - `ddp_backend`: None
444
+ - `tpu_num_cores`: None
445
+ - `tpu_metrics_debug`: False
446
+ - `debug`: []
447
+ - `dataloader_drop_last`: False
448
+ - `dataloader_num_workers`: 0
449
+ - `dataloader_prefetch_factor`: None
450
+ - `past_index`: -1
451
+ - `disable_tqdm`: False
452
+ - `remove_unused_columns`: True
453
+ - `label_names`: None
454
+ - `load_best_model_at_end`: False
455
+ - `ignore_data_skip`: False
456
+ - `fsdp`: []
457
+ - `fsdp_min_num_params`: 0
458
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
459
+ - `fsdp_transformer_layer_cls_to_wrap`: None
460
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
461
+ - `deepspeed`: None
462
+ - `label_smoothing_factor`: 0.0
463
+ - `optim`: adamw_torch
464
+ - `optim_args`: None
465
+ - `adafactor`: False
466
+ - `group_by_length`: False
467
+ - `length_column_name`: length
468
+ - `ddp_find_unused_parameters`: None
469
+ - `ddp_bucket_cap_mb`: None
470
+ - `ddp_broadcast_buffers`: False
471
+ - `dataloader_pin_memory`: True
472
+ - `dataloader_persistent_workers`: False
473
+ - `skip_memory_metrics`: True
474
+ - `use_legacy_prediction_loop`: False
475
+ - `push_to_hub`: False
476
+ - `resume_from_checkpoint`: None
477
+ - `hub_model_id`: None
478
+ - `hub_strategy`: every_save
479
+ - `hub_private_repo`: None
480
+ - `hub_always_push`: False
481
+ - `gradient_checkpointing`: False
482
+ - `gradient_checkpointing_kwargs`: None
483
+ - `include_inputs_for_metrics`: False
484
+ - `include_for_metrics`: []
485
+ - `eval_do_concat_batches`: True
486
+ - `fp16_backend`: auto
487
+ - `push_to_hub_model_id`: None
488
+ - `push_to_hub_organization`: None
489
+ - `mp_parameters`:
490
+ - `auto_find_batch_size`: False
491
+ - `full_determinism`: False
492
+ - `torchdynamo`: None
493
+ - `ray_scope`: last
494
+ - `ddp_timeout`: 1800
495
+ - `torch_compile`: False
496
+ - `torch_compile_backend`: None
497
+ - `torch_compile_mode`: None
498
+ - `dispatch_batches`: None
499
+ - `split_batches`: None
500
+ - `include_tokens_per_second`: False
501
+ - `include_num_input_tokens_seen`: False
502
+ - `neftune_noise_alpha`: None
503
+ - `optim_target_modules`: None
504
+ - `batch_eval_metrics`: False
505
+ - `eval_on_start`: False
506
+ - `use_liger_kernel`: False
507
+ - `eval_use_gather_object`: False
508
+ - `average_tokens_across_devices`: False
509
+ - `prompts`: None
510
+ - `batch_sampler`: no_duplicates
511
+ - `multi_dataset_batch_sampler`: proportional
512
+
513
+ </details>
514
+
515
+ ### Training Logs
516
+ | Epoch | Step | Training Loss |
517
+ |:-------:|:----:|:-------------:|
518
+ | 6.7143 | 100 | 2.2976 |
519
+ | 13.3571 | 200 | 0.3082 |
520
+ | 20.0714 | 300 | 0.0002 |
521
+ | 26.7143 | 400 | 0.0 |
522
+ | 33.3571 | 500 | 0.0 |
523
+ | 40.0714 | 600 | 0.0 |
524
+ | 46.7143 | 700 | 0.0 |
525
+ | 53.3571 | 800 | 0.0 |
526
+ | 60.0714 | 900 | 0.0 |
527
+ | 66.7143 | 1000 | 0.0 |
528
+ | 73.3571 | 1100 | 0.0 |
529
+ | 80.0714 | 1200 | 0.0 |
530
+ | 86.7143 | 1300 | 0.0 |
531
+ | 93.3571 | 1400 | 0.0 |
532
+
533
+
534
+ ### Framework Versions
535
+ - Python: 3.10.16
536
+ - Sentence Transformers: 3.3.1
537
+ - Transformers: 4.48.1
538
+ - PyTorch: 2.5.1+cu124
539
+ - Accelerate: 1.3.0
540
+ - Datasets: 3.2.0
541
+ - Tokenizers: 0.21.0
542
+
543
+ ## Citation
544
+
545
+ ### BibTeX
546
+
547
+ #### Sentence Transformers
548
+ ```bibtex
549
+ @inproceedings{reimers-2019-sentence-bert,
550
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
551
+ author = "Reimers, Nils and Gurevych, Iryna",
552
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
553
+ month = "11",
554
+ year = "2019",
555
+ publisher = "Association for Computational Linguistics",
556
+ url = "https://arxiv.org/abs/1908.10084",
557
+ }
558
+ ```
559
+
560
+ #### CoSENTLoss
561
+ ```bibtex
562
+ @online{kexuefm-8847,
563
+ title={CoSENT: A more efficient sentence vector scheme than Sentence-BERT},
564
+ author={Su Jianlin},
565
+ year={2022},
566
+ month={Jan},
567
+ url={https://kexue.fm/archives/8847},
568
+ }
569
+ ```
570
+
571
+ <!--
572
+ ## Glossary
573
+
574
+ *Clearly define terms in order to be accessible across audiences.*
575
+ -->
576
+
577
+ <!--
578
+ ## Model Card Authors
579
+
580
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
581
+ -->
582
+
583
+ <!--
584
+ ## Model Card Contact
585
+
586
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
587
+ -->
config.json ADDED
@@ -0,0 +1,26 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "embedding_finetune/checkpoint-1400",
3
+ "architectures": [
4
+ "BertModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "classifier_dropout": null,
8
+ "gradient_checkpointing": false,
9
+ "hidden_act": "gelu",
10
+ "hidden_dropout_prob": 0.1,
11
+ "hidden_size": 384,
12
+ "initializer_range": 0.02,
13
+ "intermediate_size": 1536,
14
+ "layer_norm_eps": 1e-12,
15
+ "max_position_embeddings": 512,
16
+ "model_type": "bert",
17
+ "num_attention_heads": 12,
18
+ "num_hidden_layers": 6,
19
+ "pad_token_id": 0,
20
+ "position_embedding_type": "absolute",
21
+ "torch_dtype": "float32",
22
+ "transformers_version": "4.48.1",
23
+ "type_vocab_size": 2,
24
+ "use_cache": true,
25
+ "vocab_size": 30522
26
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.3.1",
4
+ "transformers": "4.48.1",
5
+ "pytorch": "2.5.1+cu124"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:c19f576fe7e1bca63186eeb1833e0b42d7408f9aee66e01a5325e179b37b471f
3
+ size 90864192
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 256,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": {
3
+ "content": "[CLS]",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "mask_token": {
10
+ "content": "[MASK]",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "pad_token": {
17
+ "content": "[PAD]",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "sep_token": {
24
+ "content": "[SEP]",
25
+ "lstrip": false,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "unk_token": {
31
+ "content": "[UNK]",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ }
37
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,65 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "[PAD]",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "100": {
12
+ "content": "[UNK]",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "101": {
20
+ "content": "[CLS]",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "102": {
28
+ "content": "[SEP]",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "103": {
36
+ "content": "[MASK]",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "clean_up_tokenization_spaces": false,
45
+ "cls_token": "[CLS]",
46
+ "do_basic_tokenize": true,
47
+ "do_lower_case": true,
48
+ "extra_special_tokens": {},
49
+ "mask_token": "[MASK]",
50
+ "max_length": 128,
51
+ "model_max_length": 256,
52
+ "never_split": null,
53
+ "pad_to_multiple_of": null,
54
+ "pad_token": "[PAD]",
55
+ "pad_token_type_id": 0,
56
+ "padding_side": "right",
57
+ "sep_token": "[SEP]",
58
+ "stride": 0,
59
+ "strip_accents": null,
60
+ "tokenize_chinese_chars": true,
61
+ "tokenizer_class": "BertTokenizer",
62
+ "truncation_side": "right",
63
+ "truncation_strategy": "longest_first",
64
+ "unk_token": "[UNK]"
65
+ }
vocab.txt ADDED
The diff for this file is too large to render. See raw diff