Spaces:

ClemSummer
/

ai-lab

Running on CPU Upgrade

App Files Files Community

ClemSummer commited on Jul 29

Commit

e497915

1 Parent(s): d32cb1d

moved both cbow and qwen to cache HF dataset

Browse files

Files changed (4) hide show

.dockerignore +3 -1
.gitignore +1 -0
Dockerfile +11 -3
cbow_logic.py +1 -1

.dockerignore CHANGED Viewed

@@ -31,4 +31,6 @@ models/
 # Docker or Space-specific
 docker-compose.yaml
-Caddyfile

 # Docker or Space-specific
 docker-compose.yaml
+Caddyfile
+qwen_model/
+models/

.gitignore CHANGED Viewed

@@ -2,3 +2,4 @@ __pycache__/
 *.png
 **/artifacts/
 models/

 *.png
 **/artifacts/
 models/
+qwen_model/

Dockerfile CHANGED Viewed

@@ -22,13 +22,21 @@ RUN mkdir -p /models/clip && \
 RUN python3 -c "from transformers import AutoTokenizer; AutoTokenizer.from_pretrained('bert-base-uncased').save_pretrained('/models/bert-tokenizer')"
 RUN python3 -c "from transformers import CLIPProcessor; CLIPProcessor.from_pretrained('openai/clip-vit-base-patch32').save_pretrained('/models/clip')"
 RUN mkdir -p /models/cbow && \
-    python3 -c "import gensim.downloader as api; model = api.load('glove-twitter-200'); model.save('/models/cbow_model.kv')"
 RUN mkdir -p /models/qwen && \
-    python3 -c "from transformers import AutoTokenizer; AutoTokenizer.from_pretrained('Qwen/Qwen3-0.6B-Base').save_pretrained('/models/qwen')"
-RUN python3 -c "from transformers import AutoModelForCausalLM; AutoModelForCausalLM.from_pretrained('Qwen/Qwen3-0.6B-Base').save_pretrained('/models/qwen')"
 EXPOSE 7860
 # Install curl if it's not already installed

 RUN python3 -c "from transformers import AutoTokenizer; AutoTokenizer.from_pretrained('bert-base-uncased').save_pretrained('/models/bert-tokenizer')"
 RUN python3 -c "from transformers import CLIPProcessor; CLIPProcessor.from_pretrained('openai/clip-vit-base-patch32').save_pretrained('/models/clip')"
+# RUN mkdir -p /models/cbow && \
+#     python3 -c "import gensim.downloader as api; model = api.load('glove-twitter-200'); model.save('/models/cbow_model.kv')"
 RUN mkdir -p /models/cbow && \
+    wget https://huggingface.co/datasets/ClemSummer/cbow-model-cache/resolve/main/cbow_model.kv -O /models/cbow/cbow_model.kv && \
+    wget https://huggingface.co/datasets/ClemSummer/cbow-model-cache/resolve/main/cbow_model.kv.vectors.npy -O /models/cbow/cbow_model.kv.vectors.npy
+# RUN mkdir -p /models/qwen && \
+#     python3 -c "from transformers import AutoTokenizer; AutoTokenizer.from_pretrained('Qwen/Qwen3-0.6B-Base').save_pretrained('/models/qwen')"
+# RUN python3 -c "from transformers import AutoModelForCausalLM; AutoModelForCausalLM.from_pretrained('Qwen/Qwen3-0.6B-Base').save_pretrained('/models/qwen')"
 RUN mkdir -p /models/qwen && \
+    python3 -c "from transformers import AutoTokenizer; \
+                AutoTokenizer.from_pretrained('ClemSummer/qwen-model-cache', trust_remote_code=True).save_pretrained('/models/qwen')"
+RUN python3 -c "from transformers import AutoModelForCausalLM; \
+                AutoModelForCausalLM.from_pretrained('ClemSummer/qwen-model-cache', trust_remote_code=True).save_pretrained('/models/qwen')"
 EXPOSE 7860
 # Install curl if it's not already installed

cbow_logic.py CHANGED Viewed

@@ -7,7 +7,7 @@ import shlex
 class MeaningCalculator:
-    def __init__(self, model_path: str = "/models/cbow_model.kv"):
         if not os.path.exists(model_path):
             raise FileNotFoundError(f"Model not found at: {model_path}")
         self.model = gensim.models.KeyedVectors.load(model_path, mmap='r')

 class MeaningCalculator:
+    def __init__(self, model_path: str = "/models/cbow/cbow_model.kv"):
         if not os.path.exists(model_path):
             raise FileNotFoundError(f"Model not found at: {model_path}")
         self.model = gensim.models.KeyedVectors.load(model_path, mmap='r')