Spaces:

JackAILab
/

ConsistentID

Running on Zero

JackAILab commited on May 7, 2024

Commit

43bce3d

verified ·

1 Parent(s): 2ce0115

Update pipline_StableDiffusion_ConsistentID.py

Files changed (1) hide show

pipline_StableDiffusion_ConsistentID.py CHANGED Viewed

@@ -43,7 +43,7 @@ class ConsistentIDStableDiffusionPipeline(StableDiffusionPipeline):
         subfolder: str = '',
         trigger_word_ID: str = '<|image|>',
         trigger_word_facial: str = '<|facial|>',
-        image_encoder_path: str = '/data6/huangjiehui_m22/pretrained_model/CLIP-ViT-H-14-laion2B-s32B-b79K',   # TODO
         torch_dtype = torch.float16,
         num_tokens = 4,
         lora_rank= 128,
@@ -68,7 +68,7 @@ class ConsistentIDStableDiffusionPipeline(StableDiffusionPipeline):
         ### BiSeNet
         self.bise_net = BiSeNet(n_classes = 19)
         self.bise_net.cuda()
-        self.bise_net_cp='./models/BiSeNet_pretrained_for_ConsistentID.pth' #TODO BiSeNet的checkpoint
         self.bise_net.load_state_dict(torch.load(self.bise_net_cp))
         self.bise_net.eval()
         # Colors for all 20 parts
@@ -83,7 +83,7 @@ class ConsistentIDStableDiffusionPipeline(StableDiffusionPipeline):
                     [0, 255, 255], [85, 255, 255], [170, 255, 255]]
         ### LLVA Optional
-        self.llva_model_path = "/data6/huangjiehui_m22/pretrained_model/llava-v1.5-7b" #TODO
         self.llva_prompt = "Describe this person's facial features for me, including face, ears, eyes, nose, and mouth."
         self.llva_tokenizer, self.llva_model, self.llva_image_processor, self.llva_context_len = None,None,None,None #load_pretrained_model(self.llva_model_path)

         subfolder: str = '',
         trigger_word_ID: str = '<|image|>',
         trigger_word_facial: str = '<|facial|>',
+        image_encoder_path: str = 'CLIP-ViT-H-14-laion2B-s32B-b79K',   # TODO
         torch_dtype = torch.float16,
         num_tokens = 4,
         lora_rank= 128,
         ### BiSeNet
         self.bise_net = BiSeNet(n_classes = 19)
         self.bise_net.cuda()
+        self.bise_net_cp='./models/BiSeNet_pretrained_for_ConsistentID.pth' #TODO
         self.bise_net.load_state_dict(torch.load(self.bise_net_cp))
         self.bise_net.eval()
         # Colors for all 20 parts
                     [0, 255, 255], [85, 255, 255], [170, 255, 255]]
         ### LLVA Optional
+        self.llva_model_path = "llava-v1.5-7b" #TODO
         self.llva_prompt = "Describe this person's facial features for me, including face, ears, eyes, nose, and mouth."
         self.llva_tokenizer, self.llva_model, self.llva_image_processor, self.llva_context_len = None,None,None,None #load_pretrained_model(self.llva_model_path)