Spaces:

roll-ai
/

EPiC

Paused

Muhammad Taqi Raza commited on 3 days ago

Commit

4ada65a

1 Parent(s): 3c780d6

push optimized changes

Files changed (2) hide show

controlnet_pipeline.py CHANGED Viewed

@@ -161,6 +161,7 @@ class ControlnetCogVideoXImageToVideoPCDPipeline(DiffusionPipeline, CogVideoXLor
             tokenizer=tokenizer, text_encoder=text_encoder, vae=vae, transformer=transformer, controlnet=controlnet, scheduler=scheduler
         )
         self.vae_scale_factor_spatial = (
             2 ** (len(self.vae.config.block_out_channels) - 1) if hasattr(self, "vae") and self.vae is not None else 8
         )
         self.vae_scale_factor_temporal = (
@@ -317,6 +318,8 @@ class ControlnetCogVideoXImageToVideoPCDPipeline(DiffusionPipeline, CogVideoXLor
             )
         num_frames = (num_frames - 1) // self.vae_scale_factor_temporal + 1
         shape = (
             batch_size,
             num_frames,

             tokenizer=tokenizer, text_encoder=text_encoder, vae=vae, transformer=transformer, controlnet=controlnet, scheduler=scheduler
         )
         self.vae_scale_factor_spatial = (
+            # 6
             2 ** (len(self.vae.config.block_out_channels) - 1) if hasattr(self, "vae") and self.vae is not None else 8
         )
         self.vae_scale_factor_temporal = (
             )
         num_frames = (num_frames - 1) // self.vae_scale_factor_temporal + 1
+        # 36//
         shape = (
             batch_size,
             num_frames,

inference/cli_demo_camera_i2v_pcd.py CHANGED Viewed

@@ -254,7 +254,7 @@ def generate_video(
         vae=vae,
         controlnet=controlnet,
         scheduler=scheduler,
-    ).to('cuda')
     # If you're using with lora, add this code
     if lora_path:
@@ -275,6 +275,7 @@ def generate_video(
     # pipe.to("cuda")
     pipe = pipe.to(dtype=dtype)
     # pipe.enable_sequential_cpu_offload()
     if pipe_cpu_offload:
         pipe.enable_model_cpu_offload()
@@ -427,7 +428,7 @@ if __name__ == "__main__":
     parser.add_argument("--num_frames", type=int, default=49)
     parser.add_argument("--start_camera_idx", type=int, default=0)
     parser.add_argument("--end_camera_idx", type=int, default=1)
-    parser.add_argument("--controlnet_transformer_num_attn_heads", type=int, default=4)
     parser.add_argument("--controlnet_transformer_attention_head_dim", type=int, default=64)
     parser.add_argument("--controlnet_transformer_out_proj_dim_factor", type=int, default=64)
     parser.add_argument("--controlnet_transformer_out_proj_dim_zero_init", action="store_true", default=True, help=("Init project zero."),

         vae=vae,
         controlnet=controlnet,
         scheduler=scheduler,
+    )
     # If you're using with lora, add this code
     if lora_path:
     # pipe.to("cuda")
     pipe = pipe.to(dtype=dtype)
+    pipe = pipe.to("cuda")
     # pipe.enable_sequential_cpu_offload()
     if pipe_cpu_offload:
         pipe.enable_model_cpu_offload()
     parser.add_argument("--num_frames", type=int, default=49)
     parser.add_argument("--start_camera_idx", type=int, default=0)
     parser.add_argument("--end_camera_idx", type=int, default=1)
+    parser.add_argument("--controlnet_transformer_num_attn_heads", type=int, default=2)
     parser.add_argument("--controlnet_transformer_attention_head_dim", type=int, default=64)
     parser.add_argument("--controlnet_transformer_out_proj_dim_factor", type=int, default=64)
     parser.add_argument("--controlnet_transformer_out_proj_dim_zero_init", action="store_true", default=True, help=("Init project zero."),