Spaces:

naderasadi
/

DesignGenie

Build error

App Files Files Community

DesignGenie / src /designgenie /models /diffusion /controlnet.py

naderasadi

Initial commit

5b2ab1c almost 2 years ago

raw

history blame

5.07 kB

	from typing import Any, List, Optional, Tuple, Union
	import itertools
	from PIL import Image
	import numpy as np
	import torch

	from controlnet_aux import MLSDdetector, PidiNetDetector, HEDdetector
	from diffusers import (
	ControlNetModel,
	StableDiffusionControlNetPipeline,
	UniPCMultistepScheduler,
	)


	MODEL_DICT = {
	"mlsd": {
	"name": "lllyasviel/Annotators",
	"detector": MLSDdetector,
	"model": "lllyasviel/control_v11p_sd15_mlsd",
	},
	"soft_edge": {
	"name": "lllyasviel/Annotators",
	"detector": PidiNetDetector,
	"model": "lllyasviel/control_v11p_sd15_softedge",
	},
	"hed": {
	"name": "lllyasviel/Annotators",
	"detector": HEDdetector,
	"model": "lllyasviel/sd-controlnet-hed",
	},
	"scribble": {
	"name": "lllyasviel/Annotators",
	"detector": HEDdetector,
	"model": "lllyasviel/control_v11p_sd15_scribble",
	},
	}


	class StableDiffusionControlNet:
	"""ControlNet pipeline for generating images from prompts.

	Args:
	control_model_name (str):
	Name of the controlnet processor.
	sd_model_name (str):
	Name of the StableDiffusion model.
	"""

	def __init__(
	self,
	control_model_name: str,
	sd_model_name: Optional[str] = "runwayml/stable-diffusion-v1-5",
	) -> None:
	self.processor = MODEL_DICT[control_model_name]["detector"].from_pretrained(
	MODEL_DICT[control_model_name]["name"]
	)
	self.pipe = self.create_pipe(
	sd_model_name=sd_model_name, control_model_name=control_model_name
	)

	def _repeat(self, items: List[Any], n: int) -> List[Any]:
	"""Repeat items in a list n times.

	Args:
	items (List[Any]): List of items to be repeated.
	n (int): Number of repetitions.

	Returns:
	List[Any]: List of repeated items.
	"""
	return list(
	itertools.chain.from_iterable(itertools.repeat(item, n) for item in items)
	)

	def generate_control_images(self, images: List[Image.Image]) -> List[Image.Image]:
	"""Generate control images from input images.

	Args:
	images (List[Image.Image]): Input images.

	Returns:
	List[Image.Image]: Control images.
	"""
	return [self.processor(image) for image in images]

	def create_pipe(
	self, sd_model_name: str, control_model_name: str
	) -> StableDiffusionControlNetPipeline:
	"""Create a StableDiffusionControlNetPipeline.

	Args:
	sd_model_name (str): StableDiffusion model name.
	control_model_name (str): Name of the ControlNet module.

	Returns:
	StableDiffusionControlNetPipeline
	"""
	controlnet = ControlNetModel.from_pretrained(
	MODEL_DICT[control_model_name]["model"], torch_dtype=torch.float16
	)
	pipe = StableDiffusionControlNetPipeline.from_pretrained(
	sd_model_name, controlnet=controlnet, torch_dtype=torch.float16
	)

	pipe.scheduler = UniPCMultistepScheduler.from_config(pipe.scheduler.config)
	pipe.enable_model_cpu_offload()
	pipe.enable_xformers_memory_efficient_attention()

	return pipe

	def process(
	self,
	images: List[Image.Image],
	prompts: List[str],
	negative_prompt: Optional[str] = None,
	n_outputs: Optional[int] = 1,
	num_inference_steps: Optional[int] = 30,
	) -> List[List[Image.Image]]:
	"""Generate images from `prompts` using `control_images` and `negative_prompt`.

	Args:
	images (List[Image.Image]): Input images.
	prompts (List[str]): List of prompts.
	negative_prompt (Optional[str], optional): Negative prompt. Defaults to None.
	n_outputs (Optional[int], optional): Number of generated outputs. Defaults to 1.
	num_inference_steps (Optional[int], optional): Number of inference iterations. Defaults to 30.

	Returns:
	List[List[Image.Image]]
	"""

	control_images = self.generate_control_images(images)

	assert len(prompts) == len(
	control_images
	), "Number of prompts and input images must be equal."

	if n_outputs > 1:
	prompts = self._repeat(prompts, n=n_outputs)
	control_images = self._repeat(control_images, n=n_outputs)

	generator = [
	torch.Generator(device="cuda").manual_seed(int(i))
	for i in np.random.randint(len(prompts), size=len(prompts))
	]

	output = self.pipe(
	prompts,
	image=control_images,
	negative_prompt=[negative_prompt] * len(prompts),
	num_inference_steps=num_inference_steps,
	generator=generator,
	)

	output_images = [
	output.images[idx * n_outputs : (idx + 1) * n_outputs]
	for idx in range(len(images))
	]

	return output_images