AnimateDiff-Lightning

Running

App Files Files Community

AnimateDiff-Lightning / app_3.py

K00B404

Create app_3.py

a174f44 verified 10 days ago

raw

history blame contribute delete

2.79 kB

	import torch
	from diffusers import AnimateDiffSparseControlNetPipeline
	from diffusers.models import AutoencoderKL, MotionAdapter, SparseControlNetModel
	from diffusers.schedulers import DPMSolverMultistepScheduler
	from diffusers.utils import export_to_gif, load_image

	torch.backends.cuda.matmul.allow_tf32 = True # Enable TF32 for speed
	device = "cuda"
	dtype = torch.float16

	# Model IDs
	model_id = "SG161222/Realistic_Vision_V5.1_noVAE"
	motion_adapter_id = "guoyww/animatediff-motion-adapter-v1-5-3"
	controlnet_id = "guoyww/animatediff-sparsectrl-scribble"
	lora_adapter_id = "guoyww/animatediff-motion-lora-v1-5-3"
	vae_id = "stabilityai/sd-vae-ft-mse"

	# Load models to device once
	motion_adapter = MotionAdapter.from_pretrained(motion_adapter_id, torch_dtype=dtype, device_map="auto")
	controlnet = SparseControlNetModel.from_pretrained(controlnet_id, torch_dtype=dtype, device_map="auto")
	vae = AutoencoderKL.from_pretrained(vae_id, torch_dtype=dtype, device_map="auto")

	# Use DPMSolverMultistepScheduler with optimizations
	scheduler = DPMSolverMultistepScheduler.from_pretrained(
	model_id, subfolder="scheduler", beta_schedule="linear",
	algorithm_type="dpmsolver++", use_karras_sigmas=True,
	)

	pipe = AnimateDiffSparseControlNetPipeline.from_pretrained(
	model_id, motion_adapter=motion_adapter, controlnet=controlnet,
	vae=vae, scheduler=scheduler, torch_dtype=dtype,
	).to(device)

	# Enable memory optimizations
	pipe.enable_xformers_memory_efficient_attention()
	pipe.load_lora_weights(lora_adapter_id, adapter_name="motion_lora")
	pipe.fuse_lora(lora_scale=1.0)

	# Preload conditioning frames
	image_files = [
	"https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/diffusers/animatediff-scribble-1.png",
	"https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/diffusers/animatediff-scribble-2.png",
	"https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/diffusers/animatediff-scribble-3.png"
	]
	condition_frame_indices = [0, 8, 15]
	conditioning_frames = [load_image(img) for img in image_files]

	# Generator for reproducibility
	generator = torch.Generator(device).manual_seed(1337)

	# Inference with memory optimizations
	with torch.inference_mode():
	video = pipe(
	prompt="an aerial view of a cyberpunk city, night time, neon lights, masterpiece, high quality",
	negative_prompt="low quality, worst quality, letterboxed",
	num_inference_steps=25,
	conditioning_frames=conditioning_frames,
	controlnet_conditioning_scale=1.0,
	controlnet_frame_indices=condition_frame_indices,
	generator=generator,
	).frames[0]

	export_to_gif(video, "output.gif")

	# Free memory
	del pipe, motion_adapter, controlnet, vae
	torch.cuda.empty_cache()