flux-labs

Running on Zero

App Files Files Community

vilarin commited on Jun 17, 2024

Commit

92f9e1d

verified ·

1 Parent(s): a0f72b8

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -3

app.py CHANGED Viewed

@@ -13,7 +13,7 @@ from diffusers.utils import load_image
 from PIL import Image
 import requests
 import transformers
-from transformers import AutoTokenizer, T5EncoderModel, BitsAndBytesConfig
 from translatepy import Translator
 os.environ["HF_HUB_ENABLE_HF_TRANSFER"] = "1"
@@ -53,12 +53,10 @@ transformer = SD3Transformer2DModel.from_pretrained(
     torch_dtype=torch.float16,
 )
-quantization_config = BitsAndBytesConfig(load_in_8bit=True)
 text_encoder_3 = T5EncoderModel.from_pretrained(
     repo,
     subfolder="text_encoder_3",
-    quantization_config=quantization_config,
 )
 tokenizer_3 = AutoTokenizer.from_pretrained(
@@ -81,6 +79,31 @@ if torch.cuda.is_available():
         text_encoder_3=text_encoder_3,
         torch_dtype=torch.float16).to("cuda")
 pipe.scheduler = FlowMatchEulerDiscreteScheduler.from_config(pipe.scheduler.config)
 pipe2.scheduler = FlowMatchEulerDiscreteScheduler.from_config(pipe2.scheduler.config)

 from PIL import Image
 import requests
 import transformers
+from transformers import AutoTokenizer, T5EncoderModel
 from translatepy import Translator
 os.environ["HF_HUB_ENABLE_HF_TRANSFER"] = "1"
     torch_dtype=torch.float16,
 )
 text_encoder_3 = T5EncoderModel.from_pretrained(
     repo,
     subfolder="text_encoder_3",
 )
 tokenizer_3 = AutoTokenizer.from_pretrained(
         text_encoder_3=text_encoder_3,
         torch_dtype=torch.float16).to("cuda")
+torch.set_float32_matmul_precision("high")
+torch._inductor.config.conv_1x1_as_mm = True
+torch._inductor.config.coordinate_descent_tuning = True
+torch._inductor.config.epilogue_fusion = False
+torch._inductor.config.coordinate_descent_check_all_directions = True
+pipe.set_progress_bar_config(disable=True)
+pipe.transformer.to(memory_format=torch.channels_last)
+pipe.vae.to(memory_format=torch.channels_last)
+pipe.transformer = torch.compile(pipe.transformer, mode="max-autotune", fullgraph=True)
+pipe.vae.decode = torch.compile(pipe.vae.decode, mode="max-autotune", fullgraph=True)
+pipe2.set_progress_bar_config(disable=True)
+pipe2.transformer.to(memory_format=torch.channels_last)
+pipe2.vae.to(memory_format=torch.channels_last)
+pipe2.transformer = torch.compile(pipe2.transformer, mode="max-autotune", fullgraph=True)
+pipe2.vae.decode = torch.compile(pipe2.vae.decode, mode="max-autotune", fullgraph=True)
 pipe.scheduler = FlowMatchEulerDiscreteScheduler.from_config(pipe.scheduler.config)
 pipe2.scheduler = FlowMatchEulerDiscreteScheduler.from_config(pipe2.scheduler.config)