Spaces:

alexnasa
/

pixel3dmm

Running on Zero

File size: 10,859 Bytes

480e656
2f19918
 
 
 
480e656
8355ef8
 
 
f0ccdf1
480e656
 
 
 
 
 
 
98dd4d1
e2cec11
3b8b123
 
 
 
 
 
 
 
b94a387
fe8ccea
d38ca73
27d9c8d
 
a2f3197
 
 
39c9247
 
3b8b123
 
 
0f5fa52
e86d00d
63529cc
 
0c8ae54
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
cae2bd9
 
6b0fd85
cae2bd9
c037013
 
 
 
0c8ae54
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
6b0fd85
 
 
0c8ae54
 
 
c037013
c65fc1e
0c8ae54
c65fc1e
0c8ae54
 
 
 
c65fc1e
0c8ae54
 
 
 
 
 
 
 
 
6b0fd85
0c8ae54
 
 
c65fc1e
0c8ae54
 
 
c65fc1e
0c8ae54
6b0fd85
 
 
 
 
 
 
 
 
 
 
0c8ae54
c65fc1e
0c8ae54
6b0fd85
c65fc1e
0c8ae54
 
 
c65fc1e
0c8ae54
6b0fd85
 
 
 
 
 
 
 
 
 
 
 
0c8ae54
c65fc1e
0c8ae54
6b0fd85
c65fc1e
0c8ae54
 
 
c65fc1e
626abf7
6b0fd85
 
c037013
 
 
 
 
 
 
 
 
939af2e
c037013
626abf7
6b0fd85
c037013
 
939af2e
 
 
 
 
 
6b0fd85
939af2e
 
 
 
6b0fd85
c037013
939af2e
6b0fd85
 
2f19918
 
0c8ae54
 
 
 
c65fc1e
0c8ae54
9db6838
 
c65fc1e
308fe7a
 
 
d0853f7
c65fc1e
9db6838
c65fc1e
d0853f7
c65fc1e
d0853f7
c65fc1e
d0853f7
c65fc1e
d0853f7
c65fc1e
d0853f7
 
9db6838
c65fc1e
9db6838
58c9f2e
6f8a30f
 
58c9f2e
 
 
 
 
 
308fe7a
 
 
 
 
 
 
0c8ae54
308fe7a
d9631c9
 
 
 
 
 
 
 
 
 
 
 
308fe7a
 
 
 
 
 
 
c65fc1e
308fe7a
 
 
 
 
 
 
 
d9631c9
308fe7a
 
 
 
 
 
 
 
 
 
 
 
c65fc1e
 
308fe7a
c65fc1e
 
d0853f7
6f8a30f
0c8ae54
 
d0853f7

import spaces

import torch._dynamo
torch._dynamo.disable()

import os
# Force Dynamo off at import‐time of torch, pytorch3d, etc.
os.environ["TORCHDYNAMO_DISABLE"] = "1"

from gradio_litmodel3d import LitModel3D
import subprocess
import tempfile
import uuid
import glob
import shutil
import time
import gradio as gr
import sys
from PIL import Image
import importlib, site, sys

# Re-discover all .pth/.egg-link files
for sitedir in site.getsitepackages():
    site.addsitedir(sitedir)

# Clear caches so importlib will pick up new modules
importlib.invalidate_caches()

# Set environment variables
os.environ["PIXEL3DMM_CODE_BASE"] = f"{os.getcwd()}"
os.environ["PIXEL3DMM_PREPROCESSED_DATA"] = f"{os.getcwd()}/proprocess_results"
os.environ["PIXEL3DMM_TRACKING_OUTPUT"] = f"{os.getcwd()}/tracking_results"

def sh(cmd): subprocess.check_call(cmd, shell=True)

sh("pip install -e .")

# tell Python to re-scan site-packages now that the egg-link exists
import importlib, site; site.addsitedir(site.getsitepackages()[0]); importlib.invalidate_caches()

from pixel3dmm import env_paths

sh("cd src/pixel3dmm/preprocessing/facer && pip install -e . && cd ../../../..")
sh("cd src/pixel3dmm/preprocessing/PIPNet/FaceBoxesV2/utils && sh make.sh && cd ../../../../../..")

def install_cuda_toolkit():
    CUDA_TOOLKIT_URL = "https://developer.download.nvidia.com/compute/cuda/12.1.0/local_installers/cuda_12.1.0_530.30.02_linux.run"
    CUDA_TOOLKIT_FILE = "/tmp/%s" % os.path.basename(CUDA_TOOLKIT_URL)
    subprocess.call(["wget", "-q", CUDA_TOOLKIT_URL, "-O", CUDA_TOOLKIT_FILE])
    subprocess.call(["chmod", "+x", CUDA_TOOLKIT_FILE])
    subprocess.call([CUDA_TOOLKIT_FILE, "--silent", "--toolkit"])

    os.environ["CUDA_HOME"] = "/usr/local/cuda"
    os.environ["PATH"] = "%s/bin:%s" % (os.environ["CUDA_HOME"], os.environ["PATH"])
    os.environ["LD_LIBRARY_PATH"] = "%s/lib:%s" % (
        os.environ["CUDA_HOME"],
        "" if "LD_LIBRARY_PATH" not in os.environ else os.environ["LD_LIBRARY_PATH"],
    )
    # Fix: arch_list[-1] += '+PTX'; IndexError: list index out of range
    os.environ["TORCH_CUDA_ARCH_LIST"] = "9.0"
    print("==> finished installation")
    
install_cuda_toolkit()

from omegaconf import OmegaConf
from pixel3dmm.network_inference import normals_n_uvs

DEVICE = "cuda"

# 2. Empty cache for our heavy objects
_model_cache = {}


# Utility to select first image from a folder
def first_image_from_dir(directory):
    patterns = ["*.jpg", "*.png", "*.jpeg"]
    files = []
    for p in patterns:
        files.extend(glob.glob(os.path.join(directory, p)))
    if not files:
        return None
    return sorted(files)[0]

# Function to reset the UI and state
def reset_all():
    return (
        None,  # crop_img
        None,  # normals_img
        None,  # uv_img
        None,  # track_img
        "Awaiting new image upload...",  # status
        {},    # state
        gr.update(interactive=True),   # preprocess_btn
        gr.update(interactive=True),  # normals_btn
        gr.update(interactive=True),  # uv_map_btn
        gr.update(interactive=True)   # track_btn
    )

# Step 1: Preprocess the input image (Save and Crop)
@spaces.GPU()
def preprocess_image(image_array, session_id):
    if image_array is None:
        return "❌ Please upload an image first.", None, gr.update(interactive=True), gr.update(interactive=True)

    os.makedirs(base_dir, exist_ok=True)

    img = Image.fromarray(image_array)
    saved_image_path = os.path.join(os.environ["PIXEL3DMM_PREPROCESSED_DATA"], session_id, f"{session_id}.png")
    img.save(saved_image_path)
    
    try:
        p = subprocess.run([
            "python", "scripts/run_preprocessing.py", "--video_or_images_path", saved_image_path
        ], check=True, capture_output=True, text=True)
    except subprocess.CalledProcessError as e:
        err = f"❌ Preprocess failed (exit {e.returncode}).\n\n{e.stdout}\n{e.stderr}"
        shutil.rmtree(base_dir)
        return err, None, {}, gr.update(interactive=True), gr.update(interactive=True)

    crop_dir = os.path.join(base_dir, "cropped")
    image = first_image_from_dir(crop_dir)
    return "✅ Step 1 complete. Ready for Normals.", image, gr.update(interactive=True), gr.update(interactive=True)

# Step 2: Normals inference → normals image
@spaces.GPU()
def step2_normals(session_id):

    base_conf = OmegaConf.load("configs/base.yaml")

    if "normals_model" not in _model_cache:
        from pixel3dmm.lightning.p3dmm_system import system as p3dmm_system
    
        model = p3dmm_system.load_from_checkpoint(f"{env_paths.CKPT_N_PRED}", strict=False)
        model =  model.eval().to(DEVICE)
        _model_cache["normals_model"] = model   

    base_conf.video_name = f'{session_id}'
    normals_n_uvs(base_conf, _model_cache["normals_model"])

    normals_dir = os.path.join(os.environ["PIXEL3DMM_PREPROCESSED_DATA"], session_id, "p3dmm", "normals")
    image = first_image_from_dir(normals_dir)

    return "✅ Step 2 complete. Ready for UV Map.", image, gr.update(interactive=True), gr.update(interactive=True)

# Step 3: UV map inference → uv map image
@spaces.GPU()
def step3_uv_map(session_id):

    base_conf = OmegaConf.load("configs/base.yaml")

    if "uv_model" not in _model_cache:
        from pixel3dmm.lightning.p3dmm_system import system as p3dmm_system
    
        model = p3dmm_system.load_from_checkpoint(f"{env_paths.CKPT_UV_PRED}", strict=False)
        model =  model.eval().to(DEVICE)
        _model_cache["uv_model"] = model   

    base_conf.video_name = f'{session_id}'
    base_conf.model.prediction_type = "uv_map"
    normals_n_uvs(base_conf, _model_cache["uv_model"])

    uv_dir = os.path.join(os.environ["PIXEL3DMM_PREPROCESSED_DATA"], session_id, "p3dmm", "uv_map")
    image = first_image_from_dir(uv_dir)

    return "✅ Step 3 complete. Ready for Tracking.", image, gr.update(interactive=True), gr.update(interactive=True)

# Step 4: Tracking → final tracking image
@spaces.GPU()
def step4_track(session_id):

    tracking_conf = OmegaConf.load("configs/tracking.yaml")

     # Lazy init + caching of FLAME model on GPU
    if "flame_model" not in _model_cache:
        import os
        import torch
        import numpy as np
        import trimesh
        from pytorch3d.io import load_obj
        
        from pixel3dmm.tracking.flame.FLAME import FLAME
        from pixel3dmm.tracking.renderer_nvdiffrast import NVDRenderer
        from pixel3dmm.tracking.tracker import Tracker
    
        flame = FLAME(tracking_conf)      # CPU instantiation
        flame = flame.to(DEVICE)      # CUDA init happens here
        _model_cache["flame_model"] = flame   
        
        _mesh_file = env_paths.head_template
        
        _obj_faces = load_obj(_mesh_file)[1]
        
        _model_cache["diff_renderer"] = NVDRenderer(
            image_size=tracking_conf.size, 
            obj_filename=_mesh_file,
            no_sh=False,
            white_bg=True
        ).to(DEVICE)
   
    flame_model = _model_cache["flame_model"]
    diff_renderer = _model_cache["diff_renderer"]
    tracking_conf.video_name = f'{session_id}'
    tracker = Tracker(tracking_conf, flame_model, diff_renderer)
    tracker.run()
        

    tracking_dir = os.path.join(os.environ["PIXEL3DMM_TRACKING_OUTPUT"], session_id, "frames")
    image = first_image_from_dir(tracking_dir)

    return "✅ Pipeline complete!", image, gr.update(interactive=True)

# New: run all steps sequentially
@spaces.GPU()
def run_pipeline(image_array, request: gr.Request):

    session_id = request.session_hash

    # Step 1
    status1, crop_img, _, _ = preprocess_image(image_array)
    if "❌" in status1:
        return status1, None, None, None, None, None
    # Step 2
    status2, normals_img, _, _ = step2_normals(session_id)
    # Step 3
    status3, uv_img, _, _ = step3_uv_map(session_id)
    # Step 4
    status4, track_img, _ = step4_track(session_id)
    # Locate mesh (.ply)
    mesh_dir = os.path.join(os.environ["PIXEL3DMM_TRACKING_OUTPUT"], session_id, "mesh")
    mesh_file = first_file_from_dir(mesh_dir, "ply")

    final_status = "\n".join([status1, status2, status3, status4])
    return final_status, crop_img, normals_img, uv_img, track_img, mesh_file

# Cleanup on unload
def cleanup(request: gr.Request):
    sid = request.session_hash
    if sid:
        d1 = os.path.join(env["PIXEL3DMM_PREPROCESSED_DATA"], sid)
        d2 = os.path.join(env["PIXEL3DMM_TRACKING_OUTPUT"], sid)
        shutil.rmtree(d1, ignore_errors=True)
        shutil.rmtree(d2, ignore_errors=True)

css = """
#col-container {
    margin: 0 auto;
    max-width: 1024px;
}
"""

# Build Gradio UI
with gr.Blocks(css=css) as demo:
    gr.Markdown("## Pixel3dmm [Image Mode]")
    gr.Markdown("Versatile Screen-Space Priors for Single-Image 3D Face Reconstruction.")
    gr.HTML(
        """
        <br>
        <div style="display: flex; justify-content: center; align-items: center; text-align: center;">
            <a href="https://github.com/SimonGiebenhain/pixel3dmm">
                <img src='https://img.shields.io/badge/GitHub-Repo-blue'>
            </a>
        </div>
        """
    )

    with gr.Column(elem_id="col-container"):
        
        with gr.Row():
            with gr.Column():
                image_in = gr.Image(label="Upload Image", type="numpy", height=512)
                status = gr.Textbox(label="Status", lines=6, interactive=True, value="Upload an image to start.")

            with gr.Column():
                with gr.Row():
                    crop_img = gr.Image(label="Preprocessed", height=256)
                    normals_img = gr.Image(label="Normals", height=256)
                with gr.Row():
                    uv_img = gr.Image(label="UV Map", height=256)
                    track_img = gr.Image(label="Tracking", height=256)
                mesh_file = gr.Model3D(label="3D Model Preview")
    
                examples = gr.Examples(
                    examples=["example_images/jim_carrey.png", "example_images/margaret_qualley.png"],
                    inputs=image_in,
                    outputs=[],  # outputs are specified via the callback
                    fn=run_pipeline,
                    cache_examples=True  # cache results of examples for faster loading
                )
    
        run_btn = gr.Button("Run Pipeline")
    
        run_btn.click(
            fn=run_pipeline,
            inputs=[image_in],
            outputs=[status, crop_img, normals_img, uv_img, track_img, mesh_file]
        )
        examples.outputs = [status, crop_img, normals_img, uv_img, track_img, mesh_file]
        image_in.upload(fn=reset_all, inputs=None, outputs=[crop_img, normals_img, uv_img, track_img, mesh_file, status, run_btn])

    demo.unload(cleanup)

demo.queue()
demo.launch(share=True, ssr_mode=False)