Spaces:

uruguayai
/

trainflux

Runtime error

App Files Files Community

uruguayai commited on Sep 8, 2024

Commit

00f4326

verified ·

1 Parent(s): 4434e29

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -6

app.py CHANGED Viewed

@@ -155,23 +155,27 @@ state = train_state.TrainState.create(
 )
 # Modify the train_step function
-def train_step(state, batch, rng):
     def compute_loss(params, pixel_values, rng):
         # Encode images to latent space
         latents = pipeline.vae.apply(
             {"params": params["vae"]},
             pixel_values,
             method=pipeline.vae.encode
         ).latent_dist.sample(rng)
-        latents = latents * 0.18215
         # Generate random noise
-        noise = jax.random.normal(rng, latents.shape)
         # Sample random timesteps
         timesteps = jax.random.randint(
             rng, (latents.shape[0],), 0, pipeline.scheduler.config.num_train_timesteps
         )
         # Add noise to latents
         noisy_latents = pipeline.scheduler.add_noise(
@@ -184,7 +188,8 @@ def train_step(state, batch, rng):
         # Generate random encoder hidden states (simulating text embeddings)
         encoder_hidden_states = jax.random.normal(
             rng,
-            (latents.shape[0], pipeline.text_encoder.config.hidden_size)
         )
         # Predict noise
@@ -199,12 +204,16 @@ def train_step(state, batch, rng):
         # Compute loss
         return jnp.mean((model_output - noise) ** 2)
-    grad_fn = jax.value_and_grad(compute_loss)
     rng, step_rng = jax.random.split(rng)
-    loss, grads = grad_fn(state.params, batch["pixel_values"], step_rng)
     state = state.apply_gradients(grads=grads)
     return state, loss
 # Training loop (remains the same)
 num_epochs = 3
 batch_size = 1

 )
 # Modify the train_step function
+ef train_step(state, batch, rng):
     def compute_loss(params, pixel_values, rng):
+        # Ensure pixel_values are float32
+        pixel_values = jnp.array(pixel_values, dtype=jnp.float32)
         # Encode images to latent space
         latents = pipeline.vae.apply(
             {"params": params["vae"]},
             pixel_values,
             method=pipeline.vae.encode
         ).latent_dist.sample(rng)
+        latents = latents * jnp.float32(0.18215)
         # Generate random noise
+        noise = jax.random.normal(rng, latents.shape, dtype=jnp.float32)
         # Sample random timesteps
         timesteps = jax.random.randint(
             rng, (latents.shape[0],), 0, pipeline.scheduler.config.num_train_timesteps
         )
+        timesteps = jnp.array(timesteps, dtype=jnp.float32)
         # Add noise to latents
         noisy_latents = pipeline.scheduler.add_noise(
         # Generate random encoder hidden states (simulating text embeddings)
         encoder_hidden_states = jax.random.normal(
             rng,
+            (latents.shape[0], pipeline.text_encoder.config.hidden_size),
+            dtype=jnp.float32
         )
         # Predict noise
         # Compute loss
         return jnp.mean((model_output - noise) ** 2)
+    grad_fn = jax.grad(compute_loss, argnums=0, allow_int=True)
     rng, step_rng = jax.random.split(rng)
+    grads = grad_fn(state.params, batch["pixel_values"], step_rng)
+    loss = compute_loss(state.params, batch["pixel_values"], step_rng)
     state = state.apply_gradients(grads=grads)
     return state, loss
 # Training loop (remains the same)
 num_epochs = 3
 batch_size = 1