Spaces:

BaljinderH
/

Tetris-RL

Sleeping

BaljinderH commited on Dec 4, 2024

Commit

880396d

verified ·

1 Parent(s): d467399

Update train.py

Files changed (1) hide show

train.py CHANGED Viewed

@@ -6,10 +6,10 @@ from callbacks import SaveFramesCallback
 import os
 def main():
-    # Create the environment
     env = TetrisEnv()
-    # Initialize the RL model (DQN)
     model = DQN('MlpPolicy', env, verbose=1,
                 learning_rate=1e-3,
                 buffer_size=50000,
@@ -20,21 +20,21 @@ def main():
                 exploration_fraction=0.1,
                 exploration_final_eps=0.02)
-    # Define the number of training timesteps
-    TIMESTEPS = 550000  # Adjust as needed
-    # Initialize the callback
     callback = SaveFramesCallback(save_freq=5000, save_path="models/frames", verbose=1)
-    # Train the model with the callback
     model.learn(total_timesteps=TIMESTEPS, callback=callback)
-    # Save the model
     os.makedirs("models", exist_ok=True)
     model.save("models/dqn_tetris")
     print("Model saved to models/dqn_tetris.zip")
-    # Evaluate the trained agent
     mean_reward, std_reward = evaluate_policy(model, env, n_eval_episodes=10)
     print(f"Mean Reward: {mean_reward} +/- {std_reward}")

 import os
 def main():
     env = TetrisEnv()
     model = DQN('MlpPolicy', env, verbose=1,
                 learning_rate=1e-3,
                 buffer_size=50000,
                 exploration_fraction=0.1,
                 exploration_final_eps=0.02)
+    TIMESTEPS = 550000
     callback = SaveFramesCallback(save_freq=5000, save_path="models/frames", verbose=1)
     model.learn(total_timesteps=TIMESTEPS, callback=callback)
     os.makedirs("models", exist_ok=True)
     model.save("models/dqn_tetris")
     print("Model saved to models/dqn_tetris.zip")
     mean_reward, std_reward = evaluate_policy(model, env, n_eval_episodes=10)
     print(f"Mean Reward: {mean_reward} +/- {std_reward}")