Commits · TroglodyteDerivations/Meta_Learning_With_HRL_Homer_Simpson

Updated line 92 with: st.write(f"Calculated intrinsic reward rounded 4 decimal places:", np.round(r_t_int,4))

d39e519
verified

TroglodyteDerivations commited on 1 day ago

Updated line 146 with: st.write(f"Calculated intrinsic reward rounded 4 decimal places:", np.round(r_t_int,4))

c52326d
verified

TroglodyteDerivations commited on 1 day ago

Updated lines 80-147 with: st.write("Example 3 via Method 1:") # Example 3 parameters eta = 0.1 N_st = 3 epsilon = 1e-5 # Intrinsic reward formulation r_t_int = eta * (1 / (N_st + epsilon)**0.5) # Display the formulation with parameters plugged in st.latex(r""" r_{t}^{int} \eta \frac{1}{\sqrt{N(s_{t}) + \epsilon}} = 0.1 \frac{1}{\sqrt{3 + 1 x 10^{-5}}} """) st.write(f"Calculated intrinsic reward: {r_t_int}") st.dataframe(df_0_0[2:3]) # Display the formulation with parameters plugged in st.write("Example 4 via Method 2:") st.latex(r""" r_{t}^{int} \eta \frac{1}{\sqrt{N(s_{t}) + \epsilon}} = 0.1 \frac{1}{\sqrt{4 + 1 x 10^{-5}}} """) # Abstract Base Class for Intrinsic Reward Calculation class IntrinsicRewardCalculator(ABC): @abstractmethod def calculate_intrinsic_reward(self, eta, count, epsilon): pass # Concrete Class for Intrinsic Reward Calculation class ConcreteIntrinsicRewardCalculator(IntrinsicRewardCalculator): def calculate_intrinsic_reward(self, eta, count, epsilon): return eta * (1 / np.sqrt(count + epsilon)) def populate_df_0_0(self, df_0_0, eta, count, epsilon): intrinsic_reward = self.calculate_intrinsic_reward(eta, count, epsilon) df_0_0.at[0, 'Intrinsic Reward'] = intrinsic_reward return df_0_0 # Example 4 parameters eta = 0.1 count = 4 epsilon = 1e-5 x,y = 0,0 # Create instance for Intrinsic Reward Calculation irc = ConcreteIntrinsicRewardCalculator() intrinsic_reward = irc.calculate_intrinsic_reward(0.1, 4, 1e-5) st.write(f"Intrinsic Reward @ {count} @ Coordinates {x,y}:", intrinsic_reward) st.write(f"Intrinsic Reward @ {count} @ Coordinates {x,y} rounded 2 decimal places:", np.round(intrinsic_reward,2)) # Populate the DataFrame with the calculated intrinsic reward df_0_0 = irc.populate_df_0_0(df_0_0, eta, count, epsilon) # Display the updated DataFrame st.dataframe(df_0_0[3:4]) st.write("Example 5 via Method 1:") # Example 5 parameters eta = 0.1 N_st = 5 epsilon = 1e-5 # Intrinsic reward formulation r_t_int = eta * (1 / (N_st + epsilon)**0.5) # Display the formulation with parameters plugged in st.latex(r""" r_{t}^{int} \eta \frac{1}{\sqrt{N(s_{t}) + \epsilon}} = 0.1 \frac{1}{\sqrt{5 + 1 x 10^{-5}}} """) st.write(f"Calculated intrinsic reward: {r_t_int}") st.write(f"Calculated intrinsic reward rounded 4 decimal places:", np.round(r_t_int,4)") st.dataframe(df_0_0[4:5])

3b5b8d7
verified

TroglodyteDerivations commited on 1 day ago

Updated lines 80, 87 with: st.write(f"Intrinsic Reward @ {count} @ Coordinates {x,y} rounded 4 decimal places:", np.round(intrinsic_reward,4)) | st.dataframe(df_0_0[1:2])

42b0add
verified

TroglodyteDerivations commited on 1 day ago

Updated line 55 with: def calculate_intrinsic_reward(self, eta, count, epsilon):

da76220
verified

TroglodyteDerivations commited on 1 day ago

Updated lines 45-86 with: # Display the formulation with parameters plugged in st.write("Example 2 via Method 2:") st.latex(r""" r_{t}^{int} \eta \frac{1}{\sqrt{N(s_{t}) + \epsilon}} = 0.1 \frac{1}{\sqrt{2 + 1 x 10^{-5}}} """) # Abstract Base Class for Intrinsic Reward Calculation class IntrinsicRewardCalculator(ABC): @abstractmethod def calculate_intrinsic_reward(self, eta, count, epsilon): pass # Concrete Class for Intrinsic Reward Calculation class ConcreteIntrinsicRewardCalculator(IntrinsicRewardCalculator): def calculate_intrinsic_reward(self, eta, count, epsilon): return eta * (1 / np.sqrt(count + epsilon)) def populate_df_0_0(self, df_0_0, eta, count, epsilon): intrinsic_reward = self.calculate_intrinsic_reward(eta, count, epsilon) df_0_0.at[0, 'Intrinsic Reward'] = intrinsic_reward return df_0_0 # Example 2 parameters eta = 0.1 count = 2 epsilon = 1e-5 x,y = 0,0 # Create instance for Intrinsic Reward Calculation irc = ConcreteIntrinsicRewardCalculator() intrinsic_reward = irc.calculate_intrinsic_reward(0.1, 2, 1e-5) st.write(f"Intrinsic Reward @ {count} @ Coordinates {x,y}:", intrinsic_reward) st.write(f"Intrinsic Reward @ {count} @ Coordinates {x,y} rounded 6 decimal places:", np.round(intrinsic_reward,6)) # Populate the DataFrame with the calculated intrinsic reward df_0_0 = irc.populate_df_0_0(df_0_0, eta, count, epsilon) # Display the updated DataFrame st.write(df_0_0[1:2])

94c96eb
verified

TroglodyteDerivations commited on 1 day ago

Updated line 4 with: pandas

a8f3137
verified

TroglodyteDerivations commited on 1 day ago

Updated line 37 with: r_{t}^{int} \eta \frac{1}{\sqrt{N(s_{t}) + \epsilon}} = 0.1 \frac{1}{\sqrt{1 + 1 x 10^{-5}}}

6a948bb
verified

TroglodyteDerivations commited on 1 day ago

Updated lines 24-41 with: df_0_0 = pd.read_csv('df_0_0.csv') st.write(df_0_0.shape) # Define parameters eta = 0.1 N_st = 1 epsilon = 1e-5 # Intrinsic reward formulation r_t_int = eta * (1 / (N_st + epsilon)**0.5) # Display the formulat with parameters plugged in st.latex(r""" r_{t}^{int} \eta \frac{1}{\sqrt{N(s_{t}) + \epsilon}} = 0.1 \frac{1}{\sqrt{1 + 1 times 10^{-5}}} """) st.write(f"Calculated intrinsic reward: {r_t_int}") st.dataframe(df_0_0[:1]) Updated line 2 with: import pandas as pd

3a287f7
verified

TroglodyteDerivations commited on 1 day ago

Updated line 18 with: st.image("intrinsic_reward_formulation.png", caption='Intrinsic Reward Formulation')

462fbcc
verified

TroglodyteDerivations commited on 1 day ago

Updated line 16 with: st.write("Oh, sweet Homer's doughnuts! If that second .wav file ain't playin', just download the darn thing! Mmm... downloads...")

fec75a6
verified

TroglodyteDerivations commited on 1 day ago

Upload h1.wav

2a91225
verified

TroglodyteDerivations commited on 1 day ago

Delete h1.wav

a58b451
verified

TroglodyteDerivations commited on 1 day ago

Upload 2 files

75a7151
verified

TroglodyteDerivations commited on 1 day ago

Updated lines 15-16 with: st.audio("h1.wav", format="audio/wav") st.audio("h2.wav", format="audio/wav")

06aa953
verified

TroglodyteDerivations commited on 1 day ago

Upload 3 files

cf6d633
verified

TroglodyteDerivations commited on 1 day ago

Delete goal_rows.csv

00b0405
verified

TroglodyteDerivations commited on 1 day ago

Delete df_0_0.csv

189a69c
verified

TroglodyteDerivations commited on 1 day ago

Delete intrinsic_analysis.csv

dce754a
verified

TroglodyteDerivations commited on 1 day ago

Upload 3 files

90b03ba
verified

TroglodyteDerivations commited on 2 days ago

Update requirements.txt

d3199aa
verified

TroglodyteDerivations commited on 2 days ago

Update app.py

45d2337
verified

TroglodyteDerivations commited on 2 days ago

Create dataframes.txt

21a2b49
verified

TroglodyteDerivations commited on 2 days ago

Create algo2.txt

682f2b2
verified

TroglodyteDerivations commited on 2 days ago

Upload h0.wav

5b42e60
verified

TroglodyteDerivations commited on 2 days ago

Upload Algo2_Meta_Learning.png

29a24e5
verified

TroglodyteDerivations commited on 2 days ago

Create app.py

9fdc565
verified

TroglodyteDerivations commited on 2 days ago

init!

db241f1
verified

TroglodyteDerivations commited on 2 days ago

Upload 2410.07921v1.pdf

3738666
verified

TroglodyteDerivations commited on 2 days ago

Upload intrinsic_reward_formulation.png

7cff3b6
verified

TroglodyteDerivations commited on 2 days ago

Upload homer.webp

026bbe8
verified

TroglodyteDerivations commited on 2 days ago

initial commit

e7e8f93
verified

TroglodyteDerivations commited on 2 days ago

Spaces:

TroglodyteDerivations
/

Meta_Learning_With_HRL_Homer_Simpson_Lecture

Running

Commit History

Updated line 92 with: st.write(f"Calculated intrinsic reward rounded 4 decimal places:", np.round(r_t_int,4))

d39e519
verified

Updated line 146 with: st.write(f"Calculated intrinsic reward rounded 4 decimal places:", np.round(r_t_int,4))

c52326d
verified

Updated lines 80, 87 with: st.write(f"Intrinsic Reward @ {count} @ Coordinates {x,y} rounded 4 decimal places:", np.round(intrinsic_reward,4)) | st.dataframe(df_0_0[1:2])

42b0add
verified

Updated line 55 with: def calculate_intrinsic_reward(self, eta, count, epsilon):

da76220
verified

Updated line 4 with: pandas

a8f3137
verified

Updated line 37 with: r_{t}^{int} \eta \frac{1}{\sqrt{N(s_{t}) + \epsilon}} = 0.1 \frac{1}{\sqrt{1 + 1 x 10^{-5}}}

6a948bb
verified

Updated line 18 with: st.image("intrinsic_reward_formulation.png", caption='Intrinsic Reward Formulation')

462fbcc
verified

Updated line 16 with: st.write("Oh, sweet Homer's doughnuts! If that second .wav file ain't playin', just download the darn thing! Mmm... downloads...")

fec75a6
verified

Upload h1.wav

2a91225
verified

Delete h1.wav

a58b451
verified

Upload 2 files

75a7151
verified

Updated lines 15-16 with: st.audio("h1.wav", format="audio/wav") st.audio("h2.wav", format="audio/wav")

06aa953
verified

Upload 3 files

cf6d633
verified

Delete goal_rows.csv

00b0405
verified

Delete df_0_0.csv

189a69c
verified

Delete intrinsic_analysis.csv

dce754a
verified

Upload 3 files

90b03ba
verified

Update requirements.txt

d3199aa
verified

Update app.py

45d2337
verified

Create dataframes.txt

21a2b49
verified

Create algo2.txt

682f2b2
verified

Upload h0.wav

5b42e60
verified

Upload Algo2_Meta_Learning.png

29a24e5
verified

Create app.py

9fdc565
verified

init!

db241f1
verified

Upload 2410.07921v1.pdf

3738666
verified

Upload intrinsic_reward_formulation.png

7cff3b6
verified

Upload homer.webp

026bbe8
verified

initial commit

e7e8f93
verified

Commit History

Updated line 92 with: st.write(f"Calculated intrinsic reward rounded 4 decimal places:", np.round(r_t_int,4)) d39e519 verified

Updated line 146 with: st.write(f"Calculated intrinsic reward rounded 4 decimal places:", np.round(r_t_int,4)) c52326d verified

Updated lines 80, 87 with: st.write(f"Intrinsic Reward @ {count} @ Coordinates {x,y} rounded 4 decimal places:", np.round(intrinsic_reward,4)) | st.dataframe(df_0_0[1:2]) 42b0add verified

Updated line 55 with: def calculate_intrinsic_reward(self, eta, count, epsilon): da76220 verified

Updated line 4 with: pandas a8f3137 verified

Updated line 37 with: r_{t}^{int} \eta \frac{1}{\sqrt{N(s_{t}) + \epsilon}} = 0.1 \frac{1}{\sqrt{1 + 1 x 10^{-5}}} 6a948bb verified

Updated line 18 with: st.image("intrinsic_reward_formulation.png", caption='Intrinsic Reward Formulation') 462fbcc verified

Updated line 16 with: st.write("Oh, sweet Homer's doughnuts! If that second .wav file ain't playin', just download the darn thing! Mmm... downloads...") fec75a6 verified

Upload h1.wav 2a91225 verified

Delete h1.wav a58b451 verified

Upload 2 files 75a7151 verified

Updated lines 15-16 with: st.audio("h1.wav", format="audio/wav") st.audio("h2.wav", format="audio/wav") 06aa953 verified

Upload 3 files cf6d633 verified

Delete goal_rows.csv 00b0405 verified

Delete df_0_0.csv 189a69c verified

Delete intrinsic_analysis.csv dce754a verified

Upload 3 files 90b03ba verified

Update requirements.txt d3199aa verified

Update app.py 45d2337 verified

Create dataframes.txt 21a2b49 verified

Create algo2.txt 682f2b2 verified

Upload h0.wav 5b42e60 verified

Upload Algo2_Meta_Learning.png 29a24e5 verified

Create app.py 9fdc565 verified

init! db241f1 verified

Upload 2410.07921v1.pdf 3738666 verified

Upload intrinsic_reward_formulation.png 7cff3b6 verified

Upload homer.webp 026bbe8 verified

initial commit e7e8f93 verified

Updated line 92 with: st.write(f"Calculated intrinsic reward rounded 4 decimal places:", np.round(r_t_int,4))

d39e519
verified

Updated line 146 with: st.write(f"Calculated intrinsic reward rounded 4 decimal places:", np.round(r_t_int,4))

c52326d
verified

Updated lines 80, 87 with: st.write(f"Intrinsic Reward @ {count} @ Coordinates {x,y} rounded 4 decimal places:", np.round(intrinsic_reward,4)) | st.dataframe(df_0_0[1:2])

42b0add
verified

Updated line 55 with: def calculate_intrinsic_reward(self, eta, count, epsilon):

da76220
verified

Updated line 4 with: pandas

a8f3137
verified

Updated line 37 with: r_{t}^{int} \eta \frac{1}{\sqrt{N(s_{t}) + \epsilon}} = 0.1 \frac{1}{\sqrt{1 + 1 x 10^{-5}}}

6a948bb
verified

Updated line 18 with: st.image("intrinsic_reward_formulation.png", caption='Intrinsic Reward Formulation')

462fbcc
verified

Updated line 16 with: st.write("Oh, sweet Homer's doughnuts! If that second .wav file ain't playin', just download the darn thing! Mmm... downloads...")

fec75a6
verified

Upload h1.wav

2a91225
verified

Delete h1.wav

a58b451
verified

Upload 2 files

75a7151
verified

Updated lines 15-16 with: st.audio("h1.wav", format="audio/wav") st.audio("h2.wav", format="audio/wav")

06aa953
verified

Upload 3 files

cf6d633
verified

Delete goal_rows.csv

00b0405
verified

Delete df_0_0.csv

189a69c
verified

Delete intrinsic_analysis.csv

dce754a
verified

Upload 3 files

90b03ba
verified

Update requirements.txt

d3199aa
verified

Update app.py

45d2337
verified

Create dataframes.txt

21a2b49
verified

Create algo2.txt

682f2b2
verified

Upload h0.wav

5b42e60
verified

Upload Algo2_Meta_Learning.png

29a24e5
verified

Create app.py

9fdc565
verified

init!

db241f1
verified

Upload 2410.07921v1.pdf

3738666
verified

Upload intrinsic_reward_formulation.png

7cff3b6
verified

Upload homer.webp

026bbe8
verified

initial commit

e7e8f93
verified