Spaces:

ATB
/

AI-trade-bot-demo

Runtime error

App Files Files Community

AI-trade-bot-demo / app.py

pmthangk09

Visualize total profits

e2f5cf3 over 2 years ago

raw

history blame contribute delete

8.67 kB

	import gradio as gr
	import pandas as pd
	import plotly.graph_objects as go
	from plotly.subplots import make_subplots

	from rl_agent.env import Environment
	from rl_agent.policy import Policy
	from rl_agent.utils import myOptimizer

	import torch
	from collections import OrderedDict
	from tqdm import tqdm
	import statistics


	import datetime
	def get_time():
	return datetime.datetime.now().time()


	def get_profit():
	global profit
	return profit


	# def update_table():
	# global


	def pretrain_rl_agent():
	global equity
	observations = env_train.reset()

	for _ in tqdm(range(state_size, len(train))):
	observations = torch.as_tensor(observations).float()
	action = agent(observations)
	observations, reward, _ = env_train.step(action.data.to("cpu").numpy())
	# reward *= 1e3

	action.backward()

	for name, param in agent.named_parameters():
	grad_n = param.grad
	param = param + optimizer.step(grad_n, reward, observations[-1], model_gradients_history[name])
	checkpoint[name] = param
	model_gradients_history.update({name: grad_n})

	# equity += env_train.profit
	optimizer.after_step(reward)
	agent.load_state_dict(checkpoint)


	def make_prediction(observations):
	# observations: 0-14
	action = agent(torch.as_tensor(observations).float())
	# returned observation: 1- 15
	observations, reward, _ = env_test.step(action.data.to("cpu").numpy())

	action.backward()

	for name, param in agent.named_parameters():
	grad_n = param.grad
	param = param + optimizer.step(grad_n, reward, observations[-1], model_gradients_history[name])
	checkpoint[name] = param
	model_gradients_history.update({name: grad_n})

	# equity += env_test.profit
	optimizer.after_step(reward)
	agent.load_state_dict(checkpoint)

	return action, observations # [-1.0, 1.0] * leverage


	# ----------------------------------------------------------------------------------------------------------------------
	# For visualization
	# ----------------------------------------------------------------------------------------------------------------------
	profit = 0.0

	counter = 0
	start_year, test_year = 2021, 2023
	datetime_column = "Date"
	df_data = pd.read_csv(f"./data/EURUSD_Candlestick_1_M_BID_01.01.{start_year}-04.02.2023_processed.csv")
	df_data[datetime_column] = pd.to_datetime(df_data[datetime_column], format="%Y-%m-%d") # %d.%m.%Y %H:%M:%S.000 GMT%z

	# Removing all empty dates
	# Build complete timeline from start date to end date
	dt_all = pd.date_range(start=df_data[datetime_column].tolist()[0], end=df_data[datetime_column].tolist()[-1])
	# Retrieve the dates that ARE in the original dataset
	dt_obs = set([d.strftime("%Y-%m-%d") for d in pd.to_datetime(df_data[datetime_column])])
	# Define dates with missing values
	dt_breaks = [d for d in dt_all.strftime("%Y-%m-%d").tolist() if not d in list(dt_obs)]

	df_data_test = df_data[df_data['Date'].dt.year == test_year]
	df_data_train = df_data[df_data['Date'].dt.year != test_year]

	df_data_train_viz = pd.DataFrame(columns=["Action", "Amount", "Profit"])
	# ----------------------------------------------------------------------------------------------------------------------

	# ----------------------------------------------------------------------------------------------------------------------
	# For RL Agent
	# ----------------------------------------------------------------------------------------------------------------------
	data = pd.read_csv(f'./data/EURUSD_Candlestick_1_M_BID_01.01.{start_year}-04.02.2023.csv')
	data = data.head(600000)
	data = data.set_index('Local time')
	date_split = '31.01.2022 03:29:00.000 GMT-0600'

	learning_rate = 0.001
	first_momentum = 0.0
	second_momentum = 0.0001
	transaction_cost = 0.0001
	adaptation_rate = 0.01
	state_size = 15
	equity = 1.0

	train = data[:date_split]
	test = pd.concat([train.tail(state_size), data[date_split:]])

	# Initialize agent and optimizer
	agent = Policy(input_channels=state_size)
	optimizer = myOptimizer(learning_rate, first_momentum, second_momentum, adaptation_rate, transaction_cost)

	history = []
	for i in range(1, state_size):
	c = train.iloc[i, :]['Close'] - train.iloc[i - 1, :]['Close']
	history.append(c)

	# Initialize train and test environments
	env_train = Environment(train, history=history, state_size=state_size)

	history = []
	for i in range(1, state_size):
	c = test.iloc[i, :]['Close'] - test.iloc[i - 1, :]['Close']
	history.append(c)

	env_test = Environment(test, history=history, state_size=state_size)

	model_gradients_history = dict()
	checkpoint = OrderedDict()

	for name, param in agent.named_parameters():
	model_gradients_history.update({name: torch.zeros_like(param)})

	pretrain_rl_agent()
	observations = env_test.reset()
	# ----------------------------------------------------------------------------------------------------------------------


	def trading_plot():
	global counter
	global df_data_train
	global observations
	global profit
	actions = []

	if counter < len(df_data_test):
	df_data_train = df_data_train.append(df_data_test.iloc[counter])
	counter += 1

	last_observation = observations[-1]
	for i in range(1440):
	action, observations = make_prediction(observations)
	actions.append(action.item())
	position = statistics.mean(actions)
	# profit += -1.0 * (last_observation - observations[-1]) * position
	profit = env_test.profits
	else:
	df_data_train = df_data

	fig = make_subplots(rows=2, cols=1, shared_xaxes=True, vertical_spacing=0.02, row_heights=[0.7, 0.3],
	subplot_titles=['OHLC chart', ''])

	# Plot OHLC on 1st subplot
	fig.add_trace(go.Candlestick(x=df_data_train[datetime_column].tolist(),
	open=df_data_train["Open"].tolist(), close=df_data_train["Close"].tolist(),
	high=df_data_train["High"].tolist(), low=df_data_train["Low"].tolist(),
	name=""), row=1, col=1)

	# Plot volume trace on 2nd row
	colors = ['red' if row['Open'] - row['Close'] >= 0 else 'green' for index, row in df_data_train.iterrows()]
	fig.add_trace(go.Bar(x=df_data_train[datetime_column], y=df_data_train['Volume'], name="", marker_color=colors,
	hovertemplate="%{x}<br>Volume: %{y}"), row=2, col=1)

	# Add chart title and Hide dates with no values and remove rangeslider
	fig.update_layout(title="", height=600, showlegend=False,
	xaxis_rangeslider_visible=False,
	xaxis_rangebreaks=[dict(values=dt_breaks)])

	# Update y-axis label
	fig.update_yaxes(title_text="Price", row=1, col=1)
	fig.update_yaxes(title_text="Volume", row=2, col=1)

	fig.update_xaxes(showspikes=True, spikecolor="green", spikesnap="cursor", spikemode="across")
	fig.update_yaxes(showspikes=True, spikecolor="orange", spikethickness=2)
	fig.update_layout(spikedistance=1000, hoverdistance=100)

	fig.layout.xaxis.range = ("2022-12-01", "2023-03-01")

	return fig


	# The UI of the demo defines here.
	with gr.Blocks() as demo:
	gr.Markdown("Auto AI Trading Bot")
	gr.Markdown(f"Investment: $100,000")

	dt = gr.Textbox(label="Total profit (Amount of profit in PIPS that the agent makes in EUR/USD)")
	demo.queue().load(get_profit, inputs=None, outputs=dt, every=1)

	# for plotly it should follow this: https://gradio.app/plot-component-for-maps/
	candlestick_plot = gr.Plot().style()
	demo.queue().load(trading_plot, [], candlestick_plot, every=1)

	with gr.Row():
	with gr.Column():
	gr.Markdown("User Interactive panel")
	amount = gr.components.Textbox(value="", label="Amount", interactive=True)
	with gr.Row():
	buy_btn = gr.components.Button("Buy", label="Buy", interactive=True, inputs=[amount])
	sell_btn = gr.components.Button("Sell", label="Sell", interactive=True, inputs=[amount])
	hold_btn = gr.components.Button("Hold", label="Hold", interactive=True, inputs=[amount])

	with gr.Column():
	gr.Markdown("Trade bot history")

	# trade_bot_table = gr.Dataframe(df_data_train_viz)
	# demo.queue().load(update_table, inputs=None, outputs=trade_bot_table, every=1)
	# Show trade box history in a table or something
	# gr.components.Textbox(value="Some history? Need to decide how to show bot history", label="History", interactive=True)

	demo.launch()