Spaces:
Runtime error
Runtime error
rvian
commited on
Commit
·
4e3e82b
1
Parent(s):
7e7ef19
ajustes fluxo
Browse files
app.py
CHANGED
@@ -28,33 +28,27 @@ def traduzir_en_pt(text):
|
|
28 |
output = model.generate(input_ids, attention_mask=attention_mask, forced_bos_token_id=tokenizer.lang_code_to_id['pt_XX'])
|
29 |
return tokenizer.decode(output[0], skip_special_tokens=True)
|
30 |
|
|
|
|
|
|
|
|
|
|
|
|
|
31 |
|
32 |
-
|
33 |
-
#### interface ####
|
34 |
-
###################
|
35 |
-
|
36 |
-
# Cabeçalho
|
37 |
-
st.title('Tradutor de datasets (inglês para português)')
|
38 |
-
# Carrega dataset
|
39 |
-
|
40 |
-
with st.beta_container():
|
41 |
-
dataset = st.file_uploader("Carrege o dataset (coluna a ser traduzida deve ser nomeada como 'texto')", type=["csv"])
|
42 |
-
st.write('Carregando dataset...')
|
43 |
-
|
44 |
-
with st.beta_expander():
|
45 |
if dataset is not None:
|
46 |
st.write('🎲 Dataset carregado com sucesso!')
|
47 |
-
|
48 |
-
|
49 |
-
|
50 |
|
51 |
-
|
52 |
modelo_selecionado = st.selectbox('Escolha um modelo', modelos_opcao)
|
53 |
if st.button("Carregar modelo escolhido"):
|
54 |
model, tokenizer = carregar_modelo_e_tokenizador_mbart(modelo_selecionado)
|
55 |
st.write(f"🎰 Modelo {modelo_selecionado} carregado com sucesso! 🔥")
|
|
|
56 |
|
57 |
-
|
58 |
qtde_linhas_traduzir = st.slider('Quantidade de linhas a serem traduzidas', 1, len(dataset), 50)
|
59 |
if st.button(f"Traduzir {qtde_linhas_traduzir} linhas"):
|
60 |
for i in range(qtde_linhas_traduzir):
|
@@ -64,11 +58,28 @@ with st.beta_container():
|
|
64 |
st.write(f'Tradução: {texto_traduzido}')
|
65 |
|
66 |
# adiciona traducao em nova coluna dataset
|
67 |
-
dataset["traduzido"]= texto_traduzido
|
68 |
st.write("Traduzido 👍")
|
69 |
-
|
70 |
-
st.
|
71 |
-
|
72 |
-
with st.beta_expander():
|
73 |
st.download_button(label='Baixar dataset', data=dataset.to_csv(index=False))
|
74 |
-
st.write("Fim 👍")
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
28 |
output = model.generate(input_ids, attention_mask=attention_mask, forced_bos_token_id=tokenizer.lang_code_to_id['pt_XX'])
|
29 |
return tokenizer.decode(output[0], skip_special_tokens=True)
|
30 |
|
31 |
+
## streamlit ##
|
32 |
+
def carregar_dataset():
|
33 |
+
dataset = st.file_uploader("(coluna a ser traduzida deve ser nomeada como 'texto')",type="csv")
|
34 |
+
if dataset is not None:
|
35 |
+
st.write('Carregando dataset...')
|
36 |
+
return pd.read_csv(dataset)
|
37 |
|
38 |
+
def mostrar_dataset():
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
39 |
if dataset is not None:
|
40 |
st.write('🎲 Dataset carregado com sucesso!')
|
41 |
+
with st.expander("Dataset:"):
|
42 |
+
st.table(dataset)
|
|
|
43 |
|
44 |
+
def carregar_modelo():
|
45 |
modelo_selecionado = st.selectbox('Escolha um modelo', modelos_opcao)
|
46 |
if st.button("Carregar modelo escolhido"):
|
47 |
model, tokenizer = carregar_modelo_e_tokenizador_mbart(modelo_selecionado)
|
48 |
st.write(f"🎰 Modelo {modelo_selecionado} carregado com sucesso! 🔥")
|
49 |
+
return model, tokenizer
|
50 |
|
51 |
+
def traduzir_dataset(dataset):
|
52 |
qtde_linhas_traduzir = st.slider('Quantidade de linhas a serem traduzidas', 1, len(dataset), 50)
|
53 |
if st.button(f"Traduzir {qtde_linhas_traduzir} linhas"):
|
54 |
for i in range(qtde_linhas_traduzir):
|
|
|
58 |
st.write(f'Tradução: {texto_traduzido}')
|
59 |
|
60 |
# adiciona traducao em nova coluna dataset
|
61 |
+
dataset["traduzido"][i]= texto_traduzido
|
62 |
st.write("Traduzido 👍")
|
63 |
+
def resultado():
|
64 |
+
with st.expander():
|
65 |
+
st.write(dataset)
|
|
|
66 |
st.download_button(label='Baixar dataset', data=dataset.to_csv(index=False))
|
67 |
+
st.write("Fim 👍")
|
68 |
+
|
69 |
+
###################
|
70 |
+
#### interface ####
|
71 |
+
###################
|
72 |
+
|
73 |
+
# Cabeçalho
|
74 |
+
st.title('Tradutor de datasets (inglês para português)')
|
75 |
+
# Carrega dataset
|
76 |
+
dataset = carregar_dataset()
|
77 |
+
if dataset is not None:
|
78 |
+
mostrar_dataset()
|
79 |
+
if st.button("Carregar modelo"):
|
80 |
+
model, tokenizer = carregar_modelo()
|
81 |
+
|
82 |
+
|
83 |
+
if st.button("Traduzir dataset") and model is not None:
|
84 |
+
traduzir_dataset(dataset)
|
85 |
+
resultado()
|