rvian commited on
Commit
4e3e82b
·
1 Parent(s): 7e7ef19

ajustes fluxo

Browse files
Files changed (1) hide show
  1. app.py +35 -24
app.py CHANGED
@@ -28,33 +28,27 @@ def traduzir_en_pt(text):
28
  output = model.generate(input_ids, attention_mask=attention_mask, forced_bos_token_id=tokenizer.lang_code_to_id['pt_XX'])
29
  return tokenizer.decode(output[0], skip_special_tokens=True)
30
 
 
 
 
 
 
 
31
 
32
- ###################
33
- #### interface ####
34
- ###################
35
-
36
- # Cabeçalho
37
- st.title('Tradutor de datasets (inglês para português)')
38
- # Carrega dataset
39
-
40
- with st.beta_container():
41
- dataset = st.file_uploader("Carrege o dataset (coluna a ser traduzida deve ser nomeada como 'texto')", type=["csv"])
42
- st.write('Carregando dataset...')
43
-
44
- with st.beta_expander():
45
  if dataset is not None:
46
  st.write('🎲 Dataset carregado com sucesso!')
47
- dataset = pd.read_csv(dataset)
48
- st.write(dataset)
49
-
50
 
51
- with st.beta_container():
52
  modelo_selecionado = st.selectbox('Escolha um modelo', modelos_opcao)
53
  if st.button("Carregar modelo escolhido"):
54
  model, tokenizer = carregar_modelo_e_tokenizador_mbart(modelo_selecionado)
55
  st.write(f"🎰 Modelo {modelo_selecionado} carregado com sucesso! 🔥")
 
56
 
57
- with st.beta_container():
58
  qtde_linhas_traduzir = st.slider('Quantidade de linhas a serem traduzidas', 1, len(dataset), 50)
59
  if st.button(f"Traduzir {qtde_linhas_traduzir} linhas"):
60
  for i in range(qtde_linhas_traduzir):
@@ -64,11 +58,28 @@ with st.beta_container():
64
  st.write(f'Tradução: {texto_traduzido}')
65
 
66
  # adiciona traducao em nova coluna dataset
67
- dataset["traduzido"]= texto_traduzido
68
  st.write("Traduzido 👍")
69
- with st.beta_expander():
70
- st.write(dataset)
71
-
72
- with st.beta_expander():
73
  st.download_button(label='Baixar dataset', data=dataset.to_csv(index=False))
74
- st.write("Fim 👍")
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
28
  output = model.generate(input_ids, attention_mask=attention_mask, forced_bos_token_id=tokenizer.lang_code_to_id['pt_XX'])
29
  return tokenizer.decode(output[0], skip_special_tokens=True)
30
 
31
+ ## streamlit ##
32
+ def carregar_dataset():
33
+ dataset = st.file_uploader("(coluna a ser traduzida deve ser nomeada como 'texto')",type="csv")
34
+ if dataset is not None:
35
+ st.write('Carregando dataset...')
36
+ return pd.read_csv(dataset)
37
 
38
+ def mostrar_dataset():
 
 
 
 
 
 
 
 
 
 
 
 
39
  if dataset is not None:
40
  st.write('🎲 Dataset carregado com sucesso!')
41
+ with st.expander("Dataset:"):
42
+ st.table(dataset)
 
43
 
44
+ def carregar_modelo():
45
  modelo_selecionado = st.selectbox('Escolha um modelo', modelos_opcao)
46
  if st.button("Carregar modelo escolhido"):
47
  model, tokenizer = carregar_modelo_e_tokenizador_mbart(modelo_selecionado)
48
  st.write(f"🎰 Modelo {modelo_selecionado} carregado com sucesso! 🔥")
49
+ return model, tokenizer
50
 
51
+ def traduzir_dataset(dataset):
52
  qtde_linhas_traduzir = st.slider('Quantidade de linhas a serem traduzidas', 1, len(dataset), 50)
53
  if st.button(f"Traduzir {qtde_linhas_traduzir} linhas"):
54
  for i in range(qtde_linhas_traduzir):
 
58
  st.write(f'Tradução: {texto_traduzido}')
59
 
60
  # adiciona traducao em nova coluna dataset
61
+ dataset["traduzido"][i]= texto_traduzido
62
  st.write("Traduzido 👍")
63
+ def resultado():
64
+ with st.expander():
65
+ st.write(dataset)
 
66
  st.download_button(label='Baixar dataset', data=dataset.to_csv(index=False))
67
+ st.write("Fim 👍")
68
+
69
+ ###################
70
+ #### interface ####
71
+ ###################
72
+
73
+ # Cabeçalho
74
+ st.title('Tradutor de datasets (inglês para português)')
75
+ # Carrega dataset
76
+ dataset = carregar_dataset()
77
+ if dataset is not None:
78
+ mostrar_dataset()
79
+ if st.button("Carregar modelo"):
80
+ model, tokenizer = carregar_modelo()
81
+
82
+
83
+ if st.button("Traduzir dataset") and model is not None:
84
+ traduzir_dataset(dataset)
85
+ resultado()