rvian commited on
Commit
64a313a
·
1 Parent(s): f577d91

ajustes download dataset e model cpu

Browse files
Files changed (1) hide show
  1. app.py +6 -5
app.py CHANGED
@@ -15,7 +15,7 @@ def carregar_modelo_e_tokenizador_mbart(modelo):
15
 
16
  st.write(f'Carregando modelo {modelo}')
17
  tokenizer = MBart50TokenizerFast.from_pretrained(modelo)
18
- model = MBartForConditionalGeneration.from_pretrained(modelo).to("cuda")
19
 
20
  tokenizer.src_lang = 'en_XX'
21
  return model, tokenizer
@@ -23,8 +23,8 @@ def carregar_modelo_e_tokenizador_mbart(modelo):
23
  # TODO:batch?
24
  def traduzir_en_pt(text):
25
  inputs = tokenizer(text, return_tensors='pt')
26
- input_ids = inputs.input_ids.to('cuda')
27
- attention_mask = inputs.attention_mask.to('cuda')
28
  output = model.generate(input_ids, attention_mask=attention_mask, forced_bos_token_id=tokenizer.lang_code_to_id['pt_XX'])
29
  return tokenizer.decode(output[0], skip_special_tokens=True)
30
 
@@ -62,5 +62,6 @@ if st.button(f"Traduzir {qtde_linhas_traduzir} linhas"):
62
  # adiciona traducao em nova coluna dataset
63
  dataset["traduzido"]= texto_traduzido
64
 
65
-
66
- st.write("Fim 👍")
 
 
15
 
16
  st.write(f'Carregando modelo {modelo}')
17
  tokenizer = MBart50TokenizerFast.from_pretrained(modelo)
18
+ model = MBartForConditionalGeneration.from_pretrained(modelo)
19
 
20
  tokenizer.src_lang = 'en_XX'
21
  return model, tokenizer
 
23
  # TODO:batch?
24
  def traduzir_en_pt(text):
25
  inputs = tokenizer(text, return_tensors='pt')
26
+ input_ids = inputs.input_ids
27
+ attention_mask = inputs.attention_mask
28
  output = model.generate(input_ids, attention_mask=attention_mask, forced_bos_token_id=tokenizer.lang_code_to_id['pt_XX'])
29
  return tokenizer.decode(output[0], skip_special_tokens=True)
30
 
 
62
  # adiciona traducao em nova coluna dataset
63
  dataset["traduzido"]= texto_traduzido
64
 
65
+ st.write(dataset)
66
+ st.download_button(label='Baixar dataset', data=dataset.to_csv(index=False))
67
+ st.write("Fim 👍")