pere commited on
Commit
75bf09d
·
1 Parent(s): 9891614

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +8 -2
app.py CHANGED
@@ -2,6 +2,9 @@
2
  import streamlit as st
3
  from transformers import T5ForConditionalGeneration, T5TokenizerFast, T5Config
4
 
 
 
 
5
  @st.cache(allow_output_mutation=True, suppress_st_warning=True)
6
  def load_model():
7
  model_name = "north/demo-deuncaser-base"
@@ -17,16 +20,19 @@ def deuncase(model, tokenizer, text):
17
  )
18
  return tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
19
 
 
 
 
 
20
  st.title("DeUnCaser")
21
 
22
  st.sidebar.write("This web app adds spaces, punctation and capitalisation back into the text.")
23
  st.sidebar.write("You can use the examples below, but too really test the effect of the model: Write or copy text from the Internet, and then use the buttons to remove spaces, puctation, cases etc. Try to restore the text.")
24
 
25
- mytext= 'Vi bruker ikke tegnsetting eller store bokstaver når vi prater. Vi slår også sammen ord, og i praksis er dermed heller ikke mellomrom meningsbærende. Prøv å fjerne tegnsetting, store bokstaver og mellomrom fra dette avsnittet. Se om den nye North-T5-modellen greier å sette sammen til et nytt meningsbærende avsnitt.'
26
 
27
  option = st.sidebar.selectbox(
28
  "Examples:",
29
- ("tirsdag var travel for ukrainas president volodymyr zelenskyj på morgenen tok han imot polens statsminister mateusz morawiecki","tirsdagvartravelforukrainaspresidentvolodymyrzelenskyjpåkveldentokhanimotpolensstatsministermateuszmorawiecki","deterikkelettåholderedepåstoreogsmåbokstavermanmåforeksempelhuskestorforbokstavnårmanskriveromkrimhalvøyamenkunbrukelitenforbokstavnårmanhenvisertilenkrimroman","detteerenlitendemosomerlagetavperegilkummervoldhanerenforskersomtidligerejobbetvednasjonalbiblioteketimoirana", "sentpå60talletvardetfaktisknoensomkalteungensinperegilkummervoldidagerdetikkelengersåvanligåbrukedobbeltnavninorgehvasynesduomdet"))
30
 
31
  col1, col2, col3 = st.columns([1,1,1])
32
  with col1:
 
2
  import streamlit as st
3
  from transformers import T5ForConditionalGeneration, T5TokenizerFast, T5Config
4
 
5
+ mytext= 'Vi bruker ikke tegnsetting eller store bokstaver når vi prater. Vi slår også sammen ord, og i praksis er dermed heller ikke mellomrom meningsbærende. Prøv å fjerne tegnsetting, store bokstaver og mellomrom fra dette avsnittet. Se om den nye North-T5-modellen greier å sette sammen til et nytt meningsbærende avsnitt.'
6
+
7
+
8
  @st.cache(allow_output_mutation=True, suppress_st_warning=True)
9
  def load_model():
10
  model_name = "north/demo-deuncaser-base"
 
20
  )
21
  return tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
22
 
23
+ def change_mytext():
24
+ global mytext
25
+ mytext = option
26
+
27
  st.title("DeUnCaser")
28
 
29
  st.sidebar.write("This web app adds spaces, punctation and capitalisation back into the text.")
30
  st.sidebar.write("You can use the examples below, but too really test the effect of the model: Write or copy text from the Internet, and then use the buttons to remove spaces, puctation, cases etc. Try to restore the text.")
31
 
 
32
 
33
  option = st.sidebar.selectbox(
34
  "Examples:",
35
+ ("tirsdag var travel for ukrainas president volodymyr zelenskyj på morgenen tok han imot polens statsminister mateusz morawiecki","tirsdagvartravelforukrainaspresidentvolodymyrzelenskyjpåkveldentokhanimotpolensstatsministermateuszmorawiecki","deterikkelettåholderedepåstoreogsmåbokstavermanmåforeksempelhuskestorforbokstavnårmanskriveromkrimhalvøyamenkunbrukelitenforbokstavnårmanhenvisertilenkrimroman","detteerenlitendemosomerlagetavperegilkummervoldhanerenforskersomtidligerejobbetvednasjonalbiblioteketimoirana", "sentpå60talletvardetfaktisknoensomkalteungensinperegilkummervoldidagerdetikkelengersåvanligåbrukedobbeltnavninorgehvasynesduomdet"), onchange=change_mytext)
36
 
37
  col1, col2, col3 = st.columns([1,1,1])
38
  with col1: