Update app.py
Browse files
app.py
CHANGED
@@ -4,7 +4,7 @@ from transformers import T5ForConditionalGeneration, T5TokenizerFast, T5Config
|
|
4 |
|
5 |
st.session_state
|
6 |
if 'textbox' not in st.session_state:
|
7 |
-
st.session_state['textbox'] = ""
|
8 |
|
9 |
|
10 |
|
@@ -24,7 +24,12 @@ def deuncase(model, tokenizer, text):
|
|
24 |
return tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
|
25 |
def uncase():
|
26 |
st.session_state['textbox'] = st.session_state['textbox'].lower()
|
27 |
-
|
|
|
|
|
|
|
|
|
|
|
28 |
st.title("DeUnCaser")
|
29 |
|
30 |
st.sidebar.write("This web app adds spaces, punctation and capitalisation back into the text.")
|
@@ -33,7 +38,7 @@ st.sidebar.write("You can use the examples below, but too really test the effect
|
|
33 |
|
34 |
option = st.sidebar.selectbox(
|
35 |
"Examples:",
|
36 |
-
("Vi bruker ikke tegnsetting eller store bokstaver når vi prater. Vi slår også sammen ord, og i praksis er dermed heller ikke mellomrom meningsbærende. Prøv å fjerne tegnsetting, store bokstaver og mellomrom fra dette avsnittet. Se om den nye North-T5-modellen greier å sette sammen til et nytt meningsbærende avsnitt.","tirsdag var travel for ukrainas president volodymyr zelenskyj på morgenen tok han imot polens statsminister mateusz morawiecki","tirsdagvartravelforukrainaspresidentvolodymyrzelenskyjpåkveldentokhanimotpolensstatsministermateuszmorawiecki","deterikkelettåholderedepåstoreogsmåbokstavermanmåforeksempelhuskestorforbokstavnårmanskriveromkrimhalvøyamenkunbrukelitenforbokstavnårmanhenvisertilenkrimroman","detteerenlitendemosomerlagetavperegilkummervoldhanerenforskersomtidligerejobbetvednasjonalbiblioteketimoirana", "sentpå60talletvardetfaktisknoensomkalteungensinperegilkummervoldidagerdetikkelengersåvanligåbrukedobbeltnavninorgehvasynesduomdet"))
|
37 |
|
38 |
st.button('Uncase', on_click=uncase)
|
39 |
|
|
|
4 |
|
5 |
st.session_state
|
6 |
if 'textbox' not in st.session_state:
|
7 |
+
st.session_state['textbox'] = "Vi bruker ikke tegnsetting eller store bokstaver når vi prater. Vi slår også sammen ord, og i praksis er dermed heller ikke mellomrom meningsbærende. Prøv å fjerne tegnsetting, store bokstaver og mellomrom fra dette avsnittet. Se om den nye North-T5-modellen greier å sette sammen til et nytt meningsbærende avsnitt."
|
8 |
|
9 |
|
10 |
|
|
|
24 |
return tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
|
25 |
def uncase():
|
26 |
st.session_state['textbox'] = st.session_state['textbox'].lower()
|
27 |
+
|
28 |
+
def sidebar_callback():
|
29 |
+
st.session_state['textbox'] = st.session_state['sidebar']
|
30 |
+
|
31 |
+
|
32 |
+
|
33 |
st.title("DeUnCaser")
|
34 |
|
35 |
st.sidebar.write("This web app adds spaces, punctation and capitalisation back into the text.")
|
|
|
38 |
|
39 |
option = st.sidebar.selectbox(
|
40 |
"Examples:",
|
41 |
+
("Vi bruker ikke tegnsetting eller store bokstaver når vi prater. Vi slår også sammen ord, og i praksis er dermed heller ikke mellomrom meningsbærende. Prøv å fjerne tegnsetting, store bokstaver og mellomrom fra dette avsnittet. Se om den nye North-T5-modellen greier å sette sammen til et nytt meningsbærende avsnitt.","tirsdag var travel for ukrainas president volodymyr zelenskyj på morgenen tok han imot polens statsminister mateusz morawiecki","tirsdagvartravelforukrainaspresidentvolodymyrzelenskyjpåkveldentokhanimotpolensstatsministermateuszmorawiecki","deterikkelettåholderedepåstoreogsmåbokstavermanmåforeksempelhuskestorforbokstavnårmanskriveromkrimhalvøyamenkunbrukelitenforbokstavnårmanhenvisertilenkrimroman","detteerenlitendemosomerlagetavperegilkummervoldhanerenforskersomtidligerejobbetvednasjonalbiblioteketimoirana", "sentpå60talletvardetfaktisknoensomkalteungensinperegilkummervoldidagerdetikkelengersåvanligåbrukedobbeltnavninorgehvasynesduomdet"),key=sidebar, on_change=sidebar_callback)
|
42 |
|
43 |
st.button('Uncase', on_click=uncase)
|
44 |
|