Spaces:

WhiteAngelss
/

turkce-varlik-tanima-teknofest-nlp

Running

App Files Files Community

ihsan66 commited on Jul 31, 2024

Commit

9eef783

verified ·

1 Parent(s): df052cb

Update app.py

Browse files

Files changed (1) hide show

app.py +9 -58

app.py CHANGED Viewed

@@ -1,12 +1,7 @@
 import streamlit as st
-from transformers import pipeline, AutoModelForSequenceClassification, AutoTokenizer, AutoModelForTokenClassification, AutoModelForCausalLM
 import pandas as pd
 import spacy
-import io
-import torch
-import torchaudio
-from transformers import Wav2Vec2ForCTC, Wav2Vec2FeatureExtractor
-from transformers import Wav2Vec2Processor
 st.set_page_config(layout="wide")
@@ -20,13 +15,14 @@ Birinci Dünya Savaşı sırasında Osmanlı ordusunda görev yapan Atatürk, Ç
 # Uygulama başlığı
 st.title("NLP Toolkit")
 # Model seçim
-model_list = {
-    'Metin Sınıflandırma': 'dbmdz/bert-base-turkish-cased',
     'Metin Analizi': 'savasy/bert-base-turkish-ner-cased',
     'Duygu Analizi': 'akdeniz27/xlm-roberta-base-turkish-ner',
     'Metin Oluşturma': 'dbmdz/bert-base-turkish-cased'
-}
 st.sidebar.header("Select NER Model")
 model_checkpoint = st.sidebar.radio("", model_list)
@@ -45,7 +41,7 @@ else:
 # Metin giriş yöntemi
 st.subheader("Metin Giriş Yöntemi Seç")
-input_method = st.radio("", ('Örneklerden Seç', 'Metin Yaz veya Yapıştır', 'Dosya Yükle', 'Ses Dosyası Yükle'))
 if input_method == 'Örneklerden Seç':
     selected_text = st.selectbox('Metin Seç', example_list, index=0, key=1)
@@ -61,11 +57,6 @@ elif input_method == "Dosya Yükle":
         input_text = str(uploaded_file.read(), "utf-8")
     else:
         input_text = ""
-elif input_method == "Ses Dosyası Yükle":
-    st.subheader("Ses Dosyası")
-    uploaded_audio = st.file_uploader("Ses Dosyasını Seç", type=["wav"], key="audio_file_uploader")
-    if uploaded_audio is not None:
-        audio_bytes = uploaded_audio.read()
 @st.cache_resource
 def load_pipeline(model_name, task_type):
@@ -82,7 +73,7 @@ def load_pipeline(model_name, task_type):
         tokenizer = AutoTokenizer.from_pretrained(model_name)
         return pipeline('sentiment-analysis', model=model, tokenizer=tokenizer)
     elif task_type == "Metin Oluşturma":
-        model = AutoModelForCausalLM.from_pretrained(model_name)
         tokenizer = AutoTokenizer.from_pretrained(model_name)
         return pipeline('text-generation', model=model, tokenizer=tokenizer)
@@ -111,49 +102,9 @@ def entity_comb(output):
             output_comb.append(entity)
     return output_comb
-# Ses dosyasını metne çevirme fonksiyonu
-def transcribe_audio(audio_file):
-    # Wav2Vec2 model ve feature extractor yükleme
-    processor = Wav2Vec2FeatureExtractor.from_pretrained("facebook/wav2vec2-large-xlsr-53")
-    model = Wav2Vec2ForCTC.from_pretrained("facebook/wav2vec2-large-xlsr-53")
-    # Ses dosyasını yükleme
-    audio_input = io.BytesIO(audio_file)
-    waveform, sample_rate = torchaudio.load(audio_input, normalize=True)
-    # Ses verisini işleme
-    inputs = processor(waveform.squeeze().numpy(), sampling_rate=sample_rate, return_tensors="pt", padding="longest")
-    # Model ile tahmin yapma
-    with torch.no_grad():
-        logits = model(inputs.input_values).logits
-    # Tahmin sonuçlarını çözme
-    predicted_ids = torch.argmax(logits, dim=-1)
-    transcription = processor.batch_decode(predicted_ids)[0]
-    return transcription
 Run_Button = st.button("Çalıştır", key=None)
-if input_method == "Metin Yaz veya Yapıştır":
-    st.subheader("Metin Girişi")
-    input_text = st.text_area("Metni buraya yazın veya yapıştırın:", key="text_input_area")
-    if input_text != "":
-        st.subheader("Girdiğiniz Metin")
-        st.write(input_text)
-elif input_method == "Ses Dosyası Yükle":
-    st.subheader("Ses Dosyası")
-    uploaded_audio = st.file_uploader("Ses Dosyasını Seç", type=["wav"], key="audio_file_uploader")
-    if uploaded_audio is not None:
-        transcription = transcribe_audio(uploaded_audio)
-        st.subheader("Ses Transkripsiyonu")
-        st.write(transcription)
-if input_text != "":
     if task == "Metin Sınıflandırma":
         pipeline_model = load_pipeline(model_checkpoint, task)
         output = pipeline_model(input_text)
@@ -206,4 +157,4 @@ if input_text != "":
         output = pipeline_model(input_text, max_length=50, num_return_sequences=1)
         st.subheader(f"{task} Sonuçları")
         for idx, item in enumerate(output):
-            st.write(f"Öneri {idx+1}: {item['generated_text']}")

 import streamlit as st
+from transformers import pipeline, AutoModelForSequenceClassification, AutoTokenizer, AutoModelForTokenClassification, AutoModelWithLMHead
 import pandas as pd
 import spacy
 st.set_page_config(layout="wide")
 # Uygulama başlığı
 st.title("NLP Toolkit")
 # Model seçim
+model_list = [
+     'Metin Sınıflandırma': 'dbmdz/bert-base-turkish-cased',
     'Metin Analizi': 'savasy/bert-base-turkish-ner-cased',
     'Duygu Analizi': 'akdeniz27/xlm-roberta-base-turkish-ner',
     'Metin Oluşturma': 'dbmdz/bert-base-turkish-cased'
+]
 st.sidebar.header("Select NER Model")
 model_checkpoint = st.sidebar.radio("", model_list)
 # Metin giriş yöntemi
 st.subheader("Metin Giriş Yöntemi Seç")
+input_method = st.radio("", ('Örneklerden Seç', 'Metin Yaz veya Yapıştır', 'Dosya Yükle'))
 if input_method == 'Örneklerden Seç':
     selected_text = st.selectbox('Metin Seç', example_list, index=0, key=1)
         input_text = str(uploaded_file.read(), "utf-8")
     else:
         input_text = ""
 @st.cache_resource
 def load_pipeline(model_name, task_type):
         tokenizer = AutoTokenizer.from_pretrained(model_name)
         return pipeline('sentiment-analysis', model=model, tokenizer=tokenizer)
     elif task_type == "Metin Oluşturma":
+        model = AutoModelWithLMHead.from_pretrained(model_name)
         tokenizer = AutoTokenizer.from_pretrained(model_name)
         return pipeline('text-generation', model=model, tokenizer=tokenizer)
             output_comb.append(entity)
     return output_comb
 Run_Button = st.button("Çalıştır", key=None)
+if Run_Button and input_text != "":
     if task == "Metin Sınıflandırma":
         pipeline_model = load_pipeline(model_checkpoint, task)
         output = pipeline_model(input_text)
         output = pipeline_model(input_text, max_length=50, num_return_sequences=1)
         st.subheader(f"{task} Sonuçları")
         for idx, item in enumerate(output):
+            st.write(f"Öneri {idx+1}: {item['generated_text']}")