Spaces:

Finnish-NLP
/

Finnish-Automatic-Speech-Recognition

App Files Files Community

RasmusToivanen commited on May 8, 2022

Commit

ef1a65c

•

1 Parent(s): 78d0acf

add secrets

Files changed (1) hide show

app.py +8 -9

app.py CHANGED Viewed

@@ -3,7 +3,7 @@ import librosa
 import soundfile as sf
 import torch
 import warnings
 from transformers import Wav2Vec2ProcessorWithLM, Wav2Vec2CTCTokenizer
 warnings.filterwarnings("ignore")
@@ -11,22 +11,21 @@ warnings.filterwarnings("ignore")
 #load wav2vec2 tokenizer and model
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
-import time
 from fastapi import FastAPI, HTTPException, File
-model_name = "Finnish-NLP/wav2vec2-xlsr-300m-finnish-lm"
 from transformers import pipeline
-#feature_extractor = AutoFeatureExtractor.from_pretrained(model_name)
-#tokenizer = AutoTokenizer.from_pretrained(model_name)
-#model = Wav2Vec2ForCTC.from_pretrained(model_name)
-pipe = pipeline(model="Finnish-NLP/wav2vec2-xlsr-1b-finnish-lm-v2",chunk_length_s=20, stride_length_s=(4, 2))
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model_checkpoint = 'Finnish-NLP/t5x-small-nl24-finnish'
-tokenizer = AutoTokenizer.from_pretrained(model_checkpoint, use_auth_token=True)
-model = AutoModelForSeq2SeqLM.from_pretrained('model_t5', from_flax=False, torch_dtype=torch.float32).to(device)
 # define speech-to-text function

 import soundfile as sf
 import torch
 import warnings
+import os
 from transformers import Wav2Vec2ProcessorWithLM, Wav2Vec2CTCTokenizer
 warnings.filterwarnings("ignore")
 #load wav2vec2 tokenizer and model
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 from fastapi import FastAPI, HTTPException, File
 from transformers import pipeline
+pipe = pipeline(model="Finnish-NLP/wav2vec2-xlsr-1b-finnish-lm-v2",chunk_length_s=20, stride_length_s=(4, 2))
+token = os.getenv()
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model_checkpoint = 'Finnish-NLP/t5x-small-nl24-finnish'
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint, use_auth_token=os.environ.get('hf_token'))
+model = AutoModelForSeq2SeqLM.from_pretrained('Finnish-NLP/case_correction_model', from_flax=False, torch_dtype=torch.float32, use_auth_token=os.environ.get('hf_token')).to(device)
 # define speech-to-text function