Spaces:

k2-fsa
/

automatic-speech-recognition

Running

App Files Files Community

csukuangfj commited on 9 days ago

Commit

10b604a

1 Parent(s): 387e4e6

add more models

Browse files

Files changed (1) hide show

model.py +50 -0

model.py CHANGED Viewed

@@ -1282,6 +1282,54 @@ def _get_french_pre_trained_model(
     return recognizer
 @lru_cache(maxsize=10)
 def _get_sherpa_onnx_nemo_transducer_models_int8(
     repo_id: str,
@@ -2159,6 +2207,8 @@ russian_models = {
     "csukuangfj/sherpa-onnx-nemo-ctc-giga-am-russian-2024-10-24": _get_russian_pre_trained_model_ctc,
     "alphacep/vosk-model-ru": _get_russian_pre_trained_model,
     "alphacep/vosk-model-small-ru": _get_russian_pre_trained_model,
 }
 chinese_cantonese_english_models = {

     return recognizer
+@lru_cache(maxsize=10)
+def _get_streaming_vosk_pre_trained_model(
+    repo_id: str,
+    decoding_method: str,
+    num_active_paths: int,
+) -> sherpa_onnx.OnlineRecognizer:
+    assert repo_id in [
+        "csukuangfj/sherpa-onnx-streaming-zipformer-small-ru-vosk-int8-2025-08-16",
+        "csukuangfj/sherpa-onnx-streaming-zipformer-small-ru-vosk-2025-08-16",
+    ], repo_id
+    is_int8 = "int8" in repo_id
+    encoder_model = _get_nn_model_filename(
+        repo_id=repo_id,
+        filename="encoder.int8.onnx" if is_int8 else "encoder.onnx",
+        subfolder=".",
+    )
+    decoder_model = _get_nn_model_filename(
+        repo_id=repo_id,
+        filename="decoder.onnx",
+        subfolder=".",
+    )
+    joiner_model = _get_nn_model_filename(
+        repo_id=repo_id,
+        filename="joiner.int8.onnx" if is_int8 else "joiner.onnx",
+        subfolder=".",
+    )
+    tokens = _get_token_filename(repo_id=repo_id, subfolder=".")
+    recognizer = sherpa_onnx.OnlineRecognizer.from_transducer(
+        tokens=tokens,
+        encoder=encoder_model,
+        decoder=decoder_model,
+        joiner=joiner_model,
+        num_threads=2,
+        sample_rate=16000,
+        feature_dim=80,
+        decoding_method=decoding_method,
+        max_active_paths=num_active_paths,
+    )
+    return recognizer
 @lru_cache(maxsize=10)
 def _get_sherpa_onnx_nemo_transducer_models_int8(
     repo_id: str,
     "csukuangfj/sherpa-onnx-nemo-ctc-giga-am-russian-2024-10-24": _get_russian_pre_trained_model_ctc,
     "alphacep/vosk-model-ru": _get_russian_pre_trained_model,
     "alphacep/vosk-model-small-ru": _get_russian_pre_trained_model,
+    "csukuangfj/sherpa-onnx-streaming-zipformer-small-ru-vosk-int8-2025-08-16": _get_streaming_vosk_pre_trained_model,
+    "csukuangfj/sherpa-onnx-streaming-zipformer-small-ru-vosk-2025-08-16": _get_streaming_vosk_pre_trained_model,
 }
 chinese_cantonese_english_models = {