Spaces:

alakxender
/

dhivehi-mms-demo

Running on Zero

App Files Files Community

alakxender commited on Feb 7

Commit

cb3f68b

1 Parent(s): 700fda9

ptlocal

Browse files

Files changed (1) hide show

app.py +14 -14

app.py CHANGED Viewed

@@ -136,20 +136,20 @@ if __name__ == "__main__":
         torch_dtype = torch.float16 if torch.cuda.is_available() else torch.float32
         MODEL_NAME = "alakxender/wav2vec2-large-mms-1b-dv-syn-md" # Trained on 100% Synthetic Data (150 Hours)
-        # MODEL_NAME = "alakxender/wav2vec2-large-mms-1b-cv" # Trained on Common Voice Data (Unknown Hours)
-        # MODEL_NAME =  "alakxender/whisper-small-dv-syn-md" # Trained on 100% Synthetic Data (150 Hours)
-        # MODEL_NAME = "alakxender/whisper-small-cv" # Trained on Common Voice Data (Unknown Hours)
-        # MODEL_NAME = "alakxender/whisper-medium-dv-syn-md" # Trained on 100% Synthetic Data (150 Hours)
-        # MODEL_NAME = "alakxender/whisper-medium-cv" # Trained on Common Voice Data (Unknown Hours)
-        # MODEL_NAME = "alakxender/whisper-large-v3-dv-syn-md" # Trained on 100% Synthetic Data (150 Hours)
-        # MODEL_NAME = "alakxender/whisper-large-v3-cv" # Trained on Common Voice Data (Unknown Hours)
-        # MODEL_NAME = "alakxender/whisper-large-v3-calls-md" # Trained on phone calls (65 Hours)
-        # MODEL_NAME = "alakxender/wav2vec2-large-mms-1b-calls-md" # Trained on phone calls (65 Hours)
-        # MODEL_NAME = "alakxender/wav2vec2-large-xlsr-calls-md" # Trained on phone calls (23 Hours)
-        # MODEL_NAME = "alakxender/wav2vec2-large-xlsr-dv-syn-md" # Trained on 100% Synthetic Data (80 Hours)
-        # MODEL_NAME = "alakxender/dhivehi-asr-full-ctc" # Trained on multiple datasets (350+ Hours)
-        # MODEL_NAME = "alakxender/dhivehi-asr-full-ctc-v2" # Trained on multiple datasets (350+ Hours)
-        # MODEL_NAME = "alakxender/dhivehi-asr-full-whisper-v3" # Trained on multiple datasets (350+ Hours)
         # Load model and processor with LM
         processor = Wav2Vec2ProcessorWithLM.from_pretrained(MODEL_NAME)

         torch_dtype = torch.float16 if torch.cuda.is_available() else torch.float32
         MODEL_NAME = "alakxender/wav2vec2-large-mms-1b-dv-syn-md" # Trained on 100% Synthetic Data (150 Hours)
+        # MODEL_NAME = "/home/rusputin/lab/audio/fine-tunes/wav2vec2-large-mms-1b-cv" # Trained on Common Voice Data (Unknown Hours)
+        # MODEL_NAME =  "/home/rusputin/lab/audio/fine-tunes/whisper-small-dv-syn-md" # Trained on 100% Synthetic Data (150 Hours)
+        # MODEL_NAME = "/home/rusputin/lab/audio/fine-tunes/whisper-small-cv" # Trained on Common Voice Data (Unknown Hours)
+        # MODEL_NAME = "/home/rusputin/lab/audio/fine-tunes/whisper-medium-dv-syn-md" # Trained on 100% Synthetic Data (150 Hours)
+        # MODEL_NAME = "/home/rusputin/lab/audio/fine-tunes/whisper-medium-cv" # Trained on Common Voice Data (Unknown Hours)
+        # MODEL_NAME = "/home/rusputin/lab/audio/fine-tunes/whisper-large-v3-dv-syn-md" # Trained on 100% Synthetic Data (150 Hours)
+        # MODEL_NAME = "/home/rusputin/lab/audio/fine-tunes/whisper-large-v3-cv" # Trained on Common Voice Data (Unknown Hours)
+        # MODEL_NAME = "/home/rusputin/lab/audio/fine-tunes/whisper-large-v3-calls-md" # Trained on phone calls (65 Hours)
+        # MODEL_NAME = "/home/rusputin/lab/audio/fine-tunes/wav2vec2-large-mms-1b-calls-md" # Trained on phone calls (65 Hours)
+        # MODEL_NAME = "/home/rusputin/lab/audio/fine-tunes/wav2vec2-large-xlsr-calls-md" # Trained on phone calls (23 Hours)
+        # MODEL_NAME = "/home/rusputin/lab/audio/fine-tunes/wav2vec2-large-xlsr-dv-syn-md" # Trained on 100% Synthetic Data (80 Hours)
+        # MODEL_NAME = "/home/rusputin/lab/audio/fine-tunes/dhivehi-asr-full-ctc" # Trained on multiple datasets (350+ Hours)
+        # MODEL_NAME = "/home/rusputin/lab/audio/fine-tunes/dhivehi-asr-full-ctc-v2" # Trained on multiple datasets (350+ Hours)
+        # MODEL_NAME = "/home/rusputin/lab/audio/fine-tunes/dhivehi-asr-full-whisper-v3" # Trained on multiple datasets (350+ Hours)
         # Load model and processor with LM
         processor = Wav2Vec2ProcessorWithLM.from_pretrained(MODEL_NAME)