hkab
/

whisper-base-vietnamese-finetuned

Automatic Speech Recognition

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

HKAB commited on Oct 6, 2023

Commit

bf1f61c

·

1 Parent(s): 8ee4ae6

Update Readme.md

Files changed (1) hide show

README.md +32 -8

README.md CHANGED Viewed

@@ -1,4 +1,18 @@
 # Whisper Finetune 1 Notebook
 In this experiment, Whisper (base) is finetuned on VinBigData 100h dataset, but with special pre-processing:
@@ -11,6 +25,23 @@ As state in the [paper](https://arxiv.org/pdf/2212.04356.pdf):
 Whisper output is already in written form, and we would want to keep this ability by doing the last 2 preprocessing step. **However, the result is not perfect**.
 ## Installation
@@ -38,11 +69,4 @@ batch_size = 16
 num_epochs = 10
 learning_rate=5e-4
 warmup_steps=2000,
-```
-## Checkpoint to play with
-Updating...
----
-license: mit
----

+---
+language:
+  - vi
+thumbnail: "url to a thumbnail used in social sharing"
+tags:
+- automatic-speech-recognition
+- whisper
+license: mit
+datasets:
+- google/fleurs
+metrics:
+- Unnormalized WER
+---
 # Whisper Finetune 1 Notebook
 In this experiment, Whisper (base) is finetuned on VinBigData 100h dataset, but with special pre-processing:
 Whisper output is already in written form, and we would want to keep this ability by doing the last 2 preprocessing step. **However, the result is not perfect**.
+## Usage
+```python
+from transformers import WhisperProcessor, WhisperForConditionalGeneration
+model_trained = WhisperForConditionalGeneration.from_pretrained('hkab/whisper-base-vietnamese-finetuned')
+processor = WhisperProcessor.from_pretrained("hkab/whisper-base-vietnamese-finetuned")
+forced_decoder_ids = processor.get_decoder_prompt_ids(language="vi", task="transcribe")
+input_speech, rate = librosa.load('/path/to/audio.wav', sr=16000)
+input_features = processor(input_speech, sampling_rate=rate, return_tensors="pt").input_features
+predicted_ids = model_trained.generate(input_features, forced_decoder_ids=forced_decoder_ids)
+print(f'Prediction: {processor.batch_decode(predicted_ids, skip_special_tokens=True)}')
+```
 ## Installation
 num_epochs = 10
 learning_rate=5e-4
 warmup_steps=2000,
+```