MUSTAR
/

Rigel-rvc-base-pretrained-model

Model card Files Files and versions Community

MUSTAR commited on Jul 22, 2024

Commit

578213e

·

verified ·

1 Parent(s): 02c2343

Update README.md

Files changed (1) hide show

README.md +46 -59

README.md CHANGED Viewed

@@ -1,76 +1,63 @@
-### Dataset is about ~2000 hours of speech and vocals
-### Supported (included) languages:
-~800 hrs of English
-~200 Spanish
-~42 French
-~188 Russian
-~70 Arabic
-~140 Japanese
-~70 Chinese (Mandarin)
-~80 Korean
-~30 Hindi
-~53 Indonesian
-~30 Tagalog
-~40 Portuguese
-~35 German
-~190 singing (all languages)
-common language (I don't remember how much data was there)
-# Sampling frequency: 32k(done), 40k(retraining)
-#### Base and Fine tuned (FT) mdoels
-## Base model:
-data - approximate 2k hrs of low-mid quality data
-steps - 3890220
-batch - 40-20-2
-fp32
-Sampling frequency - 32k
-## Fine Tuned
-data - 102 hrs of high quality data
-steps - 2854856
-batch - 20-12-2
-fp32
-Sampling frequency - 32k
-# Hardware used:
-Cpu - amd epyc 9754
-Ram - 256gb
-Gpu's:
-1 - h100, 4 - L40s
-1 - rtx 4080, 1 - rtx 4070ti
-Expected release date - 22 july
-![image/png](https://cdn-uploads.huggingface.co/production/uploads/65041c19e88eb2d0d521d46c/NfsOJxAzRbllBDCDjFC5e.png)

+## Rigel Pretrained Model
+### Dataset
+* **Size:** Approximately 2000 hours of speech and vocals.
+* **Languages:**
+    * English: ~800 hours
+    * Spanish: ~200 hours
+    * French: ~42 hours
+    * Russian: ~188 hours
+    * Arabic: ~70 hours
+    * Japanese: ~140 hours
+    * Chinese (Mandarin): ~70 hours
+    * Korean: ~80 hours
+    * Hindi: ~30 hours
+    * Indonesian: ~53 hours
+    * Tagalog: ~30 hours
+    * Portuguese: ~40 hours
+    * German: ~35 hours
+    * Singing (all languages): ~190 hours
+    * Common language: Unknown amount
+### Sampling Frequency
+* **32kHz** (Done)
+* **40kHz** (Retraining)
+### Models
+#### **Base Model**
+* **Data:** Approximately 2000 hours of low-mid quality data.
+* **Steps:** 3,890,220
+* **Batch:** 40-20-2
+* **Precision:** FP32
+* **Sampling Frequency:** 32kHz
+#### **Fine-Tuned Model**
+* **Data:** 102 hours of high-quality data.
+* **Steps:** 2,854,856
+* **Batch:** 20-12-2
+* **Precision:** FP32
+* **Sampling Frequency:** 32kHz
+### Hardware Used
+* **CPU:** AMD EPYC 9754
+* **RAM:** 256GB
+* **GPUs:**
+    * 1 x H100
+    * 4 x L40s
+    * 1 x RTX 4080
+    * 1 x RTX 4070 Ti
+### Expected Release Date
+* July 22nd
+I hope this is more helpful! Let me know if you'd like any other adjustments or have any other questions.