Spaces:

Remsky
/

Kokoro-TTS-Zero

Running on Zero

Remsky commited on Jan 28

Commit

d0c45ea

1 Parent(s): 9aea310

Update model version to v1.0.0 and adjust initialization logic for voice selection

Files changed (3) hide show

app.py CHANGED Viewed

@@ -24,7 +24,7 @@ logging.getLogger('matplotlib').setLevel(logging.WARNING)
 logger = logging.getLogger(__name__)
 logger.debug("Starting app initialization...")
-def initialize_model(version="v0.19"):
     """Initialize model and get voices"""
     global model
     try:
@@ -388,7 +388,7 @@ with gr.Blocks(title="Kokoro TTS Demo", css=styling) as demo:
                 version_dropdown = gr.Dropdown(
                     label="Model Version",
                     choices=["v0.19", "v1.0.0"],
-                    value="v0.19",
                     allow_custom_value=False,
                     multiselect=False
                 )
@@ -398,11 +398,15 @@ with gr.Blocks(title="Kokoro TTS Demo", css=styling) as demo:
                     choices=[],  # Start empty, will be populated after initialization
                     value=None,
                     allow_custom_value=True,
-                    multiselect=True
                 )
                 def on_version_change(version):
-                    return initialize_model(version)
                 version_dropdown.change(
                     fn=on_version_change,
@@ -458,7 +462,7 @@ with gr.Blocks(title="Kokoro TTS Demo", css=styling) as demo:
     # Initialize voices on load with default version
     demo.load(
-        fn=lambda: initialize_model("v0.19"),
         outputs=[voice_dropdown]
     )

 logger = logging.getLogger(__name__)
 logger.debug("Starting app initialization...")
+def initialize_model(version="v1.0.0"):
     """Initialize model and get voices"""
     global model
     try:
                 version_dropdown = gr.Dropdown(
                     label="Model Version",
                     choices=["v0.19", "v1.0.0"],
+                    value="v1.0.0",
                     allow_custom_value=False,
                     multiselect=False
                 )
                     choices=[],  # Start empty, will be populated after initialization
                     value=None,
                     allow_custom_value=True,
+                    multiselect=False  # Start with v1.0.0 which doesn't support multiselect
                 )
                 def on_version_change(version):
+                    voices = initialize_model(version)
+                    # Disable multiselect for v1.0.0 since it doesn't support voice mixing yet
+                    if version == "v1.0.0":
+                        return gr.update(choices=voices.choices, value=voices.value, multiselect=False)
+                    return gr.update(choices=voices.choices, value=voices.value, multiselect=True)
                 version_dropdown.change(
                     fn=on_version_change,
     # Initialize voices on load with default version
     demo.load(
+        fn=lambda: initialize_model("v1.0.0"),
         outputs=[voice_dropdown]
     )

tts_factory.py CHANGED Viewed

@@ -5,7 +5,7 @@ class TTSFactory:
     """Factory class to create appropriate TTS model version"""
     @staticmethod
-    def create_model(version="v0.19"):
         """Create TTS model instance for specified version
         Args:

     """Factory class to create appropriate TTS model version"""
     @staticmethod
+    def create_model(version="v1.0.0"):
         """Create TTS model instance for specified version
         Args:

tts_model_v1.py CHANGED Viewed

@@ -73,7 +73,8 @@ class TTSModelV1:
                 text,
                 voice=voice_name,
                 speed=speed,
-                split_pattern=r'\n+'  # Default chunking pattern
             )
             # Process chunks

                 text,
                 voice=voice_name,
                 speed=speed,
+                split_pattern=r'\n\n+',  # Split on double newlines or more
+                preprocess_text=lambda t: t.replace('\n', ' ').replace('  ', ' ')  # Replace single newlines with spaces
             )
             # Process chunks