# Adia_TTS Wolof Inference Server: API & Segmentation Solution

by sudoping01 - opened 1 day ago

1 day ago

•

Hello Adia TTS team!

I wanted to share a project I've built on top of your excellent Adia_TTS Wolof model. I've developed a production-ready inference server that addresses the 200-character limitation through a robust text segmentation strategy, making your TTS technology more accessible for real-world applications.

Project Overview

The server provides a simple API for Wolof text-to-speech conversion with these key features:

text segmentation to handle texts of any length
Audio concatenation with smooth transitions (150ms crossfading)
Batch processing for documents
FastAPI-based HTTP endpoints

Text Segmentation Implementation

To overcome the model's 200-character limitation, I've implemented a natural segmentation approach that:

Searches backward from the 200-character mark to find natural stopping points
Prioritizes sentence endings (., !, ?) closest to but before the limit
Falls back to other punctuation marks if needed (,, ;, :)
Uses word boundaries as a last resort
Only cuts at exactly 200 characters if no other break points are available

This ensures segmentation occurs at natural pauses, resulting in more natural-sounding speech when audio segments are combined.

Audio Processing

The server handles audio combination with:

Crossfading between segments (150ms)
Audio normalization for consistent volume
Raised cosine functions for smoother transitions
Post-processing to reduce artifacts

Repository & Documentation

T[he project is available on GitHub: repo

I've documented the API endpoints, installation process, and usage examples in the README. The server is containerized with Docker for easy deployment.

Feedback Welcome

I'd love to hear your thoughts on this implementation, especially regarding the segmentation approach. If you have any suggestions for improvements or would be interested in incorporating any of these techniques into your official implementations, I'd be happy to collaborate.

Thank you for creating such an excellent model for the Wolof language! This project wouldn't be possible without your work.

Regards,
@sudoping01

Hawoly18

CONCREE org 1 day ago

Bonjour et merci pour ce partage passionnant ! Nous sommes ravis de voir que Adia_TTS inspire autant d'intérêt et d'initiatives innovantes. Afin de pouvoir explorer vos réalisations en détail, nous avons tenté d'accéder au dépôt GitHub que vous avez partagé. Cependant, le lien ne semble pas mener au projet mentionné. Serait-il possible d'obtenir le bon lien pour que nous puissions parcourir vos travaux ? Cela nous permettrait de mieux comprendre votre implémentation et d'échanger sur les suggestions. Merci d'avance et à très bientôt !

sudoping01

1 day ago

Bonjour, desole pour cette erreur de l'url du repo, voici le lien vers le repo correct

https://github.com/sudoping01/adia-inference-server

Hawoly18

CONCREE org about 1 hour ago

Bonjour,

Nous venons de parcourir votre dépôt GitHub, et nous sommes vraiment impressionnés par la qualité et la finesse de votre travail ! Votre implémentation de l'API est remarquable, et la stratégie de segmentation que vous avez développée est particulièrement ingénieuse. Nous avons testé l'API et avons constaté qu'elle gère avec brio des textes de toute longueur, tout en préservant une fluidité naturelle dans la synthèse vocale.

La gestion des transitions audio, avec le fondu enchaîné et la normalisation, est également très bien pensée et contribue à une expérience utilisateur agréable. Nous apprécions particulièrement l'attention que vous avez portée aux détails, comme la priorisation des points d'arrêt naturels et la réduction des artefacts audio.

C'est un véritable plaisir de voir qu'Adia_TTS a pu inspirer un projet aussi fonctionnel et innovant. Votre contribution démontre tout le potentiel de cette technologie pour des applications concrètes, et nous en sommes ravis.

Si vous le souhaitez, nous serions heureux d'explorer des pistes de collaboration pour intégrer certaines de vos améliorations à nos implémentations officielles, ou simplement pour échanger davantage sur vos idées et vos retours d'expérience.

Encore une fois, bravo pour ce travail exceptionnel, et merci d'avoir partagé cette réalisation avec nous !

À très bientôt,
L'équipe Adia TTS

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment