VALL-E-X

Runtime error

Plachta commited on Aug 28, 2023

Commit

d90cf30

•

1 Parent(s): f330917

Fix OOM

Files changed (2) hide show

app.py CHANGED Viewed

@@ -116,7 +116,6 @@ def transcribe_one(model, audio_path):
     return lang, text_pr
 def make_npz_prompt(name, uploaded_audio, recorded_audio, transcript_content):
-    global model, text_collater, text_tokenizer, audio_tokenizer
     clear_prompts()
     audio_prompt = uploaded_audio if uploaded_audio is not None else recorded_audio
     sr, wav_pr = audio_prompt
@@ -159,7 +158,6 @@ def make_npz_prompt(name, uploaded_audio, recorded_audio, transcript_content):
 def make_prompt(name, wav, sr, save=True):
-    global whisper_model
     if not isinstance(wav, torch.FloatTensor):
         wav = torch.tensor(wav)
     if wav.abs().max() > 1:
@@ -185,7 +183,6 @@ def make_prompt(name, wav, sr, save=True):
 def infer_from_audio(text, language, accent, audio_prompt, record_audio_prompt, transcript_content):
     if len(text) > 150:
         return "Rejected, Text too long (should be less than 150 characters)", None
-    global model, text_collater, text_tokenizer, audio_tokenizer
     audio_prompt = audio_prompt if audio_prompt is not None else record_audio_prompt
     sr, wav_pr = audio_prompt
     if len(wav_pr) / sr > 15:

     return lang, text_pr
 def make_npz_prompt(name, uploaded_audio, recorded_audio, transcript_content):
     clear_prompts()
     audio_prompt = uploaded_audio if uploaded_audio is not None else recorded_audio
     sr, wav_pr = audio_prompt
 def make_prompt(name, wav, sr, save=True):
     if not isinstance(wav, torch.FloatTensor):
         wav = torch.tensor(wav)
     if wav.abs().max() > 1:
 def infer_from_audio(text, language, accent, audio_prompt, record_audio_prompt, transcript_content):
     if len(text) > 150:
         return "Rejected, Text too long (should be less than 150 characters)", None
     audio_prompt = audio_prompt if audio_prompt is not None else record_audio_prompt
     sr, wav_pr = audio_prompt
     if len(wav_pr) / sr > 15:

models/vallex.py CHANGED Viewed

@@ -14,6 +14,7 @@
 import random
 from typing import Dict, Iterator, List, Tuple, Union
 import numpy as np
 import torch
@@ -462,6 +463,7 @@ class VALLE(VALLF):
         **kwargs,
     ):
         raise NotImplementedError
     def inference(
         self,
         x: torch.Tensor,
@@ -674,6 +676,7 @@ class VALLE(VALLF):
                     y_emb[:, prefix_len:] += embedding_layer(samples)
         assert len(codes) == self.num_quantizers
         return torch.stack(codes, dim=-1)
     def continual(

 import random
 from typing import Dict, Iterator, List, Tuple, Union
+import gc
 import numpy as np
 import torch
         **kwargs,
     ):
         raise NotImplementedError
     def inference(
         self,
         x: torch.Tensor,
                     y_emb[:, prefix_len:] += embedding_layer(samples)
         assert len(codes) == self.num_quantizers
+        gc.collect()
         return torch.stack(codes, dim=-1)
     def continual(