MMS_1_10

Sleeping

bomolopuu commited on Oct 12, 2024

Commit

d3bad75

1 Parent(s): ad2000a

change .name to obj as is

Files changed (1) hide show

asr.py CHANGED Viewed

@@ -6,6 +6,7 @@ from pathlib import Path
 import torch
 from transformers import Wav2Vec2ForCTC, AutoProcessor
 import numpy as np
 # Настройка логирования
 logging.basicConfig(level=logging.DEBUG)
@@ -26,10 +27,10 @@ model = Wav2Vec2ForCTC.from_pretrained(MODEL_ID)
 def safe_process_file(file_obj):
     try:
-        logger.debug(f"Processing file: {file_obj.name}")
         # Используем Path для безопасной обработки путей
-        file_path = Path(file_obj.name)
         logger.debug(f"Loading audio from file path: {file_path}")
@@ -61,6 +62,7 @@ def transcribe_multiple_files(audio_files, lang, transcription):
             transcriptions.append(f"Error processing file: {str(e)}\n")
     return "\n".join(transcriptions)
 def transcribe_file(model, audio_samples, lang, user_transcription):
     if not audio_samples:
         return "<<ERROR: Empty Audio Input>>"
@@ -92,6 +94,7 @@ def transcribe_file(model, audio_samples, lang, user_transcription):
     #return transcription
 def fine_tune_model(model, processor, user_transcription, audio_samples, lang_code):
     # Convert the user-provided transcription to a tensor
     transcription_tensor = processor.tokenize(user_transcription, return_tensors="pt")

 import torch
 from transformers import Wav2Vec2ForCTC, AutoProcessor
 import numpy as np
+import spaces
 # Настройка логирования
 logging.basicConfig(level=logging.DEBUG)
 def safe_process_file(file_obj):
     try:
+        logger.debug(f"Processing file: {file_obj}")
         # Используем Path для безопасной обработки путей
+        file_path = Path(file_obj)
         logger.debug(f"Loading audio from file path: {file_path}")
             transcriptions.append(f"Error processing file: {str(e)}\n")
     return "\n".join(transcriptions)
+@spaces.GPU
 def transcribe_file(model, audio_samples, lang, user_transcription):
     if not audio_samples:
         return "<<ERROR: Empty Audio Input>>"
     #return transcription
+@spaces.GPU
 def fine_tune_model(model, processor, user_transcription, audio_samples, lang_code):
     # Convert the user-provided transcription to a tensor
     transcription_tensor = processor.tokenize(user_transcription, return_tensors="pt")