aekupor
/

connecting

Text Classification

Transformers

PyTorch

roberta

Inference Endpoints

Model card Files Files and versions Community

aekupor commited on Apr 19, 2023

Commit

638ffeb

•

1 Parent(s): 5cefadd

Remove logic moved into talk_move_router

Browse files

Files changed (1) hide show

handler.py +1 -120

handler.py CHANGED Viewed

@@ -6,22 +6,6 @@ from datetime import datetime
 import torch
 import spacy
-nlp = spacy.load("en_core_web_sm")
-tokenizer = nlp.tokenizer
-token_limit = 200
-class Utterance(object):
-    def __init__(self, starttime, endtime, speaker, text,
-                 idx, prev_utterance, prev_prev_utterance):
-        self.starttime = starttime
-        self.endtime = endtime
-        self.speaker = speaker
-        self.text = text
-        self.idx = idx
-        self.prev = prev_utterance
-        self.prev_prev = prev_prev_utterance
 class EndpointHandler():
     def __init__(self, path="."):
         print("Loading models...")
@@ -30,109 +14,6 @@ class EndpointHandler():
             "roberta", path, use_cuda=cuda_available
         )
-    def utterance_to_str(self, utterance: Utterance) -> str:
-        # connecting only uses text
-        doc = nlp(utterance.text)
-        if len(doc) > token_limit:
-            return self.handle_long_utterances(doc)
-        return utterance.text
-    def handle_long_utterances(self, doc: str) -> List[str]:
-        split_count = 1
-        total_sent = len([x for x in doc.sents])
-        sent_count = 0
-        token_count = 0
-        split_utterance = ''
-        utterances = []
-        for sent in doc.sents:
-            # add a sentence to split
-            split_utterance = split_utterance + ' ' + sent.text
-            token_count += len(sent)
-            sent_count +=1
-            if token_count >= token_limit or sent_count == total_sent:
-                # save utterance segment
-                utterances.append(split_utterance)
-                # restart count
-                split_utterance = ''
-                token_count = 0
-                split_count += 1
-        return utterances
-    def convert_time(self, time_str):
-        time = datetime.strptime(time_str, "%H:%M:%S.%f")
-        return 1000 * (3600 * time.hour + 60 * time.minute + time.second) + time.microsecond / 1000
-    def process_vtt_transcript(self, vttfile) -> List[Utterance]:
-        """Process raw vtt file."""
-        utterances_list = []
-        text = ""
-        prev_speaker = None
-        prev_start = "00:00:00.000"
-        prev_end = "00:00:00.000"
-        idx = 0
-        prev_utterance = None
-        prev_prev_utterance = None
-        for caption in webvtt.read(vttfile):
-            # Get speaker
-            check_for_speaker = caption.text.split(":")
-            if len(check_for_speaker) > 1:  # the speaker was changed or restated
-                speaker = check_for_speaker[0]
-            else:
-                speaker = prev_speaker
-            # Get utterance
-            new_text = check_for_speaker[1] if len(check_for_speaker) > 1 else check_for_speaker[0]
-            # If speaker was changed, start new batch
-            if (prev_speaker is not None) and (speaker != prev_speaker):
-                utterance = Utterance(starttime=self.convert_time(prev_start),
-                              endtime=self.convert_time(prev_end),
-                              speaker=prev_speaker,
-                              text=text.strip(),
-                              idx=idx,
-                              prev_utterance=prev_utterance,
-                              prev_prev_utterance=prev_prev_utterance)
-                utterances_list.append(utterance)
-                # Start new batch
-                prev_start = caption.start
-                text = ""
-                prev_prev_utterance = prev_utterance
-                prev_utterance = utterance
-                idx+=1
-            text += new_text + " "
-            prev_end = caption.end
-            prev_speaker = speaker
-        # Append last one
-        if prev_speaker is not None:
-            utterance = Utterance(starttime=self.convert_time(prev_start),
-                                  endtime=self.convert_time(prev_end),
-                                  speaker=prev_speaker,
-                                  text=text.strip(),
-                                  idx=idx,
-                                  prev_utterance=prev_utterance,
-                                  prev_prev_utterance=prev_prev_utterance)
-            utterances_list.append(utterance)
-        print(utterances_list)
-        return utterances_list
     def __call__(self, data_file: str) -> List[Dict[str, Any]]:
         ''' data_file is a str pointing to filename of type .vtt '''
-        utterances_list = []
-        for utterance in self.process_vtt_transcript(data_file):
-            #TODO: filter out to only have SL utterances
-            utterances_list.append(self.utterance_to_str(utterance))
-        predictions, raw_outputs = self.model.predict(utterances_list)
-        return predictions

 import torch
 import spacy
 class EndpointHandler():
     def __init__(self, path="."):
         print("Loading models...")
             "roberta", path, use_cuda=cuda_available
         )
     def __call__(self, data_file: str) -> List[Dict[str, Any]]:
         ''' data_file is a str pointing to filename of type .vtt '''
+        return []