hylee719
/

transcript-analysis-testing

Model card Files Files and versions Community

hylee719 commited on Jan 30, 2024

Commit

d858b97

·

verified ·

1 Parent(s): a9d7959

add del for memory cleanup

Files changed (1) hide show

handler.py +8 -3

handler.py CHANGED Viewed

@@ -437,21 +437,26 @@ class EndpointHandler():
         uptake_speaker = params.pop("uptake_speaker", None)
         uptake_model.run_inference(transcript, min_prev_words=params['uptake_min_num_words'],
                                    uptake_speaker=uptake_speaker)
         # Reasoning
         reasoning_model = ReasoningModel(
             self.device, self.tokenizer, self.input_builder)
         reasoning_model.run_inference(transcript, uptake_speaker=uptake_speaker)
         # Question
         question_model = QuestionModel(
             self.device, self.tokenizer, self.input_builder)
         question_model.run_inference(transcript)
         # Focusing Question
         focusing_question_model = FocusingQuestionModel(
             self.device, self.tokenizer, self.input_builder)
         focusing_question_model.run_inference(transcript, uptake_speaker=uptake_speaker)
         math_cloud = run_math_density(transcript)
         transcript.update_utterance_roles(uptake_speaker)
         transcript.calculate_aggregate_word_count()

         uptake_speaker = params.pop("uptake_speaker", None)
         uptake_model.run_inference(transcript, min_prev_words=params['uptake_min_num_words'],
                                    uptake_speaker=uptake_speaker)
+        del uptake_model
         # Reasoning
         reasoning_model = ReasoningModel(
             self.device, self.tokenizer, self.input_builder)
         reasoning_model.run_inference(transcript, uptake_speaker=uptake_speaker)
+        del reasoning_model
         # Question
         question_model = QuestionModel(
             self.device, self.tokenizer, self.input_builder)
         question_model.run_inference(transcript)
+        del question_model
         # Focusing Question
         focusing_question_model = FocusingQuestionModel(
             self.device, self.tokenizer, self.input_builder)
         focusing_question_model.run_inference(transcript, uptake_speaker=uptake_speaker)
+        del focusing_question_model
         math_cloud = run_math_density(transcript)
         transcript.update_utterance_roles(uptake_speaker)
         transcript.calculate_aggregate_word_count()