Spaces:

robert-moyai
/

lets-chat-langchain-zerogpu

Sleeping

robert commited on Jul 18, 2024

Commit

c42ac02

1 Parent(s): e57aba0

Changing the logic in spaces_model_predict

Files changed (1) hide show

app.py CHANGED Viewed

@@ -41,26 +41,20 @@ class StopOnSequence(StoppingCriteria):
     def __call__(
         self, input_ids: torch.LongTensor, scores: torch.FloatTensor, **kwargs
     ) -> bool:
-        if input_ids.shape[1] < self.sequence_len:
-            return False
-        return (
-            (
-                input_ids[0, -self.sequence_len :]
-                == torch.tensor(self.sequence_ids, device=input_ids.device)
-            )
-            .all()
-            .item()
-        )
 @spaces.GPU(duration=54)
 def spaces_model_predict(message: str, history: list[tuple[str, str]]):
     history_transformer_format = history + [[message, ""]]
-    stop = StopOnSequence("<|human|>", tokenizer)
     messages = "".join(
         [
-            "".join(["\n<human>:" + item[0], "\n<ai>:" + item[1]])
             for item in history_transformer_format
         ]
     )
@@ -85,9 +79,8 @@ def spaces_model_predict(message: str, history: list[tuple[str, str]]):
     partial_message = ""
     for new_token in streamer:
-        if new_token != "<":
-            partial_message += new_token
-            return partial_message
 def predict(

     def __call__(
         self, input_ids: torch.LongTensor, scores: torch.FloatTensor, **kwargs
     ) -> bool:
+        for i in range(input_ids.shape[0]):
+            if input_ids[i, -self.sequence_len:].tolist() == self.sequence_ids:
+                return True
+        return False
 @spaces.GPU(duration=54)
 def spaces_model_predict(message: str, history: list[tuple[str, str]]):
     history_transformer_format = history + [[message, ""]]
+    stop = StopOnSequence("<|user|>", tokenizer)
     messages = "".join(
         [
+            f"<|user|>\n{item[0]}\n<|assistant|>\n{item[1]}"
             for item in history_transformer_format
         ]
     )
     partial_message = ""
     for new_token in streamer:
+        partial_message += new_token
+        yield partial_message
 def predict(