Spaces:

supermy
/

jinyong

Sleeping

supermy commited on Dec 3, 2022

Commit

aac4628

1 Parent(s): 4be04dc

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,6 +6,8 @@ import torch.nn.functional as F
 from transformers import AutoTokenizer, GPT2LMHeadModel
 tokenizer = AutoTokenizer.from_pretrained("supermy/jinyong-gpt2")
 model = GPT2LMHeadModel.from_pretrained("supermy/jinyong-gpt2")
 model.eval()
@@ -27,12 +29,12 @@ def top_k_top_p_filtering( logits, top_k=0, top_p=0.0, filter_value=-float('Inf'
 def generate(title, context, max_len):
-    input_ids=tokenizer.encode(title + "-" + context, add_special_tokens=False)
-    # title_ids = tokenizer.encode(title, add_special_tokens=False)
-    # context_ids = tokenizer.encode(context, add_special_tokens=False)
-    # input_ids = title_ids + [sep_id] + context_ids
-    # print(input_ids)
     cur_len = len(input_ids)
     input_len = cur_len

 from transformers import AutoTokenizer, GPT2LMHeadModel
 tokenizer = AutoTokenizer.from_pretrained("supermy/jinyong-gpt2")
+tokenizer.add_special_tokens(['SEP'])
+tokenizer.add_special_tokens(['UNK'])
 model = GPT2LMHeadModel.from_pretrained("supermy/jinyong-gpt2")
 model.eval()
 def generate(title, context, max_len):
+    # input_ids=tokenizer.encode(title + "-" + context, add_special_tokens=False)
+    title_ids = tokenizer.encode(title, add_special_tokens=False)
+    context_ids = tokenizer.encode(context, add_special_tokens=False)
+    input_ids = title_ids + [sep_id] + context_ids
+    print(input_ids)
     cur_len = len(input_ids)
     input_len = cur_len