lst-nectec
/

HoogBERTa

Inference Endpoints

Model card Files Files and versions Community

new5558 commited on Mar 31, 2023

Commit

643e5ff

•

1 Parent(s): d8e4832

docs: fix padding error

Files changed (1) hide show

README.md +6 -4

README.md CHANGED Viewed

@@ -50,8 +50,9 @@ with torch.no_grad():
         all_sent.append(" ".join(tokenize(sent)).replace("_","[!und:]"))
     sentence = " _ ".join(all_sent)
-    token_ids = tokenizer(sentence, return_tensors = 'pt')['input_ids']
-    features = model(token_ids)
 ```
 For batch processing,
@@ -69,8 +70,9 @@ with torch.no_grad():
         sentence = " _ ".join(all_sent)
         inputList.append(sentence)
-    token_ids = tokenizer(inputList, padding = True, return_tensors = 'pt').input_ids
-    features = model(token_ids)
 ```
 To use HoogBERTa as an embedding layer, use

         all_sent.append(" ".join(tokenize(sent)).replace("_","[!und:]"))
     sentence = " _ ".join(all_sent)
+    tokenized_text = tokenizer(sentence, return_tensors = 'pt')
+    token_ids = tokenized_text['input_ids']
+    features = model(**tokenized_text)
 ```
 For batch processing,
         sentence = " _ ".join(all_sent)
         inputList.append(sentence)
+    tokenized_text = tokenizer(inputList, padding = True, return_tensors = 'pt')
+    token_ids = tokenized_text['input_ids']
+    features = model(**tokenized_text)
 ```
 To use HoogBERTa as an embedding layer, use