Spaces:

raul-padua
/

BERT-NER

Sleeping

raul-padua commited on Aug 14, 2023

Commit

0d8634d

•

1 Parent(s): 9f96e9d

Update app.py

added merge_tokens function.

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,9 +3,25 @@ import gradio as gr
 get_completion = pipeline("ner", model="dslim/bert-base-NER")
 def ner(input):
     output = get_completion(input)
-    return {"text": input, "entities": output}
 gr.close_all()
 demo = gr.Interface(fn=ner,

 get_completion = pipeline("ner", model="dslim/bert-base-NER")
+def merge_tokens(tokens):
+    merged_tokens = []
+    for token in tokens:
+        if merged_tokens and token['entity'].startswith('I-') and merged_tokens[-1]['entity'].endswith(token['entity'][2:]):
+            # If current token continues the entity of the last one, merge them
+            last_token = merged_tokens[-1]
+            last_token['word'] += token['word'].replace('##', '')
+            last_token['end'] = token['end']
+            last_token['score'] = (last_token['score'] + token['score']) / 2
+        else:
+            # Otherwise, add the token to the list
+            merged_tokens.append(token)
+    return merged_tokens
 def ner(input):
     output = get_completion(input)
+    merged_tokens = merge_tokens(output)
+    return {"text": input, "entities": merged_tokens}
 gr.close_all()
 demo = gr.Interface(fn=ner,