Spaces:

osiria
/

classifier-zero-shot-italian

Sleeping

osiria commited on Aug 22, 2023

Commit

5a35bf2

1 Parent(s): fbef3bb

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -53,12 +53,12 @@ def classify(text, classes, prompt = "L'argomento di cui parliamo è quindi: "):
     classes = {el.split(":")[0].strip(): el.split(":")[1].strip() for el in classes.split("\n")}
-    t_vec = model_cl(tokenizer_cl.encode(text, return_tensors = "pt")).last_hidden_state[0,0,:].cpu().detach().numpy()
     t_vec = t_vec/np.linalg.norm(t_vec)
     t_vec = t_vec.reshape(-1, 1)
     classes_mod = [prompt + re.sub("\s+", " ", classes[cl].lower().replace(",", " ")).strip() for cl in classes]
-    cl_vecs = np.array([model_cl(tokenizer_cl.encode(cl, return_tensors = "pt")).last_hidden_state[0,0,:].cpu().detach().numpy() for cl in classes_mod])
     cl_vecs = cl_vecs/np.sqrt(np.sum(cl_vecs**2, axis = 1).reshape(-1,1))
     scores = np.dot(cl_vecs, t_vec).reshape(1,-1)[0]

     classes = {el.split(":")[0].strip(): el.split(":")[1].strip() for el in classes.split("\n")}
+    t_vec = model_cl(tokenizer_cl.encode(text, return_tensors = "pt", truncation = True, max_length = 512)).last_hidden_state[0,0,:].cpu().detach().numpy()
     t_vec = t_vec/np.linalg.norm(t_vec)
     t_vec = t_vec.reshape(-1, 1)
     classes_mod = [prompt + re.sub("\s+", " ", classes[cl].lower().replace(",", " ")).strip() for cl in classes]
+    cl_vecs = np.array([model_cl(tokenizer_cl.encode(cl, return_tensors = "pt", truncation = True, max_length = 512)).last_hidden_state[0,0,:].cpu().detach().numpy() for cl in classes_mod])
     cl_vecs = cl_vecs/np.sqrt(np.sum(cl_vecs**2, axis = 1).reshape(-1,1))
     scores = np.dot(cl_vecs, t_vec).reshape(1,-1)[0]