Embeddings - last_hidden_state vs hidden_state[-1]

#76

by technicalanalyst - opened Mar 25

Discussion

technicalanalyst

Mar 25

last_hidden_state is not the same as hidden_state[-1]. Is this due to some normalisation?

text = "I am going home today."
inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)

with torch.no_grad():
outputs = model(**inputs, output_hidden_states=True)

last_hidden_state_1 = outputs.last_hidden_state # Directly from outputs
last_hidden_state_2 = outputs.hidden_states[-1] # Last layer from hidden_states tuple

are_equal = torch.allclose(last_hidden_state_1, last_hidden_state_2, atol=1e-6)

technicalanalyst changed discussion status to closed Mar 25

technicalanalyst changed discussion status to open Mar 25

technicalanalyst

Mar 27

•

edited Mar 27

text = "I am going home today."
inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)

with torch.no_grad():
   outputs = model(**inputs, output_hidden_states=True)

last_hidden_state_1 = outputs.last_hidden_state # Directly from outputs
last_hidden_state_2 = outputs.hidden_states[-1] # Last layer from hidden_states tuple

are_equal = torch.allclose(last_hidden_state_1, last_hidden_state_2, atol=1e-6)

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment