Neuronx model for BAAI/bge-base-en-v1.5

This repository contains are AWS Inferentia2 and neuronx compatible checkpoint for BAAI/bge-base-en-v1.5. You can find detailed information about the base model on its Model Card.

Usage on Amazon SageMaker

coming soon

Usage with optimum-neuron


from optimum.neuron import NeuronModelForFeatureExtraction
from transformers import AutoTokenizer
import torch
import torch_neuronx

# Load Model from Hugging Face repository
model = NeuronModelForFeatureExtraction.from_pretrained("aws-neuron/bge-base-en-v1-5-seqlen-384-bs-1")
tokenizer = AutoTokenizer.from_pretrained("aws-neuron/bge-base-en-v1-5-seqlen-384-bs-1")

# sentence input
inputs = "Hello, my dog is cute"

# Tokenize sentences
encoded_input = tokenizer(inputs,return_tensors="pt",truncation=True,max_length=model.config.neuron["static_sequence_length"])

# Compute embeddings
with torch.no_grad():
    model_output = model(*tuple(encoded_input.values()))

# Perform pooling. In this case, cls pooling.
sentence_embeddings = model_output[0][:, 0]
# normalize embeddings
sentence_embeddings = torch.nn.functional.normalize(sentence_embeddings, p=2, dim=1)

input_shapes

{
  "sequence_length": 384,
  "batch_size": 1
}

Evaluation results

accuracy on MTEB AmazonCounterfactualClassification (en)

test set self-reported

76.149

ap on MTEB AmazonCounterfactualClassification (en)

test set self-reported

39.323

f1 on MTEB AmazonCounterfactualClassification (en)

test set self-reported

70.169

accuracy on MTEB AmazonPolarityClassification

test set self-reported

93.387

ap on MTEB AmazonPolarityClassification

test set self-reported

90.213

f1 on MTEB AmazonPolarityClassification

test set self-reported

93.377

accuracy on MTEB AmazonReviewsClassification (en)

test set self-reported

48.846

f1 on MTEB AmazonReviewsClassification (en)

test set self-reported

48.146

map_at_1 on MTEB ArguAna

test set self-reported

40.754

map_at_10 on MTEB ArguAna

test set self-reported

55.761

aws-neuron
/

bge-base-en-v1-5-seqlen-384-bs-1

Neuronx model for BAAI/bge-base-en-v1.5

Usage on Amazon SageMaker

Usage with optimum-neuron

Spaces using aws-neuron/bge-base-en-v1-5-seqlen-384-bs-1 11

Evaluation results