Optimum Neuron Distributed

The optimum.neuron.distributed module provides a set of tools to perform distributed training and inference.

Parallelization

Selecting Model-Specific Parallelizer Classes

Each model that supports parallelization in optimum-neuron has its own derived Parallelizer class. The factory class ParallelizersManager allows you to retrieve such model-specific Parallelizers easily.

class optimum.neuron.distributed.ParallelizersManager

< source >

( )

get_supported_model_types

< source >

( )

Provides the list of supported model types for parallelization.

is_model_supported

< source >

( model_type_or_model: typing.Union[str, transformers.modeling_utils.PreTrainedModel, optimum.neuron.distributed.utils.NeuronPeftModel] )

Parameters

model_type_or_model (Union[str, PreTrainedModel]) — Either the model type or an instance of the model.

Returns a tuple of 3 booleans where:

The first element indicates if tensor parallelism can be used for this model,
The second element indicates if sequence parallelism can be used on top of tensor parallelism for this model,
The third element indicates if pipeline parallelism can be used for this model.

parallelizer_for_model

< source >

( model_type_or_model: typing.Union[str, transformers.modeling_utils.PreTrainedModel, optimum.neuron.distributed.utils.NeuronPeftModel] )

Parameters

model_type_or_model (Union[str, PreTrainedModel]) — Either the model type or an instance of the model.

Returns the parallelizer class associated to the model.

Utils

Lazy Loading

Distributed training / inference is usually needed when the model is too big to fit in one device. Tools that allow for lazy loading of optimizer states are thus needed to avoid going out-of-memory before parallelization.

optimum.neuron.distributed.make_optimizer_constructor_lazy

< source >

( optimizer_cls: typing.Type[ForwardRef('torch.optim.Optimizer')] )

Transforms an optimizer constructor (optimizer class) to make it lazy by not initializing the parameters. This makes the optimizer lightweight and usable to create a “real” optimizer once the model has been parallelized.

AWS Trainium & Inferentia

Optimum Neuron Distributed

Parallelization

Selecting Model-Specific Parallelizer Classes

class optimum.neuron.distributed.ParallelizersManager

get_supported_model_types

is_model_supported

parallelizer_for_model

Utils

Lazy Loading

optimum.neuron.distributed.make_optimizer_constructor_lazy