Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2412.09871

Papers - Embeddings - Text - Byte - Hash ngrams

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published Dec 13, 2024 • 88

Papers - Attention - Block Causal

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published Dec 13, 2024 • 88

Papers - Tokenizers - Bytes - Incremental Patching

Note: BPE does not handle incremental patching like BLT

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published Dec 13, 2024 • 88

Papers - Tokenizers- Bytes - Entropy Patching - Threshold

Helps with finding the end of the byte patch

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published Dec 13, 2024 • 88

Papers - Tokenizers - Bytes - Space - First Char - Patch Len

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published Dec 13, 2024 • 88

Papers - Tokenizers - Bytes - Patches - Space Detection

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published Dec 13, 2024 • 88

Papers - Tokenizers - Bytes - Patches - Entropy-based

Patch start detected by entropy crossing a threshold

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published Dec 13, 2024 • 88

Papers - Tokenizers - Bytes - Strided Patches - MegaByte

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published Dec 13, 2024 • 88

Papers - Text - Tokenizer - Bytes - Strided Patches

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published Dec 13, 2024 • 88

Papers - Training Research - Bytes - No Vocabulary

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published Dec 13, 2024 • 88

Previous
1
2
3
4
5
6
...
9
Next

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs