hongyin
/

chat-llama2-70b-4bit

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

chat-llama2-70b-4bit / tokenizer.json

Commit History

Upload 9 files

cb6bb81

hongyin commited on Nov 18, 2023