PhillnetLargeQuantized / tokenizer_config.json

Upload 6 files

e311507 verified 7 months ago

5.8 kB

	{
	"add_prefix_space": false,
	"added_tokens_decoder": {
	"11274": {
	"content": "good",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"26209": {
	"content": "response",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"34191": {
	"content": "happy",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"38986": {
	"content": "environment",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"50256": {
	"content": "<\|endoftext\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"50257": {
	"content": "<\|pad\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"50258": {
	"content": "<bos>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"50259": {
	"content": "<eos>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"50260": {
	"content": "<pad>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"50261": {
	"content": "<unk>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"50262": {
	"content": "<sep>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"50263": {
	"content": "<cls>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"50264": {
	"content": "<mask>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"50265": {
	"content": "<greeting>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"50266": {
	"content": "<farewell>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"50267": {
	"content": "<thank>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"50268": {
	"content": "<apology>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"50269": {
	"content": "[PAD]",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"50270": {
	"content": "intelligent",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"50271": {
	"content": "amazeballs",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"50272": {
	"content": "cryptocurrency",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"50273": {
	"content": "webinar",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"50274": {
	"content": "vlog",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"50275": {
	"content": "upcycle",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"50276": {
	"content": "photobomb",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"50277": {
	"content": "facepalm",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"50278": {
	"content": "crowdfunding",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"50279": {
	"content": "bromance",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"50280": {
	"content": "hangry",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	}
	},
	"additional_special_tokens": [
	"<\|endoftext\|>",
	"<\|pad\|>",
	"<bos>",
	"<eos>",
	"<pad>",
	"<unk>",
	"<sep>",
	"<cls>",
	"<mask>",
	"<greeting>",
	"<farewell>",
	"<thank>",
	"<apology>"
	],
	"bos_token": "<bos>",
	"clean_up_tokenization_spaces": true,
	"cls_token": "<cls>",
	"eos_token": "<eos>",
	"mask_token": "<mask>",
	"max_length": 1024,
	"model_max_length": 1024,
	"pad_to_multiple_of": null,
	"pad_token": "<eos>",
	"pad_token_type_id": 0,
	"padding_side": "right",
	"sep_token": "<sep>",
	"stride": 0,
	"tokenizer_class": "GPT2Tokenizer",
	"truncation_side": "right",
	"truncation_strategy": "longest_first",
	"unk_token": "<unk>"
	}