Spaces:

jackbielinski
/

dan_AI

Runtime error

dan_AI / train /data.py

Jack Bielinski

ed390c4 over 1 year ago

353 Bytes

	from datasets import load_dataset
	from transformers import tokenizer

	# Load a dataset from a csv file
	dataset = load_dataset('csv', data_files='data.csv')

	# Tokenize the text
	def tokenize_function(examples):
	return tokenizer(examples["text"], padding="max_length", truncation=True)

	tokenized_dataset = dataset.map(tokenize_function, batched=True)