Spaces:

somosnlp
/

SpanishMedicaLLM

Runtime error

inoid commited on Mar 30, 2024

Commit

97392da

1 Parent(s): f577be4

Add appy_chat_template process

Files changed (1) hide show

spanish_medica_llm.py CHANGED Viewed

@@ -702,6 +702,7 @@ def run_finnetuning_process():
     os.environ['WANDB_DISABLED'] = 'true'
     tokenizer = loadSpanishTokenizer()
     medicalSpanishDataset = applyChatInstructFormat( loadSpanishDatasetFinnetuning())
     medicalSpanishDataset = medicalSpanishDataset.train_test_split(0.2, seed=203984)
     train_dataset, eval_dataset, test_dataset = splitDatasetInTestValid(  medicalSpanishDataset )
@@ -710,4 +711,6 @@ def run_finnetuning_process():
     print('Dataset in One ')
     print (train_dataset[5])
     configAndRunFineTuning(base_model,train_dataset, eval_dataset, tokenizer)

     os.environ['WANDB_DISABLED'] = 'true'
     tokenizer = loadSpanishTokenizer()
     medicalSpanishDataset = applyChatInstructFormat( loadSpanishDatasetFinnetuning())
+    medicalSpanishDataset = tokenizer.apply_chat_template(medicalSpanishDataset, tokenize=False)
     medicalSpanishDataset = medicalSpanishDataset.train_test_split(0.2, seed=203984)
     train_dataset, eval_dataset, test_dataset = splitDatasetInTestValid(  medicalSpanishDataset )
     print('Dataset in One ')
     print (train_dataset[5])
     configAndRunFineTuning(base_model,train_dataset, eval_dataset, tokenizer)
+def generate_response(query):