index,model,run,accuracy,precision,recall,f1,ratio_valid_classifications 1,Llama3.1-8B (1.0-epoch),Llama3.1-8B (1.0-epoch),0.7853333333333333,0.8062405645226312,0.7853333333333333,0.7938991590982061,1.0 2,Llama3.1-70B (1.0-epoch),Llama3.1-70B (1.0-epoch),0.809,0.8282732906153989,0.809,0.8166997776775797,1.0 3,Mistral-7B (1.4-epoch),Mistral-7B (1.4-epoch),0.7616666666666667,0.789634957005121,0.7616666666666667,0.7721210086098353,1.0 4,InternLM2.5-7B (1.4-epoch),InternLM2.5-7B (1.4-epoch),0.762,0.8089123492151512,0.762,0.7753217972757948,1.0 5,InternLM2.5-7B-1M (0.8-epoch),InternLM2.5-7B-1M (0.8-epoch),0.8076666666666666,0.8048844422436796,0.8076666666666666,0.8049749805997191,1.0 6,InternLM2.5-20B (0.8-epoch),InternLM2.5-20B (0.8-epoch),0.8063333333333333,0.8207793607428686,0.8063333333333333,0.811239851005161,1.0 7,Qwen2.5-0.5B (1.4-epoch),Qwen2.5-0.5B (1.4-epoch),0.5903333333333334,0.6503049529377274,0.5903333333333334,0.6094397514027766,1.0 8,Qwen2.5-1.5B (1.4-epoch),Qwen2.5-1.5B (1.4-epoch),0.6493333333333333,0.7440287895607589,0.6493333333333333,0.6815314583590799,1.0 9,Qwen2.5-3B (1.4-epoch),Qwen2.5-3B (1.4-epoch),0.7326666666666667,0.7716369414239331,0.7326666666666667,0.7468182490858526,1.0 10,Qwen2.5-7B (1.0-epoch),Qwen2.5-7B (1.0-epoch),0.782,0.8023938029436536,0.782,0.7888740758699296,0.9993333333333333 11,Qwen2.5-72B (0.8-epoch),Qwen2.5-72B (0.8-epoch),0.8213333333333334,0.8447926258362122,0.8213333333333334,0.8299486611547571,1.0 12,gpt-4o-mini (0-shot),gpt-4o-mini (0-shot),0.7166666666666667,0.7800918028217227,0.7166666666666667,0.7260056154268697,1.0 13,gpt-4o (10-shot),gpt-4o (10-shot),0.8013333333333333,0.8246834383036209,0.8013333333333333,0.8098901724387172,0.9996666666666667 14,o1-mini (50-shot),o1-mini (50-shot),0.7536666666666667,0.7755130422727871,0.7536666666666667,0.7602241520634903,1.0 15,o1-preview (50-shot),o1-preview (50-shot),0.7576666666666667,0.7986597718440941,0.7576666666666667,0.7718331604189232,0.9996666666666667