|
llm_math_reasoning/ |
|
โ |
|
โโโ data/ # ๅญๆพMATH-500, GSM8K, AIME 2024ๆฐๆฎ้ |
|
โ โโโ load_data.py |
|
โ โโโ MATH-500.json |
|
โ โโโ GSM8K_test.json |
|
โ โโโ AIME_2024.json |
|
โ |
|
โโโ prompts/ # ๅ็งpromptๆนๆณๅฎไน |
|
โ โโโ cot.py |
|
โ โโโ self_refine.py |
|
โ โโโ self_consistency.py |
|
โ |
|
โโโ models/ # ๅฐ่ฃ
่ฐ็จQwen2.5ๅDeepSeek |
|
โ โโโ qwen2_5_math.py |
|
โ โโโ deepseek_qwen.py |
|
โ |
|
โโโ evaluation/ # ็ฒพๅบฆๅๅๅบ้ฟๅบฆ็ญ่ฏไผฐๆๆ |
|
โ โโโ metrics.py |
|
โ |
|
โโโ results/ # ไฟๅญ่ฟ่ก็ปๆๅๆฅๅฟ |
|
โ |
|
โโโ utils/ # ่ฟ่ก่ฟ็จๆฅๅฟ่ฎฐๅฝ |
|
โ โโโ logger.py |
|
โ |
|
โโโ analysis/ # ๆฐๆฎๅๆไธๅฏ่งๅ่ๆฌ |
|
โ โโโ visualize.py |
|
โ |
|
โโโ run_all.py # ่ฟ่กๆไปถ |
|
โโโ README.md |
|
|