llm_math_reasoning / readme.md
MingLi
code
63c6bf0
llm_math_reasoning/
โ”‚
โ”œโ”€โ”€ data/ # ๅญ˜ๆ”พMATH-500, GSM8K, AIME 2024ๆ•ฐๆฎ้›†
โ”‚ โ”œโ”€โ”€ load_data.py
โ”‚ โ”œโ”€โ”€ MATH-500.json
โ”‚ โ”œโ”€โ”€ GSM8K_test.json
โ”‚ โ””โ”€โ”€ AIME_2024.json
โ”‚
โ”œโ”€โ”€ prompts/ # ๅ„็งpromptๆ–นๆณ•ๅฎšไน‰
โ”‚ โ”œโ”€โ”€ cot.py
โ”‚ โ”œโ”€โ”€ self_refine.py
โ”‚ โ””โ”€โ”€ self_consistency.py
โ”‚
โ”œโ”€โ”€ models/ # ๅฐ่ฃ…่ฐƒ็”จQwen2.5ๅ’ŒDeepSeek
โ”‚ โ”œโ”€โ”€ qwen2_5_math.py
โ”‚ โ””โ”€โ”€ deepseek_qwen.py
โ”‚
โ”œโ”€โ”€ evaluation/ # ็ฒพๅบฆๅ’Œๅ“ๅบ”้•ฟๅบฆ็ญ‰่ฏ„ไผฐๆŒ‡ๆ ‡
โ”‚ โ””โ”€โ”€ metrics.py
โ”‚
โ”œโ”€โ”€ results/ # ไฟๅญ˜่ฟ่กŒ็ป“ๆžœๅ’Œๆ—ฅๅฟ—
โ”‚
โ”œโ”€โ”€ utils/ # ่ฟ่กŒ่ฟ‡็จ‹ๆ—ฅๅฟ—่ฎฐๅฝ•
โ”‚ โ””โ”€โ”€ logger.py
โ”‚
โ”œโ”€โ”€ analysis/ # ๆ•ฐๆฎๅˆ†ๆžไธŽๅฏ่ง†ๅŒ–่„šๆœฌ
โ”‚ โ””โ”€โ”€ visualize.py
โ”‚
โ”œโ”€โ”€ run_all.py # ่ฟ่กŒๆ–‡ไปถ
โ””โ”€โ”€ README.md