llm_math_reasoning / readme.md
MingLi
code
63c6bf0

llm_math_reasoning/ โ”‚ โ”œโ”€โ”€ data/ # ๅญ˜ๆ”พMATH-500, GSM8K, AIME 2024ๆ•ฐๆฎ้›† โ”‚ โ”œโ”€โ”€ load_data.py โ”‚ โ”œโ”€โ”€ MATH-500.json โ”‚ โ”œโ”€โ”€ GSM8K_test.json โ”‚ โ””โ”€โ”€ AIME_2024.json โ”‚ โ”œโ”€โ”€ prompts/ # ๅ„็งpromptๆ–นๆณ•ๅฎšไน‰ โ”‚ โ”œโ”€โ”€ cot.py โ”‚ โ”œโ”€โ”€ self_refine.py โ”‚ โ””โ”€โ”€ self_consistency.py โ”‚ โ”œโ”€โ”€ models/ # ๅฐ่ฃ…่ฐƒ็”จQwen2.5ๅ’ŒDeepSeek โ”‚ โ”œโ”€โ”€ qwen2_5_math.py โ”‚ โ””โ”€โ”€ deepseek_qwen.py โ”‚ โ”œโ”€โ”€ evaluation/ # ็ฒพๅบฆๅ’Œๅ“ๅบ”้•ฟๅบฆ็ญ‰่ฏ„ไผฐๆŒ‡ๆ ‡ โ”‚ โ””โ”€โ”€ metrics.py โ”‚ โ”œโ”€โ”€ results/ # ไฟๅญ˜่ฟ่กŒ็ป“ๆžœๅ’Œๆ—ฅๅฟ— โ”‚ โ”œโ”€โ”€ utils/ # ่ฟ่กŒ่ฟ‡็จ‹ๆ—ฅๅฟ—่ฎฐๅฝ• โ”‚ โ””โ”€โ”€ logger.py โ”‚ โ”œโ”€โ”€ analysis/ # ๆ•ฐๆฎๅˆ†ๆžไธŽๅฏ่ง†ๅŒ–่„šๆœฌ โ”‚ โ””โ”€โ”€ visualize.py โ”‚ โ”œโ”€โ”€ run_all.py # ่ฟ่กŒๆ–‡ไปถ โ””โ”€โ”€ README.md