File size: 959 Bytes
63c6bf0
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
llm_math_reasoning/
โ”‚
โ”œโ”€โ”€ data/                    # ๅญ˜ๆ”พMATH-500, GSM8K, AIME 2024ๆ•ฐๆฎ้›†
โ”‚   โ”œโ”€โ”€ load_data.py
โ”‚   โ”œโ”€โ”€ MATH-500.json
โ”‚   โ”œโ”€โ”€ GSM8K_test.json
โ”‚   โ””โ”€โ”€ AIME_2024.json
โ”‚
โ”œโ”€โ”€ prompts/                 # ๅ„็งpromptๆ–นๆณ•ๅฎšไน‰
โ”‚   โ”œโ”€โ”€ cot.py
โ”‚   โ”œโ”€โ”€ self_refine.py
โ”‚   โ””โ”€โ”€ self_consistency.py
โ”‚
โ”œโ”€โ”€ models/                  # ๅฐ่ฃ…่ฐƒ็”จQwen2.5ๅ’ŒDeepSeek
โ”‚   โ”œโ”€โ”€ qwen2_5_math.py
โ”‚   โ””โ”€โ”€ deepseek_qwen.py
โ”‚
โ”œโ”€โ”€ evaluation/              # ็ฒพๅบฆๅ’Œๅ“ๅบ”้•ฟๅบฆ็ญ‰่ฏ„ไผฐๆŒ‡ๆ ‡
โ”‚   โ””โ”€โ”€ metrics.py
โ”‚
โ”œโ”€โ”€ results/                 # ไฟๅญ˜่ฟ่กŒ็ป“ๆžœๅ’Œๆ—ฅๅฟ—
โ”‚
โ”œโ”€โ”€ utils/                   # ่ฟ่กŒ่ฟ‡็จ‹ๆ—ฅๅฟ—่ฎฐๅฝ•
โ”‚   โ””โ”€โ”€ logger.py
โ”‚
โ”œโ”€โ”€ analysis/                # ๆ•ฐๆฎๅˆ†ๆžไธŽๅฏ่ง†ๅŒ–่„šๆœฌ
โ”‚   โ””โ”€โ”€ visualize.py
โ”‚
โ”œโ”€โ”€ run_all.py               # ่ฟ่กŒๆ–‡ไปถ
โ””โ”€โ”€ README.md