rkdaldus commited on
Commit
66c9e9d
ยท
verified ยท
1 Parent(s): bc8f994

Upload README.md with huggingface_hub

Browse files
Files changed (1) hide show
  1. README.md +70 -0
README.md ADDED
@@ -0,0 +1,70 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+
2
+ # CNN ๊ธฐ๋ฐ˜ ์Œ์•… ๊ฐ์ • ๋ถ„๋ฅ˜๊ธฐ ๐ŸŽต
3
+
4
+ ## ๊ฐœ์š”
5
+
6
+ ์ด ๋ชจ๋ธ์€ ์Œ์•…์ด ์ „๋‹ฌํ•˜๋Š” ๊ฐ์ •์„ Convolutional Neural Network (CNN) ์•„ํ‚คํ…์ฒ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ถ„๋ฅ˜ํ•ฉ๋‹ˆ๋‹ค.
7
+ ๋ชจ๋ธ์€ ์Œ์•… ์ƒ˜ํ”Œ๋กœ ๊ตฌ์„ฑ๋œ ๋ฐ์ดํ„ฐ์…‹์—์„œ ๊ฐ์ • ๋ฒ”์ฃผ(Angry, Fear, Happy, Tender, Sad) ์ค‘ ํ•˜๋‚˜๋กœ ๋ผ๋ฒจ๋ง๋œ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค.
8
+
9
+ ๋ชจ๋ธ์€ ์˜ค๋””์˜ค ๋ฐ์ดํ„ฐ๋ฅผ Mel-spectrogram์œผ๋กœ ๋ณ€ํ™˜ํ•œ ํ›„, CNN ๋ ˆ์ด์–ด๋ฅผ ํ†ตํ•ด ์Œ์•…์—์„œ ๊ฐ์ • ์ƒํƒœ์™€ ๊ด€๋ จ๋œ ํŒจํ„ด์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.
10
+
11
+ ### ์ฃผ์š” ๊ธฐ๋Šฅ:
12
+ - **์ž…๋ ฅ**: Mel-spectrogram์œผ๋กœ ๋ณ€ํ™˜๋œ 5์ดˆ ๊ธธ์ด์˜ ์˜ค๋””์˜ค ์„ธ๊ทธ๋จผํŠธ
13
+ - **์ถœ๋ ฅ**: ๋‹ค์Œ ๊ฐ์ • ์ค‘ ํ•˜๋‚˜
14
+ - Angry (0)
15
+ - Fear (1)
16
+ - Happy (2)
17
+ - Tender (3)
18
+ - Sad (4)
19
+
20
+ - **์•„ํ‚คํ…์ฒ˜**: 3๊ฐœ์˜ ์ปจ๋ณผ๋ฃจ์…˜ ๋ ˆ์ด์–ด์™€ ์™„์ „ ์—ฐ๊ฒฐ์ธต์œผ๋กœ ๊ตฌ์„ฑ๋œ CNN ๋ชจ๋ธ
21
+
22
+ ## ๋ฐ์ดํ„ฐ์…‹
23
+
24
+ ์ด ๋ชจ๋ธ์€ ๋‘ ๊ฐ€์ง€ ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ•˜์—ฌ ํ•™์Šต๋˜์—ˆ์Šต๋‹ˆ๋‹ค:
25
+ 1. **MER_audio_taffc_dataset**: ์ด ๋ฐ์ดํ„ฐ์…‹์€ ํŠน์ • ์‚ฌ๋ถ„๋ฉด(Q1~Q4)์— ๋”ฐ๋ผ ๋ผ๋ฒจ๋ง๋œ ์Œ์•… ํŒŒ์ผ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค.
26
+ 2. **OSF_IO Dataset**: ๋˜ ๋‹ค๋ฅธ ์Œ์•… ํŒŒ์ผ ๋ฐ ๊ฐ์ • ๋ผ๋ฒจ๋กœ ๊ตฌ์„ฑ๋œ ๋ฐ์ดํ„ฐ์…‹์ž…๋‹ˆ๋‹ค.
27
+
28
+ ### ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ:
29
+ - ๊ฐ ์˜ค๋””์˜ค ํŒŒ์ผ์„ 5์ดˆ ๋‹จ์œ„๋กœ ๋ถ„ํ• 
30
+ - ๋ถ„ํ• ๋œ ์˜ค๋””์˜ค ์„ธ๊ทธ๋จผํŠธ๋ฅผ Mel-spectrogram์œผ๋กœ ๋ณ€ํ™˜
31
+ - ๋‘ ๋ฐ์ดํ„ฐ์…‹์„ ์„ž์–ด์„œ ํ•™์Šต ๋ฐ ๊ฒ€์ฆ์šฉ์œผ๋กœ ๋ณ‘ํ•ฉ
32
+
33
+ ## ๋ชจ๋ธ ์ƒ์„ธ ์ •๋ณด
34
+
35
+ ### ์•„ํ‚คํ…์ฒ˜:
36
+ - **์ปจ๋ณผ๋ฃจ์…˜ ๋ ˆ์ด์–ด**:
37
+ - Conv1: 32๊ฐœ์˜ ํ•„ํ„ฐ, ์ปค๋„ ํฌ๊ธฐ 3x3
38
+ - Conv2: 64๊ฐœ์˜ ํ•„ํ„ฐ, ์ปค๋„ ํฌ๊ธฐ 3x3
39
+ - Conv3: 128๊ฐœ์˜ ํ•„ํ„ฐ, ์ปค๋„ ํฌ๊ธฐ 3x3
40
+ - **ํ’€๋ง**: ๊ฐ ์ปจ๋ณผ๋ฃจ์…˜ ํ›„ MaxPooling ๋ ˆ์ด์–ด๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ฐจ์›์„ ์ถ•์†Œ
41
+ - **๋“œ๋กญ์•„์›ƒ**: ๋“œ๋กญ์•„์›ƒ ์ •๊ทœํ™”๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์˜ค๋ฒ„ํ”ผํŒ… ๋ฐฉ์ง€ (ํ™•๋ฅ  0.5)
42
+ - **์™„์ „ ์—ฐ๊ฒฐ์ธต**:
43
+ - ์ฒซ ๋ฒˆ์งธ FC ๋ ˆ์ด์–ด: 256 ์œ ๋‹›
44
+ - ์ถœ๋ ฅ ๋ ˆ์ด์–ด: 5๊ฐœ์˜ ์œ ๋‹› (5๊ฐœ์˜ ๊ฐ์ • ๋ฒ”์ฃผ)
45
+
46
+ ### ์†์‹ค ํ•จ์ˆ˜:
47
+ - **CrossEntropyLoss**: ๋‹ค์ค‘ ํด๋ž˜์Šค ๋ถ„๋ฅ˜๋ฅผ ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ
48
+
49
+ ### ์˜ตํ‹ฐ๋งˆ์ด์ €:
50
+ - **Adam**: ํ•™์Šต๋ฅ  1e-4๋กœ ์„ค์ •
51
+
52
+ ## ํ•™์Šต
53
+
54
+ ์ด ๋ชจ๋ธ์€ ๋ณ‘ํ•ฉ๋œ ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ•˜์—ฌ 10 ์—ํญ ๋™์•ˆ ํ•™์Šต๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ํ•™์Šต๊ณผ ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ ๋น„์œจ์€ 80:20์œผ๋กœ ๋‚˜๋ˆ„์–ด ๋ชจ๋ธ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค.
55
+
56
+ ๊ฒ€์ฆ ์ •ํ™•๋„๋ฅผ ๊ธฐ์ค€์œผ๋กœ ๊ฐ€์žฅ ์„ฑ๋Šฅ์ด ์ข‹์€ ๋ชจ๋ธ ์ฒดํฌํฌ์ธํŠธ๋ฅผ ์„ ํƒํ•˜์—ฌ ์ €์žฅํ•˜์˜€์Šต๋‹ˆ๋‹ค.
57
+
58
+ ## ์„ฑ๋Šฅ
59
+
60
+ - **์ตœ๊ณ  ๊ฒ€์ฆ ์ •ํ™•๋„**: ์—ฌ๋Ÿฌ ์—ํญ ๋™์•ˆ ํŠœ๋‹ํ•œ ๊ฒฐ๊ณผ, ์ตœ๊ณ  ๊ฒ€์ฆ ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.
61
+ - ์ตœ์ข… ๋ชจ๋ธ์€ ๋‹ค์–‘ํ•œ ์Œ์•… ์ƒ˜ํ”Œ์—์„œ ๊ฐ์ •์„ ์ธ์‹ํ•˜๋Š” ๋ฐ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์ž…๋‹ˆ๋‹ค.
62
+
63
+ ## ์‚ฌ์šฉ ๋ฐฉ๋ฒ•
64
+
65
+ ์ž์‹ ์˜ ์Œ์•… ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ์ • ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ฐ ์ด ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋ ค๋ฉด Hugging Face Hub์—์„œ ์ง์ ‘ ๋กœ๋“œํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค:
66
+
67
+ ```python
68
+ from transformers import AutoModel
69
+ model = AutoModel.from_pretrained("jeonghyeon97/music_emotion_classifier_4")
70
+ ```