File size: 13,879 Bytes
dcd94af
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
---
base_model: mini1013/master_domain
library_name: setfit
metrics:
- metric
pipeline_tag: text-classification
tags:
- setfit
- sentence-transformers
- text-classification
- generated_from_setfit_trainer
widget:
- text: MLB [MLB] 루키 언스트럭쳐 볼캡 24 택1 203993 선택 20) 3ACP7701N-07ORL_F 위드홀리투
- text: 남여공용 기본군모 4컬러 EVE 카키 에브리씽굿
- text: 골덴와이어버킷햇(T)7252 브라운 모티브코리아
- text: 패션울벙거지97 베이지 디플코리아 (Digital Plus Korea)
- text: '[닥스](강남점)DBHE4EL01W2 브라운 체크 면 헌팅캡  신세계백화점'
inference: true
model-index:
- name: SetFit with mini1013/master_domain
  results:
  - task:
      type: text-classification
      name: Text Classification
    dataset:
      name: Unknown
      type: unknown
      split: test
    metrics:
    - type: metric
      value: 0.8489339496048904
      name: Metric
---

# SetFit with mini1013/master_domain

This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [mini1013/master_domain](https://huggingface.co/mini1013/master_domain) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning.
2. Training a classification head with features from the fine-tuned Sentence Transformer.

## Model Details

### Model Description
- **Model Type:** SetFit
- **Sentence Transformer body:** [mini1013/master_domain](https://huggingface.co/mini1013/master_domain)
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
- **Maximum Sequence Length:** 512 tokens
- **Number of Classes:** 13 classes
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->

### Model Sources

- **Repository:** [SetFit on GitHub](https://github.com/huggingface/setfit)
- **Paper:** [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055)
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)

### Model Labels
| Label | Examples                                                                                                                                                                                                                                                  |
|:------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 10.0  | <ul><li>'밀로 [Exclusive] Holiday Signature Ball Cap (20Colors) MINT GRAY 포챌린지'</li><li>'(골라) 남녀공용 (GL)CONTRAST STITCHED CAP (3 COLOR) WW9G3SAAC101 연핑크_FRE '</li><li>'밀로 [Exclusive] Holiday Signature Ball Cap (20Colors) STONE BLACK 포챌린지'</li></ul>     |
| 4.0   | <ul><li>'꽈배기 비니 모자 두꺼운 골무 털 뜨개 여성 겨울 캡 알파카 남자 커플 니트 주황색_S(아이 32-52 cm) 앤디일레븐'</li><li>'패션모자 방한 남자 니트 후드 겨울 장갑 가을 워머 도톰한 3종세트 기모 블랙 마이클로드'</li><li>'털모자 따뜻한 낚시 모자 아빠 중년남성 노인 겨울 옵션06 에스앤지샵'</li></ul>                                                      |
| 7.0   | <ul><li>'[하프클럽/구김스]구김스 모자(스포츠/등산/여행/방수) BEST 7종 균일가 763_블랙_D type 하프클럽'</li><li>'캉골 아웃도어 액티비티 버켓 4480 에크루 M AK플라자1관'</li><li>'[벤시몽](신세계센텀점)[23FW] WINTER BUCKET HAT - 2color NAVY_FREE 주식회사 에스에스지닷컴'</li></ul>                                            |
| 3.0   | <ul><li>'고탄성 부드러운 메쉬 원단 운동야외활동 스카프 두건 연그레이 드림픽쳐스'</li><li>'[로스코]반다나 스카프 헤어밴드 페이즐리 손수건 OLIVE DRAB_4051/Freesize 패션플러스'</li><li>'페이즐리 반다나 헤어 머리두건 비 손수건 스카프 그린 보물삼'</li></ul>                                                                               |
| 1.0   | <ul><li>'방한모자2종 귀달이 털모자 군밤 스키 용품 트래퍼햇 마스크 캡방한모자 01.불구덩이군방모자 제이케이 아트 갤러리'</li><li>'[MLB] 패딩 트루퍼 귀달이 햇(3AWMPH136-50BKS) 블랙-50BKS/59H 에이케이에스앤디(주) AK플라자 평택점'</li><li>'겨울 곰돌이 후드 귀달이 모자 목돌이 동물 털모자 05.브라운 석진케이 주식회사'</li></ul>                                |
| 9.0   | <ul><li>'스냅백 패션모자 snapback (투톤)그레이오렌지 루나마켓'</li><li>'스냅백 패션모자 snapback 레드 루나마켓'</li><li>'공용 메탈 원포인트 스냅백 뉴욕양키스 (32CP57111-50L)  '</li></ul>                                                                                                                |
| 0.0   | <ul><li>'기본 군모 버킷햇 밀리터리 여자 빈티지군모 모자 남자 버캣햇 블랙 카키 / FREE 체인지비'</li><li>'빈티지 워싱 느낌 영문 레터링 장식 포인트 엣지 군모 그레이 (주)오너클랜'</li><li>'질좋은 군모 모자(차콜/국내생산) 네이비 프리마켓'</li></ul>                                                                                         |
| 2.0   | <ul><li>'여자 겨울템 따뜻 극세사 양털곰돌이머리띠 귀마개 A24973_베이지_FREE 세븐제이스(7JS)'</li><li>'양털 곰돌이귀마개 귀도리 뽀글이 귀마개 방한귀마개 목도리 화이트 현성마켓'</li><li>'스타일 더하기-36-꽈배기방한귀마개 핑크 이미연'</li></ul>                                                                                         |
| 6.0   | <ul><li>'국내발송 MARITHE FRANCOIS GIRBAUD 마리떼 CABLE KNIT BEANIE blue 1MG23SHG112 ONE SIZE 씨이랩'</li><li>'[매장발송] 마리떼 CLASSIC LOGO BEANIE black OS 와이에스마켓'</li><li>'MARITHE FRANCOIS GIRBAUD CABLE KNIT BEANIE gray 1MG23SHG112 227185 ONE SIZE 원플렉스'</li></ul> |
| 8.0   | <ul><li>'비앙카 BIANCA (여성용) 누가/내추럴로고_OS '</li><li>'[롯데백화점]화이트샌즈 공용 UV 프로텍션 바이저 소니아 2.아이보리 롯데백화점_'</li><li>'화이트샌즈 소니아 UV 프로텍션 썬바이저 1종 [00003] 아이보리 현대홈쇼핑'</li></ul>                                                                                          |
| 12.0  | <ul><li>'캉골 헌팅캡 울 플렉스핏 504 K0873 심리스 울 507 K0875 3107 남녀공용 베레모 3. K3107ST (Black)_SMALL 어썸우즈'</li><li>'다용도 활용 직원 종업원 단체 패션 모자 헌팅캡 화이트 가온'</li><li>'앨리 카페 바리스타 모자 베이커 캡 마도로스햇[루즈루나주얼리] 블랙 주식회사 웹이즈'</li></ul>                                              |
| 11.0  | <ul><li>'1631뉴욕 볼캡 6color / 남녀공용모자 캡모자 그린 레이어드컴퍼니'</li><li>'패션벙거지0009 벙거지 가을 모자 여성 패션 밤색 골드코스트'</li><li>'꽈배기니트벙거지모자B28016 검정 프레임바이브'</li></ul>                                                                                                            |
| 5.0   | <ul><li>'니트 베레모 S1450 진주방울 핑크 지에이치글로벌'</li><li>'[박민영, 라이즈 원빈 착용] 스터드 로고 울 베레모 블랙  '</li><li>'/ 베이직 레더 뉴스보이캡 빵모자 (2color) 아이보리_one size 롭스(robs)'</li></ul>                                                                                                |

## Evaluation

### Metrics
| Label   | Metric |
|:--------|:-------|
| **all** | 0.8489 |

## Uses

### Direct Use for Inference

First install the SetFit library:

```bash
pip install setfit
```

Then you can load this model and run inference.

```python
from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_ac2")
# Run inference
preds = model("남여공용 기본군모 4컬러 EVE 카키 에브리씽굿")
```

<!--
### Downstream Use

*List how someone could finetune this model on their own dataset.*
-->

<!--
### Out-of-Scope Use

*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->

<!--
## Bias, Risks and Limitations

*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->

<!--
### Recommendations

*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->

## Training Details

### Training Set Metrics
| Training set | Min | Median | Max |
|:-------------|:----|:-------|:----|
| Word count   | 3   | 9.5523 | 21  |

| Label | Training Sample Count |
|:------|:----------------------|
| 0.0   | 50                    |
| 1.0   | 50                    |
| 2.0   | 50                    |
| 3.0   | 50                    |
| 4.0   | 50                    |
| 5.0   | 50                    |
| 6.0   | 50                    |
| 7.0   | 50                    |
| 8.0   | 50                    |
| 9.0   | 50                    |
| 10.0  | 50                    |
| 11.0  | 50                    |
| 12.0  | 50                    |

### Training Hyperparameters
- batch_size: (512, 512)
- num_epochs: (20, 20)
- max_steps: -1
- sampling_strategy: oversampling
- num_iterations: 40
- body_learning_rate: (2e-05, 2e-05)
- head_learning_rate: 2e-05
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False

### Training Results
| Epoch   | Step | Training Loss | Validation Loss |
|:-------:|:----:|:-------------:|:---------------:|
| 0.0098  | 1    | 0.4348        | -               |
| 0.4902  | 50   | 0.3427        | -               |
| 0.9804  | 100  | 0.1921        | -               |
| 1.4706  | 150  | 0.1061        | -               |
| 1.9608  | 200  | 0.0544        | -               |
| 2.4510  | 250  | 0.0384        | -               |
| 2.9412  | 300  | 0.0155        | -               |
| 3.4314  | 350  | 0.0128        | -               |
| 3.9216  | 400  | 0.0177        | -               |
| 4.4118  | 450  | 0.0082        | -               |
| 4.9020  | 500  | 0.005         | -               |
| 5.3922  | 550  | 0.0007        | -               |
| 5.8824  | 600  | 0.0004        | -               |
| 6.3725  | 650  | 0.0003        | -               |
| 6.8627  | 700  | 0.0003        | -               |
| 7.3529  | 750  | 0.0003        | -               |
| 7.8431  | 800  | 0.0003        | -               |
| 8.3333  | 850  | 0.0003        | -               |
| 8.8235  | 900  | 0.0002        | -               |
| 9.3137  | 950  | 0.0002        | -               |
| 9.8039  | 1000 | 0.0001        | -               |
| 10.2941 | 1050 | 0.0001        | -               |
| 10.7843 | 1100 | 0.0001        | -               |
| 11.2745 | 1150 | 0.0001        | -               |
| 11.7647 | 1200 | 0.0001        | -               |
| 12.2549 | 1250 | 0.0001        | -               |
| 12.7451 | 1300 | 0.0001        | -               |
| 13.2353 | 1350 | 0.0001        | -               |
| 13.7255 | 1400 | 0.0001        | -               |
| 14.2157 | 1450 | 0.0001        | -               |
| 14.7059 | 1500 | 0.0001        | -               |
| 15.1961 | 1550 | 0.0001        | -               |
| 15.6863 | 1600 | 0.0001        | -               |
| 16.1765 | 1650 | 0.0001        | -               |
| 16.6667 | 1700 | 0.0001        | -               |
| 17.1569 | 1750 | 0.0001        | -               |
| 17.6471 | 1800 | 0.0001        | -               |
| 18.1373 | 1850 | 0.0001        | -               |
| 18.6275 | 1900 | 0.0001        | -               |
| 19.1176 | 1950 | 0.0001        | -               |
| 19.6078 | 2000 | 0.0001        | -               |

### Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0.dev0
- Sentence Transformers: 3.1.1
- Transformers: 4.46.1
- PyTorch: 2.4.0+cu121
- Datasets: 2.20.0
- Tokenizers: 0.20.0

## Citation

### BibTeX
```bibtex
@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
```

<!--
## Glossary

*Clearly define terms in order to be accessible across audiences.*
-->

<!--
## Model Card Authors

*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->

<!--
## Model Card Contact

*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->