File size: 14,574 Bytes
c541fbd
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
---
base_model: mini1013/master_domain
library_name: setfit
metrics:
- metric
pipeline_tag: text-classification
tags:
- setfit
- sentence-transformers
- text-classification
- generated_from_setfit_trainer
widget:
- text: 1+1 세트상품 푸쉬팝게임기 팝잇 푸시팝 뽁뽁이 게임기 스피드킹 토끼 곰돌이 우주인게임기_병아리게임기(5세대999레벨) 크앤비
- text: 굵은 모루 8mm 일반 장식줄 만들기재료 철사공예 아트 모루꽃 아트모루(10개입세트)_형광연두 아이디몬 주식회사
- text: 해리포터코스튬 풀세트 어린이 성인 남녀공용 졸사 이벤트 의상 추억 사진 후플푸프(7세트)_XXL 181-185cm 권장 here_
- text: 3D 토이나이프 야광 당근칼 틱톡 나이프 피젯 장난감  미니검 3연발 다트권총(핑크) 또와토이
- text: 알꿀밤 소형 나노블럭 미니블록 5+1 YK앉은 분홍 고양이 243. CK꽃무늬 롱치마 해적 늘솔길에아람벌다
inference: true
model-index:
- name: SetFit with mini1013/master_domain
  results:
  - task:
      type: text-classification
      name: Text Classification
    dataset:
      name: Unknown
      type: unknown
      split: test
    metrics:
    - type: metric
      value: 0.9032178674706208
      name: Metric
---

# SetFit with mini1013/master_domain

This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [mini1013/master_domain](https://huggingface.co/mini1013/master_domain) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning.
2. Training a classification head with features from the fine-tuned Sentence Transformer.

## Model Details

### Model Description
- **Model Type:** SetFit
- **Sentence Transformer body:** [mini1013/master_domain](https://huggingface.co/mini1013/master_domain)
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
- **Maximum Sequence Length:** 512 tokens
- **Number of Classes:** 14 classes
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->

### Model Sources

- **Repository:** [SetFit on GitHub](https://github.com/huggingface/setfit)
- **Paper:** [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055)
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)

### Model Labels
| Label | Examples                                                                                                                                                                                                                          |
|:------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 5.0   | <ul><li>'(LMG 택티컬) BFE 파우치 OD 대신장비샵'</li><li>'퍼프디노 그린가스 블랙 파워가스 600ml 12kg 검펍디  리버티라이프(Liberty Life)'</li><li>'아카데미과학 전동권총 데저트이글 L6 비비탄권총 자동 에어소프트건 비비탄총 09. 한국군 K5 오마이컴퍼니'</li></ul>                                             |
| 4.0   | <ul><li>'DJI 네오 / 납품 세금계산서 가능  주식회사 모즈인터내셔날'</li><li>'DJI Air 3 Fly More Combo (DJI RC-N2 포함)  게이트비젼(주)'</li><li>'DJI AIR 3S 에어 3S 플라이 모어 콤보 (RC2)납품 세금계산서가능  주식회사 모즈인터내셔날'</li></ul>                                             |
| 10.0  | <ul><li>'해적안대 가죽 할로윈용품 파티 의상소품 장식 데코  홈피스트'</li><li>'특수분장 할로윈 더마왁스상처재료 가짜피 인조피100ml BMmall'</li><li>'해적안대 가죽 할로윈 용품 파티 의상소품 데이  에스지'</li></ul>                                                                                    |
| 3.0   | <ul><li>'디디샵 지우개 야광 당근 나이프  (주)라온러닝'</li><li>'반다이 정품 RG 가오가이거  선물의 목적'</li><li>'주사모형 정맥 주입 근육 훈련 팔 모델 간호사 혈액 손 모형 팔뚝 정맥 천자 재킷 싹슬'</li></ul>                                                                                       |
| 12.0  | <ul><li>'소량 포스터 출력 인쇄 / 4종류 종이 / A3(420 297) 단면 아트지90g A3(420×297)_양면_스노우지 250g 킹콩카피'</li><li>'6090포스터 모음 W-3. 지구지도 포스터 한글 - 블루2 주식회사 제로퍼제로'</li><li>'천 포스터 가리개 장식 행잉 크리스마스 벽 트리 패브릭 인테리어 소품 5. 전나무 130X150 성공한 스토어'</li></ul>    |
| 2.0   | <ul><li>'비즈아이 [4925-13]글라스통과형 도트트리 15x16mm,1개 투명 비즈아이'</li><li>'스쿠비두 룰라끈 매듭 공예 키링 스쿠비드 1m 낱줄 운동화끈-빨강 꾀조은'</li><li>'비즈아이 [4925-13]글라스통과형 도트트리 15x16mm,1개 그린 비즈아이'</li></ul>                                                        |
| 1.0   | <ul><li>'최고급 메탈 피젯 핑거 스피너 야광 무소음 연속 회전 1_01_오렌지 sf103 사찌몰'</li><li>'5초 준다 MinSellAmount 스마일배송'</li><li>'5초 준다  주식회사 보드엠'</li></ul>                                                                                                |
| 8.0   | <ul><li>'빈티지 도장 스탬프 헤드 카드 봉투 청첩장 선물 포장 18.1588971 14.1588966 써니타운몰15호점'</li><li>'킵탑 자동차 유아용 보조 카시트 방석 커버 보호매트  삼촌쇼핑몰'</li><li>'오렌지오피스 스카이보람 우표 수집 앨범 리필내지 전지 우표 5단 리필 오렌지 오피스'</li></ul>                                          |
| 7.0   | <ul><li>'세븐틴 응원봉 SEVENTEEN OFFICIAL LIGHT STICK VER.3 (새제품)  조우코리아'</li><li>'IVE 아이브 응원봉 키링  오후세시반'</li><li>'아이브 얼빡샷 포카 포토카드 옵션선택 배디 키치홀리데이'</li></ul>                                                                            |
| 11.0  | <ul><li>'직소퍼즐 주문제작 커플 여행 기념일 선물 사진 퍼즐액자 제작 A5-(80피스)_추가안함_세로 투미투'</li><li>'짱구는못말려 소풍 100피스 만화 캐릭터 직소퍼즐 [ 짱구는못말려 150 피스 ]_19.온천욕-150 예그린스페이스'</li><li>'짱구는못말려 소풍 100피스 만화 캐릭터 직소퍼즐 [ 짱구는못말려 150 피스 ]_03.디비전-150 예그린스페이스'</li></ul> |
| 0.0   | <ul><li>'봇치 더 락 록 굿즈 결속 밴드 아날로그 LP 바이닐 한정판 일본 직구 기본 다락방'</li><li>'2LP 게이트폴드 비닐 컷팅 32cm 10장 2LP 게이트폴드 비닐 컷팅 32cm 10장 포린(porin)'</li><li>'잭 브라이언 The Great American Bar Scene 바이닐 LP 앨범 음반  엘라커넥티드'</li></ul>                       |
| 13.0  | <ul><li>'전문가 동전 수집 코인 케이스 보관 종이 홀더 50장 코인홀더 종이홀더 수집홀더 37mm 더비씨디'</li><li>'개업 연말 이벤트 답례 축하 선물 행운의 2달러 포함 액자 행운의2달러 액자 주식회사 투마이니'</li><li>'비트코인 기념주화 모형 장식 3종 골드 에스에이치에너지'</li></ul>                                                |
| 6.0   | <ul><li>'유니콘 입체 그림 인테리어 소품 액자 유니콘 그림  1번지 스토어'</li><li>'서예용품 단아미 고급서예붓18mm 화방 화방용 화선지  글로벌케이마켓'</li><li>'16절고무판(20입)문구 교재류 준비물 판화교재  남생몰'</li></ul>                                                                               |
| 9.0   | <ul><li>'파니니 NBA카드 탑클래스 KBL 농구카드 1박스 르브론제임스 스테판커리 이정현 허웅 허훈  월드스포츠카드서울신도림점'</li><li>'원피스 루피 조로 캐릭터 굿즈 트럼프카드  유캔매직샵'</li><li>'고전키티 과일키티 스트랩  오타쿠 다락방'</li></ul>                                                                    |

## Evaluation

### Metrics
| Label   | Metric |
|:--------|:-------|
| **all** | 0.9032 |

## Uses

### Direct Use for Inference

First install the SetFit library:

```bash
pip install setfit
```

Then you can load this model and run inference.

```python
from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_lh15")
# Run inference
preds = model("3D 토이나이프 야광 당근칼 틱톡 나이프 피젯 장난감 칼 미니검 3연발 다트권총(핑크) 또와토이")
```

<!--
### Downstream Use

*List how someone could finetune this model on their own dataset.*
-->

<!--
### Out-of-Scope Use

*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->

<!--
## Bias, Risks and Limitations

*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->

<!--
### Recommendations

*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->

## Training Details

### Training Set Metrics
| Training set | Min | Median  | Max |
|:-------------|:----|:--------|:----|
| Word count   | 3   | 10.9546 | 25  |

| Label | Training Sample Count |
|:------|:----------------------|
| 0.0   | 50                    |
| 1.0   | 50                    |
| 2.0   | 50                    |
| 3.0   | 50                    |
| 4.0   | 48                    |
| 5.0   | 50                    |
| 6.0   | 38                    |
| 7.0   | 50                    |
| 8.0   | 50                    |
| 9.0   | 25                    |
| 10.0  | 50                    |
| 11.0  | 50                    |
| 12.0  | 50                    |
| 13.0  | 50                    |

### Training Hyperparameters
- batch_size: (512, 512)
- num_epochs: (20, 20)
- max_steps: -1
- sampling_strategy: oversampling
- num_iterations: 40
- body_learning_rate: (2e-05, 2e-05)
- head_learning_rate: 2e-05
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False

### Training Results
| Epoch   | Step | Training Loss | Validation Loss |
|:-------:|:----:|:-------------:|:---------------:|
| 0.0096  | 1    | 0.4054        | -               |
| 0.4808  | 50   | 0.3432        | -               |
| 0.9615  | 100  | 0.2163        | -               |
| 1.4423  | 150  | 0.0533        | -               |
| 1.9231  | 200  | 0.0368        | -               |
| 2.4038  | 250  | 0.0235        | -               |
| 2.8846  | 300  | 0.0308        | -               |
| 3.3654  | 350  | 0.0158        | -               |
| 3.8462  | 400  | 0.0122        | -               |
| 4.3269  | 450  | 0.0117        | -               |
| 4.8077  | 500  | 0.0041        | -               |
| 5.2885  | 550  | 0.004         | -               |
| 5.7692  | 600  | 0.006         | -               |
| 6.25    | 650  | 0.0096        | -               |
| 6.7308  | 700  | 0.004         | -               |
| 7.2115  | 750  | 0.0002        | -               |
| 7.6923  | 800  | 0.0002        | -               |
| 8.1731  | 850  | 0.0001        | -               |
| 8.6538  | 900  | 0.0001        | -               |
| 9.1346  | 950  | 0.0001        | -               |
| 9.6154  | 1000 | 0.0001        | -               |
| 10.0962 | 1050 | 0.0001        | -               |
| 10.5769 | 1100 | 0.0001        | -               |
| 11.0577 | 1150 | 0.0001        | -               |
| 11.5385 | 1200 | 0.0           | -               |
| 12.0192 | 1250 | 0.0001        | -               |
| 12.5    | 1300 | 0.0001        | -               |
| 12.9808 | 1350 | 0.0001        | -               |
| 13.4615 | 1400 | 0.0001        | -               |
| 13.9423 | 1450 | 0.0           | -               |
| 14.4231 | 1500 | 0.0           | -               |
| 14.9038 | 1550 | 0.0           | -               |
| 15.3846 | 1600 | 0.0           | -               |
| 15.8654 | 1650 | 0.0           | -               |
| 16.3462 | 1700 | 0.0001        | -               |
| 16.8269 | 1750 | 0.0           | -               |
| 17.3077 | 1800 | 0.0           | -               |
| 17.7885 | 1850 | 0.0           | -               |
| 18.2692 | 1900 | 0.0           | -               |
| 18.75   | 1950 | 0.0           | -               |
| 19.2308 | 2000 | 0.0           | -               |
| 19.7115 | 2050 | 0.0001        | -               |

### Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0.dev0
- Sentence Transformers: 3.1.1
- Transformers: 4.46.1
- PyTorch: 2.4.0+cu121
- Datasets: 2.20.0
- Tokenizers: 0.20.0

## Citation

### BibTeX
```bibtex
@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
```

<!--
## Glossary

*Clearly define terms in order to be accessible across audiences.*
-->

<!--
## Model Card Authors

*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->

<!--
## Model Card Contact

*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->