SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
1
  • '보만 대용량 1단 LED터치 핸디 스팀다리미 DB8640G 바이 마르코 (by MARCO)'
  • '[구매확정시 N포인트 5% 적립]필립스 핸디형 스팀다리미 7000시리즈 STH7030/18 베르수니코리아 주식회사'
  • '테팔 클래시컬 플러스 논슬립 초경량 건식다리미 FS3120K0 주식회사 코스니크'
4
  • '보풀제거기 세탁소용 FX-200 유선 아이프리 옷 제거 보푸라기 이불 FX-200 교체용 6중칼날 플라이비(FLY BEE)'
  • '[IFREE] 아이프리 6중날 보풀제거기 FX-814 주식회사 더루츠'
  • 'NEW 아이프리 세탁소 보풀제거기 가디건 니트 옷 FX-714 (주)클릭나라'
16
  • '번개표 신형 넉다운 KKD-2200 세트 + 램프1개 추가 (총 램프 2개) KKD-2200 최신형+램프 1개 세트 (주)강남대흥'
  • 'CAS 카스 360도 절루가 야생동물퇴치기 고라니 멧돼지 두더지 뱀 조류 퇴치기 CLAR-100 (주)지오쇼핑'
  • '[스마토] 벅킬러 CF-BK06(블랙) 캠핑/벌레퇴치기/해충/모기 포에버툴'
14
  • 'Coms 전화선 꼬임방지 White/NT874/전화선정리 [KF] 주식회사 케이에프컴퍼니'
  • '전화선 꼬임방지 White/NT874/전화선정리 주식회사 지엔비커뮤니케이션즈'
  • '지엔텔 GS-872 2라인(국선) 사무용전화기/단축메모리(12개)/재다이얼/온후크/벨음 리버앤오빌 주식회사'
11
  • '지니큐 다용도 UV-C 살균 소독기 무선 자외선 살균기 스마트폰 마스크 UV-500ST 블랙 주식회사 한국전산오피스'
  • '텔로 UV 살균기 미니 자외선 소독기 휴대용 책 멸균기 UVCLED 변기 멸균 TUV10 (주)모닝아트'
  • "휴대용 마스크 살균소독기 유비세이프 C'Shell MLS-100 그레이 주식회사 유비세이프"
3
  • '[잘텍] JX-220 ,JX220 생활무전기 1대 풀세트 블랙 플림스텔레콤주식회사'
  • '민영 MYT-0033 MYT0033 고성능 생활무전기 정품이어마이크 3개 주식회사 오토플렉스'
  • 'PD508/PD-508/무전기 용 경호용 이어마이크/리시버/국산/JM8000T 클럽데님'
13
  • '바이마르 바디 건조기 드라이어 VMK-21A30D030 전신 에어 샤워 냉온풍 빠르고 깔끔한 건조 터치 스마트센서 드라이기 자동 몸말리는기계 욕실 따뜻한 시원한 바람 임산부 집들이 바이마르 바디 건조기 VMK-21A30D030 팬텀파트너스'
  • '제크롤 바디 스킨 케어 에어샤워 전신건조기 JK-1WBD101 바디드라이어 (주)세중통상'
  • '대림도비도스 바디건조기 DLB-700W 국내생산 바디 드라이어 DLB-700W (주) 더수바스'
15
  • '다이슨 국내 정품 옴니 글라이드 컴플리트 (퍼플/니켈) 정품스텐딩거치대 포함 이루 이루 스토어'
  • '로보락 다이애드 브러쉬 거치대 세트 팅크웨어모바일 주식회사'
  • 'JCP 에브리봇 EDGE 주식회사 제이씨엠컴퍼니'
6
  • '한국타올기산업 자동 손소독기계 HTM-620 자동 1개 (주)서브원'
  • '티에스 자바코리아 자동 손소독기 THS2500T 전기식 건전지식 겸용 아름상사몰'
  • 'HDTOP 비접촉 휴대용 자동 디스펜서 스프레이 손소독기 HT-A600 YGPJ-NJ0042 윤 미디어'
2
  • '베스틴 지문방지 푸시풀 도어락 IDL-300 블랙헤어라인 2WAY 현관 아파트 도어락 블랙 유광 (IDL-300SWNK) 키넷'
  • '셀프시공 삼성 IOT 푸시풀 디지털도어락 SHP-DR700+보강판 현관문 현관문도어락 하우스플러스(주)'
  • '무료설치 에버넷 샷시문도어락 상가번호키 패션문도어록 가마찌도어샤시 EN250-N A지역무료설치 진흥피닉스(주)'
9
  • '[하이마트] LG 스타일러 오브제컬렉션 S3BOF [3벌/미스트베이지] 롯데하이마트(주)'
  • '엘지 트롬 스타일러 린넨 블랙 S3BF 의류관리 코스트코 갱이점빵'
  • '[삼성] 에어드레서 상의 59 벌 + 하의 1 벌,코타차콜 DF24CG5100HR 배송은 주문 후 24주이상 소요 주식회사 위링크'
5
  • '신일 스텐 탈수기 SDM-T77H 가정용 수영장 캠핑장 펜션 콜드림'
  • '삼성전자 아가사랑 WA30T2101EE 동의 선우에이치앤비(SUNWOO H&B)'
  • '한일전기 W-110 미니 짤순이 다용도 음식물 야채 오이지 두부 탈수기 1kg 탈수기 짤순이(신형) (주)씨앤제이글로벌'
12
  • '싱거 8280(단품+수강증+보증서1년)+ 프리모션노루발+노루발3종+말아박이 랍바세트 태양에스엠주식회사'
  • '부라더미싱 이노비스A16 (Innovis-A16) NV-A16 부라더미싱'
  • '부라더미싱 이노비스 A80, innovis a80, 브라더미싱 팀에이에이 Team AA'
7
  • 'LED스탠드 브로드윙X (LSP-9700) 베이스 화이트 멜라토닌 학습용 학생 스탠드 MinSellAmount (주)프리즘'
  • '듀플렉스 DP-910LS 시력보호 면조명 LED 스탠드 책상 학생용 코지인터내셔널'
  • 'LED스탠드 책상 학생 독서등 학습용 스텐드 NXL-3000 /스마일배송 오트빌'
0
  • '스마트소닉 1000 음파칫솔 단품 [화이트] + 칫솔모 1팩 블루 에스에이치 인터내셔날'
  • '프리쉐 PA-TS3000 골프_위탁 업체로 공급사나 배달업체에 개인정보 동의 도라에몽상회'
  • '알로코리아 덴픽션 바람건조 고온히팅 UV-C 무선 휴대용 칫솔살균기 ATS1G 단품 1+1 세트_크림+블루 알로이비즈 주식회사'
17
  • '[아메리칸스탠다드] 핸드 드라이어 삽입형 FG8901(고속형), FG8984(일반형) 화장실 상업용 편의품 FG8901(고속형) 대일도기사 주식회사'
  • '대림 도비도스 DX-1000,DX1000 핸드드라이어 (아이보리) 준트레이딩(JUN Trading)'
  • 'TS자바 핸드드라이어 TH350ST 스테인레스 핸드드라이기 TSJAVA 화장실 강풍 프럼바디'
8
  • '쿠쿠 버블클렌저 연수기 CWS-AO201W 주식회사 제이홀딩스'
  • '프렐 연수기 마이크로버블 클렌저 녹물 염소 제거 버블수기 무광 화이트 그레이 투톤색상 (주)로보터스'
  • '[렌탈] [셀프형] 현대큐밍 샤워기필터 연수기 더클린 워터케어 (HQS20100W0) 실버 (주)현대렌탈케어'
10
  • '[특별 ] 세라젬 밸런스 알칼리 이온수 생성기 의료기기 (주) 세라젬'
  • '뉴랜드올네이처 알칼리이온수기 셀터치프리미엄 뉴랜드올네이처비전'
  • '뉴랜드올네이처 알칼리이온수기 셀터치필터 복합중공사(UF Membrane) 뉴랜드올네이처비전'

Evaluation

Metrics

Label Metric
all 0.7946

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_el11")
# Run inference
preds = model("ALLNEW29000 파워메이드_그레이(GRAY)  나성민")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 3 9.3700 32
Label Training Sample Count
0 50
1 50
2 50
3 50
4 50
5 50
6 50
7 50
8 5
9 50
10 3
11 50
12 50
13 50
14 50
15 50
16 50
17 50

Training Hyperparameters

  • batch_size: (512, 512)
  • num_epochs: (20, 20)
  • max_steps: -1
  • sampling_strategy: oversampling
  • num_iterations: 40
  • body_learning_rate: (2e-05, 2e-05)
  • head_learning_rate: 2e-05
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: False

Training Results

Epoch Step Training Loss Validation Loss
0.0079 1 0.4968 -
0.3937 50 0.3206 -
0.7874 100 0.1406 -
1.1811 150 0.0735 -
1.5748 200 0.0518 -
1.9685 250 0.0242 -
2.3622 300 0.006 -
2.7559 350 0.0102 -
3.1496 400 0.0088 -
3.5433 450 0.0082 -
3.9370 500 0.0062 -
4.3307 550 0.012 -
4.7244 600 0.0021 -
5.1181 650 0.002 -
5.5118 700 0.0049 -
5.9055 750 0.0043 -
6.2992 800 0.006 -
6.6929 850 0.0002 -
7.0866 900 0.0004 -
7.4803 950 0.0002 -
7.8740 1000 0.0002 -
8.2677 1050 0.0002 -
8.6614 1100 0.0001 -
9.0551 1150 0.0001 -
9.4488 1200 0.0002 -
9.8425 1250 0.0002 -
10.2362 1300 0.0001 -
10.6299 1350 0.0001 -
11.0236 1400 0.0001 -
11.4173 1450 0.0001 -
11.8110 1500 0.0001 -
12.2047 1550 0.0001 -
12.5984 1600 0.0001 -
12.9921 1650 0.0001 -
13.3858 1700 0.0001 -
13.7795 1750 0.0001 -
14.1732 1800 0.0001 -
14.5669 1850 0.0001 -
14.9606 1900 0.0001 -
15.3543 1950 0.0001 -
15.7480 2000 0.0001 -
16.1417 2050 0.0001 -
16.5354 2100 0.0001 -
16.9291 2150 0.0001 -
17.3228 2200 0.0001 -
17.7165 2250 0.0001 -
18.1102 2300 0.0001 -
18.5039 2350 0.0001 -
18.8976 2400 0.0001 -
19.2913 2450 0.0001 -
19.6850 2500 0.0001 -

Framework Versions

  • Python: 3.10.12
  • SetFit: 1.1.0.dev0
  • Sentence Transformers: 3.1.1
  • Transformers: 4.46.1
  • PyTorch: 2.4.0+cu121
  • Datasets: 2.20.0
  • Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
Downloads last month
742
Safetensors
Model size
111M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for mini1013/master_cate_el11

Base model

klue/roberta-base
Finetuned
(132)
this model

Evaluation results