SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
5.0
  • '(LMG 택티컬) BFE 파우치 OD 대신장비샵'
  • '퍼프디노 그린가스 블랙 파워가스 600ml 12kg 검펍디 리버티라이프(Liberty Life)'
  • '아카데미과학 전동권총 데저트이글 L6 비비탄권총 자동 에어소프트건 비비탄총 09. 한국군 K5 오마이컴퍼니'
4.0
  • 'DJI 네오 / 납품 세금계산서 가능 주식회사 모즈인터내셔날'
  • 'DJI Air 3 Fly More Combo (DJI RC-N2 포함) 게이트비젼(주)'
  • 'DJI AIR 3S 에어 3S 플라이 모어 콤보 (RC2)납품 세금계산서가능 주식회사 모즈인터내셔날'
10.0
  • '해적안대 가죽 할로윈용품 파티 의상소품 장식 데코 홈피스트'
  • '특수분장 할로윈 더마왁스상처재료 가짜피 인조피100ml BMmall'
  • '해적안대 가죽 할로윈 용품 파티 의상소품 데이 에스지'
3.0
  • '디디샵 지우개 야광 당근 나이프 (주)라온러닝'
  • '반다이 정품 RG 가오가이거 선물의 목적'
  • '주사모형 정맥 주입 근육 훈련 팔 모델 간호사 혈액 손 모형 팔뚝 정맥 천자 재킷 싹슬'
12.0
  • '소량 포스터 출력 인쇄 / 4종류 종이 / A3(420 297) 단면 아트지90g A3(420×297)_양면_스노우지 250g 킹콩카피'
  • '6090포스터 모음 W-3. 지구지도 포스터 한글 - 블루2 주식회사 제로퍼제로'
  • '천 포스터 가리개 장식 행잉 크리스마스 벽 트리 패브릭 인테리어 소품 5. 전나무 130X150 성공한 스토어'
2.0
  • '비즈아이 [4925-13]글라스통과형 도트트리 15x16mm,1개 투명 비즈아이'
  • '스쿠비두 룰라끈 매듭 공예 키링 스쿠비드 1m 낱줄 운동화끈-빨강 꾀조은'
  • '비즈아이 [4925-13]글라스통과형 도트트리 15x16mm,1개 그린 비즈아이'
1.0
  • '최고급 메탈 피젯 핑거 스피너 야광 무소음 연속 회전 1_01_오렌지 sf103 사찌몰'
  • '5초 준다 MinSellAmount 스마일배송'
  • '5초 준다 주식회사 보드엠'
8.0
  • '빈티지 도장 스탬프 헤드 카드 봉투 청첩장 선물 포장 18.1588971 14.1588966 써니타운몰15호점'
  • '킵탑 자동차 유아용 보조 카시트 방석 커버 보호매트 삼촌쇼핑몰'
  • '오렌지오피스 스카이보람 우표 수집 앨범 리필내지 전지 우표 5단 리필 오렌지 오피스'
7.0
  • '세븐틴 응원봉 SEVENTEEN OFFICIAL LIGHT STICK VER.3 (새제품) 조우코리아'
  • 'IVE 아이브 응원봉 키링 오후세시반'
  • '아이브 얼빡샷 포카 포토카드 옵션선택 배디 키치홀리데이'
11.0
  • '직소퍼즐 주문제작 커플 여행 기념일 선물 사진 퍼즐액자 제작 A5-(80피스)_추가안함_세로 투미투'
  • '짱구는못말려 소풍 100피스 만화 캐릭터 직소퍼즐 [ 짱구는못말려 150 피스 ]_19.온천욕-150 예그린스페이스'
  • '짱구는못말려 소풍 100피스 만화 캐릭터 직소퍼즐 [ 짱구는못말려 150 피스 ]_03.디비전-150 예그린스페이스'
0.0
  • '봇치 더 락 록 굿즈 결속 밴드 아날로그 LP 바이닐 한정판 일본 직구 기본 다락방'
  • '2LP 게이트폴드 비닐 컷팅 32cm 10장 2LP 게이트폴드 비닐 컷팅 32cm 10장 포린(porin)'
  • '잭 브라이언 The Great American Bar Scene 바이닐 LP 앨범 음반 엘라커넥티드'
13.0
  • '전문가 동전 수집 코인 케이스 보관 종이 홀더 50장 코인홀더 종이홀더 수집홀더 37mm 더비씨디'
  • '개업 연말 이벤트 답례 축하 선물 행운의 2달러 포함 액자 행운의2달러 액자 주식회사 투마이니'
  • '비트코인 기념주화 모형 장식 3종 골드 에스에이치에너지'
6.0
  • '유니콘 입체 그림 인테리어 소품 액자 유니콘 그림 1번지 스토어'
  • '서예용품 단아미 고급서예붓18mm 화방 화방용 화선지 글로벌케이마켓'
  • '16절고무판(20입)문구 교재류 준비물 판화교재 남생몰'
9.0
  • '파니니 NBA카드 탑클래스 KBL 농구카드 1박스 르브론제임스 스테판커리 이정현 허웅 허훈 월드스포츠카드서울신도림점'
  • '원피스 루피 조로 캐릭터 굿즈 트럼프카드 유캔매직샵'
  • '고전키티 과일키티 스트랩 오타쿠 다락방'

Evaluation

Metrics

Label Metric
all 0.9032

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_lh15")
# Run inference
preds = model("3D 토이나이프 야광 당근칼 틱톡 나이프 피젯 장난감 칼 미니검 3연발 다트권총(핑크) 또와토이")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 3 10.9546 25
Label Training Sample Count
0.0 50
1.0 50
2.0 50
3.0 50
4.0 48
5.0 50
6.0 38
7.0 50
8.0 50
9.0 25
10.0 50
11.0 50
12.0 50
13.0 50

Training Hyperparameters

  • batch_size: (512, 512)
  • num_epochs: (20, 20)
  • max_steps: -1
  • sampling_strategy: oversampling
  • num_iterations: 40
  • body_learning_rate: (2e-05, 2e-05)
  • head_learning_rate: 2e-05
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: False

Training Results

Epoch Step Training Loss Validation Loss
0.0096 1 0.4054 -
0.4808 50 0.3432 -
0.9615 100 0.2163 -
1.4423 150 0.0533 -
1.9231 200 0.0368 -
2.4038 250 0.0235 -
2.8846 300 0.0308 -
3.3654 350 0.0158 -
3.8462 400 0.0122 -
4.3269 450 0.0117 -
4.8077 500 0.0041 -
5.2885 550 0.004 -
5.7692 600 0.006 -
6.25 650 0.0096 -
6.7308 700 0.004 -
7.2115 750 0.0002 -
7.6923 800 0.0002 -
8.1731 850 0.0001 -
8.6538 900 0.0001 -
9.1346 950 0.0001 -
9.6154 1000 0.0001 -
10.0962 1050 0.0001 -
10.5769 1100 0.0001 -
11.0577 1150 0.0001 -
11.5385 1200 0.0 -
12.0192 1250 0.0001 -
12.5 1300 0.0001 -
12.9808 1350 0.0001 -
13.4615 1400 0.0001 -
13.9423 1450 0.0 -
14.4231 1500 0.0 -
14.9038 1550 0.0 -
15.3846 1600 0.0 -
15.8654 1650 0.0 -
16.3462 1700 0.0001 -
16.8269 1750 0.0 -
17.3077 1800 0.0 -
17.7885 1850 0.0 -
18.2692 1900 0.0 -
18.75 1950 0.0 -
19.2308 2000 0.0 -
19.7115 2050 0.0001 -

Framework Versions

  • Python: 3.10.12
  • SetFit: 1.1.0.dev0
  • Sentence Transformers: 3.1.1
  • Transformers: 4.46.1
  • PyTorch: 2.4.0+cu121
  • Datasets: 2.20.0
  • Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
Downloads last month
460
Safetensors
Model size
111M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for mini1013/master_cate_lh15

Base model

klue/roberta-base
Finetuned
(132)
this model

Evaluation results