File size: 40,836 Bytes
80f28ec
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
---
base_model: snunlp/KR-SBERT-V40K-klueNLI-augSTS
library_name: setfit
metrics:
- accuracy
pipeline_tag: text-classification
tags:
- setfit
- sentence-transformers
- text-classification
- generated_from_setfit_trainer
widget:
- text: 2020년부터 2022년까지 반도체에 해당하는 중점 기술 분류 코드가 'NAT0'  과제의  연구비 현물 금액을 조회해주세요.
- text: 2020년부터 2022년까지 AI 관련 중점기술코드에 대한 상위 5 지역별 연도별 민간 연구비 합계를  단위로 조회해주세요. 
    지역명에서 '특별시', '광역시', '특별자치시', '특별자치' 제외하고, 연구비가 5천만  미만인 경우 1 원으로 간주하여 계산한 결과를
    보여주세요.
- text: 2018년부터 2022년까지 인공지능 중점기술코드('AI')와 관련된 연도별 연구비 현금합계금액과  연구비 합계금액을 조회해 주세요.
    또한  연도별 연구비 비중을 함께 보여주세요.
- text: 2018년부터 2022년까지 반도체 중점기술코드에 대한 상위 5 지역별 연도별 민간 연구비 총액을  단위로 조회해주세요.  지역명에서
    '특별시', '광역시', '특별자치시', '특별자치' 제외하고, 연구비가 5천만  미만인 경우 1 원으로 간주하여 계산한 결과를 보여주세요.
- text: 2018년부터 2022년까지 양자컴퓨팅('QUC') 중점기술코드와 관련된 연도별 미국 자금 지원 금액을 조회해주세요. 자금 지원 총액을
    백만 단위로 변환하여 보여주세요.
inference: true
---

# SetFit with snunlp/KR-SBERT-V40K-klueNLI-augSTS

This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [snunlp/KR-SBERT-V40K-klueNLI-augSTS](https://huggingface.co/snunlp/KR-SBERT-V40K-klueNLI-augSTS) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning.
2. Training a classification head with features from the fine-tuned Sentence Transformer.

## Model Details

### Model Description
- **Model Type:** SetFit
- **Sentence Transformer body:** [snunlp/KR-SBERT-V40K-klueNLI-augSTS](https://huggingface.co/snunlp/KR-SBERT-V40K-klueNLI-augSTS)
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
- **Maximum Sequence Length:** 128 tokens
- **Number of Classes:** 29 classes
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->

### Model Sources

- **Repository:** [SetFit on GitHub](https://github.com/huggingface/setfit)
- **Paper:** [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055)
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)

### Model Labels
| Label | Examples                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       |
|:------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 0     | <ul><li>"2018년부터 2022년까지 인공지능 중점기술코드('AI')와 관련된 연도별 유럽 자금 지원 금액을 조회해주세요. 자금 지원 총액을 백만 단위로 변환하여 보여주세요."</li><li>"2018년부터 2022년까지 양자전체('QUG') 중점기술코드와 관련된 연도별 유럽 자금 지원 금액을 조회해주세요. 자금 지원 총액을 백만 단위로 변환하여 보여주세요."</li><li>"2018년부터 2022년까지 양자전체('QUG')와 관련된 연도별 유럽 자금 지원 금액을 조회해주세요. 자금 지원 총액을 백만 단위로 변환하여 보여주세요."</li></ul>                                                                                                                                                                                                                                                                                                                                                      |
| 1     | <ul><li>"2018년부터 2022년까지 반도체('NAT0')와 관련된 연도별 미국 자금 지원 금액을 조회해주세요. 자금 지원 총액을 백만 단위로 변환하여 보여주세요."</li><li>"2018년부터 2022년까지 반도체('NAT0') 중점기술코드와 관련된 연도별 미국 자금 지원 금액을 조회해주세요. 자금 지원 총액을 백만 단위로 변환하여 보여주세요."</li><li>"2018년부터 2022년까지 반도체('semi') 중점기술코드와 관련된 연도별 미국 자금 지원 금액을 조회해주세요. 자금 지원 총액을 백만 단위로 변환하여 보여주세요."</li></ul>                                                                                                                                                                                                                                                                                                                                                     |
| 2     | <ul><li>"2018년부터 2022년까지 반도체('NAT0') 중점기술코드와 관련된 연도별 국내 및 해외 특허 출원 및 등록 건수를 조회해주세요. 각 연도별로 국내 특허 출원 건수, 등록 건수, 총 건수와 해외 특허 출원 건수, 등록 건수, 총 건수를 포함해주세요."</li><li>'2018년부터 2022년까지 양자전체(QUG) 중점기술코드와 관련된 연도별 국내 및 해외 특허 출원 및 등록 건수를 조회해주세요. 각 연도별로 국내 특허 출원 건수, 등록 건수, 총 건수와 해외 특허 출원 건수, 등록 건수, 총 건수를 포함해주세요.'</li><li>"2018년부터 2022년까지 양자전체('QUG')와 관련된 연도별 국내 및 해외 특허 출원 및 등록 건수를 조회해주세요. 각 연도별로 국내 특허 출원 건수, 등록 건수, 총 건수와 해외 특허 출원 건수, 등록 건수, 총 건수를 포함해주세요."</li></ul>                                                                                                                                                                                                       |
| 3     | <ul><li>"2018년부터 2022년까지 양자전체('QUG') 중점기술코드와 관련된 국내 및 해외 특허 출원 및 등록 건수를 조회해주세요. 각 연도별로 국내 특허 출원 건수, 등록 건수, 총 건수와 해외 특허 출원 건수, 등록 건수, 총 건수를 포함해주세요."</li><li>"2018년부터 2022년까지 반도체 중점기술코드('NAT0')와 관련된 국내 및 해외 특허 출원 및 등록 건수를 조회해주세요. 각 연도별로 국내 특허 출원 건수, 등록 건수, 총 건수와 해외 특허 출원 건수, 등록 건수, 총 건수를 포함해주세요."</li><li>"2018년부터 2022년까지 양자전체('QUG')와 관련된 국내 및 해외 특허 출원 및 등록 건수를 조회해주세요. 각 연도별로 국내 특허 출원 건수, 등록 건수, 총 건수와 해외 특허 출원 건수, 등록 건수, 총 건수를 포함해주세요."</li></ul>                                                                                                                                                                                                                 |
| 4     | <ul><li>"2018년부터 2022년까지 반도체('semi') 중점기술코드와 관련된 연도별 참여 연구자 수를 조회해 주세요. 참여 연구자 유형은 자연과학, 엔지니어링, 농업 및 임업, 의학 및 보건, 인문사회, 기타입니다. 또한 각 연도의 총 연구자 수도 함께 보여주세요."</li><li>"2018년부터 2022년까지 인공지능('AI') 중점기술코드와 관련된 연도별 연구비 현금합계금액과 그 비율을 조회해 주세요. 또한 각 연도의 총 연구비 현금합계금액도 함께 보여주세요."</li><li>"2018년부터 2022년까지 반도체 중점기술코드('NAT0')와 관련된 연도별 주요 연구자 수와 그 비율을 조회해 주세요. 연구자 유형은 자연과학, 엔지니어링, 농업 및 임업, 의학 및 보건, 인문사회, 기타입니다. 또한 각 연도의 총 연구자 수도 함께 보여주세요."</li></ul>                                                                                                                                                                                                                          |
| 5     | <ul><li>"2018년부터 2022년까지 인공지능('AI') 중점기술코드와 관련된 연도별 연구비 금액과 전체 연구비 금액 합계를 조회해 주세요."</li><li>"2018년부터 2022년까지 반도체('NAT0') 중점기술코드와 관련된 연도별 연구비 금액과 전체 연구비 금액 합계를 조회해 주세요."</li><li>'2018년부터 2022년까지 양자전체(QUG) 중점기술코드와 관련된 연도별 연구비금액과 전체 연구비금액 합계를 조회해 주세요.'</li></ul>                                                                                                                                                                                                                                                                                                                                                                                                            |
| 6     | <ul><li>"2015년부터 2020년까지 양자전체('QUG') 중점기술코드와 관련된 프로젝트에서 사용된 상위 50개의 영어 키워드와 해당 키워드의 사용 횟수를 조회해 주세요."</li><li>"2018년부터 2022년까지 반도체('NAT0')와 양자전체('QUG') 중점기술코드 관련 프로젝트에서 사용된 상위 50개의 영어 키워드와 해당 키워드의 사용 횟수를 조회해 주세요."</li><li>"2018년부터 2022년까지 양자전체('QUG')와 관련된 프로젝트에서 사용된 상위 100개의 영어 키워드와 해당 키워드의 사용 횟수를 조회해 주세요."</li></ul>                                                                                                                                                                                                                                                                                                                                                  |
| 7     | <ul><li>"2018년부터 2022년까지 양자전체('QUG') 중점기술코드와 관련된 프로젝트에서 사용된 상위 100개의 한국어 키워드와 해당 키워드의 사용 횟수를 조회해 주세요."</li><li>"2015년부터 2020년까지 인공지능('AI')과 관련된 프로젝트에서 사용된 상위 50개의 한국어 키워드와 해당 키워드의 사용 횟수를 조회해 주세요."</li><li>"2015년부터 2021년까지 양자전체('QUG')와 관련된 프로젝트에서 사용된 상위 50개의 한국어 키워드와 해당 키워드의 사용 횟수를 조회해 주세요."</li></ul>                                                                                                                                                                                                                                                                                                                                                                  |
| 8     | <ul><li>'2018년부터 2022년까지 양자전체 중점기술코드에 대해 연도별 정부 투자 연구비 총액, 프로젝트 수, 전체 연구비 총액, 전체 프로젝트 수, 연구비 상대 중요도, 프로젝트 수 상대 중요도를 조회해주세요.'</li><li>'2018년부터 2022년까지 인공지능(AI) 중점기술코드에 대해 연도별 정부 투자 연구비 총액, 프로젝트 수, 전체 연구비 총액, 전체 프로젝트 수, 연구비 상대 중요도, 프로젝트 수 상대 중요도를 조회해주세요.'</li><li>'2020년부터 2023년까지 양자전체 중점기술코드에 대해 연도별 정부 투자 연구비 총액, 프로젝트 수, 전체 연구비 총액, 전체 프로젝트 수, 연구비 상대 중요도, 프로젝트 수 상대 중요도를 조회해주세요.'</li></ul>                                                                                                                                                                                                                                                                           |
| 9     | <ul><li>'2018년부터 2022년까지 양자전체 중점기술코드에 대해 연도별로 정부 투자 연구비 합계와 전체 연구비 합계를 조회해주세요. 정부 투자 연구비 합계는 억 단위로 변환하며, 0인 경우 1로 표시해주세요.'</li><li>'2018년부터 2022년까지 반도체 중점기술코드에 대해 연도별로 정부 투자 연구비 합계와 전체 연구비 합계를 조회해주세요. 정부 투자 연구비 합계는 억 단위로 변환하며, 0인 경우 1로 표시해주세요.'</li><li>'2020년부터 2022년까지 인공지능 중점기술코드에 대해 연도별로 민간연구비 총현물금액과 정부 투자 연구비를 조회해주세요. 민간연구비 총현물금액은 억 단위로 변환하며, 0인 경우 1로 표시해주세요.'</li></ul>                                                                                                                                                                                                                                                                                        |
| 10    | <ul><li>'2022년 기준, 감염병 중점기술코드에 대해 연도별로 각 세부 기술코드(FCTC_LCLS_CD)와 그에 해당하는 기술 코드 이름(CD_NM)의 정부 투자 연구비 합계를 억 단위로 조회해주세요. 각 세부 기술코드는 총 연구비 금액에 따라 내림차순으로 정렬해주세요.'</li><li>"2022년 현재 반도체 기술 분야에서 중점 기술코드가 'NAT0'인 과제에 대해 과제명, 중점 기술코드, 정부 투자 연구비, 민간 투자 연구비의 총액을 조회해주세요."</li><li>'2022년 감염병 중점기술코드에 대해 세부 기술코드(FCTC_LCLS_CD)와 그에 해당하는 기술 코드 이름(CD_NM)의 정부 투자 연구비 합계를 억 단위로 조회해주세요. 각 세부 기술코드는 총 연구비 금액에 따라 내림차순으로 정렬해주세요.'</li></ul>                                                                                                                                                                                                                                                |
| 11    | <ul><li>'2022년 기준으로 감염병 전반에 대한 연구개발과제에 대한 정부투자연구비의 총액과 그 중점기술코드별 정부투자연구비를 조회해주세요.'</li><li>'2022년 현재 반도체 중점기술코드에 해당하는 과제의 총 연구비 금액을 억 원 단위로 조회해주세요. 또한, 과제명, 과제번호, 수행기관명, 수행기관 대표명, 과제 수행기관 유형명, 연구책임자명, 연구책임자 소속기관명, 연구책임자 학위코드, 연구책임자 전공코드, 연구책임자 성별구분, 연구책임자 지식재산권 건수, 연구책임자 논문 건수, 연구책임자 과제 건수, 연구책임자 총 연구비 금액을 함께 조회해주세요.'</li><li>'2022년 기준, 반도체 중점기술코드에 해당하는 과제의 총 연구비 금액과 민간연구비 금액의 합계를 구해주세요.'</li></ul>                                                                                                                                                                                                                                                              |
| 12    | <ul><li>'2018년부터 2022년까지 인공지능 중점기술코드에 대해 연구 수행 주체별 정부 투자 연구비 합계와 각 연구비의 억 단위 금액 및 상대적 중요도를 조회해주세요. 연구 수행 주체는 다음과 같습니다 대기업, 중소기업, 기타 기업, 대학, 정부출연연구소, 비영리기관, 병원, 기타. 5천만 원 미만인 경우 1억 원으로 간주하여 계산한 결과를 보여주세요.'</li><li>'2018년부터 2022년까지 인공지능(AI) 중점기술코드에 대해 연구 수행 주체별 정부 투자 연구비 합계와 각 연구비의 억 단위 금액 및 상대적 중요도를 조회해주세요. 연구 수행 주체는 다음과 같습니다 대기업, 중소기업, 기타 기업, 대학, 정부출연연구소, 비영리기관, 병원, 기타. 5천만 원 미만인 경우 1억 원으로 간주하여 계산한 결과를 보여주세요.'</li><li>'2020년부터 2022년까지 양자전체 중점기술코드에 대해 연구 수행 주체별 정부 투자 연구비 합계와 각 연구비의 억 단위 금액 및 상대적 중요도를 조회해주세요. 연구 수행 주체는 다음과 같습니다 대기업, 중소기업, 기타 기업, 대학, 정부출연연구소, 비영리기관, 병원, 기타. 5천만 원 미만인 경우 1억 원으로 간주하여 계산한 결과를 보여주세요.'</li></ul>                           |
| 13    | <ul><li>'2018년부터 2022년까지 양자전체 중점기술코드에 대해 연구 수행 주체별 정부 투자 연구비 합계와 각 연구비의 억 단위 금액 및 전체 연구비 대비 상대적 중요도를 조회해주세요. 연구 수행 주체는 다음과 같습니다 대기업, 중소기업, 기타 기업, 대학, 정부출연연구소, 비영리기관, 병원, 기타. 5천만 원 미만인 경우 1억 원으로 간주하여 계산한 결과를 보여주세요.'</li><li>'2020년부터 2023년까지 양자전체 중점기술코드에 대해 연구 수행 주체별 정부 투자 연구비 합계와 각 연구비의 억 단위 금액 및 전체 연구비 대비 상대적 중요도를 조회해주세요. 연구 수행 주체는 다음과 같습니다 대기업, 중소기업, 기타 기업, 대학, 정부출연연구소, 비영리기관, 병원, 기타. 5천만 원 미만인 경우 1억 원으로 간주하여 계산한 결과를 보여주세요.'</li><li>'2018년부터 2022년까지 인공지능 중점기술코드에 대해 연구 수행 주체별 정부 투자 연구비 합계와 각 연구비의 억 단위 금액 및 전체 연구비 대비 상대적 중요도를 조회해주세요. 연구 수행 주체는 다음과 같습니다 대기업, 중소기업, 기타 기업, 대학, 정부출연연구소, 비영리기관, 병원, 기타. 5천만 원 미만인 경우 1억 원으로 간주하여 계산한 결과를 보여주세요.'</li></ul> |
| 14    | <ul><li>"2018년부터 2022년까지 인공지능 중점기술코드에 대한 상위 5개 지역별 연도별 민간 연구비 합계를 억 단위로 조회해주세요. 각 지역명에서 '특별시', '광역시', '특별자치시', '특별자치'는 제외하고, 연구비가 5천만 원 미만인 경우 1억 원으로 간주하여 계산한 결과를 보여주세요."</li><li>"2018년부터 2022년까지 양자전체 중점기술코드에 대한 상위 5개 지역별 연도별 정부 투자 연구비 합계를 억 단위로 조회해주세요. 각 지역명에서 '특별시', '광역시', '특별자치시', '특별자치'는 제외하고, 연구비가 5천만 원 미만인 경우 1억 원으로 간주하여 계산한 결과를 보여주세요."</li><li>"2018년부터 2022년까지 반도체 중점기술코드에 대한 상위 5개 지역별 연도별 민간 연구비 합계를 억 단위로 조회해주세요. 각 지역명에서 '특별시', '광역시', '특별자치시', '특별자치'는 제외하고, 연구비가 5천만 원 미만인 경우 1억 원으로 간주하여 계산한 결과를 보여주세요."</li></ul>                                                                                                                                   |
| 15    | <ul><li>"2020년부터 2022년까지 인공지능 중점기술코드에 대한 상위 5개 지역별 연도별 민간연구비 현물금액 합계를 억 단위로 조회해주세요. 각 지역명에서 '특별시', '광역시', '특별자치시', '특별자치'는 제외하고, 연구비가 5천만 원 미만인 경우 1억 원으로 간주하여 계산한 결과를 보여주세요."</li><li>"2021년부터 2023년까지 반도체 중점기술코드에 대한 상위 5개 지역별 연도별 민간 연구비 합계를 억 단위로 조회해주세요. 각 지역명에서 '특별시', '광역시', '특별자치시', '특별자치'는 제외하고, 연구비가 5천만 원 미만인 경우 1억 원으로 간주하여 계산한 결과를 보여주세요."</li><li>"2022년부터 2023년까지 반도체 중점기술코드에 대한 상위 5개 지역별 연도별 민간 연구비 합계를 억 단위로 조회해주세요. 각 지역명에서 '특별시', '광역시', '특별자치시', '특별자치'는 제외하고, 연구비가 5천만 원 미만인 경우 1억 원으로 간주하여 계산한 결과를 보여주세요."</li></ul>                                                                                                                                   |
| 16    | <ul><li>'2018년부터 2022년까지 양자컴퓨팅 중점기술코드에 대한 연도별 기초연구, 개발연구, 응용연구, 기타연구 단계의 연구비와 연구비 비중을 조회해주세요. 연구비가 5천만 원 미만인 경우 1억 원으로 간주하여 억 단위로 변환한 결과를 보여주세요. 또한, 2018년부터 2022년까지 연구개발 단계별 총 연구비와 각 단계별 연구비 비중을 조회해주세요.'</li><li>'2018년부터 2022년까지 인공지능(AI) 중점기술코드에 대한 연도별 기초연구, 개발연구, 응용연구, 기타연구 단계의 연구비와 연구비 비중을 조회해주세요. 연구비가 5천만 원 미만인 경우 1억 원으로 간주하여 억 단위로 변환한 결과를 보여주세요. 또한, 2018년부터 2022년까지 연구개발 단계별 총 연구비와 각 단계별 연구비 비중을 조회해주세요.'</li><li>'2018년부터 2022년까지 인공지능 중점기술코드에 대한 연도별 기초연구, 개발연구, 응용연구, 기타연구 단계의 연구비와 연구비 비중을 조회해주세요. 연구비가 5천만 원 미만인 경우 1억 원으로 간주하여 억 단위로 변환한 결과를 보여주세요. 또한, 2018년부터 2022년까지 연구개발 단계별 총 연구비와 각 단계별 연구비 비중을 조회해주세요.'</li></ul>                                |
| 17    | <ul><li>'2020년부터 2022년까지 인공지능 중점기술코드에 대한 연도별 기초연구, 개발연구, 응용연구, 기타연구 단계의 연구비와 연구비 비중을 조회해주세요. 연구비가 5천만 원 미만인 경우 1억 원으로 간주하여 억 단위로 변환한 결과를 보여주세요.'</li><li>'2018년부터 2022년까지 인공지능 중점기술코드에 대한 연도별 기초연구, 개발연구, 응용연구, 기타연구 단계의 연구비와 연구비 비중을 조회해주세요. 연구비가 5천만 원 미만인 경우 1억 원으로 간주하여 억 단위로 변환한 결과를 보여주세요.'</li><li>'2020년부터 2023년까지 반도체 중점기술코드에 대한 연도별 기초연구, 개발연구, 응용연구, 기타연구 단계의 연구비와 연구비 비중을 조회해주세요. 연구비가 5천만 원 미만인 경우 1억 원으로 간주하여 억 단위로 변환한 결과를 보여주세요.'</li></ul>                                                                                                                                                                                                                    |
| 18    | <ul><li>"2022년 현재, 중점 기술 코드가 'NAT0R'인 연구 프로젝트 중 '반도체 전체'에 해당하는 데이터를 조회해주세요. 각 연구 프로젝트의 연구책임자 이름, 연구책임자 소속 기관명, 연구책임자 학위코드, 연구책임자 지식재산권 건수를 함께 보여주세요."</li><li>"2022년 현재 진행 중인 연구 프로젝트 중 감염병 중점기술 코드와 관련된 데이터를 조회해주세요. 연구 프로젝트의 총 정부 투자 연구비를 억 단위로 변환하여 중점기술 코드와 코드명을 함께 보여주세요. 코드명에 '전체'가 포함되지 않은 경우만 조회합니다."</li><li>"2020년부터 2022년까지 반도체 중점기술 코드와 관련된 연구 프로젝트 중 총 연구비가 100억 이상인 데이터를 조회해주세요. 연구 프로젝트의 총 정부 투자 연구비를 억 단위로 변환하여 중점기술 코드와 코드명을 함께 보여주세요. 코드명에 '전체'가 포함되지 않은 경우만 조회합니다."</li></ul>                                                                                                                                                                               |
| 19    | <ul><li>'2018년부터 2022년까지 양자전체 중점기술코드에 대해 연도별 논문, 특허, 기술이전, 사업화 건수를 조회해주세요.'</li><li>'2018년부터 2022년까지 반도체 중점기술코드에 대해 연도별 논문, 특허, 기술이전, 사업화 건수를 조회해주세요.'</li><li>'2020년부터 2023년까지 양자컴퓨팅 중점기술코드에 대해 연도별 논문, 특허, 기술이전, 사업화 건수를 조회해주세요.'</li></ul>                                                                                                                                                                                                                                                                                                                                                                                                                                  |
| 20    | <ul><li>'2022년 현재 반도체 중점기술코드에 대해 논문, 특허, 기술이전, 사업화 건수를 조회해주세요. 비밀 과제는 제외하고, 논문은 SCI와 NSCI 논문만 포함해주세요.'</li><li>'2018년부터 2022년까지 반도체 중점기술코드에 대해 연도별로 논문, 특허, 기술이전, 사업화 건수를 조회해주세요. 비밀 과제는 제외하고, 논문은 SCI와 NSCI 논문만 포함해주세요. 결과는 연도별로 정렬해주세요.'</li><li>'2018년부터 2022년까지 인공지능 중점기술코드에 대해 연도별로 논문, 특허, 기술이전, 사업화 건수를 조회해주세요. 비밀 과제는 제외하고, 논문은 SCI와 NSCI 논문만 포함해주세요. 결과는 연도별로 정렬해주세요.'</li></ul>                                                                                                                                                                                                                                                                                      |
| 21    | <ul><li>'2022년부터 2023년까지 인공지능 중점기술코드에 대한 연도별 연구비 현금금액의 합계를 조회해주세요. 각 연도의 금액은 막대 그래프로 표시될 수 있습니다.'</li><li>'2018년부터 2022년까지 인공지능 중점기술코드에 대한 연도별 사업화 건수의 합계를 조회해주세요. 각 연도의 건수는 막대 그래프로 표시될 수 있습니다.'</li><li>'2018년부터 2022년까지 반도체 중점기술코드에 대한 연도별 사업화 건수의 합계를 조회해주세요. 각 연도의 건수는 막대 그래프로 표시될 수 있습니다.'</li></ul>                                                                                                                                                                                                                                                                                                                                                                     |
| 22    | <ul><li>'2022년에 수행된 과제 중에서 반도체 관련 기술(중점기술대분류코드_연구재단 NAT0R)인 과제의 수를 조회해주세요.'</li><li>'2022년까지의 인공지능 기술을 활용한 연구개발 과제의 총 연구비 현금금액 합계를 조회해주세요.'</li><li>'2022년 인공지능(AI) 분야에서 진행된 사업화 건수의 합계를 조회해주세요.'</li></ul>                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
| 23    | <ul><li>'2018년부터 2022년까지 인공지능 중점기술코드에 대해 각 부처별로 연구비 합계와 해당 부처가 차지하는 비중을 연도별로 조회해주세요. 결과는 연구비 합계를 억 단위로 변환하고, 비중은 백분율로 표시해주세요. 상위 10개의 부처만 포함되어야 합니다'</li><li>'2018년부터 2022년까지 인공지능 중점기술코드에 대해 각 부처별로 연구비 합계와 해당 부처가 차지하는 비중을 연도별로 조회해주세요. 결과는 연구비 합계를 억 단위로 변환하고, 비중은 백분율로 표시해주세요. 상위 10개의 부처만 포함되어야 합니다.'</li><li>'2018년부터 2022년까지 양자전체 중점기술코드에 대해 각 부처별로 연구비 합계와 해당 부처가 차지하는 비중을 연도별로 조회해주세요. 결과는 연구비 합계를 억 단위로 변환하고, 비중은 백분율로 표시해주세요. 상위 10개의 부처만 포함되어야 합니다.'</li></ul>                                                                                                                                                                                                     |
| 24    | <ul><li>'2022년 인공지능 기술분야 중점기술코드에 대해 각 부처별로 연구비 합계와 해당 부처가 차지하는 비중을 조회해주세요. 결과는 연구비 합계를 억 단위로 변환하고, 비중은 백분율로 표시해주세요. 상위 10개의 부처만 포함되어야 합니다.'</li><li>'2022년 인공지능 중점기술코드에 해당하는 과제들의 과제명, 연구책임자명, 연구비 금액, 수행기관명, 연구개시일, 연구종료일을 조회해주세요.'</li><li>'2022년 반도체 관련 연구 개발에 대한 부처별 연구비 합계와 해당 부처가 차지하는 비중을 연도별로 조회해주세요. 결과는 연구비 합계를 억 단위로 변환하고, 비중은 백분율로 표시해주세요. 상위 10개의 부처만 포함되어야 합니다.'</li></ul>                                                                                                                                                                                                                                                                                       |
| 25    | <ul><li>'2018년부터 2022년까지 양자컴퓨팅 중점기술코드에 대해 연도별로 SCI 및 NSCI 논문의 수를 조회하고, 각 논문의 수를 소수점 두 자리까지 반올림하여 보여주세요.'</li><li>'2020년부터 2022년까지 양자전체 중점기술코드에 대해 연도별로 SCI 및 NSCI 논문의 수를 조회하고, 각 논문의 수를 소수점 두 자리까지 반올림하여 보여주세요.'</li><li>'2018년부터 2022년까지 양자전체 중점기술코드에 대해 연도별로 SCI 및 NSCI 논문의 수를 조회하고, 각 논문의 수를 소수점 두 자리까지 반올림하여 보여주세요.'</li></ul>                                                                                                                                                                                                                                                                                                                                             |
| 26    | <ul><li>'2018년부터 2022년까지 양자전체 중점기술코드에 대해 연도별로 국내 및 해외 SCI 논문 수와 NSCI 논문 수, 총 논문 수, 그리고 SCI 논문의 비중을 조회해주세요.'</li><li>'2018년부터 2022년까지 반도체 중점기술코드에 대해 연도별로 국내 및 해외 특허건수, 국내 및 해외 특허등록수, 그리고 국내 및 해외 특허출원수를 조회해주세요.'</li><li>'2018년부터 2022년까지 반도체 중점기술코드에 대해 연도별로 국내 및 해외 SCI 논문 수와 NSCI 논문 수, 총 논문 수, 그리고 SCI 논문의 비중을 조회해주세요.'</li></ul>                                                                                                                                                                                                                                                                                                                                         |
| 27    | <ul><li>'2018년부터 2022년까지 양자전체 중점기술코드에 대해 연도별로 각 납부 방식에 따른 금액의 합계를 억 단위로 변환하여 보여주세요. 또한, 각 연도의 금액 합계도 포함해주세요.'</li><li>'2020년부터 2022년까지 양자전체(QUG) 중점기술코드에 대해 연도별로 각 납부 방식에 따른 금액의 합계를 억 단위로 변환하여 보여주세요. 또한, 각 연도의 금액 합계도 포함해주세요.'</li><li>'2020년부터 2022년까지 반도체 중점기술코드에 대해 연도별로 각 납부 방식에 따른 금액의 합계를 억 단위로 변환하여 보여주세요. 또한, 각 연도의 금액 합계도 포함해주세요.'</li></ul>                                                                                                                                                                                                                                                                                                                        |
| 28    | <ul><li>'2022년 인공지능 기술 분야의 연구개발비 현물금액과 연구개발비 현금금액의 합계를 보여주세요.'</li><li>'2018년부터 2022년까지 감염병 전반에 대한 연구개발과제의 총연구비금액의 합계를 구하시오. 또한, 각 연도별로 민간연구비, 정부투자연구비, 총연구비금액의 합계를 구하시오.'</li><li>'2022년 반도체 연구에 대한 중점기술코드의 중점기술코드에 해당하는 연구비의 총액을 구하시오.'</li></ul>                                                                                                                                                                                                                                                                                                                                                                                                                            |

## Uses

### Direct Use for Inference

First install the SetFit library:

```bash
pip install setfit
```

Then you can load this model and run inference.

```python
from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("NTIS/ntisql_encoder_setfit")
# Run inference
preds = model("2020년부터 2022년까지 반도체에 해당하는 중점 기술 분류 코드가 'NAT0' 인 과제의 총 연구비 현물 금액을 조회해주세요.")
```

<!--
### Downstream Use

*List how someone could finetune this model on their own dataset.*
-->

<!--
### Out-of-Scope Use

*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->

<!--
## Bias, Risks and Limitations

*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->

<!--
### Recommendations

*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->

## Training Details

### Training Set Metrics
| Training set | Min | Median  | Max |
|:-------------|:----|:--------|:----|
| Word count   | 6   | 22.8862 | 66  |

| Label | Training Sample Count |
|:------|:----------------------|
| 0     | 65                    |
| 1     | 28                    |
| 2     | 26                    |
| 3     | 131                   |
| 4     | 489                   |
| 5     | 180                   |
| 6     | 80                    |
| 7     | 217                   |
| 8     | 62                    |
| 9     | 77                    |
| 10    | 4                     |
| 11    | 3                     |
| 12    | 5                     |
| 13    | 41                    |
| 14    | 179                   |
| 15    | 108                   |
| 16    | 4                     |
| 17    | 56                    |
| 18    | 41                    |
| 19    | 21                    |
| 20    | 78                    |
| 21    | 72                    |
| 22    | 99                    |
| 23    | 116                   |
| 24    | 48                    |
| 25    | 46                    |
| 26    | 115                   |
| 27    | 75                    |
| 28    | 13                    |

### Framework Versions
- Python: 3.12.7
- SetFit: 1.0.0
- Sentence Transformers: 3.0.1
- Transformers: 4.46.3
- PyTorch: 2.5.1+cu124
- Datasets: 3.1.0
- Tokenizers: 0.20.3

## Citation

### BibTeX
```bibtex
@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
```

<!--
## Glossary

*Clearly define terms in order to be accessible across audiences.*
-->

<!--
## Model Card Authors

*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->

<!--
## Model Card Contact

*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->