seongil-dn's picture
Add new SentenceTransformer model
cd78ab8 verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:482743
  - loss:CachedMultipleNegativesRankingLoss
base_model: BAAI/bge-m3
widget:
  - source_sentence: 언제 청년층 생산가능인구 수가 9,149,000명으로 드러났어
    sentences:
      - >-
        제2장 청년층 노동시장 동향 및 청년내일채움공제의 성과 개괄

          장에서는 청년내일채움공제 사업의 도입 배경으로 작용한 청년층 노동시장의 현황을 살펴보고, 세부 성과에 앞서
        청년내일채움공제가  청년고용 실태에 미친 개괄적 성과를 평가하고자 한다

        제1절 청년층 노동시장 동향

        1. 청년층 인구구조 변화 추이

         고용률과 실업률, 취업자  등의 고용지표는 경제  노동시장의 상황   아니라, 인구구조 변화에 의해 영향을 받는 만큼,
        청년층의 노동시장 동향을 파악하기 위해서는 청년층 인구구조의 변화양상을 이해할 필요가 있음  청년층 인구구조 변화 추이

         전체 생산가능인구가 여전히 증가추세에 있는 것에 비해, 청년층(15∼29세) 생산가능인구는 1990년을 기점으로 감소추세에
        있음. 2018 청년층 생산가능인구는 전년대비 133천명 감소한 9,149천명임 - 15∼19세, 20∼24세 연령대의
        생산가능인구는 감소추세에 있으나, 25∼29세 생산가능인구(3,432천명, 전년대비 96천명 증가)는 증가추세에 있으며 향후
        2∼3년간 증가추세가 지속될 것으로 전망됨

         청년층 경제활동인구는 2000년대 지속적으로 감소하다가 2013∼2016년 기간 증가추세를 보였으나, 2017 이후 감소하고
        있음. 2018 청년층 경제활동인구는 전년대비 21천명 감소한 4,312천명을 기록하였음
      - >-
        2. 인구구조변화의 현황<br>UN 인구국 자료를 분석해보면 2010년 인구와 2050년의 중간 수준 예측치를 기준으로 인구
        1,000만 명 이상의 국가이면서 2050년까지 생산가능인구(15세~64세)가 감소하는 국가는 198개국중에서 19개국이다. 이
        중에서 우리나라는 생산 가능인구(15세~64세) 감소율이 세계 6위 수준을 기록할 것으로 분석되었고, 이에 따라 생산가능 인구가
        2010년 대비 2050년에는 27%가 줄어들 것으로 예상된다. 이에 반하여 노인인구는 236%가 증가할 것으로 예상된다.
        우리나라는 생산가능인구 감소율과 노인인구(65세 이상) 증가율이 매우 높은 나라 중 하나이며, 동시에 유소년(0~14세) 인구의
        감소도 22% 정도 될 것으로 예상하고 있다. <br>UN의 인구국(局) 자료인 [표 1]을 보면, 첫째 현재 우리나라를 포함하여
        선진국에서조차도 현재 인구감소를 겪어본 국가가 거의 없어 이것이 가져다 줄 영향에 대한 경험적 지식이 거의 전무하다는 점이다.
        <br>둘째, 우리나라의 경우에는 무엇보다도 인구감소기로의 전환이 급격하게 이루어지고 있다. 따라서 우리 스스로 이의
        긍정적ㆍ부정적 영향을 연역적으로 추론해볼 필요가 있다. 이를 위해서는 우리 사회의 전체 변화를 거시적으로 바라보고 정책 수단에
        따라 가져다 줄 다양한 변화를 살펴볼 수 있는 시뮬레이션(simulation) 도구 및 정책 개발 그리고 집행 체제가 필요하다고
        할 수 있다.
      - >-
        7. 해외사례

        플랫폼 노동관계에 특화된 산재보험제도를 별도로 규정하고 있는 포괄적 입법례는 아직 보이지 않는다. 다만, 플랫폼 노동에 관한
        미국의 앨라배마 주법(SB363, 2018.3.13. 제정)에서는 플랫폼 노동자들에게 일정한 수준의 복지를 허용하기 위한 법적
        기초를 만들고 있다(부표 1 참조). SB363은 플랫폼 노동자들의 이동성을 고려한 ‘이동 가능 복지제도’(portable
        benefit plans)를 플랫폼 사업주들이 만들면,  복지제도를 통해 다수의 플랫폼과 계약을 맺는 플랫폼 노동자들이 복수
        사업주 혹은 사업주의 변경에도 불구하고 복지제도를 유지하면서 그로부터 복지수혜를 얻을  있도록 하고 있다. 이때의 복지제도는
        건강보험, 재해보험, 퇴직수당제도 등으로 구성될  있고, 플랫폼 노동자가 복지계좌를 개설하면 여기에 플랫폼 사업주가 복지기여금을
        납부하는 방식을 취하고 있다. 국가에 의한 사회보험제도가 아니고, 플랫폼 사업주에 의한 자발적 복지제도의 기초를 구성한 것이기는
        하지만, 지방정부가 이를 관리하도록 함으로써 공정성과 객관성을 담보한다. 한국의 산재보험제도에 대입시켜 비교할  있는 입법례가
        아니기는 하지만, 플랫폼 사업주로 하여금 플랫폼 노동자에 대한 일정한 복지제도 형성을 촉구하고 있다는 점, 해당 복지제도에 대하여
        플랫폼이 일정한 기여금을 납부하도록 하고 있다는  등에서 하나의 제도적 모델로 시사가능하다. 한편, 미국의 플로리다, 인디아나,
        아이오와, 켄터키, 테네시, 텍사스, 유타주 등에서는 플랫폼노동자(경우에 따라서는 가사노동자에 국한)의 의미를 규정하면서, 주법상
        재해보험제도 및(또는) 실업급여제도의 가입자가   있도록 하고 있다.
  - source_sentence: 도매 전력 매매를 주로  전력거래체계를 만들었을  어느 부문이 안정성 영향을 받을  있어
    sentences:
      - >-
        (4) 외환시장

        원/달러 환율 2016  대비 하락

        원/달러 환율은 연초  보호무역주의에 대한 우려, 수출 호조, 외국인 증권투자자금 유입 등으로 3 말까지 상당  하락하였다.
        이후 북한 관련 리스크 전개 상황,  연준의 연내 금리인상 기대 변화 등에 따라 등락하는 모습을 보였다. 10 들어 북한
        리스크 완화,  달러화 약세 지속, 국내경제의 견실한 성장세 등으로 하락세로 전환하였으며, 2017 말에는 연중 최저치인
        1,070.5원을 기록하였다. 2017   달러화에 대한 원화의 가치는 2016  대비 12.8% 상승하였다. 한편
        원/엔 환율(100엔당)은  연준 금리인상 기대변화, 북한 리스크 등에 영향을 받으며 등락을 지속하다가 10 들어 원화가
        상대적으로 강세를 보이면서 하락하였다. 2017  원화의 엔화에 대한 가치는 100엔당 949.2원으로 2016  대비
        9.1% 상승하였다. 원/달러 환율의 일중  전일대비 변동폭은 연평균 각각 5.5원, 4.4원을 기록하여 2016년(각각
        7.5  6.0원)에 비해 축소되었다. 외환스왑레이트 하락, 통화스왑금리 상승

        외환스왑레이트(3개월물)는 외화자금수요 확대 등으로 2016  대비 0.61% 포인트 하락한 -0.63%를 기록하였다.
        통화스왑금리(3년물)는 경제지표 호조 등에 따른 국고채 금리 상승 등으로 2016  대비 0.37% 포인트 상승한 1.57%를
        기록하였다.
      - >-
        4. 국내 전력거래 형태 전망

        앞서 살펴보았듯이, 구조개편을 단행한 외국의 전력거래 형태는 대체로 도매 전력거래 위주, 소매 전력거래 위주, 계약위주  
        가지로 구분되어 있다. 국내 전력산업의 현재 여건을 고려할 경우 가장 가능성이 높은 전력거래 형태는 도매 전력거래 위주의
        거래형태일 것이다. 만약 도매 전력거래 위주의 전력거래체계를 구축하는 경우 가격과 공급의 안정성에 상당한 영향을 미칠 것으로
        보인다. 하지만 규제계약(Vesting Contract)을 포함하여 장단기 계약물량을 확대함으로써 현물시장의 가격  공급
        변동성을 완화할  있는 대안이 존재한다. 만약 전력시장에서의 가격과 공급 안정성 측면을 염두에 둔다면 소매 전력거래 형태 또는
        장단기 계약 위주의 전력거래 형태를 고려해   있다. 소매 전력거래 형태에서는 주로 기존의 수직통합체제 또는 이미 발전과
        판매가 송배전 부문으로부터 분리된 경우라면 발전과 판매의 통합과 이로 인한 규모의 확대에 따라 유효경쟁의 약화 가능성이 문제가 
         있다. 이렇게 통합된 기업의 소매시장에서의 시장지배력 문제가 존재하기 때문에 순수 판매회사 또는 신규기업과의 실질적인 경쟁이
        가능한 방향으로 제도적 장치를 마련할 필요가 있다.
      - >-
        Ⅲ. 우리나라 전력시장에서의 유연성 자원

        1. 우리나라 전력시장의 현황

        우리나라의 전력시장은 전력산업의 효율성 향상을 위하여 2001 전력산업구조개편을 통해 독점사업자였던 한국전력공사로부터 발전부문을
        분리시켜 발전자회사로 재편시키고, 발전부문에 대한 경쟁체제를 도입하면서 출범하였다. 우리나라 전력시장은 소비자가 직접 거래에
        참여하는 소매시장이 아닌 발전회사와 판매회사가 참여하는 도매시장으로, 다수의 발전회사가 존재하는 공급측과는 달리 수요측은 단일
        구매자인 한국전력공사만 존재하는 구매독점 형태로 이루어져 있다. 또한 설비용량이 20MW를 초과하는 상업용 발전기는 전력시장을
        통해서만 거래가 가능한 의무적 시장이다.
  - source_sentence: 해외 파생상품시장에서 거래되는 경우는 어떤 파생상품으로 분류할  있어
    sentences:
      - >-
        3) 연금 세제

         근퇴법  연금수령을 활성화하기 위한 강제조항이 부재한 상황에서 세제체계(소득세법)에 따라 수령방법이 결정되는 구조임. 
        제도적으로 일시금 수령을 방지하거나 연금수령을 강제하는 규정이 부재한 상황에서 수령 방법은 주로 세금부담에 따라 결정될 수밖에
        없음.  일시금 수령을 경감시키기 위해 2016 소득세법을 개정하였으나 개정된 소득세법 조차도 일시금과 연금수령  세금부담
        차이가 크지 않아 일시금 수령을 방지하지 못하는 한계가 존재함.  연금과 일시금 수령  세제차이가 크지 않은 주요 원인은
        일시금 수령시 제공하는 공제혜택이 크기 때문임.  국내 퇴직연금시장에서 일시금 수령이 만연한 것은 연금수령  부담하는 세율이
        높아서가 아니라 일시금 수령  부담하는 세율이 낮기 때문임.  일시금 수령의 세금부담이 높지 않은 이유는 일시금 수령 시에도
        다수의 공제혜택(근속연수공제+환산급여공제)이 제공되고 혜택의 규모도 크기 때문임.   연금수령 시에는 일시금 수령  부담하는
        세금의 70%만을 부담하도록 규정하고(소득세법 제129조(원천징수세율)제1항제5의336)) 있으나, 일시금 수령  세금부담이
        작기 때문에 연금수령  추가 제공되는 세제혜택의 크기가 미미하게 됨.  특히 연금수령 기간에 따른 세금차이가 없어 연금으로
        수령하더라도 단기간 연금(예, 10년)을 수령하는 유인을 제공함.
      - >-
        □ 장외파생 권역별 대표 상품을 살펴보면 금리관련상품 중에는 금리스왑(Interest Rate Swap:IRS)이, 통화관련 상품
        중에서는 통화선도계약이, 신용관련거래에서는 신용파산스왑(Credit Default Swap:CDS)이 가장 높은 비중을
        차지<br>○ 금리스왑은 금리관련 장외파생상품시장의 91.2%를 차지하고 있으며, 신용관련상품의 경우 신용파산스왑과
        총수익스왑(Total Return Swap:TRS)만이 거래<br>○ 통화선도는 대부분 NDF(Non-Deliverable
        Forward)의 형태로 거래<br>○ 장외파생상품 거래는 일대일 계약을 기반으로 하고 거래당사자의 높은 신용도를 요구하기 때문에
        신용도가 낮은 개인 또는 금융기관은 참가하기가 어려운 실정<br>○ 특히, 신용관련거래는 다른 금융기관에 비해 상대적으로 높은
        신용도를 가지고 있는 은행과 증권사를 통해서만 거래가 이루어지고 있는 것으로 파악
      - >-
        제5조 (파생상품) ① 이 법에서 ˝파생상품˝이란 다음 각 호의 어느 하나에 해당하는 계약상의 권리를 말한다.

        1. 기초자산이나 기초자산의 가격ㆍ이자율ㆍ지표ㆍ단위 또는 이를 기초로 하는 지수 등에 의하여 산출된 금전등을 장래의 특정 시점에
        인도할 것을 약정하는 계약

        2. 당사자 어느 한쪽의 의사표시에 의하여 기초자산이나 기초자산의 가격ㆍ이자율ㆍ지표ㆍ단위 또는 이를 기초로 하는 지수 등에 의하여
        산출된 금전등을 수수하는 거래를 성립시킬  있는 권리를 부여하는 것을 약정하는 계약

        3. 장래의 일정기간 동안 미리 정한 가격으로 기초자산이나 기초자산의 가격ㆍ이자율ㆍ지표ㆍ단위 또는 이를 기초로 하는 지수 등에
        의하여 산출된 금전등을 교환할 것을 약정하는 계약

          법에서 ˝장내파생상품˝이란 파생상품으로서 파생상품시장에서 거래되는  또는 해외 파생상품시장(파생상품시장과 유사한
        시장으로서 해외에 있는 시장과 대통령령으로 정하는 해외 파생상품거래가 이루어지는 시장을 말한다)에서 거래되는 것을 말한다.  
        법에서 ˝장외파생상품˝이란 파생상품으로서 장내파생상품이 아닌 것을 말한다.  제1항  호의 어느 하나에 해당하는 계약 
        매매계약이 아닌 계약의 체결은  법을 적용함에 있어서 매매계약의 체결로 본다.
  - source_sentence: 어디서 자금세탁 전제범죄에서 비영리단체 관련 자금세탁범죄를 찾아내는 방식을 선택했어
    sentences:
      - >-
        IV. 비영리단체 분야의 범죄유형 및 사례

        1. 국내사례와 범죄유형

         한국은 아직 비영리단체에 대한 명확한 개념 구분이 정립되어 있지 않은 실정으로 이에 따라 그동안 한국에서는 비영리단체
        관련범죄에 대한 인식이 제대로 이루어지지 않음. -비영리단체 관련 범죄에 있어서도 비영리단체에 대한 명확한 개념 구분 없이
        판결문이 작성되어 비영리단체 관련 자금세탁범죄를 조사하는데 있어서  장애로 작용함. -국내 판례에서 비영리단체와 관련하여
        자금세탁이라는 용어를 직접 사용한 경우는 없으며 이에 따라 부득이 자금세탁 전제범죄를 통하여 비영리단체 관련 자금세탁범죄를
        조사하는 방법을 택함.
      - >-
        VI. 비영리단체를 통한 테러자금조달방지를 위한 제도개선방안

         FATF는 2001 10 테러자금조달에 대한 특별권고 8항(Special Recommendationson Terrorist
        Financing)을 통하여 비영리단체에 대한 관리감독을 강화하고 관련 법규를 정비할 것을 권고하였음. -우리나라에서 비영리단체를
        통한 자금세탁을 이용해서 테러자금이 조달될 가능성은 매우 낮은 것으로 평가되나 자금세탁의 우회로를 차단하고, 또한 예방적인 조치를
        취해 국제적으로 자금세탁을 통한 불법적인 테러자금조달 방지 노력에 적극 부응하기 위해서는 비영리단체에 대한 자금세탁 방지제도
        도입에 적극 참여해야  것임.
      - >-
        (2) 전북의 풍력산업 약점

        전북의 풍력산업은 내부환경관점에서 다음과 같은 약점을 보유하고 있다. 첫째, 두산(창원), 유니슨(사천), 효성(창원),
        한진(양산)  풍력터빈시스템업체는 모두 경남권에 위치하고 있으며, 현재 경남 이외 지역에서는 MW급 이상 풍력용 터빈시스템업체가
        존재하지 않는다. 다만 최근 터빈의 대형화에 따라, 터빈의 무게  부피 등에 따른 운송에 한계가 존재하고 상당기간 고정식 형태의
        해상풍력발전단지 구축이 중심이  것으로 판단됨에 따라, 부유식 해상풍력단지개발이 시작되기 전까지는 GW급 해상풍력단지 개발계획에
        따라 서해안권으로 시스템업체의 이전가능성은 일부 존재한다. 둘째, 해상풍력 관련 연구/생산인력 부족 역시 장기적 해상풍력기술의
        지속성 관점에서 시급한 문제이다. 현재 전북은 해상풍력터빈과 관련된 기술은 없으나, 휴먼컴퍼지트와 재료연구원 풍력핵심기술연구센터를
        통해 해상풍력 블레이드  재료 등에 대한 기술이 축적되어 있다. 이외에 하부구조물  타워 관련 기술 역시 에드벡트가
        석션버켓(suction bucket)방식의 하부구조물 관련 기술을 보유하고 있고 현재 군산공장을 리모델링 중인 CS윈드는 세계
        최고수준의 타워제작기술을 확보하고 있다. 따라서 전북은 블레이드, 재료, 타워  하부구조물 등과 관련된 기술을 확보하고 있다.
  - source_sentence: 전남지역의 석유와 화학제품은  수출이 늘어나는 경향을 보였어
    sentences:
      - >-
        수출 증가세 지속

        1/4분기  수출은 전년동기대비 증가흐름을 지속하였다. 품목별로 보면 석유제품, 석유화학, 철강, 선박, 반도체, 자동차 
        대다수 품목에서 증가하였다. 석유제품은 글로벌 경기회복에 따른 에너지 수요 증가와 국제유가 급등으로 수출단가가 높은 상승세를
        지속하면서 증가하였다. 석유화학도 중국, 아세안을 중심으로 합성수지, 고무 등의 수출이   증가한 데다 고유가로 인한
        수출가격도 동반 상승하면서 증가세를 이어갔다. 철강은 건설, 조선  글로벌 전방산업의 수요 증대, 원자재가격 상승  중국 감산
        등에 따른 수출단가 상승 등에 힘입어 증가세를 이어갔다. 선박은 1/4분기  인도물량이 확대됨에 따라 증가하였다. 반도체는
        자동차  전방산업의 견조한 수요가 이어지는 가운데 전년동기대비로 높은 단가가 지속되면서 증가하였다. 자동차는 차량용 반도체
        수급차질이 지속되었음에도 불구하고 글로벌 경기회복 흐름에 따라 수요가 늘어나면서 전년동기대비 소폭 증가하였다. 모니터링 결과 향후
        수출은 증가세가 지속될 것으로 전망되었다. 석유화학  석유정제는 수출단가 상승과 전방산업의 수요확대 기조가 이어지면서 증가할
        전망이다. 철강은 주요국 경기회복과 중국, 인도 등의 인프라 투자 확대 등으로 양호한 흐름을 이어갈 전망이다. 반도체는 글로벌
        스마트폰 수요 회복, 디지털 전환 기조 등으로 견조한 증가세를 지속할 것으로 보인다. 자동차는 차량용 반도체 공급차질이 점차
        완화되고 미국, 신흥시장을 중심으로 수요회복이 본격화됨에 따라 소폭 증가할 전망이다. 선박은 친환경 선박수요 지속, 글로별 교역
        신장 등에도 불구하고 2021 2/4분기 집중되었던 인도물량의 기저효과로 인해 감소할 것으로 보인다.
      - >-
        (3) 금융기관 여수신

        은행 수신   확대

        은행 수신은 2019년에 비해 증가폭이 크게 확대되었다. 수시입출식예금은 불확실성 증대에 따른 가계  기업의 예비자금 확보 등의
        영향으로 증가 규모가 전년대비 3배가량 확대되었다. 반면 정기예금은 예금금리 하락, 예대율  LCR 규제 완화에 따른 은행의
        정기예금 유치 유인 축소 등에 기인하여 감소로 전환하였다. 자산운용사 수신은 증가폭이 축소되었다. MMF는 꾸준한 증가세를
        유지하였으나 주식형  채권형 펀드는 개인투자자의 주식 직접투자증가, 신용증권에 대한 시장 경계감 확대 등으로 감소로 전환하였다.
        또한 기타펀드는 2019  일부 사모펀드 손실  환매중단 사태, 사모펀드 일반투자자 요건 강화 등으로 증가 규모가 절반
        수준으로 축소되었다. 한편 신용협동기구  비은행예금취급기관 수신은 대체로 2019년과 비슷한 증가 규모를 나타내었다.
      - >-
        (2) 전남지역

        2013년중 전남지역 수출은 전년대비 1.2% 감소로 전환하였다. 품목별로는 석유(+9.3%  +3.8%) 
        화학제품(+1.2%  +7.1%)이 중국  해외수요확대로 증가세를 지속하였으나 철강금속(+1.8%  -8.6%)은 글로벌
        공급과잉  중국의 저가 철강수출 확대로, 선박(+7.6%  -49.2%)은 수주물량이 급격히 줄어들면서 감소로 전환하였다.
        전남지역 수입은 원유, 화학제품, 철강금속 등의 수입이 줄면서 전년대비 7.4% 감소로 전환하였다.
pipeline_tag: sentence-similarity
library_name: sentence-transformers

SentenceTransformer based on BAAI/bge-m3

This is a sentence-transformers model finetuned from BAAI/bge-m3. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: BAAI/bge-m3
  • Maximum Sequence Length: 1024 tokens
  • Output Dimensionality: 1024 tokens
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 1024, 'do_lower_case': False}) with Transformer model: XLMRobertaModel 
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("seongil-dn/bge-m3-kor-retrieval-bs1024-checkpoint-295")
# Run inference
sentences = [
    '전남지역의 석유와 화학제품은 왜 수출이 늘어나는 경향을 보였어',
    '(2) 전남지역\n2013년중 전남지역 수출은 전년대비 1.2% 감소로 전환하였다. 품목별로는 석유(+9.3% → +3.8%) 및 화학제품(+1.2% → +7.1%)이 중국 등 해외수요확대로 증가세를 지속하였으나 철강금속(+1.8% → -8.6%)은 글로벌 공급과잉 및 중국의 저가 철강수출 확대로, 선박(+7.6% → -49.2%)은 수주물량이 급격히 줄어들면서 감소로 전환하였다. 전남지역 수입은 원유, 화학제품, 철강금속 등의 수입이 줄면서 전년대비 7.4% 감소로 전환하였다.',
    '수출 증가세 지속\n1/4분기 중 수출은 전년동기대비 증가흐름을 지속하였다. 품목별로 보면 석유제품, 석유화학, 철강, 선박, 반도체, 자동차 등 대다수 품목에서 증가하였다. 석유제품은 글로벌 경기회복에 따른 에너지 수요 증가와 국제유가 급등으로 수출단가가 높은 상승세를 지속하면서 증가하였다. 석유화학도 중국, 아세안을 중심으로 합성수지, 고무 등의 수출이 큰 폭 증가한 데다 고유가로 인한 수출가격도 동반 상승하면서 증가세를 이어갔다. 철강은 건설, 조선 등 글로벌 전방산업의 수요 증대, 원자재가격 상승 및 중국 감산 등에 따른 수출단가 상승 등에 힘입어 증가세를 이어갔다. 선박은 1/4분기 중 인도물량이 확대됨에 따라 증가하였다. 반도체는 자동차 등 전방산업의 견조한 수요가 이어지는 가운데 전년동기대비로 높은 단가가 지속되면서 증가하였다. 자동차는 차량용 반도체 수급차질이 지속되었음에도 불구하고 글로벌 경기회복 흐름에 따라 수요가 늘어나면서 전년동기대비 소폭 증가하였다. 모니터링 결과 향후 수출은 증가세가 지속될 것으로 전망되었다. 석유화학 및 석유정제는 수출단가 상승과 전방산업의 수요확대 기조가 이어지면서 증가할 전망이다. 철강은 주요국 경기회복과 중국, 인도 등의 인프라 투자 확대 등으로 양호한 흐름을 이어갈 전망이다. 반도체는 글로벌 스마트폰 수요 회복, 디지털 전환 기조 등으로 견조한 증가세를 지속할 것으로 보인다. 자동차는 차량용 반도체 공급차질이 점차 완화되고 미국, 신흥시장을 중심으로 수요회복이 본격화됨에 따라 소폭 증가할 전망이다. 선박은 친환경 선박수요 지속, 글로별 교역 신장 등에도 불구하고 2021년 2/4분기 집중되었던 인도물량의 기저효과로 인해 감소할 것으로 보인다.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 512
  • learning_rate: 3e-05
  • num_train_epochs: 5
  • warmup_ratio: 0.05
  • fp16: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 512
  • per_device_eval_batch_size: 8
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 3e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 5
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.05
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: True
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • eval_use_gather_object: False
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Click to expand
Epoch Step Training Loss
0.0085 1 2.0476
0.0171 2 2.0595
0.0256 3 2.0267
0.0342 4 2.0971
0.0427 5 2.2171
0.0513 6 2.287
0.0598 7 2.0867
0.0684 8 1.9498
0.0769 9 1.569
0.0855 10 1.3313
0.0940 11 1.4122
0.1026 12 1.3425
0.1111 13 1.1936
0.1197 14 0.8012
0.1282 15 0.8862
0.1368 16 1.193
0.1453 17 0.9771
0.1538 18 0.3887
0.1624 19 0.363
0.1709 20 0.3092
0.1795 21 0.2692
0.1880 22 0.2386
0.1966 23 0.2266
0.2051 24 0.233
0.2137 25 0.2214
0.2222 26 0.2038
0.2308 27 0.2015
0.2393 28 0.1772
0.2479 29 0.1697
0.2564 30 0.1718
0.2650 31 0.2456
0.2735 32 0.5238
0.2821 33 0.5308
0.2906 34 0.5111
0.2991 35 0.3931
0.3077 36 0.3414
0.3162 37 0.2704
0.3248 38 0.2949
0.3333 39 0.3082
0.3419 40 0.3755
0.3504 41 0.3127
0.3590 42 0.3756
0.3675 43 0.3564
0.3761 44 0.3905
0.3846 45 0.377
0.3932 46 0.3043
0.4017 47 0.3237
0.4103 48 0.4035
0.4188 49 0.4522
0.4274 50 0.4392
0.4359 51 0.4482
0.4444 52 0.3586
0.4530 53 0.3154
0.4615 54 0.4053
0.4701 55 0.5846
0.4786 56 0.4372
0.4872 57 0.6201
0.4957 58 0.5278
0.5043 59 0.4844
0.5128 60 0.5817
0.5214 61 0.3765
0.5299 62 0.4785
0.5385 63 0.5724
0.5470 64 0.5375
0.5556 65 0.5362
0.5641 66 0.4731
0.5726 67 0.4514
0.5812 68 0.4563
0.5897 69 0.4198
0.5983 70 0.4086
0.6068 71 0.3612
0.6154 72 0.3463
0.6239 73 0.6261
0.6325 74 0.6283
0.6410 75 0.4635
0.6496 76 0.463
0.6581 77 0.4075
0.6667 78 0.3797
0.6752 79 0.2769
0.6838 80 0.3353
0.6923 81 0.2295
0.7009 82 0.4316
0.7094 83 0.9861
0.7179 84 0.9684
0.7265 85 0.9883
0.7350 86 0.8865
0.7436 87 0.8248
0.7521 88 0.7973
0.7607 89 0.8465
0.7692 90 0.7664
0.7778 91 0.7643
0.7863 92 0.7665
0.7949 93 0.7348
0.8034 94 0.7493
0.8120 95 0.6115
0.8205 96 0.6233
0.8291 97 0.6435
0.8376 98 0.5581
0.8462 99 0.542
0.8547 100 0.5571
0.8632 101 0.502
0.8718 102 0.5375
0.8803 103 0.4952
0.8889 104 0.4873
0.8974 105 0.4599
0.9060 106 0.4536
0.9145 107 0.4479
0.9231 108 0.384
0.9316 109 0.3523
0.9402 110 0.369
0.9487 111 0.3422
0.9573 112 0.3698
0.9658 113 0.3625
0.9744 114 0.3736
0.9829 115 0.4313
0.9915 116 0.4605
1.0 117 0.2948
1.0085 118 0.7391
1.0171 119 0.6622
1.0256 120 0.6917
1.0342 121 0.7963
1.0427 122 0.7815
1.0513 123 0.6719
1.0598 124 0.6098
1.0684 125 0.549
1.0769 126 0.7212
1.0855 127 0.6381
1.0940 128 0.7424
1.1026 129 0.6822
1.1111 130 0.6921
1.1197 131 0.5022
1.1282 132 0.578
1.1368 133 0.8139
1.1453 134 0.6167
1.1538 135 0.1836
1.1624 136 0.1853
1.1709 137 0.1628
1.1795 138 0.1464
1.1880 139 0.1308
1.1966 140 0.1273
1.2051 141 0.1414
1.2137 142 0.138
1.2222 143 0.1268
1.2308 144 0.1348
1.2393 145 0.111
1.2479 146 0.1069
1.2564 147 0.1122
1.2650 148 0.1703
1.2735 149 0.405
1.2821 150 0.3876
1.2906 151 0.378
1.2991 152 0.2633
1.3077 153 0.2263
1.3162 154 0.1748
1.3248 155 0.2016
1.3333 156 0.2166
1.3419 157 0.2798
1.3504 158 0.2295
1.3590 159 0.2805
1.3675 160 0.2619
1.3761 161 0.3006
1.3846 162 0.2843
1.3932 163 0.2244
1.4017 164 0.2361
1.4103 165 0.3025
1.4188 166 0.3443
1.4274 167 0.3329
1.4359 168 0.3467
1.4444 169 0.2748
1.4530 170 0.2304
1.4615 171 0.3125
1.4701 172 0.478
1.4786 173 0.3085
1.4872 174 0.4337
1.4957 175 0.3936
1.5043 176 0.3455
1.5128 177 0.4205
1.5214 178 0.2752
1.5299 179 0.36
1.5385 180 0.4347
1.5470 181 0.3949
1.5556 182 0.4072
1.5641 183 0.3633
1.5726 184 0.3532
1.5812 185 0.3451
1.5897 186 0.3242
1.5983 187 0.3122
1.6068 188 0.2845
1.6154 189 0.2815
1.6239 190 6.9159
1.6325 191 7.9604
1.6410 192 6.5821
1.6496 193 3.9177
1.6581 194 1.6951
1.6667 195 0.5367
1.6752 196 0.2935
1.6838 197 0.3295
1.6923 198 0.2212
1.7009 199 0.335
1.7094 200 0.7829
1.7179 201 0.7884
1.7265 202 0.7921
1.7350 203 0.7342
1.7436 204 0.6092
1.7521 205 0.6014
1.7607 206 0.6414
1.7692 207 0.5842
1.7778 208 0.5916
1.7863 209 0.5993
1.7949 210 0.5658
1.8034 211 0.6013
1.8120 212 0.4769
1.8205 213 0.4801
1.8291 214 0.5087
1.8376 215 0.436
1.8462 216 0.4398
1.8547 217 0.4391
1.8632 218 0.419
1.8718 219 0.4338
1.8803 220 0.395
1.8889 221 0.4063
1.8974 222 0.375
1.9060 223 0.3655
1.9145 224 0.3637
1.9231 225 0.3098
1.9316 226 0.2782
1.9402 227 0.2941
1.9487 228 0.275
1.9573 229 0.3018
1.9658 230 0.2971
1.9744 231 0.3108
1.9829 232 0.3808
1.9915 233 0.4067
2.0 234 0.2424
2.0085 235 0.6453
2.0171 236 0.5577
2.0256 237 0.6179
2.0342 238 0.72
2.0427 239 0.689
2.0513 240 0.58
2.0598 241 0.5204
2.0684 242 0.4697
2.0769 243 0.6434
2.0855 244 0.5762
2.0940 245 0.6552
2.1026 246 0.6069
2.1111 247 0.619
2.1197 248 0.4467
2.1282 249 0.5206
2.1368 250 0.7318
2.1453 251 0.5432
2.1538 252 0.1411
2.1624 253 0.1448
2.1709 254 0.1297
2.1795 255 0.1207
2.1880 256 0.1104
2.1966 257 0.1071
2.2051 258 0.1148
2.2137 259 0.1103
2.2222 260 0.1015
2.2308 261 0.1091
2.2393 262 0.0956
2.2479 263 0.0939
2.2564 264 0.0957
2.2650 265 0.1511
2.2735 266 0.3833
2.2821 267 0.3583
2.2906 268 0.35
2.2991 269 0.2327
2.3077 270 0.1911
2.3162 271 0.1528
2.3248 272 0.1747
2.3333 273 0.1915
2.3419 274 0.2387
2.3504 275 0.1978
2.3590 276 0.2454
2.3675 277 0.2302
2.3761 278 0.2579
2.3846 279 0.2458
2.3932 280 0.1907
2.4017 281 0.2128
2.4103 282 0.2675
2.4188 283 0.2936
2.4274 284 0.2778
2.4359 285 0.2962
2.4444 286 0.238
2.4530 287 0.2024
2.4615 288 0.2726
2.4701 289 0.423
2.4786 290 0.2687
2.4872 291 0.386
2.4957 292 0.3448
2.5043 293 0.3082
2.5128 294 0.3734
2.5214 295 0.2406

Framework Versions

  • Python: 3.10.12
  • Sentence Transformers: 3.2.1
  • Transformers: 4.44.2
  • PyTorch: 2.3.1+cu121
  • Accelerate: 1.1.1
  • Datasets: 2.21.0
  • Tokenizers: 0.19.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

CachedMultipleNegativesRankingLoss

@misc{gao2021scaling,
    title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
    author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
    year={2021},
    eprint={2101.06983},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}