metadata
license: cc-by-nc-4.0
pipeline_tag: summarization
λ² μ΄μ€ λͺ¨λΈ
gogamza/kobart-base-v2μ λ² μ΄μ€λ‘ νμκ³ , aihubμ μλ μμ½ λ°μ΄ν°λ₯Ό μ¬μ©νμ¬ νμ΅μ μ§ννμμ΅λλ€.
μ¬μ© λ°μ΄ν°μ (683,335건)
μΆμ μμ½ μ¬μ€μ± κ²μ¦ λ°μ΄ν°
μμ½λ¬Έ λ° λ ν¬νΈ μμ± λ°μ΄ν°
λ¬Έμμμ½ ν
μ€νΈ
λμμλ£ μμ½
νμ΅
Nvidia A100 x 1μ μ¬μ©νμμΌλ©°, 3epoch νμ΅μ 17hμ΄ μμλμμ΅λλ€.
μ¬μ© μμ
from transformers import pipeline
# GPU μ¬μ© μΌμ΄μ€
# pipe = pipeline("summarization", model="gangyeolkim/kobart-korean-summarizer-v2", device=0)
# GPU λ―Έμ¬μ© μΌμ΄μ€
pipe = pipeline("summarization", model="gangyeolkim/kobart-korean-summarizer-v2")
original_text = """
(μμΈ=μ°ν©λ΄μ€) νΉλ³μ·¨μ¬ν = μ°ν©λ΄μ€TVμ λν μ λμ μΈμΒ·ν©λ³(M&A)μ μλνλ μμ§μ¬λ¨μ΄ μ¬μ€μ λ°μ€μ νμ₯ μΌκ°μ 'μ‘±λ²κ²½μ' 체μ μμ μ¬μ΅μ μ€ννλ μλ¨μΌλ‘ νμ©λλ€λ μ§μ μ΄ λμ¨λ€.
μμ§μ¬λ¨μ μ°νμ λ³μ, λν λ± μ¬λ¬ λ²μΈμ λκ³ μμ§λ§, λ°μ€μ νμ₯κ³Ό μλ΄μΈ νμ±ν¬ μμ§λ μ΄μ₯μ΄ μμ§μ μ£Όκ³ λ°μΌλ©΄μ μ¬μ€μ ν¨κ» κ²½μνλ 체μ λ€.
λΉμ리λ²μΈμΌλ‘ κ°μ’
μΈμ ννμ λ°λ μμ§μ¬λ¨μ 'μ‘±λ²κ²½μ' νν΄λ μ¬λ¬ μ¬λ‘λ₯Ό ν΅ν΄ μ¬μ€ν λλ¬λκ³ μλ€.
λΆλΆκ° λΉμκ·Όμ΄μ¬μ΄λ©΄μλ μ¬λ¨μμ λ§€λ¬ 1μ²λ§μμ© 'μ
νκΈμ¬'λ₯Ό λ°μ κ², λ° νμ₯μ΄ 'μ¬λ¨ μμ λ³μ'μμ λ§μ½μ± μ§ν΅μ λ₯Ό 3μ²ν μ΄μ μ²λ°©λ°μ κ², κ°μΈ μμ μ κ΄κ³νμ¬λ₯Ό λ§λ€μ΄ λ³μκ³Ό κ±°λμμ μκΈ°λ μμ΅μ μ±κΈ΄ κ² λ±λ±.
μμ§μ¬λ¨μ μ°ν©λ΄μ€TVμ μ΅λμ£Όμ£Ό μ§μλ₯Ό λ
Έλ¦¬λ©΄μ κ·Έ μ΄μ λ°©μΉ¨μΌλ‘ 'μμ μ κ²½μμ λΆλ¦¬', '곡μ μ± λ° κ³΅μ΅μ± μ€ν'μ λ΄μΈμ λ€.
νμ§λ§ λ° νμ₯ λΆλΆμ μ΄μ΅μ μν΄ μ² μ νκ² μ¬λ¨μ 'μ¬μ ν'ν ννκ° μ¬λ¬ μ¬λ‘λ₯Ό ν΅ν΄ λλ¬λ μν©μμ, μ΄λ€μ 곡μλ°©μ‘ μ§λ°°λ₯Ό μ°λ €νλ λͺ©μ리λ κ°μλ‘ μ»€μ§κ³ μλ€.
"""
summarized = pipe(original_text)
print(summarized["summary_text"]) # μμ§μ¬λ¨μ΄ λ° νμ₯ μΌκ°μ 'μ‘±λ²κ²½μ' 체μ μμ μ¬μ΅μ μ€ννλ μλ¨μΌλ‘ νμ©λλ€λ μ§μ μ΄ λμ€κ³ μλ€.