DDingcheol commited on
Commit
e2b23b2
Β·
1 Parent(s): feff33b

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +22 -7
app.py CHANGED
@@ -25,15 +25,30 @@ def get_pdf_text(pdf_docs):
25
 
26
  # 과제
27
  # μ•„λž˜ ν…μŠ€νŠΈ μΆ”μΆœ ν•¨μˆ˜λ₯Ό μž‘μ„±
28
- def get_text_file(file):
29
  try:
30
- text = file.read().decode('utf-8') # ν…μŠ€νŠΈ νŒŒμΌμ—μ„œ ν…μŠ€νŠΈλ₯Ό μ½μ–΄μ˜΅λ‹ˆλ‹€. 파일 인코딩은 utf-8둜 κ°€μ •ν•©λ‹ˆλ‹€.
31
- return [text] # ν…μŠ€νŠΈλ₯Ό 리슀트둜 λ°˜ν™˜ν•©λ‹ˆλ‹€. λ§Œμ•½ 청크λ₯Ό λ‚˜λˆ„λ €λ©΄ 적절히 μ²˜λ¦¬ν•΄μ•Ό ν•©λ‹ˆλ‹€.
32
- except Exception as e:
33
- print(f"ν…μŠ€νŠΈ 파일 처리 쀑 였λ₯˜κ°€ λ°œμƒν–ˆμŠ΅λ‹ˆλ‹€: {str(e)}")
34
- return []
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
35
 
36
-
37
 
38
  def get_csv_file(docs):
39
  pass
 
25
 
26
  # 과제
27
  # μ•„λž˜ ν…μŠ€νŠΈ μΆ”μΆœ ν•¨μˆ˜λ₯Ό μž‘μ„±
28
+ def get_text_file(docs):
29
  try:
30
+ # μž„μ‹œ 디렉토리 생성
31
+ temp_dir = tempfile.TemporaryDirectory()
32
+
33
+ # μž„μ‹œ 파일 생성
34
+ temp_file = tempfile.NamedTemporaryFile(dir=temp_dir.name, suffix=".txt", delete=False)
35
+
36
+ # docs둜 μ „λ‹¬λœ 파일 λ‚΄μš©μ„ μž„μ‹œ νŒŒμΌμ— 씀
37
+ for file in docs:
38
+ # νŒŒμΌμ—μ„œ ν…μŠ€νŠΈλ₯Ό μ½μ–΄μ„œ μž„μ‹œ νŒŒμΌμ— 씀
39
+ text_content = file.read().decode('utf-8') # νŒŒμΌμ—μ„œ ν…μŠ€νŠΈ 읽기
40
+ temp_file.write(text_content.encode('utf-8')) # μž„μ‹œ νŒŒμΌμ— ν…μŠ€νŠΈ μ“°κΈ°
41
+
42
+ # μž„μ‹œ 파일 읽기
43
+ temp_file.seek(0) # 파일 포인터λ₯Ό 파일의 μ‹œμž‘μœΌλ‘œ 이동
44
+ extracted_text = temp_file.read().decode('utf-8') # μž„μ‹œ νŒŒμΌμ—μ„œ ν…μŠ€νŠΈ 읽기
45
+
46
+ # μž„μ‹œ 파일 및 디렉토리 μ‚­μ œ
47
+ temp_file.close()
48
+ temp_dir.cleanup()
49
+
50
+ return extracted_text
51
 
 
52
 
53
  def get_csv_file(docs):
54
  pass