aliceblue11 commited on
Commit
d9d2e2a
·
verified ·
1 Parent(s): 065fc33

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +30 -27
app.py CHANGED
@@ -1,45 +1,48 @@
1
  import pandas as pd
2
  import os
3
 
4
- # 엑셀 파일 경로
5
- file_path = '파일경로.xlsx'
6
 
7
  # 파일이 존재하는지 확인하는 코드 추가
8
  if os.path.exists(file_path):
9
- # 파일이 존재하면 엑셀 파일을 읽어들임
10
- df = pd.read_excel(file_path)
11
-
12
- # 1. G1셀에 "글자수"를 입력
13
- df.loc[0, 'G'] = "글자수"
 
14
 
15
- # 2. G2셀부터 G열에 D열의 글자수를 입력
16
- df['G'] = df['D'].apply(lambda x: len(str(x)) if pd.notnull(x) else 0)
17
 
18
- # 3. G열 기준으로 내림차순 정렬
19
- df = df.sort_values(by='G', ascending=False)
20
 
21
- # 4. E열의 데이터가 5, 4점인 항목에서 G열이 500자 이하인 항목 중 10개를 긍정리뷰 10개로 선택
22
- positive_reviews = df[(df['E'].isin([5, 4])) & (df['G'] <= 500)].head(10)
23
 
24
- # 5. E열의 데이터가 1, 2점인 항목에서 G열이 500자 이하인 항목 중 10개를 부정리뷰 10개로 선택
25
- negative_reviews = df[(df['E'].isin([1, 2])) & (df['G'] <= 500)].head(10)
26
 
27
- # 6. 긍정리뷰, 부정리뷰의 리뷰날짜, 옵션, 리뷰내용을 모두 가져옴
28
- positive_reviews_data = positive_reviews[['리뷰날짜', '옵션', 'D']] # D열이 리뷰내용
29
- negative_reviews_data = negative_reviews[['리뷰날짜', '옵션', 'D']]
30
 
31
- # 긍정리뷰 10개 출력
32
- print("긍정리뷰 10개:")
33
- print(positive_reviews_data)
34
 
35
- # 부정리뷰 10개 출력
36
- print("부정리뷰 10개:")
37
- print(negative_reviews_data)
38
 
39
- # 필요시 결과를 새로운 엑셀 파일로 저장
40
- positive_reviews_data.to_excel('긍정리뷰_10개.xlsx', index=False)
41
- negative_reviews_data.to_excel('부정리뷰_10개.xlsx', index=False)
42
 
 
 
43
  else:
44
  # 파일이 존재하지 않으면 에러 메시지 출력
45
  print(f"Error: 파일을 찾을 수 없습니다. 경로를 확인해주세요: {file_path}")
 
1
  import pandas as pd
2
  import os
3
 
4
+ # 엑셀 파일 경로를 지정하는 부분을 수정함
5
+ file_path = input("엑셀 파일의 경로를 입력하세요 (예: 'C:/path/to/file.xlsx'): ")
6
 
7
  # 파일이 존재하는지 확인하는 코드 추가
8
  if os.path.exists(file_path):
9
+ try:
10
+ # 파일이 존재하면 엑셀 파일을 읽어들임
11
+ df = pd.read_excel(file_path)
12
+
13
+ # 1. G1셀에 "글자수"를 입력
14
+ df.loc[0, 'G'] = "글자수"
15
 
16
+ # 2. G2셀부터 G열에 D열의 글자수를 입력
17
+ df['G'] = df['D'].apply(lambda x: len(str(x)) if pd.notnull(x) else 0)
18
 
19
+ # 3. G열 기준으로 내림차순 정렬
20
+ df = df.sort_values(by='G', ascending=False)
21
 
22
+ # 4. E열의 데이터가 5, 4점인 항목에서 G열이 500자 이하인 항목 중 10개를 긍정리뷰 10개로 선택
23
+ positive_reviews = df[(df['E'].isin([5, 4])) & (df['G'] <= 500)].head(10)
24
 
25
+ # 5. E열의 데이터가 1, 2점인 항목에서 G열이 500자 이하인 항목 중 10개를 부정리뷰 10개로 선택
26
+ negative_reviews = df[(df['E'].isin([1, 2])) & (df['G'] <= 500)].head(10)
27
 
28
+ # 6. 긍정리뷰, 부정리뷰의 리뷰날짜, 옵션, 리뷰내용을 모두 가져옴
29
+ positive_reviews_data = positive_reviews[['리뷰날짜', '옵션', 'D']] # D열이 리뷰내용
30
+ negative_reviews_data = negative_reviews[['리뷰날짜', '옵션', 'D']]
31
 
32
+ # 긍정리뷰 10개 출력
33
+ print("긍정리뷰 10개:")
34
+ print(positive_reviews_data)
35
 
36
+ # 부정리뷰 10개 출력
37
+ print("부정리뷰 10개:")
38
+ print(negative_reviews_data)
39
 
40
+ # 필요시 결과를 새로운 엑셀 파일로 저장
41
+ positive_reviews_data.to_excel('긍정리뷰_10개.xlsx', index=False)
42
+ negative_reviews_data.to_excel('부정리뷰_10개.xlsx', index=False)
43
 
44
+ except Exception as e:
45
+ print(f"파일을 처리하는 중 오류가 발생했습니다: {e}")
46
  else:
47
  # 파일이 존재하지 않으면 에러 메시지 출력
48
  print(f"Error: 파일을 찾을 수 없습니다. 경로를 확인해주세요: {file_path}")