kambris commited on
Commit
b24f0de
ยท
verified ยท
1 Parent(s): 24d8365

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +57 -18
app.py CHANGED
@@ -18,25 +18,56 @@ current_dir = os.path.dirname(os.path.abspath(__file__))
18
  font_path = os.path.join(current_dir, "ArabicR2013-J25x.ttf")
19
 
20
  ARABIC_STOP_WORDS = {
21
- 'ููŠ', 'ู…ู†', 'ุฅู„ู‰', 'ุนู„ู‰', 'ุนู†', 'ู…ุน', 'ุฎู„ุงู„', 'ุญุชู‰', 'ุฅุฐุง', 'ุซู…',
22
- 'ุฃูˆ', 'ูˆ', 'ู', 'ู„', 'ุจ', 'ูƒ', 'ู„ู„', 'ุงู„', 'ู‡ุฐุง', 'ู‡ุฐู‡', 'ุฐู„ูƒ',
23
- 'ุชู„ูƒ', 'ู‡ุคู„ุงุก', 'ู‡ู…', 'ู‡ู†', 'ู‡ูˆ', 'ู‡ูŠ', 'ู†ุญู†', 'ุงู†ุช', 'ุงู†ุชู…',
24
- 'ูƒุงู†', 'ูƒุงู†ุช', 'ูŠูƒูˆู†', 'ุชูƒูˆู†', 'ุงูŠ', 'ูƒู„', 'ุจุนุถ', 'ุบูŠุฑ', 'ุญูˆู„',
25
- 'ุนู†ุฏ', 'ู‚ุฏ', 'ู„ู‚ุฏ', 'ู„ู…', 'ู„ู†', 'ู„ูˆ', 'ู…ุง', 'ู…ุงุฐุง', 'ู…ุชู‰', 'ูƒูŠู',
26
- 'ุงูŠู†', 'ู„ู…ุงุฐุง', 'ุงู„ุฐูŠ', 'ุงู„ุชูŠ', 'ุงู„ุฐูŠู†', 'ุงู„ู„ุงุชูŠ', 'ุงู„ู„ูˆุงุชูŠ',
27
- 'ุงู„ุงู†', 'ุจูŠู†', 'ููˆู‚', 'ุชุญุช', 'ุงู…ุงู…', 'ุฎู„ู', 'ุญูŠู†', 'ู‚ุจู„', 'ุจุนุฏ',
28
- 'ูˆ', 'ุฃู†', 'ููŠ', 'ูƒู„', 'ู„ู…', 'ู„ู†', 'ู„ู‡', 'ู…ู†', 'ู‡ูˆ', 'ู‡ูŠ',
29
- 'ูƒู…ุง', 'ู„ู‡ุง', 'ู…ู†ุฐ', 'ูˆู‚ุฏ', 'ูˆู„ุง', 'ู†ูุณ', 'ูˆู„ู…', 'ุญูŠุซ', 'ู‡ู†ุงูƒ',
30
- 'ุฌุฏุง', 'ุฐุงุช', 'ุถู…ู†', 'ุงู†ู‡', 'ู„ุฏู‰', 'ุนู„ูŠู‡', 'ู…ุซู„', 'ูˆู„ู‡', 'ุนู†ุฏ',
31
- 'ุฃู…ุง', 'ู‡ุฐู‡', 'ูˆุฃู†', 'ูˆูƒู„', 'ูˆู‚ุงู„', 'ู„ุฏูŠ', 'ูˆูƒุงู†', 'ููŠู‡', 'ูˆู‡ูŠ',
32
- 'ูˆู‡ูˆ', 'ุชู„ูƒ', 'ูƒู„ู…', 'ู„ูƒู†', 'ูˆููŠ', 'ูˆู‚ู', 'ูˆู„ู‚ุฏ', 'ูˆู…ู†', 'ูˆู‡ุฐุง',
33
- 'ุงูˆู„', 'ุถู…ู†', 'ุงู†ู‡ุง', 'ุฌู…ูŠุน', 'ุงู„ุฐูŠ', 'ู‚ุจู„', 'ุจุนุฏ', 'ุญูˆู„', 'ุงูŠุถุง',
34
- 'ู„ุงุฒู…', 'ุนู„ูŠ', 'ูŠุฌุจ', 'ุตุงุฑ', 'ุตุงุฑุช', 'ุชุญุช', 'ุถุฏ',
35
- 'ูŠุง', 'ู„ุง', 'ุงู…ุง', 'ุจู‡ุง', 'ุงู†', 'ุจู‡', 'ุงู„ูŠ', 'ู„ู…ุง',
36
- 'ุงู†ุง', 'ุงู„ูŠูƒ', 'ู„ูŠ', 'ู„ูƒ', 'ุงูˆ', 'ู‚ู„ุช'
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
37
  }
38
 
39
 
 
 
40
  COUNTRY_MAPPING = {
41
  'ู…ุตุฑ': 'Egypt',
42
  'ุงู„ุณุนูˆุฏูŠุฉ': 'Saudi Arabia',
@@ -141,9 +172,17 @@ def create_topic_map(summaries):
141
  for summary in summaries:
142
  country_en = COUNTRY_MAPPING.get(summary['country'])
143
  if country_en and country_en in coordinates:
144
- # Get dominant sentiment
 
 
 
 
 
 
 
145
  dominant_emotion = summary['top_emotions'][0]['emotion'] if summary['top_emotions'] else "Neutral"
146
- circle_color = sentiment_colors.get(dominant_emotion, 'gray')
 
147
 
148
  # Create popup content
149
  popup_content = f"""
 
18
  font_path = os.path.join(current_dir, "ArabicR2013-J25x.ttf")
19
 
20
  ARABIC_STOP_WORDS = {
21
+ ARABIC_STOP_WORDS = {
22
+ # First group
23
+ 'ููŠ', 'ู…ู†', 'ุฅู„ู‰', 'ุนู„ู‰', 'ุนู„ูŠ', 'ุนู†', 'ู…ุน', 'ุฎู„ุงู„', 'ุญุชูŠ', 'ุญุชู‰', 'ุฅุฐุง',
24
+
25
+ # Middle group
26
+ 'ุซู…', 'ุฃูˆ', 'ูˆ', 'ู„', 'ุจ', 'ูƒ', 'ู„ู„', 'ุงู„', 'ู‡ุฐุง',
27
+ 'ู‡ุฐู‡', 'ุฐู„ูƒ', 'ุชู„ูƒ', 'ู‡ุคู„ุงุก', 'ู‡ู…', 'ู‡ู†', 'ู‡ูˆ', 'ู‡ูŠ', 'ู†ุญู†',
28
+ 'ุงู†ุช', 'ุงู†ุชู…', 'ูƒุงู†', 'ูƒุงู†ุช', 'ูŠูƒูˆู†', 'ุชูƒูˆู†', 'ุงูŠ', 'ูƒู„',
29
+ 'ุจุนุถ', 'ุบูŠุฑ', 'ุญูˆู„', 'ุนู†ุฏ', 'ู‚ุฏ', 'ู„ู‚ุฏ', 'ู„ู…', 'ู„ู†', 'ู„ูˆ',
30
+ 'ู…ุง', 'ู…ุงุฐุง', 'ู…ุชู‰', 'ูƒูŠู', 'ุงูŠู†', 'ู„ู…ุงุฐุง', 'ุงู„ุฐูŠ', 'ุงู„ุชูŠ',
31
+ 'ุงู„ุฐูŠู†', 'ุงู„ู„ุงุชูŠ', 'ุงู„ู„ูˆุงุชูŠ', 'ุงู„ุงู†', 'ุจูŠู†', 'ููˆู‚', 'ุชุญุช',
32
+ 'ุงู…ุงู…', 'ุฎู„ู', 'ุญูŠู†', 'ู‚ุจู„', 'ุจุนุฏ', 'ุฃู†', 'ู„ู‡', 'ูƒู…ุง', 'ู„ู‡ุง',
33
+ 'ู…ู†ุฐ', 'ู†ูุณ', 'ุญูŠุซ', 'ู‡ู†ุงูƒ', 'ุฌุฏุง', 'ุฐุงุช', 'ุถู…ู†', 'ุงู†ู‡', 'ู„ุฏู‰',
34
+ 'ุนู„ูŠู‡', 'ู…ุซู„', 'ุฃู…ุง', 'ู„ุฏูŠ', 'ููŠู‡', 'ูƒู„ู…', 'ู„ูƒู†', 'ุงูŠุถุง', 'ู„ุงุฒู…',
35
+ 'ูŠุฌุจ', 'ุตุงุฑ', 'ุตุงุฑุช', 'ุถุฏ', 'ูŠุง', 'ู„ุง', 'ุงู…ุง',
36
+ 'ุจู‡ุง', 'ุงู†', 'ุจู‡', 'ุงู„ูŠ', 'ู„ู…ุง', 'ุงู†ุง', 'ุงู„ูŠูƒ', 'ู„ูŠ', 'ู„ูƒ', 'ู‚ู„ุช',
37
+
38
+ # Middle group prefixed with "ูˆ"
39
+ 'ูˆุซู…', 'ูˆุฃูˆ', 'ูˆู„', 'ูˆุจ', 'ูˆูƒ', 'ูˆู„ู„', 'ูˆุงู„',
40
+ 'ูˆู‡ุฐุง', 'ูˆู‡ุฐู‡', 'ูˆุฐู„ูƒ', 'ูˆุชู„ูƒ', 'ูˆู‡ุคู„ุงุก', 'ูˆู‡ู…', 'ูˆู‡ู†', 'ูˆู‡ูˆ', 'ูˆู‡ูŠ', 'ูˆู†ุญู†',
41
+ 'ูˆุงู†ุช', 'ูˆุงู†ุชู…', 'ูˆูƒุงู†', 'ูˆูƒุงู†ุช', 'ูˆูŠูƒูˆู†', 'ูˆุชูƒูˆู†', 'ูˆุงูŠ', 'ูˆูƒู„',
42
+ 'ูˆุจุนุถ', 'ูˆุบูŠุฑ', 'ูˆุญูˆู„', 'ูˆุนู†ุฏ', 'ูˆู‚ุฏ', 'ูˆู„ู‚ุฏ', 'ูˆู„ู…', 'ูˆู„ู†', 'ูˆู„ูˆ',
43
+ 'ูˆู…ุง', 'ูˆู…ุงุฐุง', 'ูˆู…ุชู‰', 'ูˆูƒูŠู', 'ูˆุงูŠู†', 'ูˆู„ู…ุงุฐุง', 'ูˆุงู„ุฐูŠ', 'ูˆุงู„ุชูŠ',
44
+ 'ูˆุงู„ุฐูŠู†', 'ูˆุงู„ู„ุงุชูŠ', 'ูˆุงู„ู„ูˆุงุชูŠ', 'ูˆุงู„ุงู†', 'ูˆุจูŠู†', 'ูˆููˆู‚', 'ูˆุชุญุช',
45
+ 'ูˆุงู…ุงู…', 'ูˆุฎู„ู', 'ูˆุญูŠู†', 'ูˆู‚ุจู„', 'ูˆุจุนุฏ', 'ูˆุฃู†', 'ูˆู„ู‡', 'ูˆูƒู…ุง', 'ูˆู„ู‡ุง',
46
+ 'ูˆู…ู†ุฐ', 'ูˆู†ูุณ', 'ูˆุญูŠุซ', 'ูˆู‡ู†ุงูƒ', 'ูˆุฌุฏุง', 'ูˆุฐุงุช', 'ูˆุถู…ู†', 'ูˆุงู†ู‡', 'ูˆู„ุฏู‰',
47
+ 'ูˆุนู„ูŠู‡', 'ูˆู…ุซู„', 'ูˆุฃู…ุง', 'ูˆููŠู‡', 'ูˆูƒู„ู…', 'ูˆู„ูƒู†', 'ูˆุงูŠุถุง', 'ูˆู„ุงุฒู…',
48
+ 'ูˆูŠุฌุจ', 'ูˆุตุงุฑ', 'ูˆุตุงุฑุช', 'ูˆุถุฏ', 'ูˆูŠุง', 'ูˆู„ุง', 'ูˆุงู…ุง',
49
+ 'ูˆุจู‡ุง', 'ูˆุงู†', 'ูˆุจู‡', 'ูˆุงู„ูŠ', 'ูˆู„ู…ุง', 'ูˆุงู†ุง', 'ูˆุงู„ูŠูƒ', 'ูˆู„ูŠ', 'ูˆู„ูƒ', 'ูˆู‚ู„ุช',
50
+
51
+ # Last group
52
+ 'ูˆููŠ', 'ูˆู…ู†', 'ูˆุนู„ู‰', 'ูˆุนู„ูŠ', 'ูˆุนู†', 'ูˆู…ุน', 'ูˆุญุชู‰', 'ูˆุฅุฐุง',
53
+ 'ูˆู‡ุฐุง', 'ูˆู‡ุฐู‡', 'ูˆุฐู„ูƒ', 'ูˆุชู„ูƒ', 'ูˆู‡ูˆ', 'ูˆู‡ูŠ', 'ูˆู†ุญู†',
54
+ 'ูˆูƒุงู†', 'ูˆูƒุงู†ุช', 'ูˆูƒู„', 'ูˆุจุนุถ', 'ูˆุญูˆู„', 'ูˆุนู†ุฏ', 'ูˆู‚ุฏ',
55
+ 'ูˆู„ู‚ุฏ', 'ูˆู„ู…', 'ูˆู„ู†', 'ูˆู…ุง', 'ูˆูƒูŠู', 'ูˆุงูŠู†', 'ูˆุงู„ุฐูŠ',
56
+ 'ูˆุจูŠู†', 'ูˆู‚ุจู„', 'ูˆุจุนุฏ', 'ูˆู„ู‡', 'ูˆู„ู‡ุง', 'ูˆู‡ู†ุงูƒ', 'ูˆุงู†ู‡',
57
+ 'ูˆู„ุฏู‰', 'ูˆุนู„ูŠู‡', 'ูˆู…ุซู„',
58
+
59
+ # Arabic numbers
60
+ 'ูˆุงุญุฏ', 'ุงุซู†ุงู†', 'ุซู„ุงุซุฉ', 'ุฃุฑุจุนุฉ', 'ุฎู…ุณุฉ', 'ุณุชุฉ', 'ุณุจุนุฉ',
61
+ 'ุซู…ุงู†ูŠุฉ', 'ุชุณุนุฉ', 'ุนุดุฑุฉ',
62
+
63
+ # Arabic ordinals
64
+ 'ุงู„ุฃูˆู„', 'ุงู„ุซุงู†ูŠ', 'ุงู„ุซุงู„ุซ', 'ุงู„ุฑุงุจุน', 'ุงู„ุฎุงู…ุณ', 'ุงู„ุณุงุฏุณ',
65
+ 'ุงู„ุณุงุจุน', 'ุงู„ุซุงู…ู†', 'ุงู„ุชุงุณุน', 'ุงู„ุนุงุดุฑ'
66
  }
67
 
68
 
69
+
70
+
71
  COUNTRY_MAPPING = {
72
  'ู…ุตุฑ': 'Egypt',
73
  'ุงู„ุณุนูˆุฏูŠุฉ': 'Saudi Arabia',
 
172
  for summary in summaries:
173
  country_en = COUNTRY_MAPPING.get(summary['country'])
174
  if country_en and country_en in coordinates:
175
+ # Mapping emotions back to their original labels
176
+ REVERSE_EMOTION_LABELS = {
177
+ 'Negative': 'LABEL_0',
178
+ 'Positive': 'LABEL_1',
179
+ 'Neutral': 'LABEL_2'
180
+ }
181
+
182
+ # Get dominant sentiment and map it back to original label
183
  dominant_emotion = summary['top_emotions'][0]['emotion'] if summary['top_emotions'] else "Neutral"
184
+ dominant_label = REVERSE_EMOTION_LABELS.get(dominant_emotion, 'LABEL_2')
185
+ circle_color = sentiment_colors.get(dominant_label, 'gray')
186
 
187
  # Create popup content
188
  popup_content = f"""