EyeSee_chi

Running

App Files Files Community

Niki Zhang commited on Sep 18, 2024

Commit

bbaeb48

verified ·

1 Parent(s): 89ccdb3

Update app.py

Browse files

Files changed (1) hide show

app.py +34 -31

app.py CHANGED Viewed

@@ -1721,18 +1721,12 @@ async def texttospeech(text, language,gender='female'):
         print(f"Error in texttospeech: {e}")
         return None
-# give the reason of recommendation
-async def item_associate(new_crop,openai_api_key,language,autoplay,length,log_state,sort_score,narritive,state,recommend_type,evt: gr.SelectData):
-    rec_path=evt._data['value']['image']['path']
-    if recommend_type=="Reasons":
         persona=naritive_mapping[narritive]
-        index="Item Recommendation Picture "+ str(evt.index)
-        print("rec_path",rec_path)
         prompt=recommendation_prompt[0][persona].format(language=language,length=length)
-        image_paths=[new_crop,rec_path]
         result=get_gpt_response(openai_api_key, image_paths, prompt)
         print("recommend result",result)
         state += [(None, f"{result}")]
@@ -1746,22 +1740,15 @@ async def item_associate(new_crop,openai_api_key,language,autoplay,length,log_st
         audio_output=None
         if autoplay:
             audio_output = await texttospeech(read_info, language)
-        return state,state,audio_output,log_state,index,gr.update(value=[]),rec_path
-    return state,state,None,log_state,None,gr.update(value=[]),rec_path
-async def style_associate(image_path,openai_api_key,language,autoplay,length,log_state,sort_score,narritive,state,artist,recommend_type,evt: gr.SelectData):
-    rec_path=evt._data['value']['image']['path']
-    if recommend_type=="Reasons":
         persona=naritive_mapping[narritive]
-        index="Style Recommendation Picture "+str(evt.index)
-        print("rec_path",rec_path)
         if persona==1:
             prompt=recommendation_prompt[1][persona].format(language=language,length=length,artist=artist[8:])
         else:
             prompt=recommendation_prompt[1][persona].format(language=language,length=length)
-        image_paths=[image_path,rec_path]
         result=get_gpt_response(openai_api_key, image_paths, prompt )
         print("recommend result",result)
         state += [(None, f"{result}")]
@@ -1775,8 +1762,18 @@ async def style_associate(image_path,openai_api_key,language,autoplay,length,log
         audio_output=None
         if autoplay:
             audio_output = await texttospeech(read_info, language)
-        return state,state,audio_output,log_state,index,gr.update(value=[]),rec_path
-    return state,state,None,log_state,None,gr.update(value=[]),rec_path
 def change_naritive(session_type,image_input, state, click_state, paragraph, origin_image,narritive,task_instruct,gallery_output,style_gallery_result,reco_reasons,language="English"):
@@ -1920,6 +1917,10 @@ def create_ui():
         image_path=gr.State('')
         pic_index=gr.State(None)
         recomended_state=gr.State([])
@@ -2060,7 +2061,7 @@ def create_ui():
                 #         cap_everything_button = gr.Button(value="Caption Everything in a Paragraph", interactive=True)
                 with gr.Column(visible=False) as modules_not_need_gpt2:
                             with gr.Blocks():
-                                chatbot = gr.Chatbot(label="Chatbox", elem_classes="chatbot",likeable=True,height=600,bubble_full_width=False)
                                 with gr.Column() as modules_need_gpt3:
                                     chat_input = gr.MultimodalTextbox(interactive=True, file_types=[".txt"], placeholder="Message EyeSee...", show_label=False)
                                     with gr.Row():
@@ -2346,20 +2347,25 @@ def create_ui():
         gallery_result.select(
             item_associate,
-            inputs=[new_crop_save_path,openai_api_key,language,auto_play,length,log_state,sort_rec,naritive,recomended_state,recommend_type],
-            outputs=[recommend_bot,recomended_state,output_audio,log_state,pic_index,recommend_score,selected_image],
         )
         style_gallery_result.select(
             style_associate,
-            inputs=[image_path,openai_api_key,language,auto_play,length,log_state,sort_rec,naritive,recomended_state,artist_label,recommend_type],
-            outputs=[recommend_bot,recomended_state,output_audio,log_state,pic_index,recommend_score,selected_image],
         )
         ###############################################################################
         ############# above part is for text to image #############
         ###############################################################################
@@ -2701,10 +2707,7 @@ def create_ui():
             print("reason")
-        selected_image.select(
-            print_reason,
-            inputs=[],
-            outputs=[])

         print(f"Error in texttospeech: {e}")
         return None
+async def get_recommendation(new_crop,image_path,openai_api_key,language,autoplay,length,log_state,sort_score,narritive,state,recommend_type,artist,recomended_path):
+    if recommend_type=="Item":
         persona=naritive_mapping[narritive]
         prompt=recommendation_prompt[0][persona].format(language=language,length=length)
+        image_paths=[new_crop,recomended_path]
         result=get_gpt_response(openai_api_key, image_paths, prompt)
         print("recommend result",result)
         state += [(None, f"{result}")]
         audio_output=None
         if autoplay:
             audio_output = await texttospeech(read_info, language)
+        return state,state,audio_output,log_state,index,gr.update(value=[])
+    else:
         persona=naritive_mapping[narritive]
         if persona==1:
             prompt=recommendation_prompt[1][persona].format(language=language,length=length,artist=artist[8:])
         else:
             prompt=recommendation_prompt[1][persona].format(language=language,length=length)
+        image_paths=[image_path,recomended_path]
         result=get_gpt_response(openai_api_key, image_paths, prompt )
         print("recommend result",result)
         state += [(None, f"{result}")]
         audio_output=None
         if autoplay:
             audio_output = await texttospeech(read_info, language)
+        return state,state,audio_output,log_state,index,gr.update(value=[])
+# give the reason of recommendation
+async def item_associate(new_crop,openai_api_key,language,autoplay,length,log_state,sort_score,narritive,state,evt: gr.SelectData):
+    rec_path=evt._data['value']['image']['path']
+    return state,state,None,log_state,None,gr.update(value=[]),rec_path,rec_path,"Item"
+async def style_associate(image_path,openai_api_key,language,autoplay,length,log_state,sort_score,narritive,state,artist,evt: gr.SelectData):
+    rec_path=evt._data['value']['image']['path']
+    return state,state,None,log_state,None,gr.update(value=[]),rec_path, rec_path,"Style"
 def change_naritive(session_type,image_input, state, click_state, paragraph, origin_image,narritive,task_instruct,gallery_output,style_gallery_result,reco_reasons,language="English"):
         image_path=gr.State('')
         pic_index=gr.State(None)
         recomended_state=gr.State([])
+        recomended_path=gr.State(None)
+        recomended_type=gr.State(None)
                 #         cap_everything_button = gr.Button(value="Caption Everything in a Paragraph", interactive=True)
                 with gr.Column(visible=False) as modules_not_need_gpt2:
                             with gr.Blocks():
+                                chatbot = gr.Chatbot(label="Chatbox", elem_classes="chatbot",likeable=True,height=700,bubble_full_width=False)
                                 with gr.Column() as modules_need_gpt3:
                                     chat_input = gr.MultimodalTextbox(interactive=True, file_types=[".txt"], placeholder="Message EyeSee...", show_label=False)
                                     with gr.Row():
         gallery_result.select(
             item_associate,
+            inputs=[new_crop_save_path,openai_api_key,language,auto_play,length,log_state,sort_rec,naritive,recomended_state],
+            outputs=[recommend_bot,recomended_state,output_audio,log_state,pic_index,recommend_score,selected_image,recomended_path, recomended_type],
         )
         style_gallery_result.select(
             style_associate,
+            inputs=[image_path,openai_api_key,language,auto_play,length,log_state,sort_rec,naritive,recomended_state,artist_label],
+            outputs=[recommend_bot,recomended_state,output_audio,log_state,pic_index,recommend_score,selected_image,recomended_path,recomended_type],
         )
+        selected_image.select(
+            get_recommendation,
+            inputs=[new_crop_save_path,image_path, openai_api_key,language,auto_play,length,log_state,sort_rec,naritive,recomended_state,recomended_type,artist_label,recomended_path],
+            outputs=[recommend_bot,recomended_state,output_audio,log_state,pic_index,recommend_score])
         ###############################################################################
         ############# above part is for text to image #############
         ###############################################################################
             print("reason")