Spaces:

matoma-project
/

ja-clarity

Running

App Files Files Community

karubiniumu commited on Jan 23

Commit

3461492

1 Parent(s): 4c6bbdb

description ですます調

Browse files

Files changed (4) hide show

.gradio/certificate.pem +31 -0
__pycache__/pipe.cpython-310.pyc +0 -0
app.py +23 -19
pipe.py +23 -16

.gradio/certificate.pem ADDED Viewed

	@@ -0,0 +1,31 @@

+-----BEGIN CERTIFICATE-----
+MIIFazCCA1OgAwIBAgIRAIIQz7DSQONZRGPgu2OCiwAwDQYJKoZIhvcNAQELBQAw
+TzELMAkGA1UEBhMCVVMxKTAnBgNVBAoTIEludGVybmV0IFNlY3VyaXR5IFJlc2Vh
+cmNoIEdyb3VwMRUwEwYDVQQDEwxJU1JHIFJvb3QgWDEwHhcNMTUwNjA0MTEwNDM4
+WhcNMzUwNjA0MTEwNDM4WjBPMQswCQYDVQQGEwJVUzEpMCcGA1UEChMgSW50ZXJu
+ZXQgU2VjdXJpdHkgUmVzZWFyY2ggR3JvdXAxFTATBgNVBAMTDElTUkcgUm9vdCBY
+MTCCAiIwDQYJKoZIhvcNAQEBBQADggIPADCCAgoCggIBAK3oJHP0FDfzm54rVygc
+h77ct984kIxuPOZXoHj3dcKi/vVqbvYATyjb3miGbESTtrFj/RQSa78f0uoxmyF+
+0TM8ukj13Xnfs7j/EvEhmkvBioZxaUpmZmyPfjxwv60pIgbz5MDmgK7iS4+3mX6U
+A5/TR5d8mUgjU+g4rk8Kb4Mu0UlXjIB0ttov0DiNewNwIRt18jA8+o+u3dpjq+sW
+T8KOEUt+zwvo/7V3LvSye0rgTBIlDHCNAymg4VMk7BPZ7hm/ELNKjD+Jo2FR3qyH
+B5T0Y3HsLuJvW5iB4YlcNHlsdu87kGJ55tukmi8mxdAQ4Q7e2RCOFvu396j3x+UC
+B5iPNgiV5+I3lg02dZ77DnKxHZu8A/lJBdiB3QW0KtZB6awBdpUKD9jf1b0SHzUv
+KBds0pjBqAlkd25HN7rOrFleaJ1/ctaJxQZBKT5ZPt0m9STJEadao0xAH0ahmbWn
+OlFuhjuefXKnEgV4We0+UXgVCwOPjdAvBbI+e0ocS3MFEvzG6uBQE3xDk3SzynTn
+jh8BCNAw1FtxNrQHusEwMFxIt4I7mKZ9YIqioymCzLq9gwQbooMDQaHWBfEbwrbw
+qHyGO0aoSCqI3Haadr8faqU9GY/rOPNk3sgrDQoo//fb4hVC1CLQJ13hef4Y53CI
+rU7m2Ys6xt0nUW7/vGT1M0NPAgMBAAGjQjBAMA4GA1UdDwEB/wQEAwIBBjAPBgNV
+HRMBAf8EBTADAQH/MB0GA1UdDgQWBBR5tFnme7bl5AFzgAiIyBpY9umbbjANBgkq
+hkiG9w0BAQsFAAOCAgEAVR9YqbyyqFDQDLHYGmkgJykIrGF1XIpu+ILlaS/V9lZL
+ubhzEFnTIZd+50xx+7LSYK05qAvqFyFWhfFQDlnrzuBZ6brJFe+GnY+EgPbk6ZGQ
+3BebYhtF8GaV0nxvwuo77x/Py9auJ/GpsMiu/X1+mvoiBOv/2X/qkSsisRcOj/KK
+NFtY2PwByVS5uCbMiogziUwthDyC3+6WVwW6LLv3xLfHTjuCvjHIInNzktHCgKQ5
+ORAzI4JMPJ+GslWYHb4phowim57iaztXOoJwTdwJx4nLCgdNbOhdjsnvzqvHu7Ur
+TkXWStAmzOVyyghqpZXjFaH3pO3JLF+l+/+sKAIuvtd7u+Nxe5AW0wdeRlN8NwdC
+jNPElpzVmbUq4JUagEiuTDkHzsxHpFKVK7q4+63SM1N95R1NbdWhscdCb+ZAJzVc
+oyi3B43njTOQ5yOf+1CceWxG1bQVs5ZufpsMljq4Ui0/1lvh+wjChP4kqKOJ2qxq
+4RgqsahDYVvTH9w7jXbyLeiNdd8XM2w9U/t7y0Ff/9yi0GE44Za4rF2LN9d11TPA
+mRGunUHBcnWEvgJBQl9nJEiU0Zsnvgc/ubhPgXRR4Xq37Z0j4r7g1SgEEzwxA57d
+emyPxgcYxn/eR44/KJ4EBs+lVDR3veyJm+kXQ99b21/+jh5Xos1AnX5iItreGCc=
+-----END CERTIFICATE-----

__pycache__/pipe.cpython-310.pyc ADDED Viewed

Binary file (3.89 kB). View file

app.py CHANGED Viewed

@@ -4,31 +4,35 @@ import pytz
 import datetime
 import json
 def run(text):
-    now = datetime.datetime.now(pytz.timezone('Asia/Tokyo'))
-    print('\ntext:',text,now)
-    result = pipe.run({
-        'retrieve_prompt_builder':{'text':text},
-        'prompt_builder':{'text':text}
-    },include_outputs_from=['embedding_retriever','parser'])
-    for document in result['embedding_retriever']['documents']:
-        print(document.score,document.id)
         print(document.content)
-    parsed = result['parser']['parsed']
     print(parsed)
-    return json.dumps(parsed,indent=2,ensure_ascii=False)
-title = '日本語 明確さ判定'
-with gr.Blocks(title=title,css_paths='./app.css') as app:
     gr.HTML(f'<h1 class="title">{title}</h1>')
-    inputs=gr.TextArea(label='テキスト',lines=12)
-    submit = gr.Button("送信",variant="primary")
-    reply =gr.JSON(label='回答')
-    submit.click(lambda: gr.update(interactive=False),inputs=None, outputs=submit) \
-        .then(fn=run, inputs=inputs, outputs=reply ) \
-        .then(fn=lambda: gr.update(interactive=True),inputs=None, outputs=submit)
 if __name__ == "__main__":
-    app.launch()

 import datetime
 import json
 def run(text):
+    now = datetime.datetime.now(pytz.timezone("Asia/Tokyo"))
+    print("\ntext:", text, now)
+    result = pipe.run(
+        {"retrieve_prompt_builder": {"text": text}, "prompt_builder": {"text": text}},
+        include_outputs_from=["embedding_retriever", "parser"],
+    )
+    for document in result["embedding_retriever"]["documents"]:
+        print(document.score, document.id)
         print(document.content)
+    parsed = result["parser"]["parsed"]
     print(parsed)
+    return json.dumps(parsed, indent=2, ensure_ascii=False)
+title = "日本語 明確さ判定"
+with gr.Blocks(title=title, css_paths="./app.css") as app:
     gr.HTML(f'<h1 class="title">{title}</h1>')
+    inputs = gr.TextArea(label="テキスト", lines=12)
+    submit = gr.Button("送信", variant="primary")
+    reply = gr.JSON(label="回答")
+    submit.click(
+        lambda: gr.update(interactive=False), inputs=None, outputs=submit
+    ).then(fn=run, inputs=inputs, outputs=reply).then(
+        fn=lambda: gr.update(interactive=True), inputs=None, outputs=submit
+    )
 if __name__ == "__main__":
+    app.launch(share=True, debug=True)

pipe.py CHANGED Viewed

@@ -1,29 +1,34 @@
-from haystack import Document, Pipeline,component
-from haystack.components.embedders import SentenceTransformersDocumentEmbedder,SentenceTransformersTextEmbedder
 from haystack_integrations.document_stores.astra import AstraDocumentStore
 from haystack.components.writers import DocumentWriter
 from haystack.document_stores.types import DuplicatePolicy
 from haystack.components.builders import PromptBuilder
-from haystack_integrations.components.generators.google_ai import GoogleAIGeminiGenerator
 from haystack_integrations.components.retrievers.astra import AstraEmbeddingRetriever
 import json, json_repair
 from typing import List, Dict
 import os
 document_store = AstraDocumentStore(
-    collection_name='company_contents',
-    duplicates_policy=DuplicatePolicy.OVERWRITE
 )
-retrieve_template = '''
     次の日本語の文章の明確さを判定したい
     テキスト: {{text}}
-'''
 template = """
     どのように日本語の文章を記載するとよいかまとめた自社の資料があります。
     この資料を参考にして、以下のテキストの「明確さ」を様々な点から評価し、100点満点で点数を採点してください。
     次にその点数とした理由の解説と、どの辺が曖昧だったかを説明してください。
     テキストをより明確にする上で修正するべき箇所をピックアップし、その箇所が何行目の何文字目であるかと、修正前のテキストと修正後のテキストをまとめて提案して下さい。
     以上のことをマークダウンや説明なしで、JSON のみで回答して下さい。
     次のようなJSONフォーマット形式に必ず従ってください。
@@ -45,6 +50,7 @@ template = """
     テキスト: {{text}}
 """
 @component
 class ResultParser:
     @component.output_types(parsed=Dict)
@@ -62,23 +68,24 @@ class ResultParser:
             parsed = parsed[0]
         return {"parsed": parsed}
 retrieve_prompt_builder = PromptBuilder(template=retrieve_template)
-text_embedder =  SentenceTransformersTextEmbedder(model=os.environ['embedding_model'])
 embedding_retriever = AstraEmbeddingRetriever(document_store=document_store)
-prompt_builder =  PromptBuilder(template=template)
 llm = GoogleAIGeminiGenerator(model=os.environ["gemini_model"])
 parser = ResultParser()
 text_embedder.warm_up()
 pipe = Pipeline()
-pipe.add_component("retrieve_prompt_builder",retrieve_prompt_builder)
-pipe.add_component("text_embedder",text_embedder)
-pipe.add_component("embedding_retriever",embedding_retriever)
-pipe.add_component("prompt_builder",prompt_builder)
-pipe.add_component("llm",llm)
-pipe.add_component("parser",parser)
 pipe.connect("retrieve_prompt_builder.prompt", "text_embedder.text")
 pipe.connect("text_embedder", "embedding_retriever")
 pipe.connect("embedding_retriever.documents", "prompt_builder.documents")
 pipe.connect("prompt_builder", "llm")
-pipe.connect("llm.replies", "parser.replies")

+from haystack import Document, Pipeline, component
+from haystack.components.embedders import (
+    SentenceTransformersDocumentEmbedder,
+    SentenceTransformersTextEmbedder,
+)
 from haystack_integrations.document_stores.astra import AstraDocumentStore
 from haystack.components.writers import DocumentWriter
 from haystack.document_stores.types import DuplicatePolicy
 from haystack.components.builders import PromptBuilder
+from haystack_integrations.components.generators.google_ai import (
+    GoogleAIGeminiGenerator,
+)
 from haystack_integrations.components.retrievers.astra import AstraEmbeddingRetriever
 import json, json_repair
 from typing import List, Dict
 import os
 document_store = AstraDocumentStore(
+    collection_name="company_contents", duplicates_policy=DuplicatePolicy.OVERWRITE
 )
+retrieve_template = """
     次の日本語の文章の明確さを判定したい
     テキスト: {{text}}
+"""
 template = """
     どのように日本語の文章を記載するとよいかまとめた自社の資料があります。
     この資料を参考にして、以下のテキストの「明確さ」を様々な点から評価し、100点満点で点数を採点してください。
     次にその点数とした理由の解説と、どの辺が曖昧だったかを説明してください。
+    説明の文章は「である」調ではなく「ですます」調の丁寧語の文章にしてください。
     テキストをより明確にする上で修正するべき箇所をピックアップし、その箇所が何行目の何文字目であるかと、修正前のテキストと修正後のテキストをまとめて提案して下さい。
     以上のことをマークダウンや説明なしで、JSON のみで回答して下さい。
     次のようなJSONフォーマット形式に必ず従ってください。
     テキスト: {{text}}
 """
 @component
 class ResultParser:
     @component.output_types(parsed=Dict)
             parsed = parsed[0]
         return {"parsed": parsed}
 retrieve_prompt_builder = PromptBuilder(template=retrieve_template)
+text_embedder = SentenceTransformersTextEmbedder(model=os.environ["embedding_model"])
 embedding_retriever = AstraEmbeddingRetriever(document_store=document_store)
+prompt_builder = PromptBuilder(template=template)
 llm = GoogleAIGeminiGenerator(model=os.environ["gemini_model"])
 parser = ResultParser()
 text_embedder.warm_up()
 pipe = Pipeline()
+pipe.add_component("retrieve_prompt_builder", retrieve_prompt_builder)
+pipe.add_component("text_embedder", text_embedder)
+pipe.add_component("embedding_retriever", embedding_retriever)
+pipe.add_component("prompt_builder", prompt_builder)
+pipe.add_component("llm", llm)
+pipe.add_component("parser", parser)
 pipe.connect("retrieve_prompt_builder.prompt", "text_embedder.text")
 pipe.connect("text_embedder", "embedding_retriever")
 pipe.connect("embedding_retriever.documents", "prompt_builder.documents")
 pipe.connect("prompt_builder", "llm")
+pipe.connect("llm.replies", "parser.replies")