RAG-Vereine

Sleeping

App Files Files Community

mgokg commited on Nov 15, 2024

Commit

dbd949c

verified ·

1 Parent(s): cb0a01f

Update app.py

Browse files

Files changed (1) hide show

app.py +35 -41

app.py CHANGED Viewed

@@ -1,49 +1,43 @@
 import gradio as gr
 import chromadb
-import fitz  # PyMuPDF
-import time
-client = chromadb.PersistentClient(path="./")
-collection = client.get_or_create_collection(name="code")
-# Funktion zum Extrahieren von Text aus einer PDF-Datei
-def extract_text_from_pdf(file_path):
-    try:
-        #doc = fitz.open(file_path)
-        text = 'Entwicklung eines Chrome Browser Speech-to-Text Plugins: Projektübersicht: In diesem Projekt werden wir ein Chrome Browser Plugin entwickeln, das Sprache in Text umwandelt und dann in eine fokussierte Textarea einer beliebigen Webseite einfügt. Dieses Plugin kann hilfreich sein für Menschen mit motorischen Behinderungen oder für Leute, die lieber sprechen als tippen. Schritt 1: Planung Bevor wir mit der Entwicklung beginnen, sollten wir eine klare Vorstellung davon haben, was unser Plugin leisten soll. Wir benötigen ein Mikrofon-Symbol in der Browser-Symbolleiste, um das Plugin zu aktivieren, sowie einen Knopf, um die Sprache in Text umzuwandeln und in die ausgewählte Textarea einzufügen. Schritt 2: Forschung Um ein Speech-to-Text-Plugin zu entwickeln, müssen wir uns mit der Web Speech API von Chrome vertraut machen. Diese API umfasst zwei Hauptkomponenten: die SpeechRecognition- und die SpeechSynthesis-Schnittstelle. Für dieses Projekt brauchen wir jedoch nur die SpeechRecognition-Schnittstelle. Schritt 3: Entwicklung Wir beginnen mit dem Erstellen einer Datei namens "manifest.json", in der wir Informationen über unser Plugin angeben. Hier ist ein Beispiel: { "manifest\_version": 2, "name": "Speech-to-Text Plugin", "description": "Dieses Plugin verwandelt Sprache in Text und fügt sie in eine fokussierte Textarea ein.", "version": "1.0", "permissions": [ "activeTab", "storage" ], "browser\_action": { "default\_icon": "icon.png", "default\_title": "Speech-to-Text" }, "background": { "scripts": [ "background.js" ] } } Danach erstellen wir die Datei "background.js", in der wir eine Methode namens "activate" definieren, die aufgerufen wird, wenn das Mikrofon-Symbol in der Symbolleiste geklickt wird. Diese Methode startet die Spracherkennung und fügt das Mikrofon-Symbol in die Symbolleiste ein. Wir erstellen auch eine Methode namens "injectScript", die ein Skript in die aktive Registerkarte injiziert. Dieses Skript enthält eine Funktion namens "pasteText", die aufgerufen wird, wenn die Sprache in Text umgewandelt und in eine Textarea eingefügt werden soll. Schritt 4: Erstellung des Kontextmenüs Um ein Kontextmenü zu erstellen, definieren wir eine Methode namens "createContextMenu" in "background.js", die ein Kontextmenü mit einem Eintrag erstellt. Wenn dieser Eintrag geklickt wird, wird die Methode "pasteText" aufgerufen. Schritt 5: Testen Zum Schluss testen wir unser Plugin auf verschiedenen Webseiten, um sicherzustellen, dass es einwandfrei funktioniert. Abschlussbemerkung: Wir haben in diesem Projekt ein Speech-to-Text-Plugin für Chrome entwickelt, das Sprache in Text umwandelt und dann in eine fokussierte Textarea einer beliebigen Webseite einfügt. Durch das Hinzufügen des Mikrofon-Symbols in die Symbolleiste und das Erstellen eines Kontextmenüs können Benutzer das Plugin jederzeit und überall aktivieren.'
-        #for page in doc:
-            #text += page.get_text()
-        return text
-    except Exception as e:
-        return f"Fehler beim Lesen der PDF-Datei: {e}"
-def process_pdf(uploaded_file, prompt):
-    if uploaded_file is not None:
-        # Text aus der hochgeladenen PDF-Datei extrahieren
-        pdf_text = extract_text_from_pdf(uploaded_file.name)  # Hier muss der Dateipfad korrekt behandelt werden
-        timestamp = time.time()
-        if pdf_text:
-            collection.add(
-                documents=[pdf_text],
-                ids=[timestamp]
-            )
-            print(pdf_text)
-            return pdf_text
-def suchen(inputs):
-    test = "hallöle"
-    return test
-def main():
-    gr.Interface(
-        fn=process_pdf,
-        inputs=[gr.File(type="filepath", label="Upload PDF File"),
-                gr.Textbox(lines=2, placeholder="Ask a Question")],
-        outputs="text",
-        title="PDF Chatbot",
-        description="Upload a PDF file and ask questions about its content."
-    ).launch()
-if __name__ == "__main__":
-    main()

 import gradio as gr
 import chromadb
+from chromadb.utils import embedding_functions
+from PyPDF2 import PdfReader
+# Initialisiere ChromaDB
+client = chromadb.Client()
+collection_name = "pdf_collection"
+collection = client.get_or_create_collection(name=collection_name)
+# Verwende die integrierten Embeddings von ChromaDB
+embedding_function = embedding_functions.DefaultEmbeddingFunction()
+def process_pdf(file):
+    # Lese den PDF-Inhalt
+    pdf_reader = PdfReader(file.name)
+    text = ""
+    for page in pdf_reader.pages:
+        text += page.extract_text()
+    # Erstelle Embedding
+    embedding = embedding_function([text])[0]
+    # Speichere das PDF in ChromaDB
+    collection.add(
+        documents=[text],
+        metadatas=[{"filename": file.name}],
+        ids=[file.name]  # Verwende den Dateinamen als ID
+    )
+    return f"PDF {file.name} wurde erfolgreich in ChromaDB gespeichert."
+# Erstelle die Gradio-Schnittstelle
+with gr.Blocks() as demo:
+    gr.Markdown("# PDF Upload to ChromaDB")
+    file_input = gr.File(label="Wähle eine PDF-Datei aus", type="file")
+    submit_button = gr.Button("Hochladen")
+    output_text = gr.Textbox(label="Status")
+    submit_button.click(process_pdf, inputs=file_input, outputs=output_text)
+# Starte die Gradio-Anwendung
+demo.launch()