Lucia: Ein interaktiver KI-basierter Sprachdienst

Lucia ist ein Flask-basiertes Projekt, das Nutzern ermöglicht, mit einer KI zu interagieren, die Fragen beantwortet, Texte analysiert und Antworten in Audioform bereitstellt. Dieses System kombiniert Text- und Spracherkennung mit generativer KI und Text-to-Speech (TTS)-Technologie, um eine immersive Benutzererfahrung zu schaffen.

Funktionsweise

Lucia bietet folgende Funktionen:

Audioverarbeitung: Hochgeladene Audiodateien werden transkribiert.
Textverarbeitung: Die transkribierten Inhalte werden analysiert und beantwortet.
Sprachausgabe: Die Antwort wird synthetisiert und als Audio zurückgegeben.

Technologie-Stack

Flask: Für die API-Erstellung und das Servieren von Dateien.
Flask-CORS: Ermöglicht Cross-Origin Resource Sharing.
LangChain: Ermöglicht die Nutzung von LLMs (Large Language Models) wie OpenAI.
OpenAI API: Für Textgenerierung und Sprachtranskription.
Microsoft Edge TTS: Text-to-Speech-Synthese.
asyncio: Für asynchrone Verarbeitung.
base64: Kodierung der Audiodateien in Base64-Format.

Installation

1. Klone das Repository

git clone [email protected]:htsago/luciabot.git
cd luciabot

2. Erstelle eine virtuelle Umgebung

python3 -m venv venv
source venv/bin/activate  # Für Linux/Mac
venv\Scripts\activate     # Für Windows

3. Installiere die Abhängigkeiten

pip install -r requirements.txt

Konfiguration

API-Key für OpenAI:
- Speichere deinen API-Key in der Umgebungsvariable OPENAI_API_KEY.
- Füge folgende Zeile zu ~/.bashrc oder ~/.zshrc hinzu (Linux/Mac):
```
export OPENAI_API_KEY="DEIN_API_KEY"
```
  Lade die Änderungen:
```
source ~/.bashrc
```
- Für Windows:
```
set OPENAI_API_KEY=DEIN_API_KEY
```
Index-HTML-Datei: Stelle sicher, dass sich eine index.html im Verzeichnis templates/ befindet.

Nutzung

Starte den Server

python app.py

Endpunkte

1. `/`: Liefert die `index.html`-Datei aus.

Methode: GET
Rückgabe: Statische HTML-Seite.

2. `/process_audio`: Verarbeitet eine Audiodatei.

Methode: POST
Daten: audio_data (Hochgeladene Datei)
Antwort:
- user_text: Transkribierter Text.
- assistant_text: Antwort der KI.
- audio: Base64-kodierte Audioantwort.

Code-Übersicht

Hauptkomponenten

PromptTemplate: Konfiguriert den Interaktionsstil von Lucia.
LLMChain: Implementiert die Logik zur Verarbeitung von Nutzeranfragen.
Synthesize Speech: Generiert eine Audioausgabe basierend auf Text.

Beispiel-Prompt:

Dein Dienstname ist "Lucia" und du beantwortest die Fragen von Nutzern in einem Ton und Akzent.
{history}
Human: {human_input}
Assistant:

Abhängigkeiten

Eine vollständige Liste der Bibliotheken findest du in der Datei requirements.txt. Wichtigste Abhängigkeiten sind:

Flask
Flask-CORS
openai
langchain-community
langchain-core
edge-tts

Fehlerbehandlung

Falls ein Fehler auftritt, gibt die API:

HTTP 400: Bei ungültigen Anfragen (z. B. fehlende Audiodateien).
HTTP 500: Bei internen Verarbeitungsfehlern.

Ressourcen

Flask Dokumentation: https://flask.palletsprojects.com/
OpenAI API: https://platform.openai.com/docs/
Edge TTS: https://github.com/replicate/edge-tts
LangChain: https://www.langchain.com/

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
assets		assets
templates		templates
test		test
.gitignore		.gitignore
.travis.yml		.travis.yml
Dockerfile		Dockerfile
README.md		README.md
docker-compose.yml		docker-compose.yml
lucia.py		lucia.py
nginx.conf		nginx.conf
pushme.sh		pushme.sh
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Lucia: Ein interaktiver KI-basierter Sprachdienst

Funktionsweise

Technologie-Stack

Installation

1. Klone das Repository

2. Erstelle eine virtuelle Umgebung

3. Installiere die Abhängigkeiten

Konfiguration

Nutzung

Starte den Server

Endpunkte

1. `/`: Liefert die `index.html`-Datei aus.

2. `/process_audio`: Verarbeitet eine Audiodatei.

Code-Übersicht

Hauptkomponenten

Beispiel-Prompt:

Abhängigkeiten

Fehlerbehandlung

Ressourcen

About

Uh oh!

Releases

Packages

Uh oh!

Languages

htsago/luciabot

Folders and files

Latest commit

History

Repository files navigation

Lucia: Ein interaktiver KI-basierter Sprachdienst

Funktionsweise

Technologie-Stack

Installation

1. Klone das Repository

2. Erstelle eine virtuelle Umgebung

3. Installiere die Abhängigkeiten

Konfiguration

Nutzung

Starte den Server

Endpunkte

1. /: Liefert die index.html-Datei aus.

2. /process_audio: Verarbeitet eine Audiodatei.

Code-Übersicht

Hauptkomponenten

Beispiel-Prompt:

Abhängigkeiten

Fehlerbehandlung

Ressourcen

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

1. `/`: Liefert die `index.html`-Datei aus.

2. `/process_audio`: Verarbeitet eine Audiodatei.

Packages