Du nutzt Paperless-ngx, hast aber immer noch viel zu viel manuelle Nacharbeit bei Titel, Tags, Korrespondenten und Rechnungsbeträgen? Du scannst Rechnungen, Verträge oder Belege und ärgerst dich über schlechte OCR-Ergebnisse?
Hier kommt Paperless GPT ins Spiel, eine leichtgewichtige, stabile und erstaunlich präzise KI-Erweiterung, die deine Dokumente automatisch analysiert, klassifiziert und sogar deutlich bessere OCR-Ergebnisse liefert. In diesem Beitrag zeige ich dir, wie du ganz einfach Paperless GPT installieren kannst – als individuelle App auf ZimaOS (oder CasaOS) oder als Portainer Installation.

Inhalt
Warum eigentlich Paperless GPT?
1. Automatische Dokumentklassifizierung
Paperless GPT analysiert jedes neue Dokument intelligent und generiert automatische Vorschläge für Titel, Textbeschreibung und Bearbeitungsdatum. Du kannst diese Vorschläge manuell überprüfen und freigeben oder sogar vollständig automatisieren. Darüber hinaus können auch benutzerdefinierte Felder (wie beispielsweise der Rechnungsbetrag bei Invoices) automatisch extrahiert und gefüllt werden.
2. KI-basiertes OCR mit semantischem Verständnis
Während Paperless-ngx standardmäßig ein traditionelles OCR-Verfahren nutzt (Tesseract), das auf Pixelmustern basiert, geht Paperless GPT einen Schritt weiter. Die KI erkennt nicht nur einzelne Zeichen, sondern versteht auch den semantischen Kontext. Ein klassisches Beispiel: Wo traditionelles OCR „New Y“ liest, erkennt die KI korrekt „New York“. Das macht einen enormen Unterschied bei schlechter Scanqualität, untypischen Layouts oder mehrsprachigen Dokumenten.
Warum lohnt sich der Aufwand?
- Qualitativ bessere Dokumentenerfassung: Mit KI-gestütztem OCR werden auch problematische Scans korrekt erfasst. Diese verbesserten Metadaten werden sowohl in Paperless-ngx als auch im ursprünglichen PDF gespeichert, sodass auch nach einem Export die bessere Qualität erhalten bleibt.
- Vollständige Automatisierung möglich: Statt Dokumente manuell zu taggen und zu klassifizieren, wird das auf Knopfdruck erledigt. Mit den entsprechenden Workflows kann dies sogar vollständig automatisiert werden.
- Datenschutz und Kontrolle: Du kannst Paperless GPT mit lokalen KI-Modellen wie Ollama betreiben oder es DSGVO-konform mit selbstbetriebenen Lösungen nutzen. Du gibst deine Daten nicht aus der Hand und behältst die volle Kontrolle über die Kosten.
- Stabilität: Im Vergleich zu anderen Lösungen wie Paperless AI läuft Paperless GPT meiner Erfahrung nach aktuell stabiler und zuverlässiger.
Paperless GPT installieren
Für die folgende Video-Anleitung nutze ich ZimaOS (oder CasaOS), da dies für Heimserver sehr einfache Betriebssysteme sind. Du kannst das Ganze natürlich auch in Portainer installieren, der Ablauf ist ähnlich. Die Schritt-für-Schritt-Anleitung für Portainer findest Du in einem folgenden Video weiter unten.
Was du benötigst:
- Eine laufende Instanz von Paperless NGX mit API Key von der Paperless NGX-Instanz.
- Einen API-Key für das KI-Modell deiner Wahl (ich nutze hier OpenAI mit GPT-5.1, aber auch Mistral oder lokale Modelle wie Ollama sind möglich).
- Die Beispiel
docker-compose.ymlDatei von der Paperless GPT GitHub-Seite.
1. Paperless NGX API Key
Klicke dafür auf Dein Profilicon oben rechts und wähle „Mein Profil“. Hier findest Du einen „API Key generieren“ Button. Klicke ihn und kopiere anschließend den API Key.
2. Einen API-Key für das KI-Modell deiner Wahl
Du kannst hier einen kostenlosen OpenAI oder Mistral API Key verwenden (je nach Anzahl Deiner zu bearbeitenden Dokumente).
- Hier kannst Du einen Mistral API Key erstellen: Mistral Platform
- Hier kannst Du einen OpenAI API Key generieren: OpenAI Platform
3. Die YAML anpassen
Kopiere dir den Inhalt der „example docker compose“ von der GitHub-Seite und füge ihn in einen Editor ein. Nun müssen wir einige Anpassungen vornehmen.
Benötigt wird
- Paperless NGX Base URL: Trage deine Paperless-ngx URL (inkl. Port) ein.
- Paperless NGX API Token: Den benötigten API-Token holst du dir direkt aus den Einstellungen in Paperless-ngx.
- LLM Provider (OpenAI / Mistral / Ollama)
- Provider API Key
- Trigger-Tag definieren: Hier legst du fest, welcher Tag in Paperless die KI-Bearbeitung auslöst. Standardmäßig ist das „Paperless GPT“, was ich auch so belasse.
Paperless NGX Verbindung
PAPERLESS_BASE_URL: "http://192.168.1.100:8080" PAPERLESS_API_TOKEN: "dein_api_token_hier"
- Ersetze die IP-Adresse mit deiner tatsächlichen Paperless-ngx-Adresse
- Trage deinen API-Token ein (den du in den Voraussetzungen kopiert hast)
- Wichtig: Nutze die Netzwerk-IP, nicht
localhost
Paperless GPT Tag
MANUAL_TAG: "paperless-gpt"
Dieser Tag bestimmt, welche Dokumente von Paperless GPT verarbeitet werden. Dokumente, die in Paperless-ngx mit diesem Tag gekennzeichnet werden, lösen automatisch die KI-Verarbeitung aus. Du kannst diesen Namen beliebig anpassen.
LLM Backend auswählen
Du benötigst einen API-Schlüssel für eines der folgenden Systeme, je nachdem, welches KI-Backend du nutzen möchtest.
| Backend | Kosten | Datenschutz | Best For |
|---|---|---|---|
| OpenAI (GPT-5.1) | Kostenpflichtig | Daten an OpenAI | Beste Qualität, einfach |
| Mistral | Teils Kostenlos | Daten an Mistral (EU) | Preis-Leistung, DSGVO |
| Ollama (lokal) | Kostenlos | Daten bleiben lokal | Datenschutz, Hardware nötig |
| Google Doc AI | Kostenpflichtig | Daten an Google | Alternative zu OpenAI |
| Azure Doc Intel. | Kostenpflichtig | Daten an Microsoft | Enterprise |
Für den Anfang empfehle ich Dir OpenAI mit GPT-5.1 oder Mistral, da beide relativ einfach zu konfigurieren sind. Mistral ist eine EU-KI mit Sitz in Frankreich, sodass sie dadurch wesentlich DSGVO-konformer ist!
Hinweis: GPT-4o wurde am 13. Februar 2026 in ChatGPT eingestellt. OpenAI empfiehlt Entwicklern den Umstieg auf GPT-5.1. Paperless GPT unterstützt GPT-5 bereits, mit dem Hinweis, dass die Temperature für OpenAI GPT-5 explizit auf 1.0 gesetzt werden muss:

Für OpenAI:
LLM_PROVIDER: "openai" LLM_MODEL: "gpt-5.1" OPENAI_API_KEY: "sk-dein_openai_key_hier"
Für Mistral:
LLM_PROVIDER: "mistral" LLM_MODEL: "mistral-large-latest" MISTRAL_API_KEY: "dein_mistral_key_hier"
Ich nutze im Video OpenAI, aber Du kannst – insbesondere als Unternehmen – auch Mistral einsetzen, welches für diesen Zweck vollständig geeignet ist.
Paperless GPT mit Ollama: KI-OCR komplett lokal und ohne Cloud
Du möchtest komplett auf Cloud-Dienste verzichten? Dann kannst du Paperless GPT auch mit Ollama als lokalem KI-Backend betreiben. Deine Dokumente verlassen dabei zu keinem Zeitpunkt dein Netzwerk – maximaler Datenschutz also. Ja, auf reiner CPU-Basis ist Ollama spürbar langsamer als ein Cloud-Modell wie GPT-5.1 oder Mistral. In der Praxis fällt das aber kaum ins Gewicht, denn die Verarbeitung läuft ohnehin im Hintergrund. Du taggst dein Dokument, gehst einen Kaffee holen, und wenn du wiederkommst, sind Titel, Tags und OCR bereits fertig. Wer also Wert auf Datenschutz legt und keine GPU im Heimserver hat, kann Ollama trotzdem problemlos einsetzen.
OCR-Konfiguration
OCR_PROVIDER: "openai" OCR_MODEL: "gpt-5.1" VISION_LLM_TEMPERATURE: "1.0" OCR_OUTPUT_FORMAT: "image" # "pdf" für beste Kompatibilität
OCR_PROVIDER: Sollte normalerweise gleich wie deinLLM_PROVIDERsein.OCR_OUTPUT_FORMAT: „image“ ist notwendig, wenn Du openAI oder Mistral nutzt.
Empfehlung: OCR Processing Mode
Für die meisten modernen Arbeitsabläufe mit digitalen Scans und PDF-Dokumenten empfiehlt sich der Modus OCR_PROCESS_MODE: „image“.
Die Option „pdf“ ist für andere Provider gedacht. Es gibt Provider, die echte PDFs direkt verarbeiten können, ohne sie vorher in Bilder umzuwandeln.
- Beispiel Docling: Es gibt einen Provider namens docling (ein anderes OCR-Tool), der den Modus pdf unterstützt und sogar effizienter damit arbeitet, weil er die PDF-Struktur direkt liest.
- Beispiel Cloud-Dienste: Manche kommerzielle OCR-Dienste (wie Azure Document Intelligence) können ganze PDFs annehmen.
Erklärung der Optionen:
| Option | Wirkung und Empfehlung |
|---|---|
| „image“ | Einzelne Bilder/Seiten werden einzeln verarbeitet. Praktisch für einzelne Bilddateien (z. B. JPEG), aber bei PDFs weniger effizient. |
| „pdf“ | Das gesamte PDF wird als ein Dokument verarbeitet. Die OCR wird auf jedes „Seitenbild“ im PDF angewendet. Empfehlung für Standardfälle. |
| „whole_pdf“ | Behandelt das PDF als eine große Fläche. Nur für Spezialfälle, nicht empfohlen für normale Dokumente. |
ACHTUNG: Mistral kann den pdf mode nicht
Bestehende OCR überspringen
- PDF_SKIP_EXISTING_OCR: „false“ (Standard) Die OCR wird auch durchgeführt, wenn das PDF bereits eine erkennbare Textebene besitzt. Sinnvoll, falls die bestehende Texterkennung schlecht oder fehlerhaft ist. Für höchste OCR-Qualität lass diese Einstellung auf „false“.
- PDF_SKIP_EXISTING_OCR: „true“ Paperless überprüft, ob im PDF bereits eine OCR-Ebene existiert und überspringt die OCR-Verarbeitung. Spart Ressourcen, behält aber ggf. schlechte OCR-Daten.
Vollständige Automatisierung (Optional)
Möchtest du komplett auf manuelle Bestätigung verzichten? Nutze den Tag „paperless-gpt-auto“ oder trage In der docker-compose.yml folgende Variable zusätzlich ein:
AUTO_APPROVE_SUGGESTIONS: "true"
Die Einstellung AUTO_APPROVE_SUGGESTIONS: "true" solltest du nur in sehr spezifischen, kontrollierten Szenarien aktivieren. Für die meisten Anwendungsfälle wird empfohlen, diese auf „false“ zu belassen.
Was diese Einstellung bewirkt:
- „true“: Paperless GPT genehmigt OCR- und Erkennungs-Vorschläge automatisch ohne manuelle Überprüfung.
- „false“ (Standard): Vorschläge werden dir zur manuellen Überprüfung angeboten.
Praktische Szenarien:
| Szenario | Empfehlung | Begründung |
|---|---|---|
| Hochvolumen-Batch-Scanning | „false“ | Fehlerhafte automatische Genehmigungen vermeiden. |
| Vertraute Dokumenttypen | „true“ möglich | Nur bei konstant hoher Qualität. |
| Sensible Dokumente | „false“ | Finanzunterlagen, Verträge immer prüfen. |
Auskommentieren / Entfernen
Zum Schluss entfernen wir noch Dinge, die wir nicht brauchen:
- Public URL (wenn dein System nicht öffentlich erreichbar ist)
- depends_on: (kann weg, da deine Paperless-Instanz schon läuft)
- gcloud_application (falls du es nicht nutzt)
- ollama_host (falls du nicht Ollama verwendest)
Paperless GPT installieren unter ZimaOS oder CasaOS
- Gehe als Erstes auf das Plus oben rechts über den Apps.
- Wähle „Custom App“.
- Klicke auf „Importieren“ (oben rechts im Fenster) und füge Deine YAML aus Schritt 3 ein.
- Wichtig: Lege jetzt noch die Ordner für
prompts,workerundpdfsan und verknüpfe sie. - Klicke auf Installieren.
Paperless GPT installieren unter Portainer
Für die folgende Video-Anleitung nutze ich Portainer auf ZimaOS. Der Ablauf ist auf anderen Betriebssystemen ähnlich oder gar gleich, da Portainer standardisiert ist. Solltest Du ZimaOS oder CasaOS nutzen, entscheide Dich lieber für die Installation per Custom App.
So nutzt du Paperless GPT in Paperless NGX
1. Dokument hochladen
- Lade ein neues PDF ganz normal in Paperless-ngx hoch.
2. Paperless GPT Tag hinzufügen
- Gib dem Dokument den Tag
paperless-gpt(oder den von dir definierten Tag).
3. Verarbeitung starten
- Wechsle in die Paperless GPT Oberfläche.
- Du siehst sofort die Meldung: „Neues Dokument gefunden“.
- Klicke auf den Button: Generate Suggestions.
4. Ergebnis prüfen & speichern Mit einem Klick erhältst du Vorschläge für Titel, Tags, Datum, extrahierte Werte (z.B. Rechnungsbetrag) und die verbesserte OCR-Erkennung.
- Du kannst Änderungen vornehmen oder ergänzen.
- Klicke auf Speichern, um die Daten zurück nach Paperless-ngx zu übertragen.
Fertig!
Mein persönliches Fazit
Paperless GPT ist aktuell das Tool, das den größten Mehrwert mit dem geringsten Aufwand bringt. Die KI-OCR ist schlichtweg bahnbrechend gut – ich habe seit der Installation quasi keine manuelle Nachbearbeitung mehr.
Meine klare Empfehlung: Installier Paperless GPT. Jetzt. Du wirst es nicht bereuen.
Was ist besser? Paperless GPT oder Paperless AI?
Paperless AI wird oft wegen seines RAG-Chats empfohlen, mit dem man direkt mit seinen Dokumenten chatten kann. In der Praxis hat genau dieses Feature jedoch zahlreiche Probleme: Das Indexing bleibt häufig bei „Loading Data“ hängen, die Verbindung zum LLM zeigt nach wenigen Minuten „Offline“ an, und selbst wenn der Chat funktioniert, werden Fragen oft nicht korrekt an das Modell weitergegeben – oder es werden die falschen Dokumente herangezogen. Das sind keine Einzelfälle, sondern wiederkehrende Issues auf GitHub.
Für die reine Dokumentverarbeitung – also Titel, Tags, Korrespondenten, Datumsextraktion und vor allem OCR – ist Paperless GPT die klar bessere Wahl. Es läuft stabiler, liefert mit der KI-OCR deutlich bessere Ergebnisse und hat einen wesentlich schlankeren Footprint. Ich habe Paperless AI mittlerweile deinstalliert und vermisse nichts.
Letzte Änderung:






