Dokumenten-Management - Einstiegsfragen

  • Heißt das, dass du OCRmyPDF und Paperless kombiniert benutzt? Ich habe mit diesen Programmen auch schon ein bisschen herum experimentiert. Was mich an Paperless etwas stört ist, dass man an deren Web Interface gebunden ist. Aber die Funktion mit dem automatischen tagging ist schon sehr verlockend.

  • Naja an das Webinterface ist man nicht unbedingt gebunden, aber Funktionen wie tagging ist eben nur in Verbindung mit web Interface möglich, man braucht nicht ocrmypdf extra installieren, ist alles per docker-compose möglich, sehr einfach, ich werde mein docker-compose.yml heute Abend hier reinstellen mit Beispiel config mit Ordnern.


    Die Ordner kann man frei wählen, ich habe ein Eingangsordner wo OCR durchgeführt wird (MFD), noch ein Ordner wo kein OCR durchgeführt wird, für PDF wo man z.B als online Rechnung etc bekommt, da braucht man kein OCR da Text eingebettet, in beiden Fällen werden die Eingangsordner geleert, die PDFs werden einmal nummeriert ALLE IN EIN ORDNER abgelegt, parallel dazu werden aber auch die originale ohne OCR in einem Archiv Ordner, für alle Fälle.


    Wäre schön wenn die Dokumente noch dazu nach Eingangsdatum oder nach tag in Ordnern einsortiert wären, aber ich bin noch dran.


    Gesendet von meinem ONEPLUS A5010 mit Tapatalk

  • Hört sich sehr interessant an. Ich bin sehr gespannt auf deine Konfiguration. Die einzelnen Komponenten habe ich bereits auch schon durchprobiert, aber noch nie in der Kombination. Auch war es Mal wieder etwas kompliziert das ganze auf ARM-Architektur laufen zu lassen/zu konvertieren.

  • hier mal mein .env

    Code: .env
    PUID=1026
    PGID=65537
    TZ=Europe/Berlin
    CONFIG=/srv/dev-disk-by-label-raida/home/docker1/paperless-ocrmypdf-master/config
    SCANS=/srv/dev-disk-by-label-raida/dokumente/temp


    und hier mein docker-compose.yml

    Bei mir unter OMV5:8099 erreichbar.


    Die Verzeichnisse müssen natürlich erst angepasst werden (.env), nach bearbeiten von .env und docker-compose.yml:

    Code
    docker-compose up -d


    ausführen

  • Hi,


    ich fand das sehr interessant und finde es toll, dass du dein .env und dein yml file hier zur Verfügung stellst.


    Ich komme aber an einem Punkt nicht weiter. Beim Versuch im Dockerfile das PIP zu bauen, bricht er mit folgendem Fehler ab:


    Code
    Step 9/22 : RUN pip3 install --no-cache-dir -r requirements/main.txt -r requirements/webservice.txt -r requirements/test.txt -r requirements/watcher.txt .
    ---> Running in 8ba2d6a38d3b
    ERROR: Directory '.' is not installable. Neither 'setup.py' nor 'pyproject.toml' found.
    ERROR: Service 'ocrmypdf-inotify' failed to build: The command '/bin/sh -c pip3 install --no-cache-dir -r requirements/main.txt -r requirements/webservice.txt -r requirements/test.txt -r requirements/watcher.txt .' returned a non-zero code: 1

    Warum blos?

  • Ooh da kann ich dir Leider auch nicht weiterhelfen, vielleicht kennt sich einer von den Spezialisten hier besser aus, bei mir gab es keine Probleme,


    Ich habe mir damals weis nicht mehr woher eine Zip heruntergeladen, und einfach angepasst, hat auf Anhieb geklappt,
    diese ganze Docker Geschichte gefällt mir so langsam, Ich werde wenn ich mal etwas Luft habe, alles nochmal "richtig" einrichten, und eventuell eine Schritt für Schritt Anleitung hier reinstellen.


    Weil Recoll-webui nicht mehr so zeitgemäß ist und offensichtlich etwas eingeschlafen habe ich Paperless-Project und Mayan gleichzeitig eingerichtet, war eine "hopplahopp" Aktion
    Naja wie oben schon geschrieben war Mayan nicht so mein ding, kann vielleicht viel mehr, muss aber mühselig eingerichtet, für meine Zwecke reicht Paperless vollkommen aus.

  • Quote

    Ich komme aber an einem Punkt nicht weiter. Beim Versuch im Dockerfile das PIP zu bauen, bricht er mit folgendem Fehler ab:

    warum nutzt du nicht das fertige Image auf DockerHub?
    Ansonsten hast Du das gesamte github repo runtergeladen bevor du das docker Build Kommando gestartet hast?

  • Hi Morlan,


    habe ich gestern Nacht noch so gemacht. Der OCR Container läuft.


    Allerdings startet paperless nicht. Im Logfile in Portainer steht allerdings auch nichts, was verwertbar wäre:


    Code
    Mapping UID and GID for paperless:paperless to 1000:100,
    usermod: no changes,
    groupmod: GID '100' already exists,

    Ich dachte eigentlich, das wäre der einfache Teil. Ich habe lediglich die PGID und PUID von meinem User dort eingetragen (1000 und 100)


    Komme ich irgendwie an mehr logs?

  • Hi,


    ich habe den ocrmypdf ausgetauscht und entsprechend angepasst:


    Funktioniert :-)

  • Hey,

    hatte ich erzählt, dass ich nach dem Ausprobieren von unzähligen Lösungen/Programmen seit drei Jahren Folgendes fahre:

    • alle Daten landen auf einem Ordner auf einem Windows Server 2016 Domäne mit aktivierter Dateieindizierung
    • alle PDFs werden in einen Ordner mit der Scanner-SW eingescannt (OCR wird gleich mit erledigt)
    • für die Umbennung der Dateien nehme ich PDFScanmaker.
    • alle umbenannten PDFs kommen in einen Ordner (siehe Anhang)

    Die Indizierung in einem Windows Server/Client Netzwerk kann "freigegeben" werden.

    Das bedeutet, von jeder Workstation kann das Netzlaufwerk kontextbasiert durchsucht werden; man kriegt nur die
    Ergebnisse der Dateien angezeigt, auf die man auch die NTFS Rechte hat.


    Für mich die perfekte Lösung; ziemlich unabhängig und nachhaltig.

  • Hallo zusammen.

    Hat denn hier irgendjemand ein DMS unter OMV4 zum laufen gebracht?

    ecodms klingt eigentlich ganz interessant, ich verstehe aber nicht wie das installiert werden kann.

    Das funktioniert ja scheinbar via docker.

    Das habe ich bei mir aktiviert und finde dort aber leider nichts unter docker images repo.


    Ich möchte eigentlich nur unsere Rechnungen GoBD konform speichern.

    Würde mich freuen wenn jemand eine Anleitung für mich hätte.


    Viele Grüße

    Thomas

  • Hi Morlan,

    in der Anleitung wird das für eine Synology NAS mit Docker erklärt.

    Man muss einfach das image installieren und als Container starten. Klingt machbar ich finde aber das Image nirgends.

    OMV läuft doch auf Debian?

    Dafür gäbe es auch eine Server Version, wäre das evtl auch eine Möglichkeit?

Participate now!

Don’t have an account yet? Register yourself now and be a part of our community!