Dokumenten-Management - Einstiegsfragen

  • Also UCS ist ja in dem Fall nur der Unterbau. Ich habe nur kleine Ahnung wie ich die eingescannten Dokumente verarbeiten soll. Soweit ich es verstehe ist da erst mal egal ob OMV oder UCE, zumal die Plattform ja gleich ist. Was könnt Ihr sonst für alternativen zu Zarafa anbieten? Open Xchange habe ich mir noch angeschaut. Die oberfläche schaut zwar besser aus, aber die Comunity Version ist so start eingeschränkt, dass ich nix damit anfangen kann. Z.B. kein Konnektor für Android Tel. und Tablet's.

  • Naja, das mit Zarafa ist jau auch meine Meinung. Wenn du damit zurecht kommst, dann bleib dabei.


    UCS ist ganz sicher nicht gleich OMV. UCS ist anders aufgebaut und laut der Seite kann es auch weitere Server verwalten. Sprich, nein hier sind UCS fragen definitiv falsch.
    Wie sicher schon oft erwähnt, gibt google gern die Antwort, da gibts Kolab, Zimbra und einige mehr: http://www.zdnet.de/88233682/d…en-zu-microsoft-exchange/

  • mutosan: Ja, der Workflow vereinfacht sich wirklich deutlich. Allerdings ist in meinem Fall der WAF leider ziemlich gering, so dass ich immer wieder begründen muss, warum ich das gut finde...


    Bei den MS Exchabge Alternativen hatte ich ebenfalls Zarafa getestet, dort solltebes irgendwo einen Export-Button geben.
    Derzeit seitze ich auf Roundcube in Verbindung mit Owncloud bzw. Baikal auf meinem VPS.
    E-Mails werden aus dem eigentlichen Postfach in ein eigenes Archivpostfach weitergeleitet und dort von einer Archivierungssoftware abgegriffen.
    Und bevor jemand fragt: Ja, mir ist klar, dass das eigentlich über ist, aber ich finde es super

  • Ich glaube wir haben uns missverstanden. Mir ist klar, dass viele Variablen anders gestaltet sind bei UCS und OMV. Mir geht es auch nicht um Support für UCS sondern um eine best Praxis Lösung wie Mann so ein System auf die Beine stellt.


    Mal als Beispiel: ich möchte Tesseract als OCR benutzen mit Agorum als DMS. Wie gestaltete ich das die Scanns abgeholt werden und an den OCR über geben werden. Tesseract gibt ja ein Textfile aus diese soll dann in ein PDF. Passieren solche Sachen mit selbstgeschriebenen Skripten oder gibt es Tools dafür? Oder wird es ganz anders gelöst?


    Diese Sachen sollten komplett unabhängig sein vom OMV oder UCS. Hier haben es ja einige schon im Einsatz, vielleicht könnte Ihr etwas dazu sagen.

  • bis auf die automatische Sortierung habe ich alles hinbekommen, im moment versuche ich mich aber duch die OMV Plugin Geschichte durchzuschlagen, in der Hoffnung das ich das ganze per Plugin komfortabel installieren kann, vielleicht kann es ja auch ein anderer noch gebrauchen ;)

    hi,
    stehe auch vor der gleichen Aufgabe und habe im Prinzip die gleichen Anforderungen wie du.
    Wollte nach deinem letzten Stand sowie deinen Erfahrungen, Tipp etc fragen.

  • Hallo testereneco,


    Habe wie schon oben geschrieben etwas schlankes aufgebaut,
    Recoll webgui als standalone, wird bei systemstart gestartet, und recollindex alle 5 minuten durchlaufen lassen wegen Indizierung, klappt sehr gut,


    habe aber leider mein Lexmark X466 verkauft und hab mir einen Brother MFC 5720 geholt, naja wegen dem Duplex scanner, kann aber nur schlechtes darüber berichten,
    scanqualität grottenschlecht, dokumente werden teilweise schlecht eingezogen, arbeite momentan mit ABBYY Finereader und Hotfolder, weil es die beste erkennungsrate haben soll,
    selbst da werden die Seiten falsch sortiert, also Seite 1 wird als 2 und umgekehrt , und bei 40 oder mehr Seiten.....
    woran es liegt habe ich noch nicht herausgefunden



    auch als Drucker ist der absolut unbrauchbar, hängt vielleicht auch damit zusammen das ich bisher immer einen Laser hatte,


    Ich habe eventuell vor mir den IX500 zu holen, ist zwar nicht ganz billig, soll aber sehr sehr gut sein,


    allerdings habe ich in letzter Zeit auch sehr viel mit Scanbot für Android herum gespielt,
    bei bedachter bedienung auch sehr brauchbar, und in letzter Zeit bekomme ich eigentlich fast alles per EMail als PDF sodass man sich überlegen sollte ob die 400 Euro für einen Dokumentenscanner es wert sind.


    aber als Workaround auf dem Server kommt für mich nur Recoll in frage, man sollte auch nicht vergessen das man älter wird und irgendwann mal Probleme mit der Datenbank oder Webserver hat, und da liegt meiner meinung nach die Stärke von Recoll, läuft eigenständig, ohne Datenbank, und wenn alle Stricke reisen liegen die Dokumente irgendwo in verschiedenen Ordnern auf der HDD, es sei denn die Festplatte gibt den geist auf, aber da hilft dir die beste DMS auch nichts, da hilft nur dein Backup.. :)


    Das mit Plugin erstellen ist Leider etwas zu hoch für, Heimautomatisierung mit Openhab raubt mir momentan die Zeit, da bleibt nicht mehr viel übrig, letzte woche hab ich es geschafft EGroupware auf meinem OMV zum laufen zu bringen, hat mich viel nerven gekostet


    Gruß
    eiermann

  • hey,
    danke für den Feedback.


    Ich lasse auf meinem HP G8 uA eine VM-Instanz mit OMV seit bereits einem Jahr laufen. Ich bin sehr zufrieden.
    Speed eigentlich nie unter 110Mbyte/s (raw device mapping). Habe mit dem ESXI-Server schon viele Aufgaben gelöst (pfSense, Plex, Tvheadend, etc..).
    btw: Habe auch ein durchautomatisiertes Haus mit allem 'pi-pa-po'. Bei Bedarf, gerne mehr dazu.
    Nun sind meine Dokumente an der Reihe. Mit fast vierzig Jahren, Eigenheim und drei Kindern kommt das schon einiges zusammen :)


    Es spräche nichts dagegen noch eine zusätzliche VM mit einem DMS aufzubauen. Gerne auch kommerziell.
    Möchte aber auf keinem Fall, dass sich die Datei-und Ordnerstruktur ändert oder gar binäre Dateien in einer DB landen. Darum scheiden viele DM-Systeme aus.
    Was möchte ich denn? Ich möchte das die OCR-PDF-Dokumenten indiziert und möglichst plattformunabhängig (WebfrontEnd) durchsucht und gefunden werden können.
    Das stetig wachsende Alter und die damit verbundene Nachhaltigkeit und Einfachheit des angeforderten Systems ist ein sehr gutes Argument!
    Das Recoll scheint genau das Richtige hierfür zu sein. Guter Tipp!


    Measure twice, cut once.
    Ich habe viele Blogs und Foren durchgeforstet, um für mich ein System abzuleiten.
    Bestellt habe ich mir vor ein paar Tagen einen Shredder, einen Paginierstempel, einen Enthefter und eben den ix500.
    Trotz des großen Wehrmutstropfens bezüglich der fehlenden Twain-Schnittstelle habe ich mich auch für den ix500 entschieden. Habs gestern geliefert bekommen.
    Die Mechanik ist bei so einem Gerät ausschlaggebend. Die Nutzer überschlagen sich ja positiven Rückmeldungen.
    Auch die mitgelieferte Software soll recht gute Ergebnisse liefern.


    Sollte man recoll mit gui auf dem OMV installieren, oder ihm dafür eigens eine VM gönnen, in der die Laufwerke vom NAS gemounted werden?
    Kannst du mir einen guten walk-through empfehlen, irgendwelche must-haves, dont-do's oder sonstige Stolperfallen für die Installation?

  • Hallo zusammen,


    danke erstmal für eure wertvollen Beiträge. Insbesondere Recoll-WebUI ( https://github.com/koniu/recoll-webui ). Mal sehen, ob ich das im ISPConfig (Stick-to-Standard) installieren kann.


    testereneco: Das mit der Heimautomatisierung interessiert mich sehr. Ich plane gerade für einen Neubau (Wohnung, Kabelgebunden, Systeme auf SPS-Basis, ggf. commexio, loxone, S7) und bin an Praxiserfahrungen interessiert, sofern kabelgebunden und nicht KNX-Bus.


    Zum Thema ix500 eine Warnung meinerseits, warum ich meinen wieder verkauft habe. Insgesamt ein top Gerät, aber wenn man scannen will, muss zwingend immer ein PC mit laufen, über den das OCR mit einer proprietären Software realisiert wird. Die Software ist bei Windows so ineffizient, dass man drei mal "weiter" / "ok" klicken muss, um einen Scan zu PDF inkl. OCR durchzuführen. Ich werde mir wohl den Brother ADS-2600WE zulegen. Scan to SMB / Scan to FTP ohne eingeschalteten PC. OCR funktioniert auch hier nur mit eingeschaltetem PC, aber OCR über Tesseract funktioniert recht gut. Hier habe ich mich schon ausführlich damit beschäftigt:

    Meiner Meinung nach ist der ix500 super, wenn der PC "eh läuft" und man keinen!!! automatisierten Workflow plant.


    ecoDMS habe ich ein mal gekauft (Version 12.x) und leider auch keinen automatisierten Workflow vom bestehenden TIFF/PDF zur automatisierten Verschlagwortung hinbekommen. Damals musste man noch ecoICE dafür verwenden. Ob das heute noch der Fall ist? idk.


    Danke und Grüße
    knumsi

  • Hallo Leute,


    @knumsi : auf der von dir verlinkten Seite ist auch ein Beitrag von mir schau mal Februar 2016,
    mit Twain hast du recht, allerdings soll das ganze unter Sane recht gut funktionieren, nur muss man auf das automatische zuschneiden, Seiten begradigen etc verzichten, weil das ganze Softwarebasiert ist,
    also dokument rein fixformat a4 und OCR sollte funktionieren, oder eben wie du schon geschrieben hast, einen 7/24 laufenden Win PC.


    Edit : aach die Seite ist ja von dir :)


    @testereneco : für Recoll-webgui brauchst du keine VM, das ganze ist recht schlank, ist folgendermassen aufgebaut:


    recoll -webgui liegt irgendwo im dateisystem, bei mir im www,
    OMV -> Geplante Aufgaben -> ein Eintrag mit komando "exec /media/bbeee836-0a54-48bf-b4ca-4257b987113b/www/recoll-webui/webui-standalone.py -a 0.0.0.0 -p 8088" bei jedem Neustart
    OMV -> Geplante Aufgaben -> ein Eintrag mit recollindex alle 5 Minuten, dann wird alle 5 minuten Indiziert


    unter /root/.recoll/recoll.conf sollte folgender Eintrag drinne stehen :


    topdirs = /media/bbeee836-0a54-48bf-b4ca-4257b987113b/dokumente (oder wo auch immer die Dokumente sind)
    skippedPath = .recycle


    weboberfäche ist über 8088 erreichbar, sollte sich natürlich nicht mit nginx in die Quere kommen



    PS: Openhab läuft bei mir eigenständig auf einem Raspi2, allerdings kommt das ganze später auf einen Raspi3, aber ich warte noch bis Openhab2 stable ist, dann kommen bei mir auch endlich die ZWave Thermostate, homematic ade ;)


    ihr solltet euch auf jeden Fall mal Scanbot für Android oder IOS anschauen, automatischem OCR und automatisch hoch laden auf webdav, also auch für unterwegs sehr praktisch in verbindung mit einem "eigenem" Cloud
    naja über die Scanqualität kann man sich streiten, wenn man aber mit verschiedenen Belichtungsverhältnissen ausprobiert bekommt man relativ gute ergebnisse

  • Zitat

    Zum Thema ix500 eine Warnung meinerseits, warum ich meinen wieder verkauft habe.

    Du scheinst dich ja wirklich ausgiebig damit beschäftigt zu haben :thumbup:
    Du hast recht. Ein "Scan to SMB" ist ein must-have. Das nutze ich mit meinem vorhandenen AllinOne Laserjet regelmäßig.
    Nur mein Server läuft die ganze Zeit. Zudem widerspricht ein dreimaliges Weiterklicken meiner Natur.
    Ein vollautomatisierten Work-Flow an der Stelle setze ich nicht voraus. Ist auch etwas schwierig - spätestens beim Vergeben
    von 'Schlagwörtern' beim Dateinamen. Zur Not kann ich die OCR auch manuell anstoßen.
    Scannen, Zurechtstutzen, Sortieren und Ablegen auf dem NAS sollte der Scanner eigenständig können - das wird mir jetzt besser bewusst.
    Ich habe mich entschieden, den Fujitsu mit dem neuen Brother ADS2800W zu ersetzen.
    Auf Amazon.de findest du noch leider keine Rezensionen. Kostenpunkt 435-20=415 (CashBack)
    Danke.


    Ich werde Recoll am WE auf einer dedizierten VM aufsetzen und ausgiebig testen. Ich freue mich schon drauf.


    Ich "kratze" mal meine Hausautomatisierung an (Offtopic):


    Gerne auch gerne mehr Details, Pläne, eingesetzten Tools, etc... Ich bin idR ein silent-reader/leacher :rolleyes:
    Selbstkritik: vllt sollte ich irgendwann mal einen Blog schreiben, damit andere von den Erfahrungen auf profitieren können. :/

  • ... Das Thema DMS hat auch die ct in der aktuellen Ausgabe wieder entdeckt: "Ordnung im Archiv: Systeme zur privaten und geschäftlichen Dokumentenverwaltung" . Es werden im Artikel einige Systeme mit ihren wesentlichen Vor- und Nachteilen vorgestellt. Das hier im Thread schon mehrfach genannte EcoDMS gibt es nun in der allerneuesten Version auch als Docker Image, was für OMV 3 wohl interessant sein könnte.

    OpenMediaVault 6.x (most recent stable version) -- 64 bit -- OMV-Extras 6.x (most recent stable version) -- Default Kernel

  • Was ich seit einigen Tagen noch erfolgreich teste ist:


    MFD mit scan2ftp oder scan2smb
    VM auf OMV (alte XP Lizenz reicht)
    Abby Finereader mit Hotfolder (ältere Versionen gibt es in der bucht für kleines Geld)


    MFD speichert die Dokumente in einem temp Ordner, Hotfolder schaut jede Minute nach, bearbeitet und führt OCR durch, und speichert diese wiederum im selben Verzeichnis mit einer Erweiterung ab,
    fehlt nur noch das sortieren ;)


    ich muss sagen die Scanqualität und die Erkennungsrate ist einfach unschlagbar



    andererseits gibt es noch ABBYY Finereader Engine 11 CLI for Linux:
    12.000 Seiten pro Jahr 199 Euro
    120.000 Seiten pro Jahr 999 Euro
    500.000 Seiten pro Jahr 3499 Euro


    sollte aber für Privatleute sowieso wegfallen

  • Mal ein Feedback:
    Ich habe mir die letzten Jahre sehr viele Gedanken gemacht.
    Nach wirklich langer Recherche, das Testen von verschiedenen System und nach ausgiebigem Testen habe ich mir folgendes entschieden:
    ->Scannen/OCR erfolgt eigentlich immer manuell - kein automatisiertes Workflow notwendig
    ->12 Ordner eingescannt (viel Arbeit). Im Zweifel habe ich mich für das Shreddern des Originals entschieden. Ich habe vllt noch 100 Dokumente/Originale (Paginierstempel).
    ->Benennung Dateien (das war Arbeit) --> DATUM_Absender_Schlagwörter
    ->Keine Unterordner. Alle 1300 Dokumente liegen in einem einzigen Ordner.


    DMS:
    Da habe ich soviel probiert. Alles Scheiße :)
    SearchDaimon wäre es fast geworden. Wird aber leider nicht mehr weiterentwickelt.
    Darum:
    Ich nutze einen Windows Server mit klassische Ordnerfreigaben.
    Dokumente sind auf dem Server indiziert. Die Server-Indizierung kann in einem AD-Netzwerk für alle Clients freigegeben werden.
    Das ganze dann mit GPOs. Coole Sache! Ich bin sehr zufrieden und finde jedes Dokument sehr schnell.
    Ich bilde mir auch ein, das dies eine recht nachhaltige Lösung ist.


    btw: Backup mit Syncovery verschlüsselt auf Backblaze B2.

  • aus aktuellem Anlass:
    https://www.heise.de/ct/ausgab…it-dem-Raspi-4146415.html


    hier mal mein script den ich ocr.sh benannt habe und über "Geplante aufgaben" jede Stunde ausführen lasse.

    Die dokumente werden über unseren MFD als PDFs im "Eingang" abgespeichert.


    OCRMYPDF führt mit

    • - d Jede Seite vor der Texterkennung gerade ziehen (mit convert aus ImageMagick)
    • -c Jede Seite vor Texterkennung säubern (mit unpaper)
    • -f (force, nicht unbedingt notwendig, aber manchmal ziehe ich PDFs ins Verzeichnis wo ich von extern z.B per Mail bekomme)


    aus, und speichert die Datei im "Ausgang" ab, vorsichtshalber wird noch eine Kopie vom Original im "Backup" abgespeichert, (kann ich ja Jährlich einmal leeren)


    DMS nutze ich nach wie vor Recoll, ist für mich einfach die stabilste und sicherste Methode, auch von einem Tablet oder IPad aus gut zu bedienen ohne das man gleich einen Dateimanager installieren muss,
    das ganze klappt aber soweit ich weis nur unter OMV4 (stretch), mit OMV3 (jessie) gibts Probleme mit ocrmypdf, in fstab müsste glaube ich auch exec für die entsprechende HDD angegeben sein.

  • Hi zusammen!
    Der Thread ist zwar schon ein Jahr alt, aber er trifft bei mir aktuell einen Nerv. Habe mit der privaten digitalen Dokumentensicherung angefangen, seit ich ein NAS mit OMV betreibe. Als DMS nutze ich DEVONthink ToGo für meine iOS-Devices. Jetzt habe ich allerdings zwei Windowsrechner hier, die nicht auf das DMS zugreifen können. Das macht das ganze dann nicht mehr so sonderlich zukunftssicher. Daher denke ich darüber nach ein DMS auf meinem OMV-NAS zu installieren. Es muss aber eine Weboberfläche haben, damit ich von allen Geräten darauf zugreifen kann, auch zukünftig.


    EcoDMS sieht nicht schlecht aus. Ihr habt hier aber auch Recoll empfohlen. Da werd ich noch nicht so ganz schlau draus. Linux und ich sind wie Frau und Mann, wir verstehen uns nur so semi gut :). Aber OMV habe ich halbwegs zum Laufen bekommen und das NAS läuft auch gut.


    Hat Recall eine Benutzerfreundliche WebGui, die ohne Terminalkenntnisse genutzt werden kann?

  • Wenn Dir das bisherige nicht so zusagt, dann kannst Du auch einen Blick auf FileRun werfen. Es gibt dazu eine Demo und auch ein Docker Container direkt von der Firma selbst gepflegt.

    OpenMediaVault 6.x (most recent stable version) -- 64 bit -- OMV-Extras 6.x (most recent stable version) -- Default Kernel

  • Hallo Leute,


    was ich seit einigen Tagen teste ist noch https://github.com/the-paperless-project/paperless
    auch sehr gut gelungen, läuft perfekt mit OMV5 und Docker, sehr leichte Einrichtung und schlank,


    was mir echt sehr gefällt ist, dass man 2 Jahre alte Dokumente (Rechnung etc) hoch lädt, und durch OCRmyPDF wird das Eingangsdatum auf dem Dokument erkannt und darunter abgespeichert,
    des weiteren ist automatisches tagging, bei mir werden Dokumente mit Begriffen wie "strom gas müllabfuhr" automatisch mit "Nebenkosten" getagt, funktioniert echt sehr zuverlässig,


    MFD speichert als PDF auf eine Freigabe, Docker Container mit OCRmyPDF wartet dank Inotify auf Dokument und scannt, anschließend werden die oben genannten Funktionen durchgeführt und das Dokument kann Problemlos im Browser angeschaut werden, es kann nach "tags" nach eingangsdatum nach begriffen gesucht und gefiltert werden.


    Parallel dazu teste ich noch Mayan EDMS, läuft ebenfalls als Docker Container, auch sehr leicht einzurichten, man wird allerdings mit Funktionen erschlagen, meiner Meinung nach mehr was für eine Anwaltskanzlei mit mehr als 100 Dokumenten am Tag, für Ottonormalbenutzer viel zu kompliziert

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!