DocVault – Dokumentenverwaltung

Beschreibung:

Wer kennt es nicht? Obwohl wir immer von “Digitalisierung” sprechen, so bekommen wir doch weiterhin noch ziemlich viel wichtiges Papier. Sei es per Post oder als Rechnung in einem Verkaufsgeschäft. Wie geht ihr mit solchen Dokumenten um? Ordnet ihr diese konsequent und korrekt in einen regulären Bundesordner ein?

Für mich als digital affine Person war dies immer schon ein Problem welches gelöst werden sollte. Immer wieder habe ich nach einem Tool gesucht, welches meine Bedürfnisse abdecken kann. Es sollte leicht zu bedienen sein und dennoch gewisse “Extras” mitbringen. So z.B. eine Suchfunktion für Attribute sowie eine Volltextsuchfunktion. Es soll mich auch beim digitalisierungsprozess der Dokumente unterstützen.

Leider wurde ich auch im Jahr 2019 nicht fündig. So entschloss ich mich kurzerhand selbst eine entsprechende Applikation zu entwickeln.

Konzept:

Das Konzept sieht vor, dass das System grundsätzlich nur mit PDF-Dateien arbeiten kann. PDF Dokumente, besonders dann, wenn diese im PDF-A Format vorliegen, eignen sich sehr gut zur Langzeitarchivierung. Die A-Version steht dabei, wie könnte es anders sein, für “Archive” oder “Archiv”. Dieses Format verbietet jegliche Referenzen auf externe Quellen. So muss ein PDF-A Dokument z.B. alle Schriftarten welche es selbst darstellen möchte auch selbst mitbringen. So wird versucht, einen möglichst hohen Grad an Unabhängigkeit zu erreichen.

Bedienung:

Bevor mit docVault gearbeitet werden kann, müssen zuerst die drei Verzeichnisse konfiguriert werden. Das erste “Path to monitor” gibt an, welches Verzeichnis kontinuierlich auf neue Dateien überprüft werden soll. Normalerweise ist dies das Verzeichnis, in welches der Scanner automatisch seine PDF-Dokumente speichert.

Das zweite Verzeichnis “Path to vault” ist jenes Verzeichnis, welches später das eigentliche Dokumentenarchiv enthalten soll. Dort werden die verschiedenen Verzeichnisse automatisch angelegt und verwaltet.

Das letzte Verzeichnis gibt an, wo Backups gespeichert werden sollen.

Empfehlung:

Wenn du dich nicht so gut mit Computern auskennst, dann empfehle ich dir folgende Angaben zu machen:

Path to monitor: C:/docVault/Scanner
Path to Vault: C:/docVault/MeinVault
Path for backups: C:/docVault/meineBackups

Das Konzept sieht vor, dass docVault ein bestimmtes Verzeichnis kontinuierlich auf das vorhandensein neuer PDF-Dokumente überprüft. In meinem Fall ist es ein Verzeichnis, in welches der Scanner direkt die eingescannten Dokumente als PDF-Dokument ablegt. Sobald ein neues Dokument eintrift, wird dieses in der Liste angezeigt. Nach einem Klick auf den Start button, kann nun mit der Kategorisierung begonnen werden. Es können auch mehrer Dokumente zuerst eingescannt werden. docVault arbeitet dann nach einem Klick auf Start alle Dokumente nach einander ab.

In dem nun erscheinenden Dialogfenster hat man die Möglichkeit, alle relevanten Informationen zu dem vorliegenden Dokument zu erfassen. Hier wird dem Dokument auch eine eindeutige Dokumenten Identifikationsnummer vergeben (DID). Gibt man bei den Drop-Down Menüs neue Werte ein, so werden diese automatisch intern gespreichert, und stehen beim nächsten Mal direkt in der Auswahl zur Verfügung.

Wie man sehen kann, setzt sich der neue Dokumentenname nebst der DID auch aus dem Jahr, der Kategorie sowie dem Kommentar zusammen. Dies hat einen einfachen Grund. Dokumente sollen nicht nur mittels docVault gefunden werden können, sondern auch direkt beim ansehen der Ordnerstruktur. So legt docVault auch für jede Kategorie einen eigenen Ordner an und in diesem dann jeweils das entsprechende Jahr. So kann man seine Dokumente auch ohne zuhilfenahme von docVault wieder finden. Parallel dazu führt docVault noch ein reines Archiv-verzeichnis. In diesem befinden sich die Dokumente lediglich mit ihrer DID Nummer.

Suchen:

Etwas vom wichtigsten bei einer Dokumentenverwaltung ist auf jeden Fall die Art und Weise, wie Dokumente wieder gefunden werden können. Dazu bietet docVault den Data Browser. Im DataBrowser ist es möglich, sämtliche Dokumente innert Bruchteilen von Sekunden zu durchsuchen. Dabei beschränkt sich die Suche nicht nur auf die eingegebenen Attribute. docVault führt eine echte Volltextsuche in sämtlichen archivierten Dokumenten durch!

Um dies zu lösen, wird die Suchengine lucene von Apache verwendet. Lucene ermöglicht die Indexierung tausender Daten und deren Durchsuchung innert Bruchteilen von Sekunden.

Backup:

Hat man ersteinmal viel Zeit in die Archivierung investiert, so wäre der Verlust dieser Daten eine Katastrophe. Deshalb ist es wichtig, dass regelmässig Backups durchgeführt werden. Viele an sich sehr gute Applikationen überlassen diese Aufgabe dem Anwender. Dies führt oft dazu, dass wichtige Dateien vergessen gehen, da man schlicht nicht weiss, dass diese überhaupt existieren oder zu der Anwendung dazu gehören. Deshalb war es mir ein Anliegen, diese Funktionalität von Anfang an mit an Board zu haben.

Im Hauptfenster befindet sich deshalb ein Backup-Button. Dieser erzeugt ein ZIP-File mit allen relevanten Daten. Dies beinhaltet die Datenbank von lucene, die Datenbank von docVault sowie sämtliche sich im Vault befindlichen Dokumente. Alles zu einem einzigen Zip zusammengepackt und mit Datum sowie Uhrzeit in den zuvor definierten Ordner gespeichert.

Einfacher geht es nicht mehr!

Lizenzierung:

Im “About” Dialog findest du deine persönliche UMID. UMID steht dabei für Unique Machine ID. Mit dieser UMID kannst du einen Key beantragen, mit welchem du deine Applikation aktivieren kannst. Dann erscheint oben rechts im Fenster ein grünes häckchen.

Kompatiblität:

Dank der Entwicklung in Java, ist die Software sowohl auf Windows, Mac wie auch unter Linux lauffähig. Getestet wurde sie jedoch nur unter Windows und Mac. Dabei wurden den besonderheiten von MacOS rechnung getragen und versucht, das Benutzererlebnis zu optimieren.

Ausblick:

Software wird nie ganz fertig sein. Es gibt immer etwas, dass man verbessern könnte.
Nachfolgend eine kurze Liste, was implementiert werden könnte.

Automatisches Backup
Backup zu einem entfernten Ziel (FTP, S3, WebDav…)
Automatisches OCR für Bilder in PDFs
Zusätzliche Verwaltungsfunktionen für den DataBrowser

Projektinformationen

Projektdatum: 06.2019
Projektstand: updates
Aktuelle Version: 1.4
Sprache: Java

Software Download

MAC: docVault_1.2.dmg
WIN: docVault_1.4_win.jar

Quellen

Icon: Thalita Torres
Link to Thalita Torres

More projects

Zigbee Touch Key – DIY | ED2011-014 | Touch4

Description: The Touch4 enables you to simply add automation capabilities to your home. The device adds four touch keys to your environment. You can assign various functions to each of the touch keys Technical data Parameter Value Power supply CR2032 Battery Battery lifetime up to 3 Years (depends heavily on the usage) Dimensions PCB: 65…

ZigBee WallSwitch – DIY | ED2004-012 | Panda 1

Description: The Panda 1 enables you to simply add automation capabilities to your home. The device is designed to have very low standby power consumption. This can reduce the overall energy consumption of your Home automation installation significantly. Below, you can see a sample installation wiring diagram: Technical data Parameter Value Power supply 230V AC…

A13-SOM | ED1912-011-A

Description: For a few years now, there is a constantly growing market for small-sized single board computers like the RaspberryPi, beagle bone black, banana Pi and so on. They find often a place when an increased amount of computing power is needed. Since the community has grown and the market volume has increased, the prices…

Symphonist | ED1905-01-A

Description: For a few years now, there is a constantly growing market for connected devices in private homes like lightbulbs, temperature sensors, humidity sensors, doorbells and so on. One of the most annoying things about these gadgets is, that the user often needs some proprietary gateways for connecting these devices (often ZigBee based) with a…

iMotion – Motortreiber

Beschreibung: Schrittmotoren sind heute ein fester Bestandteil in unserem Alltag. So in diversen elektronischen Geräten wie etwa Drucker, Kameras, Scanner. Früher auch noch Laufwerke wie CD, Disketten oder auch Festplatten mit drehenden Scheiben. In der Automation haben Schrittmotoren ebenfalls wichtige Funktionen. Die Vorteile sind dabei die vergleichsweise einfache Ansteuerung im gegensatz zu Brushless Motoren. Wobei…

Bestückungsautomat

Beschreibung: Seit aufkommen der SMD-Technologie suchte ich nach geeigneten Möglichkeiten, um die Bestückung der Bauteile einfacher zu gesallten. Zuerst noch mit Lötkolben und Pinzette, dann mit Paste aus einer Dispenserspritze und später dann mit gelaserten PET-Folien als Pastenschablonen. Doch wirklich besser wurde es erst mit dem Aufkommen von günstigen Pastenschablonen aus gelasertem Stahl. Damit war…

Dosiervorrichtung für Klebstoffkartuschen

Beschreibung: Zweikomponenten Klebstoffe gibt es oftmals in Form von zwei einzelnen kleinen Tuben. Wobei eine davon der Härter und die andere das Harz ist. Diese mischt man dann meist im Verhältnis 1:1 um anschliessend die gewünschte Klebestelle damit zu bearbeiten. Es gibt jedoch auch Klebstoffe, welche sich in befüllten Kartuschen befinden. Diese Kartuschen haben den…

WebStamp – Postmarken generieren

Mit dem Service der Schweizerischen Post Hier gehts zur Post ist es inzwischen jeder interessierten Person möglich, Wertmarken zum Versand von Post und oder Paketen bequem zu hause zu drucken. Dazu ist nur ein entsprechendes Konto bei der Post notwendig und schon kann man online mit dem Erstellen der Wertmarken beginnen. Dieser Dienst ist an…

DocVault – Dokumentenverwaltung

Beschreibung: Wer kennt es nicht? Obwohl wir immer von “Digitalisierung” sprechen, so bekommen wir doch weiterhin noch ziemlich viel wichtiges Papier. Sei es per Post oder als Rechnung in einem Verkaufsgeschäft. Wie geht ihr mit solchen Dokumenten um? Ordnet ihr diese konsequent und korrekt in einen regulären Bundesordner ein? Für mich als digital affine Person…

ZigBee – DTB190502A

Beschreibung: Um die geplante Hausautomatisierung vorannzutreiben, wurde eine eigene kleine Leiterplatte mit ZigBee funktionalität entworfen. Ursprünglich war geplant, mit dieser Elektronik verschiedene Anwendungsbereiche gleichzeitig abzudecken. Leider haben sich bei der ersten Version ein Paar Fehler eingeschlichen, weswegen diese nun einen etwas reduzierten Umfang erhalten hat. Hier die technischen Daten: Spannungsversorgung +12V Stromaufnahme ca.…

EnviLight DRV450

Projektdatum: 30.05.2018 Das EnviLight bringt dir Automation und Fernsteuerbarkeit für deine Beleuchtung in dein Zuhause. Am Basisboard lassen sich bis zu vie einzelne LEDs mit einer Leistung von bis zu 50W pro Kanal anschlissen. Die Steuerung erfolgt über ein integriertes W-LAN Modul. Dieses stellt einen Webserver zur verfügung. Über das Aufrufen der IP-Adresse des Moduls,…

GPS-Logger

Projektdatum: 21.02.2012 Manchmal hat man das Bedürfnis, den Weg von etwas zu protokollieren. Als Beispiel wäre das eigene Auto wenn man es seinem Garagisten übergibt um zu sehen, wo denn seine Probefahrt hingeführt hat. Oder man möchte nach dem Wandern gerne nachsehen, an welchen schönen Orten man vorbeigekommen ist. Ein letztes Beispiel wäre, dass man…

Back to projects list