DecaTec

Programmieren, Fotografie, Home-Server und einiges mehr

OCR

Scanbot und Nextcloud zur Verwaltung digitaler Dokumente (mit OCR)

Nextcloud Scanbot Logo

Wer eine persönliche Cloud mit Nextcloud betreibt, wird diese sicherlich schon für viele Dinge des digitalen Alltags nutzen: Das Speichern von Dateien, Kalendern und Kontakten sind sicherlich nur einige Anwendungsbeispiele. Besonders interessant wird die Sache mit dem Verwalten (digitaler) Dokumente. In der heutigen Zeit hat man im Normalfall noch sehr viel „Papierkram“, den man meistens […]

, , , , , , , , ,

Linux: OCR-Texterkennung für PDF-Dateien und Bilder

Logo OCR

Die Texterkennung (sog. OCR – Optical Character Recognition) sorgt bei Dokumenten verschiedenster Art dafür, dass Datei-Inhalte maschinell lesbar sind. Dadurch lassen sich Datei-Inhalte zum einen leicht markieren/kopieren (z.B. bei PDF-Dateien). Zum anderen werden die Inhalte der Dateien leicht durchsuchbar. Der folgende Artikel zeigt daher, wie PDF-Dateien mit einer Texterkennung verarbeitet werden können. Ebenso wird gezeigt, […]

, , , , ,

Volltextsuche in Nextcloud (mit OCR)

Nextcloud Logo

Nextcloud stellt mittlerweile eine echte Alternative zu kommerziellen Cloud-Anbietern dar. Wenn man sich erst einmal von Google, Microsoft, Dropbox, etc. losgesagt hat, wird man die eigene Nextcloud früher oder später vermehrt nutzen und so zu einem echten „Nextcloud-Power-User“. Über die Zeit werden sich in der eigenen Cloud immer mehr Daten ansammeln, so dass man schnell […]

, , , , , , , , ,