Automatische Texterkennung (OCR) mit Adobe Acrobat Pro (alternative FreeOCR)

Ich habe ein paar alte Bücher welche digitalisiert werden müssen. Entweder wird man alles manuel einippen oder mit Hilfe von einem OCR Software es regeln. Ich habe es mit FreeOCR probiert aber es ging nicht.
Weil:

- man kann nicht eine ganze Ordner mit mehreren PDF/JPEG Dateien zu Text-datein wie TXT, RTF oder DOC konvertieren lassen.
- mann kan nicht alle PDF Seiten drehen, wenn es zu Hochformat oder Querformat gewechselt werden muss.

Dann habe ich es mit Adobe CS5 Acrobat Pro probiert. Da gibt es schon Funktionen wie alle Seiten drehen und OCR Text erkennen. Ich habe folgendes gemacht.

- Gescannte PDF Datei mit AAP geöffnet
- Datei 180 Grad gedreht und gespeichert (Dokument -> Seite drehen oder "Umschalt + STRG + R")
- Dokument >> OCR Texterkennung >> Text mit OCR Erkennen
-- Hier muss man Sprache und Auflösung anpassen. Wenn das Dokument besondere Buchstaben von nicht westeuropäische Sprachen wie russisch, kurdisch, griechisch, arabisch, persisch, türkisch usw enthält, muss die Sprache schon angepasst sein.
- Danack kommt keine Meldung aber Texte in PDF sind schon markierbar. Also es ist nicht mehr ein Bild-PDF sondern Text-PDF
- Exportieren >> Als Word Dokument speichern

Dunkle Bereiche von gescannten Bild werden manchmal zum 0101010101 gewandelt. Das sollte man manuell entfernen.

OCR

Adobe Acrobat

PDF

Word

Text-Erkennung

FreeOCR

Neuen Kommentar schreiben

Gib tes eine andere

Gib tes eine andere kostenlose alternative zu Acrobat Pro, wenn es nicht mit FreeOCR geklappt hat. Ich brauche das nicht so oft und würde dafür kein Geld ausgeben. Wenn es aber eine Freeware dafür gibt, kann ich ab und zu gut gebrauchen. Danke

Texterkennung funktioniert

Texterkennung funktioniert leider bei mir nicht so richtig. Muss ich was einstellen?

Suche

Neueste Kommentare

Für Apache 2.4 + Plesk
2 months 1 week ago
Bypass htaccess-htpasswd if IP = valid
Für Apache 2.4 + Plesk 18:

Config File: var/www/vhosts/system/test.example.com/conf/httpd.conf
RAM ist 32 MB. Wie kann ich…
2 months ago
Install APCu (PHP 8.1, Plesk)
RAM ist 32 MB. Wie kann ich es erhöhen?
Short Code w. Radio Buttons, Checkbox, Textarea, Email, Phone
4 months 3 weeks ago
Formulare: alle Text Felder mit Test / Demo Daten füllen (mit JQuery)
```
$("input[type='radio']").each(function () {
```
Wildcard
8 months ago
How to Renew Let’s Encrypt SSL Certificate on Plesk via Ubuntu Shell
Let’s Encrypt will only accept a wildcard via DNS challenge.

If your Plesk instance can’t create the _acme-challenge.example.com TXT (external DNS), the extension can’t complete validation and will show no success.
Same problem
8 months 1 week ago
Warning: Undefined array key "url" in Drupal\Core\Asset\CssCollectionOptimizerLazy->optimizeGroup()
```
Warning: Undefined array key "url" in Drupal\Core\Asset\JsCollectionOptimizerLazy->optimizeGroup() 
```
set-timezone Europe/Berlin
8 months 1 week ago
Server install & config : Debian 12 + Plesk + Apache + nginx + MariaDB + Solr
```
sudo timedatectl set-timezone Europe/Berlin
```
Try this:1. Go to Tools &…
8 months 2 weeks ago
Warning: PHP Startup: Unable to load dynamic library 'apcu.so' ... cannot open shared object file: No such file or directory
Try this:
Alternative (without warnings like "no crontab for user")
8 months 4 weeks ago
List Cronjobs for all users (via for + crontab)
Alternative (without warnings like "no crontab for dovecot") to see all tasks:
php 8.3 apcu
8 months 4 weeks ago
Install APCu (PHP 8.1, Plesk)
php 8.3 apcu failed

über Plesk hat es geklappt.
phpize failed error?
8 months 4 weeks ago
Install APCu (PHP 8.1, Plesk)
install:
```
# sudo apt install php-dev
```

Automatische Texterkennung (OCR) mit Adobe Acrobat Pro (alternative FreeOCR)

Neuen Kommentar schreiben

Suche

Neueste Kommentare

Tags