Textpassagen aus Bildern und PDFs kopieren

Bekanntermaßen findet OneNote dank automatischer OCR-Indizierung beliebige Suchbegriffe auch innerhalb von Bildern oder als Ausdruck eingebundenen PDF-Dateien. Aber lassen sich erkannte Textinhalte auch herauskopieren und weiterverwenden? Ja, sogar mit Bordmitteln von OneNote 2010/2013, aber noch viel komfortabler mit dem Add-On Onetastic.

Eines vorweg: Die folgende Anleitung bezieht sich auf die Windows-Ausgaben von OneNote. Also die mit Office installierten Clients OneNote 2010 oder 2013 und die neue kostenlose Version von OneNote 2013. Alle anderen Versionen (Mobil-Apps, Mac-Version…) verfügen über die beschriebenen Features (noch) nicht.

Wenn OneNote schon in der Lage ist, aus eingefügten (auch gescannten, an OneNote gedruckten, per Web-Clipper importierten…) Bitmap-Grafiken und PDFs per OCR Texte zu erkennen, wäre es schön, wenn man an diese auch irgendwie heran käme – etwa um Auszüge in die Zwischenablage zu verfrachten und an anderer Stelle in OneNote oder einem anderen Windows-Programm einzusetzen. Oder auch, um zu überprüfen, ob und welche Inhalte überhaupt erkannt und indiziert wurden.

Das geht auch, sogar mit Bordmitteln:

  1. Klicken Sie das betroffene Bild oder PDF mit der rechten Maustaste an
  2. Wählen Sie „Alternativtext…“. Die folgende Dialogbox enthält den kompletten indizierten Text aus dem Bild – inklusive aller eventuellen Erkennungsfehler.
  3. Diesen Dialog können Sie beliebig mit der Maus vergrößern, was bei umfangreicheren Inhalten hilft.
  4. Markieren Sie in der Textbox den gewünschten Abschnitt und kopieren Sie ihn in die Zwischenablage, entweder per Kontextmenü oder mit [STRG] + [C].

Jetzt können Sie den Abschnitt an beliebiger Stelle – auch in einem anderen Windows-Programm – einfügen.

 

Die Kontextmenü-Option "Alternativtext" zeigt den kompletten, im Bild erkannten Text – inklusiver aller Fehler.
Die Kontextmenü-Option „Alternativtext“ zeigt den kompletten, im Bild erkannten Text – inklusiver aller Fehler.

Falls die Textbox keinen Text oder nur wirren Buchstabensalat enthält, überprüfen Sie, ob die OCR-Funktion aktiv und auf die richtige Sprache eingestellt ist, indem Sie nach einem Rechtsklick auf das Bild aus dem Menü „Text im Bild als durchsuchbar definieren“ und dann die passende Sprache wählen.

Weit komfortabler mit Onetastic

Die beschriebene Methode wird spätestens bei umfangreicheren Inhalten (zum Beispiel PDF-Dokumenten mit viel Text) etwas umständlich, weil Sie die gewünschte Passage in der unformatierten Textbox erst einmal ausfindig machen müssen.

Wesentlich eleganter löst das Problem das kostenlose Add-On „Onetastic“ (mehr dazu in diesem Beitrag) von OneNote-Mitentwickler Omer Atay. Alleine diese Funktion ist die Installation von Onetastic möglicherweise schon wert.

Wenn Sie das Add-On, das mit OneNote 2010 und 2013 (auch der kostenlosen Ausgabe) kompatibel ist, installiert haben, gehen Sie folgendermaßen vor:

  1. Klicken Sie das Bild oder die PDF-Datei mit der rechten Maustaste an
  2. Wählen Sie aus dem Kontextmenü den durch Onetastic hinzugefügten Befehl „Text im Bild auswählen“.
  3. Es öffnet sich ein neues Fenster mit der verkleinerten Abbildung der betroffenen Grafik oder PDF-Datei. Alle erkannten Textpassagen sind mit einem gelben Marker gekennzeichnet.
  4. Markieren Sie mit der Maus den gewünschten Abschnitt und klicken dann auf die Schaltfläche „Auswahl kopieren und schließen“.

Der gewählte Textabschnitt steht nun in der Zwischenablage und lässt sich an anderer Stelle als Maschinentext wieder einfügen.

 

das Add-On Onetastic zeigt eine Vorschau des Bildes und kennzeichnet alle erkannten Textpassagen, die Sie von hier aus markieren und in die Zwischenablage kopieren können.
das Add-On Onetastic zeigt eine Vorschau des Bildes und kennzeichnet alle erkannten Textpassagen, die Sie von hier aus markieren und in die Zwischenablage kopieren können.

Ist die OCR-Funktion nicht aktiviert (Rechtsklick auf das Bild, „Text im Bild als durchsuchbar definieren“, Sprache wählen), erscheint nur eine Fehlermeldung, dass das Bild keinen Text enthält.

 

Das funktioniert mit allen Grafikobjekten, also auch PDFs oder (wie hier im Bild) umfangreichen Webseiten, die von OneNote-Web-Clipper übertragen wurden.
Das funktioniert mit allen Grafikobjekten, also auch PDFs oder (wie hier im Bild) umfangreichen Webseiten, die von OneNote-Web-Clipper übertragen wurden.

 

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.