Jak převést naskenované PDF a obrázky na text

Tento problém jsme řešili snad už všichni. Občas je potřeba text z vytisknutého dokumentu dostat do počítače. Přepisovat ho by bylo zdlouhavé, a když ho naskenujeme, bude se tvářit jako obrázek. Z toho obrázku se však text dá získat. Umí to třeba Google Drive!

Možná jste si sami někdy všimli, že když v Google Disku vyhledáváte, je schopný vyhledat text i v obrázcích. A podobně umí obrázky převést na text. Funguje to pro formáty JPEG, PNG, GIF a PDF. Technologie OCR (Optical Character Recognition) zatím není tak dokonalá, takže nerozpozná tučné písmo, různé velikosti písma, fonty, seznamy, tabulky atd., ale text aspoň v jednoduché formě převede.

Jak na to?

Jděte na drive.google.com a svůj obrázek si tam nahrajte. Pak na něj klikněte pravým tlačítkem a zvolte možnost Otevřít v aplikaci – Dokumenty Google.

google-drive-ocr-more-languages

Fotka: Techpp

Google radí

Google na svém webu uvádí pár rad, které by měly vést k lepšímu převodu obrázků na text.

  • Obrázek musí být v dostatečném rozlišení, text by měl mít na výšku aspoň 10 pixelů.
  • Obrázek musí být správně otočen, Google neumí rozpoznat text vzhůru nohama.
  • Lepších výsledků dosáhnete s běžnými fonty jako například Arial nebo Times New Roman.
  • Nejlépe to funguje u zaostřených fotek s vysokým kontrastem.
  • Obrázek nebo PDF dokument nesmí být větší než 2 MB.

Tým redaktorů magazínu Objevit.cz se skládá z poměrně mladých lidí, kteří psaní článků a pohybování se ve světě IT pokládají za svůj koníček, věnují se mu a tudíž mu i rozumí.

Komentáře

Nahoru