3 nejlepší online nástroje OCR pro extrahování textu z obrázků


Přepis textu z obrázků může být skutečnou bolestí. Když je text prezentován jako obrázek nebo v jiném nezvolitelném formátu, škola a práce se stávají obtížnými. Jediným řešením je přimět ty oči a prsty, aby pracovaly a pustily se do psaní - nebo je to?

Optimální rozpoznávání znaků, nebo OCR, je proces převodu psaného nebo ručně psaného textu z médií, jako je naskenovaný dokumenty nebo fotografie do prostého textu.

Přestože se jedná o chyby, v závislosti na srozumitelnosti textu, použití OCR k extrahování textu z obrázků vám může ušetřit hodiny monotónní práce. Jeden případ použití OCR by byl v případě, že jste vysokoškolský student, který potřebuje konkrétní stránku z učebnice. Pokud vám přítel pošle fotografii stránky, můžete pomocí OCR extrahovat veškerý text z obrázku a snadno jej přečíst a zkopírovat.

V tomto článku si prozkoumáme tři z nejlepších Nástroje OCR online pro extrahování textu z obrázků, z nichž žádný nevyžaduje stahování Software OCR nebo pluginy.

OnlineOCR >

OnlineOCR je jedním z nejjednodušších a nejrychlejších způsobů, jak převést obrázek nebo soubor PDF do několika různých textových formátů.

Bez účtu vám OnlineOCR.net umožní převést až 15 souborů na text za hodinu. Registrací účtu získáte přístup k funkcím, jako je převod vícestránkových dokumentů PDF a další.

OnlineOCR.net podporuje převod z formátů PDF, JPG, BMP, TIFF a GIF a jejich výstup jako DOCX. , XLSX nebo TXT.

OnlineOCR.net dokáže rozpoznat text v angličtině, afrikánštině, albánštině, baskičtině, brazilštině, bulharštině, katalánštině, čínštině, chorvatštině, češtině, dánštině, holandštině, esperantu, estonštině, finštině, francouzštině, galicijštině, němčině, Řečtina, maďarština, islandština, indonéština, italština, japonština, korejština, latina, lotyština, litevština, macedonština, malajština, moldavština, norština, polština, portugalština, rumunština, ruština, srbština, slovenština, slovinština, španělština, švédština, tagalog, turečtina, a ukrajinština.

Proces převodu vyžaduje tři jednoduché kroky. Nahrajete soubor omezený na 15 MB, vyberte jazyk a výstupní formát a klikněte na tlačítko Převést.

Bez ohledu na výstupní formát, který vyberete, v poli pod odkazem se zobrazí prostý textový náhled převodu pro stažení souboru ve vybraném formátu. To pomáhá uživatelům zabránit plýtvání stahováním při extrakci, která může být nepřesná.

NewOCR

NewOCR v současné době nabízí pouze extrakci textu z obrazových souborů, ale podporuje několik dalších zajímavých funkcí, které mnoho poskytovatelů OCR online ne.

Chcete-li začít používat NewOCR, jednoduše klikněte na tlačítko Vybrat soubor, vyberte obrázek, ze kterého chcete extrahovat text a poté klikněte na modré tlačítko Náhled. Zobrazí se náhled vašeho obrázku a zobrazí se několik dalších možností.

Na rozdíl od většiny ostatních online převaděčů obrázků na text vám NewOCR umožní nastavit více rozpoznávacích jazyků. To může být docela užitečné, pokud si nejste jisti, v jakém jazyce je text v obrázku napsán, ale máte dobrý odhad a chcete získat správný překlad z prostého textu.

Pokud je váš obrázek je zkosený na jednu stranu, můžete jej také dynamicky otáčet. Když použijete potřebné možnosti, můžete kliknutím na modré tlačítko OCRrozbalit text obrázku.

Odtud můžete stáhnout extrahovaný text do TXT, DOC nebo PDF, nebo je odešlete rovnou do Google Translate nebo Dokumentům Google k další úpravě.

OCR.space

V neposlední řadě OCR .space je rozhodně jednou z nejobsáhlejších možností, které jsme našli, a mělo by se stát, že se budete zabývat téměř jakoukoli operací obraz-text.

OCR.space je jedním z nejlepších nástrojů OCR, které podporuje formát souboru WEBP. Kromě toho jsou podporovány také soubory PNG, JPG a PDF. Navíc nemusíte nahrávat soubor - můžete na něj vzdáleně odkazovat, pokud je k dispozici někde online.

Mezi další specializované funkce patří automatická rotace, skenování účtenek, rozpoznávání tabulky a automatické měřítko. OCR.space je jedním z mála online OCR nástrojů, které podporují výstup souborů jako prohledávatelné soubory PDF (s viditelným nebo neviditelným textem), a dokonce si můžete vybrat mezi jedním ze dvou různých OCR motory pro nejlepší možnou extrakci.

Jediné, co musíte udělat, je nahrát nebo propojit soubor, klikněte na tlačítko Spustit OCR!a poté na náhled vašich výsledků se dynamicky načte na stejnou stránku. Pokud jste vybrali výstup jako prohledávatelný PDF, budou k dispozici také tlačítka Stáhnouta Zobrazit překryvné.

Jedno z nejzajímavějších a Unikátními vlastnostmi OCR.space je to, že může extrahovat jako JSON. Tento JSON bude mít pole, která obsahují každé slovo v textu a jejich souřadnice na samotném obrázku. Toto je velmi oceňovaná funkce, pokud jste tam kodér, který se snaží programově extrahovat text z obrázků.

S výše uvedenými třemi webovými nástroji extrahujte text z téměř jakéhokoli jasného a čitelného textu obrázek by měl být kousek koláče. I když jste rychle psací stroj s více monitory, není třeba trpět skrz přepis textových obrázků sami. OCR byl vytvořen z nějakého důvodu a tyto weby vám pomohou co nejlépe jej využít!

Pokud máte nějaké další tipy na nejlepší OCR nástroje nebo služby, které chcete sdílet, nebo byste jako pomoc s používáním jednoho z výše uvedených, neváhejte a napište nám zprávu do komentářů níže.

Související příspěvky:


22.02.2020