4 gratis online OCR-tools op de proef gesteld

4 gratis online OCR-tools op de proef gesteld

Als u gedrukte tekst wilt converteren naar digitale tekst die u kunt kopiëren, plakken, bewerken en zoeken, moet u OCR-scanners (Optical Character Recognition) gebruiken.





Wanneer u ervoor kiest om een ​​document te scannen of een foto te maken, wordt dit opgeslagen in een indeling zoals JPEG of PDF. OCR-software kan vervolgens de letters en cijfers in deze documenten herkennen en ze omzetten in een doorzoekbare PDF of in een bestand dat u kunt bewerken in programma's zoals Microsoft Word.





Het probleem is dat sommige OCR-scanners een stuk beter werken dan andere, en de allerbeste zijn behoorlijk zwaar voor de portemonnee.





Omnipage18 kost bijvoorbeeld $ 150, maar is vooral goed in het herkennen van verschillende talen. Adobe Acrobat Pro DC kost een oogverblindende $ 400, maar heeft een ongelooflijke nauwkeurigheid. ABBYY FineReader kost $ 150, maar is fantastisch in het omzetten van documenten zoals tijdschriften en brochures in doorzoekbare tekst. We zullen het online aanbod van ABBYY later in dit artikel testen.

Als u echter op zoek bent naar gratis alternatieven die u kunt downloaden en gebruik op Windows of OS X, moet u deze OCR-hulpmiddelen uitproberen. Maar als u liever een gratis, online OCR-tool, blijf lezen, want we hebben de top paar uitgeprobeerd, met de onderstaande resultaten.



De test

Het lijkt erop dat de meeste mensen nu hun smartphones gebruiken om voor hen te scannen, ik besloot om te gebruiken De scanbare app van Evernote (Gratis op iOS en Android). Ik heb de eerste pagina van Richard Dawkins gescand De berg beklimmen onwaarschijnlijk , om te zien welke resultaten we zouden kunnen krijgen met een zeer eenvoudige opmaak. Ik heb ook een pagina gescand van Tim Ferriss' De 4-Hour Chef om de scanners uit te proberen met wat meer gecompliceerde opmaak. Ik heb elk van deze bestanden opgeslagen als een PDF.

Deze documenten werden vervolgens door enkele van de zogenaamd beste online OCR-tools gehaald om te zien hoe goed ze het deden.





Gratis online OCR [niet langer beschikbaar]

Gelukkig is er geen registratie vereist om gratis online OCR te gebruiken. En ik was dubbel onder de indruk toen ik hun claim zag om de opmaak en lay-out van mijn document te behouden.

De site beweert PDF, GIF, BMP, JPEG, TIFF en PNG als invoer te kunnen ondersteunen. Uitvoer kan DOC, een PDF-tekstdocument, RTF en TXT zijn. Helaas kon ik niet achterhalen of ze een limiet voor de bestandsgrootte hadden.





Basisdocument naar PDF

Absoluut perfect omgebouwd. Meer valt er niet te zeggen! We gaan naar een heel goed begin.

Basisdocument naar DOC

De eigenlijke woorden lijken vlekkeloos te zijn omgezet, afgezien van de 'ount' van 'Mount Rushmore' die op de een of andere manier AWOL aan het worden is. De opmaak is echter een ander verhaal. Veel komma's werden vervangen door onderstrepingstekens en willekeurige spaties werden op punten in het document ingevoegd. Als je later ziet hoe de premium-software het in deze test doet, is dit echter geen slechte poging helemaal niet .

Complex document naar PDF

Complex document naar DOC

Deze keer duurde de conversie slechts 10 seconden, waarbij de tekst opnieuw werd geconverteerd met een nauwkeurigheid van ongeveer 95%. Er waren enkele vreemde spatiëringsproblemen en de software had problemen met het converteren van het lettertype rechtsboven in het document en miste hier en daar een paar tekens.

Vonnis

i2OCR

i2OCR maakt een aantal indrukwekkende beweringen. De tool herkent meer dan 60 talen, kan lay-outs met meerdere kolommen aan (door de opmaak te verwijderen), heeft geen limieten voor de bestandsgrootte, kan geüploade bestanden converteren en van URL's. En u hoeft zich ook niet te registreren om deze tool te gebruiken.

De service werkt door simpelweg de tekst uit uw afbeelding te extraheren en vervolgens niet-opgemaakte tekst uit te voeren. U kunt snel eventuele fouten corrigeren in de zij-aan-zij-weergave, voordat u de tekst naar andere programma's kopieert of downloadt als DOC, PDF of HTML.

Let op: toen ik probeerde mijn PDF-documenten te uploaden, werden deze afgewezen door i2OCR, dus ik moest deze converteren naar JPEG (door er een screenshot van te maken en vervolgens de bestanden te uploaden).

Basisdocument naar platte tekst

Complex document naar platte tekst

Het grootste deel van de tekst is zonder al te veel fouten omgezet, afgezien van de titel en het recept rechtsboven, dat voor deze tool onleesbaar was. De manier waarop de kolommen werden omgezet in platte tekst was verre van ideaal. Als je deze conversie werkbaar wilt maken, zou er veel tijd nodig zijn om de regels in samenhangende zinnen te herschikken.

Vonnis

Online OCR

Online OCR ondersteunt momenteel 46 verschillende talen en kan PDF, JPG, BMP, TIFF en GIF converteren naar Word, Excel of platte tekst. De site beweert dat 'geconverteerde documenten er precies hetzelfde uitzien als het origineel -- tabellen, kolommen en afbeeldingen'.

Met de versie die u kunt gebruiken zonder te registreren, kunt u tot 15 afbeeldingen per uur converteren (limiet van 5 MB). Als u zich aanmeldt voor een account, kunt u boven deze limiet meer pagina's kopen, terwijl u ook documenten met meerdere pagina's en ZIP-archieven kunt converteren.

Basisdocument naar DOC

Het basisdocument foutloos omgezet op het Romeinse cijfer na l niet opgehaald worden. Zoals de site beloofde, was de opmaak precies zoals in het boek. Een pluim voor dit hulpmiddel.

Complex document naar DOC

Nadat ik teleurgesteld was door de vorige OCR-tools bij het converteren van het complexe document, was ik enorm onder de indruk van Online OCR. De lay-out was bijna perfect, zoals je hierboven kunt zien. Nogmaals, het recept werd niet al te goed opgepikt, maar andere kleine fouten waren te verwaarlozen.

Vonnis

Absoluut fantastische resultaten van online OCR. Het enige nadeel dat ik zie, is dat er geen manier is om de geconverteerde documenten als PDF's te downloaden, aangezien de genoemde uitvoerformaten alleen DOCX, XLSX en TXT bevatten.

ABBYY FineReader Online (proefversie van 10 pagina's)

Zoals eerder vermeld, is ABBYY een van de marktleiders op het gebied van OCR-software, die ongeveer $ 150 kost voor hun volledige, downloadbare programma. Ze bieden wel een Gratis proefversie van 10 pagina's voor hun online tool (registratie vereist). Voor een abonnement van $ 5 kun je met hun online tool elke maand 200 pagina's converteren.

Geaccepteerde bestanden kunnen maximaal 100 MB groot zijn, in elk van deze formaten: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP en PNG. ABBYY herkent ook bijna 200 talen. De uitvoer is bijzonder indrukwekkend, met een keuze tussen DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 en EPUB.

U kunt tijdens uw proefperiode zelfs een aantal BETA-functies uitproberen. De eerste is de optie om uw document in een andere taal te vertalen. De andere is om uw geconverteerde document naar uw cloudopslagaccount te exporteren, of dat nu Dropbox, Google Drive, Evernote, Microsoft OneDrive of Box is.

Basisdocument naar DOCX

Complex document naar DOCX

Eenmaal geconverteerd waren er zeer weinig fouten in de tekst in het document (afgezien van de OCR die weer worstelde met het lettertype van dat recept!), maar de opmaak liet veel te wensen over.

De drie kolommen namen op de een of andere manier twee pagina's in beslag, met de centrale kolom enkel en alleen verschijnen op de tweede pagina. Als je eigenlijk zou willen doen alles met dit geconverteerde document, je zou je haren eruit trekken.

Basisdocument naar PDF

Complex document naar PDF

Vonnis

Het uiteindelijke resultaat

Als u, zoals de meeste mensen, slechts een paar tijdschriftartikelen en enkele huishoudelijke rekeningen wilt scannen, hoeft u deze documenten niet te bewerken. Daarom is direct converteren naar een PDF geschikt voor u, omdat u nog steeds in die documenten kunt zoeken. Hiervoor was Free Online OCR absoluut de beste gratis tool die we hebben getest. Dat gezegd hebbende, als je bereid bent $ 5 per maand te betalen voor bijna perfectie, ABBYY's FineReader online was iets nauwkeuriger.

Als het gaat om het converteren van documenten naar DOC, zijn we er niet in geslaagd om een ​​perfecte oplossing te vinden, maar verreweg de beste resultaten kwamen van Online OCR . De conversie was niet perfect, maar de integriteit van de opmaak werd grotendeels intact gehouden en fouten waren te verwaarlozen. Wanneer we deze resultaten vergelijken met het 'premium'-aanbod van ABBYY, kunt u niet anders dan enorm onder de indruk zijn.

We hebben de OCR-mogelijkheden van Google Drive niet in dit bericht opgenomen; een beetje voor de alomtegenwoordigheid van Google, maar meer voor het feit dat we een paar andere gratis online OCR-services wilden testen.

Aan jou: welke andere online OCR-tools zou je onze lezers aanraden? En welke heb je geprobeerd die je nooit meer zou gebruiken?

Deel Deel Tweeten E-mail Een beginnershandleiding voor het animeren van spraak

Het animeren van spraak kan een uitdaging zijn. Als u klaar bent om dialoog aan uw project toe te voegen, zullen we het proces voor u opsplitsen.

hoe twee cellen samen te voegen in Excel
Lees volgende Gerelateerde onderwerpen
  • internet
  • productiviteit
  • Bestandsconversie
  • OCR
Over de auteur Rob Nachtegaal(272 artikelen gepubliceerd)

Rob Nightingale heeft een graad in filosofie van de Universiteit van York, VK. Hij heeft ruim vijf jaar als social media manager en consultant gewerkt en workshops gegeven in verschillende landen. De afgelopen twee jaar is Rob ook technologieschrijver geweest en is hij Social Media Manager en Nieuwsbriefeditor van MakeUseOf. Je zult hem meestal de wereld zien rondreizen, videobewerking leren en experimenteren met fotografie.

Meer van Rob Nightingale

Abonneer op onze nieuwsbrief

Word lid van onze nieuwsbrief voor technische tips, recensies, gratis e-boeken en exclusieve deals!

Klik hier om je te abonneren