abonneren

Omnipage 17

Inhoudsopgave

  1. > Inleiding
  2. > Specificaties
De technieken om papieren documenten te digitaliseren worden steeds beter, maar perfect zijn ze zeker nog niet.

Sinds jaar en dag is Omnipage een van de toonaangevende namen als het om ocr (optical character recognition) gaat. Toen deze techniek voor een breed publiek zijn intrede deed, gloorden al snel visioenen van een papierloos kantoor. Aanvankelijk kon ocr-software echter weinig meer dan platte tekst herkennen en dan alleen wanneer het werd weergegeven in één enkel, liefst niet al te exotisch lettertype. Dat is goed om bijvoorbeeld een roman te digitaliseren, maar vaak niet eens krachtig genoeg voor een zakelijke brief waarin doorgaans immers meerdere lettertypen voorkomen.

Zoals het hoge versienummer van Omnipage's nieuwste paradepaard al aangeeft, zijn we sinds dat prille begin een eind opgeschoten. Nu verwachten we van ocr-software niet alleen dat ze met een flink aantal lettertypen uit de voeten kan, maar ook dat ze allerlei opmaakkenmerken correct herkent en overneemt. Op dat gebied voelden we Omnipage 17 dan ook eerst aan de tand door middel van een testset met 'real life' documenten, zoals een bankafschrift, een factuur, een zwaar opgemaakt boek en een wiskundetekst. We kozen juist voor deze documenten, omdat we ze eerder (zie PCM 1 van 2008) ook aan Omnipage 16 voerden.

Vooruitgang

Het uitgangspunt bij de praktijktest is dat we het programma 'out of the box’ op de proefdocumenten loslaten. Als we dat doen, zien we over vrijwel de hele linie verbetering. Drie documenten springen er in positieve zin uit. Een bankafschrift dat door versie 16 nogal rommelig werd verwerkt, komt nu vrijwel perfect in Word terecht en ook maakt Omnipage er moeiteloos een Excel-werkblad van. Een pagina uit een wiskundeboek – notoir struikelblok voor elk ocr-programma – wordt door versie 17 nog lang niet voldoende herkend, maar al wel significant beter dan door versie 16. Een extreem zwaar opgemaakte tijdschriftpagina die door versie 16 nog redelijk werd afgehandeld, komt na verwerking met versie 17 vrijwel levensecht in Word terecht. Tegenover dit alles staat één kleine achteruitgang in de score bij het verwerken van een fotoboek. Al met al meten we dus een behoorlijke vooruitgang qua scanresultaten.

Het succespercentage kan nog flink omhoog als we het programma een handje helpen. We kunnen namelijk op allerlei manieren aangeven hoe een document moet worden verwerkt en we kunnen het Omnipage wat makkelijker maken door documenten handmatig in hapklare brokken te verdelen. Uiteraard is dit te bewerkelijk voor het bedrijfsmatig verwerken van grote hoeveelheden documenten (we hebben het tenslotte over de Professional-editie, dus bedrijven zijn de doelgroep), maar voor dat doel kunnen we dan weer profielen maken én heeft het programma het vermogen te leren. Gelijksoortige documenten − die in een zakelijke omgeving eerder regel dan uitzondering zijn − zullen hierdoor steeds beter worden verwerkt.

Grootverbruik

Dat Omnipage gericht is op grootverbruikers blijkt niet alleen uit de al genoemde verwerkingsprofielen, maar bijvoorbeeld ook uit de speciale woordenboeken en herkenningsfuncties voor medische en juridische documenten, typische terreinen waar veel papier moet worden gedigitaliseerd. Ook nuttig voor zakelijk gebruik is de mogelijkheid bepaalde mappen continu te bewaken op het binnenkomen van faxen of e-mailbijlagen. Natuurlijk wordt ook deze versie weer geleverd met documentmanager Paperport.

Omnipage 17 is strak geïntegreerd in Windows, waardoor we de belangrijkste ocr-klussen snel via het contextmenu van de Verkenner kunnen activeren. Ook is de nieuwe versie geschikt voor multicoresystemen, wat de verwerkingssnelheid zeer ten goede komt. Tot slot werkt versie 17 beter samen met andere beheersystemen (Hummingbird, iManage) en de James Bond in u kan voortaan documenten scannen met de camera van zijn mobieltje (mits een hogere resolutie dan 2 megapixel).

PluspuntenMinpuntenConclusie
  • verbeterde ocr
  • snelheid
  • perfectie is nog ver weg
Omnipage 17 Professional is al met al een goede stap in de richting van het papierloze kantoor, maar voor exotischer materiaal dan bedrijfsdrukwerk laat het nog genoeg steken vallen.

Geschreven door: Redactie PCM op

Category: Review, OCR

Tags:

Laatste reactie