Verwerken van een PDF van een gescande factuur
Een gescande factuur wordt in de vorm van een PDF aangeleverd. Dit is als het ware een afbeelding van de factuur, die niet direct voor herkenning aangeboden kan worden aan Smartscan. Hier is een tussenstap nodig om de gescande factuur om te zetten in tekst. De PDF wordt daarom eerst aangeboden aan OCR (Optical Character Recognition). De OCR software analyseert de afbeelding(en) van de gescande factuur en zet de tekst uit de afbeeldingen om in door Smartscan interpreteerbare karakters.
Verwerken van een digitale PDF
Een digitale PDF, ook wel smart PDF of searchable PDF genoemd, is een PDF waar als het ware een tekst laag overheen ligt. Deze kan direct voor herkenning aangeboden worden en verder worden verwerkt in Smartscan. Mocht de digitale PDF door een inhoudelijk technisch probleem niet verwerkt kunnen worden in SmartScan dan wordt de PDF eerst aangeboden aan OCR en daarna verder verwerkt.
Verwerken van een beveiligde PDF
In sommige gevallen wordt door de leverancier een beveiligde PDF verstuurd. Doordat Smartscan de PDF technisch moeten kunnen lezen is verdere verwerking niet mogelijk. Het beste is om contact op te nemen met de leverancier om zo te zorgen dat er geen beveiligde PDF's meer gebruikt worden.
Multipage factuur
Van een factuur die uit meerdere pagina's bestaat, wordt standaard alleen de eerste en de laatste pagina aangeboden voor herkenning. Dit betekent dat tussenliggende pagina’s niet herkend worden, dit om een juiste balans te vinden tussen performance en herkenning. In de praktijk bestaat het merendeel van de facturen uit 1 of 2 pagina’s per factuur en heeft deze aanpak hierop geen invloed. Voor die gevallen waar het gaat om facturen met meer dan 2 pagina’s heeft deze aanpak ook geen invloed op de leverancier herkenning of het herkennen van de standaard kopgegevens. Alleen ordernummers die voorkomen op de tussenliggende pagina’s worden niet herkend.
Voor leveranciers waarbij verzamelfacturen de enige optie is, en waarbij de facturen bestaan uit veel pagina’s, raden wij aan om de factuurgegevens in XML aangeleverd te krijgen. Deze kunnen dan verwerkt worden zonder dat herkenning nodig is.
Als er toch facturen verwerkt moeten worden die uit meerdere pagina's bestaan (multipage facturen), dan kan aangegeven worden dat facturen van deze leverancier volledig herkend dienen te worden.
Multifactuur PDF
Meestal zal een PDF slechts één factuur bevatten. Het kan echter voorkomen dat een PDF meerdere facturen bevat. Hierbij zijn twee varianten mogelijk:
PDF met meerdere facturen, wel gescheiden door scheidingsvellen (hierop staat een QR-code). ISP-Classification herkent de QR-codes en maakt er losse bestanden van voor verdere verwerking. Het e-mail adres waarvoor deze functie van toepassing is kan ingesteld worden in de ISP-Classification configuratie.
PDF met meerdere facturen, niet gescheiden door scheidingsvellen. ISP-Classification houdt geen rekening met het feit dat er meerdere facturen in de PDF zitten en behandelt deze PDF als één factuur. Dit betekent dat de eindgebruiker pas in AP Automation zal zien dat deze factuur eigenlijk uit meerdere facturen bestaat. In dit geval kan de PDF uitgeprint worden en gescand worden met behulp van scheidingsvellen, zoals bij Verwerken van een papieren factuur. Het is ook mogelijk om een PDF te splitsen in meerdere PDF's middels een PDF tool. Deze kunnen vervolgens gemaild worden naar ISP-Classification en zo verder verwerkt worden. De oude factuur (die eigenlijk uit meerdere facturen bestaat) zal dan uit AP Automation verwijderd moeten worden.
Altijd met OCR verwerken
Sommige leveranciers leveren digitale PDF’s aan met een afwijkend technisch formaat, dat niet goed herkend wordt. Door in deze gevallen altijd OCR toe te passen kunnen deze PDF's beter verwerkt worden. Deze optie kan gekozen worden bij het aanmaken of aanpassen van Smartscan templates.
Verwerken van een PDF met bijlagen
De e-mail kan naast één of meerdere facturen ook bijlagen bevatten. Hoe ISP-Classification omgaat met deze bijlagen wordt beschreven op de pagina Verwerken van bijlagen. Hier wordt verder uitgelegd op welke manier bepaald wordt of een bestand een factuur of een bijlage is.
Opmerkingen
0 opmerkingen
Artikel is gesloten voor opmerkingen.