Skenování a digitalizace

1. Co mám vlastně chápat pod pojmem digitalizace?

Digitalizace záznamů je aplikace, která slouží k uchovávání dokumentů v digitalizované formě. Součástí funkcionality je řízeno extrahování dat z digitalizovaných dokumentů prostřednictvím OCR podle předem definovaných profilů. Extrahované data a digitalizované dokumenty jsou automaticky ukládány do atributů a příloh záznamů.

2. Co je to OCR a jak nastavit OCR při skenování?

OCR je zkratkou pro optical character recognition, tj. překlad textu z grafického formátu do textového formátu. Jednoduše řečeno, skenovací zařízení skenuje dokumenty jako obrázek, resp. pdf, což nejsou editovatelné upravovatelné dokumenty. OCR slouží pro převod do editovatelného záznamu. Uživatel tedy při skenování zadá OCR oblast - tedy vyznačené místo na stránce, jehož data se použijí na naplnění atributů. Pro přehled a snadné vyhledávání je důležité např. označit číslo faktury, resp. IČO dodavatele a jeho adresu. Jakmile je již jednou nastavena daná oblast, aplikace sama rozezná, o kterého dodavatele se jedná a automaticky přiřadí daný naskenovaný dokument konkrétnímu dodavateli, čímž zrychluje vnitro firemní procesy.

3. Jak dlouho trvá skenování?

DMS Greeny umožňuje hromadné skenování dokumentů. V praxi to znamená, že skenování bude trvat podle potřeby zákazníka. Např. v případě, že zákazník potřebuje naskenovat za jeden den 40 různých dokumentů o různé délce (např. smlouva může obsahovat různé přílohy a samotná může mít například. 20 stran), označí čárovým kódem první stránku konkrétního typu dokumentu. Po ukončení procesu skenování, může uživatel zkontrolovat správnost naskenovaných dokumentů a uložit je do repozitáře. V případě, že nebyly správně nastavené, může je manuálně měnit. OCR proces může být prováděn automaticky, resp. manuálně uživatelem. Výhoda hromadného skenování spočívá v tom, že uživatel vloží všechny tyto již označené dokumenty čárovým kódem do skenovacího zařízení. Během skenování může provádět jakékoli jiné pracovní úkoly. Jeho přítomnost není požadovaná, čímž se urychlují pracovní procesy ve firmě. Skenovací zařízení mezitím naskenuje všechny vložené dokumenty do aplikace DMS Greeny.

4. Jaké skenovací zařízení je vhodné?

 

Pro digitalizaci dokumentů na skenovacím zařízení, které je připojeno přímo k uživatelově počítači, je třeba disponovat skenovacím zařízením podporujícím WIA rozhraní - Windows Image Acqusition (WIA - někdy nazývaný i jako obrázková architektura Windows). Rozhraním WIA disponují i multifunkční zařízení.

V případě, že skenovací zařízení není připojeno přímo k počítači uživatele, je potřebný takový typ zařízení, který dokáže ukládat naskenované dokumenty na standardní paměťové médium jako je například USB disk nebo sdílený adresář (v případě zapojení zařízení do počítačové sítě).

Cena těchto skenovacích zařízení se pohybuje v závislosti na výrobci, dodatečných funkcionalit a jejich vlastností. Při výběru skenovacího zařízení je důležité brát v úvahu např. i velikost zásobníku papíru. Někomu může stačit 50 listů zásobník papíru, jiné firmě zas 500 listů zásobník papíru a více. Cena těchto zařízení se pohybuje od 100, - Eur výše, v závislosti na požadovaném výkonu a jiných funkcionalit.

 

5. OCR profil?

Ve zprávě OCR profilů se nachází nástrojová lišta a strom otevřených OCR profilů. V případě potřeby, může uživatel provést operace jako např. uložit, smazat, zrušit, vytvořit nový OCR profil a jiné. OCR profil reprezentuje právě jeden typ záznamu. Každý typ záznamu (např. faktura) musí mít definován OCR profil, aby mohl být při skenování správně rozpoznán. OCR profil obsahuje strany a oblasti. Právě proto je důležité, aby první strana skenovaného dokumentu měla na sobě nalepený čárový kód.

6. Co jsou to OCR strany a OCR oblasti a jak je správně nastavit?

Jedna OCR strana definuje jeden naskenovaný dokument, takže pokud má např. očekávaná faktura 3 strany, musí uživatel definovat 3 OCR strany. Při definování nové OCR strany musí uživatel definovat nový vzorový sken, který má na disku, a který bude použit pro definování OCR oblastí. Je třeba definovat strany ve správném pořadí a to tak, že první strana skenovaného dokumentu obsahuje čárový kód. Na každé OCR straně se mohou nacházet OCR oblasti, které definují místo na skenovaném dokumentu. Na vytváření OCR oblastí slouží ikona na nástrojové liště. Uživatel si tedy jednoduchým rámečkem označí podle svých potřeb OCR oblast, např. kolonku IČO dodavatele, resp. jiné.

 
 
 
 

HP internetový obchod HP Market Oracle Certified Partner HP 2013 GOLD Specialist - Personal Computing StatSoft