Czym jest technologia OCR?

Technologia optycznego rozpoznawanie znaków OCR (ang. Optical Character Recognition) w obrazach graficznych nie należy do nowinek technicznych i z powodzeniem wykorzystywana jest od co najmniej kilkudziesięciu lat przez różne programy do konwersji skanowanych tekstów do postaci cyfrowej. O ile dostępne na rynku programy do OCR sprawdzają się bardzo dobrze podczas digitalizacji zasobów bibliotek, czy dokumentów tekstowych o tyle w zastosowaniach ERP (szczególnie jeżeli chodzi o dokumenty finansowe takie jak faktury zakupu) wciąż unika się OCR jako niepewnego źródła danych.

OCR we współpracy z Microsoft Dynamics NAV

Na tym polu wyróżnia się Microsoft Dynamics NAV współpracujący z aplikacją Document Capture firmy Continia. Na podstawie przeprowadzonych wdrożeń wśród polskich firm mogę z pełną odpowiedzialnością stwierdzić, że może być to zamiennik elektronicznej wymiany dokumentów w postaci plików xml (ang. Electronic Data Interchange, EDI) szczególnie w przypadku gdy dostawca z różnych powodów nie chce lub nie może wdrożyć systemu EDI.

Dokumenty mogą być dostarczane do systemu Microsoft Dynamics NAV poprzez zeskanowanie do pliku PDF i zapisanie w wydzielonym folderze sieciowym. System może również automatycznie pobierać dokumenty bezpośrednio ze wskazanej skrzynki e-mail.

OCR

Natychmiast po odebraniu pliki poddawane są procesowi OCR. Jednak wynikiem tego procesu nie jest próba wiernego odwzorowania układu graficznego (jak w typowych programach) ale wstępne przygotowanie danych do przetworzenia na potrzeby systemu ERP.

Po zaimportowaniu plików , w pierwszej fazie analizy system poszukuje informacji identyfikującej źródło pochodzenia dokumentu i próbuje powiązać dane z rekordem bazy danych w przypadku faktur zakupu jest to kartoteka dostawcy.

OCR

W kolejnej fazie następuje dopasowanie danych nagłówka i wierszy dokumentu do szablonu stworzonego dla zidentyfikowanego dostawcy. Szablon odzwierciedla układ dokumentu specyficzny dla danego dostawcy, oraz zastosowane identyfikatory pozwalające na przypisanie danych z dokumentu do odpowiednich pól bazy danych.

OCR

W przypadku, gdy nie istnieje szablon dla rozpoznanego dostawcy, system proponuje utworzenie nowego szablonu i przypisanie go danemu dostawcy. Należy w tym miejscu nadmienić iż przygotowanie szablonu nie jest skomplikowanym procesem. Po trwającym ~4h szkoleniu utworzenie nowego szablonu dla nowego dostawcy zajmuje użytkownikom średnio od 5 do 15 min. Gdy szablon jest utworzony prawidłowo, następne dokumenty od tego dostawcy będą przetwarzać się automatycznie.

Rzadko się zdarza, że dostawca posługuje się naszymi numerami zapasów na wystawianych fakturach. Aby możliwe było przyporządkowanie numerów lub opisów wierszy faktury do odpowiednich wartości numerów zapasów, kont księgi głównej lub zasobów Document Capture w zależności od ustawień szablonu może wykorzystywać system własnych tłumaczeń lub w przypadku zapasów istniejące numery odsyłaczy.

 

W przypadku korzystania z tłumaczeń można dodatkowo zdefiniować odpowiednią jednostkę miary, grupę vat, wariant zapasu oraz określić wartości wymiarów księgi głównej.

Gdy wszystkie wymagane pola zostaną rozpoznane, system ERP – Microsoft Dynamics NAV rozpoczyna analizę spójności danych. Badane są min zgodność kwot oraz ilości w wierszach, zgodność sumy wierszy z kwotą podsumowania. System (w zależności od ustawień) może również sprawdzić zgodność faktury z zamówieniem i dostawą. Wykrycie niezgodności automatycznie blokuje możliwość utworzenia w systemie faktury zakupu, błędy wyświetlane są w sekcji komentarzy.

OCR

Gdy dokument nie zawiera błędów można go zarejestrować. Po zarejestrowaniu powstaje w systemie faktura zakupu

OCR

W stosunku do standardowego widoku faktury zakupu, standardowa strona systemu Microsoft Dynamics NAV została zmodyfikowana o widok zeskanowanego dokumentu. Widok służy jedynie poglądowej wizualizacji. W każdym momencie można otworzyć oryginalny PDF, który został dostarczony do systemu.

Aby nie obciążać bazy danych,  wszystkie pliki przechowywane są w postaci linków. System automatycznie tworzy strukturę katalogów do przechowywania zeskanowanych plików PDF, oraz przenosi i odpowiednio numeruje pliki. Zastosowanie takiego podejścia umożliwia dostęp do plików wszystkim uprawnionym użytkownikom posiadającym niezbędne uprawnienia oraz dostęp do Microsoft Dynamics NAV.

OCR

Do istniejących faktur zakupu istnieje możliwość dodania dowolnych dokumentów lub plików związanych z daną fakturą. Mogą to być np. protokoły odbioru, dodatkowe uzgodnienia, skany ofert … W tym celu wystarczy przeciągnąć dowolny plik na specjalne pole na stronie faktury

OCR

Dodane pliki są również automatycznie numerowane i kopiowane do zdefiniowanej struktury folderów.

Akceptacja faktur

Standardowym procesem w wielu firmach jest akceptacja faktur przed ich zaksięgowaniem. Akceptacja ma na celu sprawdzenie dokumentu pod kątem zgodności z ustaleniami (o ile nie istnieje w systemie zamówienie, z którym można automatycznie dokonać porównania) oraz uzupełnienia wymiarów – zadekretowania kosztów faktury na określone działy, grupy, projekty… (o ile nie da się tego zrobić automatycznie na podstawie danych z faktury) oraz wreszcie ostatecznej akceptacji kwoty faktury do zapłaty.

Wiele ścieżek akceptacji

Wykorzystując Document Capture istnieje możliwość zbudowania dowolnie wielu ścieżek akceptacji i przypisania ich określonym dostawcom. W każdej ze ścieżek akceptacji może znajdować się dowolnie duża ustalona wcześniej liczba użytkowników akceptujących. Dokument po wysłaniu do akceptacji będzie przesyłany kolejno od użytkownika do użytkownika (lub grup użytkowników) w celu akceptacji.

Każdy z uczestników tego procesu w zależności od udzielonych uprawnień może modyfikować dokument, zmieniać, dodawać wartości wymiarów oraz dodawać dowolne komentarze i pliki. Użytkownicy, którzy nie mają dostępu do Dynamics NAV (znajdujący się np. poza biurem) mogą w tym celu wykorzystywać specjalne narzędzie Web Approval. Do uruchomienia Web Approval wystarczy dowolne urządzenie obsługujące przeglądarkę internetową.

Po zalogowaniu widoczna jest lista dokumentów przeznaczonych do akceptacji.

OCR

Kliknięcie na wiersz spowoduje przejście do widoku dokumentu.

OCR

Po zaakceptowaniu, faktura może zostać zaksięgowana.

Wyszukiwanie informacji w zaksięgowanych dokumentach może odbywać się na dwa sposoby. Pierwszym jest odszukanie zaksięgowanego dokumentu oraz kliknięcie przycisku Nawiguj. Jeżeli istnieją jakiekolwiek dokumenty związane z zaksięgowaną fakturą, uprawniony użytkownik będzie mógł jednym kliknięciem przywołać na ekran zeskanowany plik PDF.

OCR

Jednak gdyż czasami nie dysponujemy wystarczająco precyzyjnymi informacjami, samo odszukanie zaksięgowanej faktury może być problemem. Wtedy można użyć funkcjonalności Document Capture umożliwiających odnalezienie dowolnego wyrazu lub frazy znajdującej się w dowolnym dokumencie:

OCR

Podsumowując

W tym krótkim artykule starałem się przekazać pokrótce funkcje modułu OCR możliwego do wykorzystania w Microsoft Dynamics NAV. Po odpowiednim ustawieniu szablonów dla dostawców przetwarzanie faktur może odbywać się w pełni automatycznie. W przypadku, gdy pojawi się dokument PDF, zostanie automatycznie przetworzony, zaimportowany do systemu, sprawdzony pod kątem poprawności, porównany z zamówieniem (jeżeli istnieje). Po przejściu przez proces walidacji automatycznie powstanie faktura zakupu w systemie, która w zależności od ustawień może zostać automatycznie zaksięgowana lub wysłana do akceptacji. Doświadczenie z przeprowadzonych wdrożeń pokazuje, że w ten sposób może zostać przetworzona zdecydowana większość dokumentów.

Podstawowe warunki przed wdrożeniem

Jednak aby wdrożenie Document Capture okazało się dobrą inwestycją należy spełnić kilka warunków.

  • Dostawcy muszą być powtarzalni. Gdy firma współpracuje z wieloma przypadkowymi dostawcami czas potrzebny na przygotowanie szablonu (choćby miało być to 5 min) jest niepotrzebnym nakładem pracy, gdyż nie ma żadnej gwarancji, ze w przyszłości dostaniemy ponownie fakturę od tego dostawcy
  • Dokumenty muszą być czytelne. Jeżeli człowiek ma problem z rozpoznaniem tekstu na wydruku, nie należy oczekiwać, że zrobi to maszyna
  • Dokumenty muszą być drukowane. Faktury pisane odręcznie nie zostaną poprawnie rozpoznane.

Document Capture… nie tylko do faktur zakupu

Na zakończenie należy również wspomnieć, że Document Capture to nie tylko faktury zakupu. W analogiczny sposób można importować zamówienia sprzedaży przysyłane przez klientów oraz dowolne inne dokumenty. Możliwości modyfikacji modułu w trakcie wdrożenia są praktycznie nieograniczone. Niewielkim nakładem pracy można stworzyć dowolną kategorię dokumentów np. zgłoszenie reklamacji, certyfikat produktu, zwolnienie lekarskie… Zdefiniować dowolne pola, które będą przechwytywane przez moduł OCR. Następnie dokument można powiązać z dowolną kartoteką w systemie oraz opracować dowolny proces rejestracji takiego dokumentu.