Formuła spotkań jest prosta – to dzielenie się wiedzą poprzez prezentację zarówno teorii, jak i praktyki. Lista poruszanych tematów jest otwarta, a prowadzący chętnie bazują na propozycjach tematów zgłaszanych przez uczestników.
Tematem tego spotkania jest narzędzie AI Builder od Microsoftu. Idealnie wpisuje się ono w ideę inteligentnej hiperautomatyzacji.
Artykuł powstał na podstawie webinaru. Jeśli wolisz obejrzeć, niż czytać – kliknij.
Czym jest robotyzacja i hiperautomatyzacja?
Na wstępie wyjaśniono podstawowe pojęcia dla osób, które dołączyły do spotkania po raz pierwszy.
Robotyzacja procesów biznesowych (RPA automatyzacja) to nauczenie robota software’owego (oprogramowania nazywanego robotem software’owym, w skrócie RPA) klikania na klawiaturze komputera i poruszania myszką po ekranie monitora w taki sam sposób, jak robi to człowiek.
Z kolei hiperautomatyzacja to pojęcie znacznie szersze. To obudowywanie robota RPA nowymi, dodatkowymi technologiami, takimi jak na przykład sztuczna inteligencja (AI). I to właśnie na temacie AI skupił się webinar.
Prowadzący podkreślili, że w robotyzacji i hiperautomatyzacji ograniczeniem jest praktycznie tylko wyobraźnia. Można znaleźć dla nich zastosowanie w każdym dziale firmy. Przykłady to księgowanie faktur, weryfikacja zleceń produkcyjnych, aktualizacja danych czy kontrola danych w specyfikacjach jakościowych. To tylko niektóre z możliwości.
AI Builder od Microsoftu – narzędzie inteligentnej hiperautomatyzacji
Dotychczas realizacja projektów opartych na sztucznej inteligencji często była trudna i kosztowna, a technologia ta była trudno dostępna dla wielu przedsiębiorstw. Microsoft z AI Builderem zmienia to podejście, dostarczając narzędzie, które nie wymaga ogromnych zobowiązań, dużych inwestycji w serwery czy długotrwałych wdrożeń. Można je uruchomić szybko, skutecznie i efektywnie, a co najważniejsze – działa od razu.
Sztuczna inteligencja Microsoft to narzędzie, które doskonale pasuje do koncepcji inteligentnej hiperautomatyzacji. Co ważne, pozwala na realizację tej inteligentnej automatyzacji w sposób nieprzepłacony, jednocześnie zapewniając najwyższą jakość.
Sztuczna inteligencja w praktyce – jak działa AI Builder?
Przytoczona została definicja sztucznej inteligencji. Według uczestników webinaru można przyjąć, że to zdolność systemu do prawidłowego interpretowania danych pochodzących z zewnętrznych źródeł, a następnie nauki na ich podstawie i wykorzystania tej wiedzy. AI pozwala na elastyczne dostosowanie się do zadań i osiąganie celów.
AI Builder to rozwiązanie, które udostępnia te możliwości sztucznej inteligencji w bardzo przystępny sposób. Działa w logice „wskaż i kliknij”. Co to oznacza w praktyce? Nie wymaga od użytkownika umiejętności kodowania ani zaawansowanej wiedzy na temat danych. Dzięki temu nawet osoby bez technicznego wykształcenia mogą go wykorzystać.
Możliwe jest tworzenie niestandardowych modeli AI dopasowanych do bardzo specyficznych potrzeb firmy. W przypadku typowych scenariuszy biznesowych można skorzystać z gotowych modeli, które są dostępne od ręki.
Narzędzie AI Builder jest dostępne w ramach usługi Microsoft Power Automate, a nawet w podstawowym zakresie bezpłatnie.
Zmiana w podejściu do danych
Uczestnicy spotkania zauważyli, że jeszcze niedawno podstawą pracy robota RPA było to, że potrzebował on dobrze ustrukturyzowanych, powtarzalnych danych wejściowych. Robot, pozbawiony „inteligencji” w rozumieniu interpretacji danych, musiał dokładnie wiedzieć, skąd i w jakiej formie ma pobrać informacje.
Dzięki modułowi AI Builder w Power Automate to podejście się zmienia. Wykorzystując stworzone i wytrenowane modele, można automatycznie analizować i strukturyzować dane wejściowe, które wcześniej byłyby dla robota nieczytelne lub wymagałyby ręcznego przygotowania.
Współczesne roboty, a także chatboty, aplikacje czy raporty, mogą teraz wykorzystywać informacje pochodzące z maili czy opinii klientów (ze stron czy social mediów). Co kluczowe dla wielu procesów biznesowych, roboty mogą skutecznie analizować faktury, w tym te zeskanowane, niezależnie od różnorodności szablonów. Potrafią również odczytywać dane z zeskanowanych wizytówek, paragonów, dokumentów takich jak prawo jazdy, formularzy CRM czy dokumentów logistycznych. To ogromne rozszerzenie możliwości automatyzacji.
Koszty i licencjonowanie AI Builder’a
Jak wygląda kwestia kosztów i dostępności AI Builder’a? Po pierwsze, aby sprawdzić narzędzie i jego skuteczność, można skorzystać z 30-dniowego okresu próbnego. W tym czasie można zbudować własne, skuteczne modele (np. do rozpoznawania formularzy jak mandaty czy faktury) i przekonać się o jego ogromnych możliwościach. Uruchomienie okresu próbnego jest łatwe.
W ramach podstawowej licencji Microsoft Power Automate użytkownicy otrzymują 5000 środków (kredytów), które można wykorzystać na analizę z wykorzystaniem AI Builder. Nie jest to ilość wystarczająca do analizowania setek dokumentów, ale może być przydatna w niektórych, mniejszych zastosowaniach.
Decydując się na pełne wykorzystanie AI Builder’a, wystarczy kupić dodatkowe środki. Milion środków na wykorzystanie funkcjonalności AI Buildera kosztuje 500 USD miesięcznie. Każdy kolejny milion to kolejne 500 USD. Jak wspomniano, AI Builder nie generuje dodatkowych kosztów związanych z serwerami, administratorami czy długoterminowymi zobowiązaniami.
Aby przybliżyć skalę, podano przykłady czynności, które można zrealizować w ramach miliona środków (kredytów):
- analiza 50 000 ciągów tekstowych zawierających opinie, reklamacje, słowa kluczowe,
- wyodrębnienie informacji z 2000 stron formularzy (np. faktur, mandatów, CRM),
- wyodrębnienie informacji z 10 000 sztuk dokumentów (np. praw jazdy, paragonów z delegacji),
- analiza 45 000 obrazów (np. zdjęć półek sklepowych w celu kontroli ułożenia produktów),
- OCR (optyczne rozpoznawanie znaków) z 50 000 stron skanów/zdjęć dokumentów),
- analiza danych i budowanie prognoz – blisko 5 milionów wyników.
Jak widać, możliwości są ogromne i jeden milion środków pozwala na znaczącą skalę automatyzacji. Jeżeli potrzeby są jednak większe, wystarczy dokupić kolejny pakiet środków.
Nieograniczone zastosowania AI Buildera
Podsumowując część teoretyczną, można śmiało powiedzieć, że w zastosowaniu AI Builder’a ograniczeniem jest jedynie wyobraźnia. Narzędzie można wykorzystywać nie tylko do klasycznego rozpoznawania w celu księgowania faktur. Pozwala na automatyzację procesów, które wcześniej były poza zasięgiem standardowej robotyzacji.
Można analizować ceny konkurencji, kontrolować jakość w oparciu o analizę obrazu z linii produkcyjnych, usprawnić procesy reklamacji czy analizować wspomniane półki sklepowe.
Funkcji i zastosowań jest prawdopodobnie tyle, ile przedsiębiorstw i procesów, które w nich zachodzą. Sztuczna inteligencja może pomagać i być wykorzystywana w każdej firmie.
AI Builder w akcji – praktyczna prezentacja
Kolejna część spotkania to przejście od teorii do praktyki i prezentacja tego, jak AI Builder działa w rzeczywistości.
Interfejs i rodzaje modeli
AI Builder jest dostępny w interfejsie Power Automate. Tam zaczyna się od zdefiniowania modelu, czyli określenia, do czego sztuczna inteligencja ma być wykorzystana. Jak już wspomniano, możliwości jest wiele – to nie tylko wyciąganie informacji z formularzy.
Można również rozpoznawać słowa kluczowe, analizować obrazy, badać sentyment wiadomości (czy są pozytywne, czy negatywne), wykrywać język tekstu, rozpoznawać fragmenty obrazów w innych obrazach czy obiekty na obrazie.
Przykład z fakturami paliwowymi
Na prezentacji skupiono się na przykładzie pobierania informacji z faktur za paliwo wystawianych przez Orlen. Pokazano, że oprócz standardowych danych z faktury, takich jak NIP odbiorcy i wystawcy, terminy płatności, wartości netto, VAT i brutto, można również pobierać dane z tabel.
W przypadku faktur paliwowych były to informacje o miejscach tankowania, użytych kartach, datach tankowania, ilości litrów i cenie za litr. Takie dane mogą być następnie wykorzystane do przygotowywania raportów środowiskowych (zużycie paliwa) czy do rozliczeń pracowniczych.
Dokument źródłowy użyty w pokazie to elektroniczny plik PDF. Jednak narzędzie działa również z zeskanowanymi dokumentami. W takim przypadku skan najpierw podlega rozpoznaniu znaków (OCR), a następnie mechanizm AI Builder’a przetwarza go tak samo, jak dokument tekstowy. Format dokumentu źródłowego nie jest więc kluczowy.
Jak działa proces?
Przygotowany wcześniej model dla faktur paliwowych potrafił pobierać konkretne dane:
- numer faktury
- datę wystawienia
- NIP nabywcy i wystawcy
- kwotę do zapłaty
- VAT
- wartość netto
- dane z tabelki dotyczącej tankowań.
Trenowanie takiego modelu polega na wskazywaniu na dokumencie, gdzie znajdują się poszczególne dane interesujące użytkownika. Proces ten trwa około 10-15 minut i jest znacznie szybszy niż tradycyjne programowanie.
W ramach pokazu zaprezentowano prostego robota Power Automate, który działał w następujący sposób:
- trigger – robot uruchamiał się, gdy na wskazany adres e-mail przychodziła wiadomość z załącznikiem o określonym tytule (np. „invoice”),
- przetwarzanie – robot przekazywał każdy załącznik do wytrenowanego modelu AI Buildera,
- pobieranie danych – model AI Buildera pobierał wskazane informacje z dokumentu,
- wynik (w demo) – robot otwierał wiadomość e-mail zawierającą wszystkie odczytane dane z dokumentu,
- wynik – w praktycznych zastosowaniach te informacje powinny trafiać bezpośrednio do systemów obiegu dokumentów (DMS) lub do systemów księgowych. Robot powinien sam wprowadzać te dane do odpowiednich pól w docelowych systemach.
Ustrukturyzowane dane – kluczowa korzyść
Bardzo ważną korzyścią płynącą z użycia AI Builder’a jest to, że zamienia on dane nieustrukturyzowane (takie jak skany dokumentów o różnorodnych szablonach) na dane ustrukturyzowane i jednoznaczne. Robot dokładnie wie, co jest czym – na przykład, która wartość to numer faktury, a która to kwota do zapłaty.
To bardzo istotne, ponieważ na dokumencie może być wiele liczb, a sztuczna inteligencja dba o to, aby właściwe wartości trafiły do odpowiednich pól. Jakość rozpoznawania jest tutaj niezwykle ważna, aby uniknąć błędów, które mogłyby prowadzić do problemów (np. błędnych przelewów).
Elastyczność i integracja
Dane odczytane przez AI Builder’a są dostępne w formie cyfrowej i ustrukturyzowanej. Daje to olbrzymią elastyczność w ich dalszym wykorzystaniu. Można przekazać te dane do dowolnego systemu, albo je przeformatować, na przykład do pliku Excel, który następnie może być zaczytywany zgodnie z wymaganiami importu danych do konkretnego systemu. Możliwości są więc bardzo szerokie.
Dokumenty mogą pochodzić z różnych źródeł. Pokazano przykład z e-maila, ale równie dobrze mogą one być skanowane do folderu czy przychodzić z systemów EDI (Elektronicznej Wymiany Danych). AI Builder może być nawet etapem pośrednim w obiegu dokumentów – skan trafia do systemu obiegu, stamtąd jest pobierany przez AI Builder’a do rozpoznania, a potem ustrukturyzowane dane wracają do systemu obiegu dokumentów do zatwierdzenia i dalszego przetwarzania. Narzędzie to kompletnie eliminuje potrzebę ręcznego przepisywania danych ze skanu dokumentu do formularza w systemie, co często jest czasochłonną pracą.
Podczas demo wysłane zostały dwie przykładowe faktury. Robot je przetworzył i odesłał e-maile ze wszystkimi odczytanymi danymi z obu faktur.
Porównanie z tradycyjnym RPA
Zauważono, że dotychczas, aby pobierać dane z dokumentów o różnych szablonach w ramach standardowej robotyzacji, konieczne było programowanie każdego formatu przez dewelopera. Każdy nowy szablon wymagał modyfikacji kodu robota.
AI Builder znacząco skraca etap nauki robota i adaptacji do nowych formatów. Wskazywanie danych na dokumencie kliknięciem zastępuje godziny programowania. Proces uczenia jest znacznie szybszy i może być wykonany przez osobę bez umiejętności programistycznych w kilkanaście minut, a nie przez programistę w kilka godzin. Oznacza to niższy koszt stworzenia rozwiązania i szybszą adaptację do zmieniających się formatów dokumentów.
Pytania i odpowiedzi
Podczas webinaru pojawiły się pytania od uczestników, na które udzielono odpowiedzi.
Czy robot AI Builder potrafi odczytywać dokumenty pisane ręcznie?
Tak, taka funkcjonalność jest dostępna w ramach platformy, jednak skuteczność zależy od czytelności pisma ręcznego. Zaleca się przeprowadzenie testów na próbce kilkunastu lub kilkudziesięciu dokumentów, aby sprawdzić, jaka będzie skuteczność w konkretnym przypadku biznesowym. Odczytywanie elektronicznych plików PDF jest zdecydowanie bardziej skuteczne.
Czy można podzielić skan zawierający kilka dokumentów na pojedyncze pliki?
Tak, taka funkcjonalność jest dostępna w ramach Power Automate. Przykładem jest użycie bezpłatnie dostępnego w ramach Windows 10 narzędzia Power Automate Desktop do podzielenia jednego pliku zawierającego np. 10 zeskanowanych mandatów na 10 osobnych plików. Te pojedyncze pliki można następnie wczytać do AI Builder’a w celu dalszego przetwarzania.