Europa dysponuje niesamowicie inteligentnymi ludźmi. W szczególności Polska ma jednych z najzdolniejszych i najbardziej utalentowanych specjalistów w dziedzinie technologii. Europa też dba o ludzi. Połączmy więc te dwie kwestie. Zamiast być wyłącznie bastionem regulacji, Europa może przejąć inicjatywę w obszarze AI – mówi David Roberts, Chief Technology Officer, dyrektor ds. produktu i członek zarządu Allegro
Rozpocznę od pokazania skali. Nasza firma właśnie obchodzi 25-lecie działalności i obsługuje około 20 mln klientów i 146 tys. sprzedawców w krajach Europy Środkowo-Wschodniej. Generujemy mniej więcej 1 proc. polskiego PKB i przyczyniamy się do zatrudnienia około 1 proc. wszystkich pracujących w kraju. Taka skala wymaga zaufania. Zanim przejdę do tematu wyjaśnialności (explainability - red.) oraz tendencyjności modeli AI i MLOps (Machine Learning Operations – red.), chcę podkreślić, jak ważne jest zaufanie do platform handlu elektronicznego. Bez niego po prostu nie da się działać. Wraz z wprowadzaniem w Allegro kolejnych technologii opartych na sztucznej inteligencji musimy dbać o to, by nie stracić tego zaufania. Mechanizmy, z których korzystamy w ramach MLOps czy DevOps (Development and Operations – red.), znane większości ludzi, wiążą się z cyklami rozwoju oprogramowania, można wręcz powiedzieć – cyklami życia. Jest to proces skupiony przede wszystkim na danych, nie na kodzie. Dane mogą być tendencyjne. Potrzebujemy zatem mechanizmu, w którym są one odpowiednio opisywane w miarę napływania. Chcemy wiedzieć, co naprawdę znaczą. Mamy wytyczne dotyczące opisywania danych i zasady dla osób, które pomagają nam to robić.
Na początku musimy zadbać o to, żeby nie mówić na przykład o jabłku, gdy tak naprawdę chodzi o ciastko. To jest pierwszy krok. W drugim przyglądamy się danym i modelowi. Sprawdzamy wszystkie dane wsadowe i ich walidację, na przykład poprzez dodatkową kontrolę, czy dany zestaw danych został przejrzany przez człowieka i jak dokładnie zostało to wykonane. Proces MLOps polega na przeglądaniu zestawów danych, które otrzymujemy. Budujemy model, następnie go walidujemy i tak dalej, aż uzyskamy poprawne wyniki. Kolejnym krokiem jest wspomniana już wyjaśnialność. Proces, który opisałem, pomaga nam pozbywać się tendencyjności. W Allegro ściśle łączymy obsługiwane modele z naszymi mikroserwisami. Dzięki temu śledzimy przewidywania w miarę ich pojawiania się i rejestrujemy. Jeśli pojawią się problemy, możemy wrócić i dokładnie wyjaśnić, jak doszliśmy do określonego rezultatu. Jednym z najlepszych przykładów jest ocena zdolności kredytowej. Możesz się zastanawiać, skąd wzięła się taka a nie inna ocena, dlaczego zostałeś dopuszczony lub nie do Allegro Pay. Być może pomyślisz „Hm, nie rozumiem tego”. Wtedy możesz zwrócić się do Allegro i poprosić o wyjaśnienie. I tu pojawia się proces wyjaśnialności, który pomaga nam w udzieleniu dokładnej odpowiedzi. Teraz opowiem, gdzie może pojawić się tendencyjność danych i co z tym robimy. Jeszcze raz skorzystam z przykładu Allegro Pay. Jeśli składasz wniosek o kredyt i jesteś starszy, to masz pewną historię kredytową. Ale jeśli jesteś młody i dopiero zaczynasz, czy odrzucenie ciebie tylko ze względu na wiek doprowadzi do powstania tendencyjności w modelu? Chcemy dawać ludziom szansę i nie korzystać z modelu, który jest stronniczy. Oczywiście dbamy o ograniczanie ryzyka kredytowego i sprawdzamy wszystkie dostępne dane, aby nasza oferta była dokładnie dopasowana do wnioskodawcy, co również jest częścią procesu. W zmniejszaniu tendencyjności modelu pomaga również różnicowanie źródeł danych. Wystarczy wyobrazić sobie podmiot polegający na bardzo ograniczonej liczbie źródeł danych, z których na przykład jedno zawiera dane tendencyjne. W Allegro Pay świadomie ponosimy koszty pozyskiwania danych predykcyjnych z różnych źródeł.
Ujmę to nieco prościej. Jeśli ktoś mnie zapyta: „Czy regulacje pozwolą mi przyspieszyć innowacje w dziedzinie AI?”, to odpowiedź będzie brzmiała: „nie”. A czy potrzebujemy wyjaśnialnej sztucznej inteligencji? Owszem. I tu wracamy do kwestii zaufania. Jeśli będę wprowadzał coraz więcej nowych technologii, na przykład agentów AI w przyszłości, muszę budować zaufanie. W tym celu muszę pozbywać się tendencyjności z modelu, wdrożyć wyjaśnialność. Potrzebne są też pewne regulacje. Czy mówię „nie” regulacjom? Absolutnie nie. Moim zdaniem potrzebujemy regulacji, ale muszą one być adekwatne i elastyczne . Potrzebna jest równowaga. Wszystkie modele i sztuczna inteligencja będą tak naprawdę mieściły się w dolnych 90 proc. skali ryzyka opisanej w unijnym rozporządzeniu w sprawie sztucznej inteligencji (AI Act – red.). Dlatego regulacje nie mogą być nadmierne. Szczególnie, że moich konkurentów spoza Europy nie ograniczają takie przepisy. Z tego punktu widzenia Allegro znajduje się w niekorzystnym położeniu względem konkurencji. Jest to oczywiście daleko idąca generalizacja, ale nie da się ukryć, że nie ma tu mowy o równych szansach. Nie obawiam się konkurencji. Nie podoba mi się tylko to, że moi konkurenci mają tak dużą niezasłużoną przewagę.
Aby dać pewne wyobrażenie o skali wysiłków, jakie obecnie wkładamy w sztuczną inteligencję w Allegro, przywołam trochę statystyk. Aktualnie działająca technologia umożliwia zatwierdzenie wniosku kredytowego Allegro Pay w czasie poniżej siedmiu sekund. Ale żeby to było możliwie, aż 40 proc. czasu poświęcanego na pisanie kodu jest przeznaczane na wyjaśnialność. Ten wskaźnik będzie rósł wraz z wprowadzaniem coraz bardziej zaawansowanych modeli i przechodzeniem na te w większym stopniu oparte na sieciach neuronowych. W ciągu ostatnich kilku lat stworzyliśmy ponad tysiąc modeli AI. Spośród tego tysiąca, ostatecznie wprowadzonych zostało tylko sto, ponieważ przeprowadzamy cykl MLOps, o którym mówiłem wcześniej. Każdy model musimy zatwierdzić i upewnić się, że ma sens. Jeśli się zastanowić, to dziennie korzystamy z około 5,5 terabajta danych, co też oznacza wydatki na usługi w chmurze. Codziennie przeglądamy 1,2 mld modeli ryzyka kredytowego lub danych ich dotyczących i analizujemy około 20 tys. zmiennych. To daje wyobrażenie, ile wysiłku kosztuje obsłużenie ponad dwóch milionów osób korzystających z Allegro Pay. Mamy sztuczną inteligencję po stronie sprzedawców, coraz więcej sztucznej inteligencji po stronie kupujących i coraz więcej tej związanej z procesami wewnętrznymi, programowaniem i budowaniem doświadczenia użytkownika. Jeśli dodamy do tego liczne regulacje, to widać, jak moje położenie względem konkurencji staje się coraz bardziej niekorzystne. Nadmierne regulacje stawiają mnie i europejskie firmy w niekorzystnej sytuacji.
Europa dysponuje niesamowicie inteligentnymi ludźmi. Uważam, że w szczególności Polska ma jednych z najzdolniejszych i najbardziej utalentowanych specjalistów w dziedzinie technologii, jakich kiedykolwiek spotkałem. Europa jest też znana z tego, że dba o ludzi. Połączmy więc te dwie kwestie. Postawmy na innowacje. Mocno inwestujmy w nie, zwiększmy skalę naszych programów AI i zacznijmy wyznaczać standardy dla świata. Jesteśmy do tego zdolni. Im ważniejszym graczem jesteśmy na tym rynku, tym bardziej się rozwijamy. Zamiast być wyłącznie bastionem regulacji, Europa może przejąć inicjatywę i ustanowić standardy dla świata, jak w przypadku np. Konwencji Genewskiej. Myślę, że taka przyszłość nas czeka.
Jestem osobą, która wdraża sztuczną inteligencję w praktyce. Mam doświadczenie w inżynierii oprogramowania i pewnego dnia pomyślałem sobie: „A może by tak podzielić sieci neuronowe jak mikroserwisy, na małe części, i to rozwiąże problem?”. Ale moi eksperci od AI oczywiście odpowiedzieli: „Tak, ale problem polega na tym, że w ten sposób nie dojdziemy do naprawdę głębokiego uczenia, które jest potrzebne do wymyślania innowacji”. W Allegro budujemy coraz bardziej kompleksowe modele sieci neuronowych i myślę, że w przyszłości nie będziemy mogli korzystać z tego samego typu wyjaśnialności co teraz. Tworzone są nowe narzędzia – na przykład LIME (Local Interpretable Model-Agnostic Explanations – red.) – i zwiększa się złożoność procesów. Pomyślmy o sieciach neuronowych jako czymś zbliżonym do ludzkiego mózgu. Ludziom ciężko jest dokładnie określić, co dzieje się w mózgu. Istnieją pewne ograniczenia. Pewna bardzo duża firma właśnie wypuściła bardziej inteligentny model, który naśladuje modelowanie ludzkiego mózgu, w tym pojęcie zaskoczenia, i ma naprawdę pogłębioną pamięć. Myślę, że w tej chwili idziemy w kierunku właśnie takiego modelu, bardziej przypominającego mózg, podobnie jak neurolodzy, którzy próbują określić, co dzieje się w poszczególnych jego obszarach.
Uważam, że talenty, które mamy w Europie, są najlepsze na świecie. Jest taki filmik, w którym Sam Altman, Prezes OpenAI, odwiedzając Polskę i mówi: „Boże, wy tu w Polsce macie największe talenty!”. Ja też uważam, że mamy takie zdolności. Musimy tylko bardziej je pielęgnować, chronić, dbać o nie. Zamiast pozwalać tym wszystkim firmom przychodzić i zabierać nasze największe talenty, postawmy na inkubację. Stwórzmy możliwość bycia innowacyjnymi, zarabiania pieniędzy i pracujmy razem nad rozwojem sztucznej inteligencji oraz nad przyszłością. Myślę, że jesteśmy w stanie to zrobić, i wierzę, że Polska może zmotywować resztę Europy do powrotu do gry.
Tak sądzę. Uważam, że otwarte oprogramowanie jest ważne, bo umożliwia wielu ludziom podejmowanie wspólnych działań i współpracę. Z mojego punktu widzenia – podkreślę jeszcze raz, że nie jestem naukowcem, tylko praktykiem – osiągnięcie pełnej wyjaśnialności pozostanie trudne. Ale uważam, że będą powstawać nowe narzędzia, które pomogą nam zrozumieć głębsze sieci neuronowe. Jestem gorącym zwolennikiem otwartego oprogramowania i sądzę, że dzięki niemu będziemy posuwać się naprzód, ponieważ coraz więcej ludzi będzie starało się rozwiązać te problemy w ramach zbiorowej współpracy.