Choć chiński model AI w wielu aspektach jest przełomowy, to prawdopodobnie nie obniży zyskówzachodnich korporacji technologicznych
Konsekwencje udostępnienia modelu R1 przez chińską firmę DeepSeek ponieśli przede wszystkim inwestorzy giełdowi. W trakcie poniedziałkowej sesji wartość rynkowa czołowych amerykańskich firm technologicznych obniżyła się łącznie o ponad bilion dolarów. Kurs akcji Nvidii, producenta najbardziej zaawansowanych procesorów wykorzystywanych do trenowania sztucznej inteligencji i lidera hossy rozgrywającej się wokół nowej technologii od jesieni 2022 r., spadł o 17 proc. We wtorek notowania odrobiły niemal połowę strat.
Reakcje były gwałtowne, ponieważ chińskiej firmie udało się zbudować model porównywalny z produktami czołowych amerykańskich korporacji, takimi jak ChatGPT od OpenAI czy Gemini Google, przy wielokrotnie niższych kosztach. DeepSeek, stworzony w 2023 r., nie potrzebował do trenowania modelu najnowocześniejszych chipów produkowanych przez Nvidię.
DeepSeek R1 nie jest tak garażowy, jak chcą go przedstawiać Chińczycy
Jednak R1 nie jest produktem tak bardzo garażowym, jak chcą go przedstawiać Chińczycy. Za przedsięwzięciem stoi Liang Wenfeng, chiński inżynier i finansista. W 2015 r. razem z dwoma kolegami założył fundusz High-Flyer, inwestujący kapitał na rynku akcji na podstawie ilościowej analizy danych. Obecnie dysponuje on aktywami o wartości 8 mld dol. W 2019 r. Liang zaczął kupować procesory Nvidii i zanim trzy lata później Stany Zjednoczone nałożyły embargo na eksport najnowocześniejszych procesorów, zgromadził ich przynajmniej 10 tys.
– To jak kupowanie fortepianu. Robisz to, bo cię na to stać. I masz grupę ludzi, którzy chcą na nim grać – tak Liang tłumaczył chińskim mediom zakupy chipów. Według branżowych ekspertów dzięki dochodom z funduszu Liang jest w stanie zatrudniać i dobrze opłacać najlepszych chińskich specjalistów, a biura DeepSeeku przypominają kampusy poważnych zachodnich firm technologicznych. Według niektórych źródeł firmy Lianga mogą dysponować nawet 50 tys. chipów Nvidii. Amerykańska firma, dostosowując się do sankcji rządu USA, sprzedaje w Chinach procesory o mniejszej mocy obliczeniowej niż najnowocześniejsze produkty.
Przełom to przede wszystkim open source
– Przełom związany z modelem DeepSeek polega przede wszystkim na tym, że został on opublikowany jako open source. Każdy może ściągnąć go na swój komputer, sprawdzić, jak działa, dowolnie modyfikować według własnych potrzeb i bezpłatnie korzystać – mówi Piotr Mieczkowski, niezależny ekspert działający w sektorze technologicznym. Wyjaśnia, że choć chińska firma nie odkryła w gruncie rzeczy niczego nowego, to jednak dzięki kreatywnemu podejściu do już istniejących technologii udało jej się osiągnąć zaskakująco dobre efekty przy niższych nakładach.
– Modele sztucznej inteligencji przetwarzają zapytania użytkowników słowo po słowie. DeepSeek używa całych fraz, dzięki czemu robi więcej w tym samym czasie. Dokładność modelu jest przez to niższa, ale okazuje się, że nie ma to większego wpływu na efekt końcowy – wyjaśnia ekspert.
Przyczajony tygrys, ukryty DeepSeek
Microsoft, właściciel OpenAI, sprawdza, czy DeepSeek w treningu swojego modelu AI nie wykorzystywał w niedozwolony sposób zasobów ChatGPT.
Mieczkowski ocenia, że osiągnięcia DeepSeeku to dobry sygnał dla takich państw jak Polska, oznaczający, że niekoniecznie trzeba kupować najbardziej zaawansowane procesory, na które może nas nie być stać, żeby liczyć się w świecie sztucznej inteligencji. Z tego punktu widzenia potencjalnym przegranym w następstwie opublikowania modelu DeepSeek może być Nvidia. Pod wpływem rosnącego popytu na mikroprocesory zysk netto firmy zwiększył się z 4 mld dol. w roku obrotowym zakończonym w styczniu 2023 r. do 63 mld dol. za ostatnie 12 miesięcy (do października 2024 r.), a wartość rynkowa spółki przekroczyła 3,5 bln dol.
– Potencjalnym wygranym mogą być z kolei firmy software’owe, takie jak Microsoft czy Amazon, które w ramach dostępu do usług chmurowych będą mogły oferować także model sztucznej inteligencji typu open source – mówi Piotr Mieczkowski.
Według analityków Goldman Sachs gwałtowne tąpnięcie kursów firm technologicznych jest jedynie przerwą w długoterminowej hossie, a nie wstępem do większej przeceny. ©℗