Chciałbym napisać artykuł obalający narosłe wokół statystyk mity. Udowodnić, że – wbrew rzucanym od lat kalumniom – statystyczne dane są wiarygodne, nikt nimi nie manipuluje, że używa się ich do słusznych celów i na ich podstawie formułuje pożyteczne wnioski. Chciałbym, ale nie mogę
Dla Japonii 2010 r. to smutna i żałosna data. Jej odwieczny rywal polityczny, sąsiednie Chiny, wyprzedziły ją pod względem wielkości PKB. Produkty i usługi oszacowane na 5,8 mld dol. uplasowały Państwo Środka tuż za liderem rankingu – Ameryką. To był olbrzymi sukces, biorąc pod uwagę pożałowania godne miejsce, z którego Chiny startowały przed 30 laty. Gospodarka kraju była wyniszczona rządami Mao Zedonga znacznie bardziej niż gospodarka Polski rządami „naszych” komunistów. I nie miał to być koniec sukcesów Państwa Środka, bo analitycy Economist Intelligence Unit oszacowali przed dwoma laty, że Chiny wyprzedzą w końcu także USA. I że ma się to stać już w 2026 r.
Od tamtej pory wzrost gospodarczy w Chinach zaczął mocno spowalniać – i to do tego stopnia, że zaczęto mówić o groźbie kryzysu. Czy analitycy EIU się przeliczyli?
Czy i jak chińscy aparatczycy uratują PKB?
Uratują. Torturami. Będą torturować dane statystyczne tak, by w końcu przyznały im rację i wykazały wzrost gospodarki. Od dawna już przecież stosują tego typu zabiegi.
Braki w toalecie
Lojalny chiński komunista mógłby powiedzieć, że oskarżenia o fałszowanie statystyk to kłamliwa propaganda wrażego elementu imperialnego. Prawda jest jednak taka, że podejrzenia, o których przebąkują cichcem nawet chińscy ekonomiści, niedawno zyskały dodatkowe potwierdzenie. Szanowana firma doradcza The Conference Board opracowała niezależne wyliczenia PKB, według których realne tempo wzrostu gospodarczego Pekinu jest niemal dwukrotnie niższe niż oficjalne. W 2015 r. oficjalne wyniosło 6,9 proc., a realne – 3,7 proc.
Przyczyn tej rozbieżności jest kilka. Główna to fakt, że Chiny nie zdążyły jeszcze dostosować swojej metodologii obliczania PKB do światowych standardów i choć „nie ustają w wysiłkach” i „idą w wyznaczonym kierunku”, to wciąż swoją statystykę opierają na modelu sowieckim. W tym modelu o wielkości gospodarki decyduje skala produkcji bez względu na to, czy to produkcja sprzedana, czy nie. Jeśli chińska państwowa firma wyprodukowała 10 mln ton stali, która zalega w magazynach i nikt nie chce jej kupić, to i tak wlicza się to w PKB. W przeciwieństwie do sowieckich standardy zachodnie, chociaż także dalece niedoskonałe, każą brać pod uwagę przede wszystkim to, co się sprzedało. Nawiasem mówiąc, sowiecka metodologia prowadzenia statystyk pozwalała Polsce Ludowej być 10. potęgą przemysłową na świecie. Druga ważna przyczyna to „konkurencja” między poszczególnymi prowincjami Chin. Każda chce wykazywać jak najwyższy wzrost i, realizując normy partyjne, zyskiwać przychylność centrali. Wykazywanie tego wzrostu odbywa się dwojako: gdy się jeszcze da, to sztucznie zwiększa się inwestycje w infrastrukturę, a jeśli się już nie da, po prostu dopisuje się dodatkowe miliardy.
Nie tylko Chiny dopuszczają się manipulacji statystyką. Robi to także m.in. Argentyna. Rządowe komunikaty dotyczące tamtejszej gospodarki ekonomiści dzielą przez pół lub mnożą przez dwa. „Z danych nieoficjalnych wynika, że inflacja w Argentynie wynosi obecnie ok. 25 proc., czyli jest dwukrotnie wyższa, niż podają to oficjalne komunikaty. Rząd Argentyny próbował nawet, choć bez powodzenia, wprowadzić przepisy, zgodnie z którymi publikacja danych na temat inflacji, które są różne od danych oficjalnych, byłaby przestępstwem” – pisał dwa lata temu Steve Forbes w książce „Pieniądz”.
Innym wyrazistym przykładem manipulowania statystyką jest Wenezuela, kraj od wielu lat rządzony przez socjalistów. Oficjalne dane gospodarcze mimo nieustannych nacjonalizacji i erozji państwa prawa były niezwykle optymistyczne. Hugo Chavez, czempion wenezuelskiego socjalizmu, od 1999 r. w ciągu pierwszej dekady swoich rządów podwoił PKB kraju, zmniejszył biedę, nierówności i śmiertelność niemowląt. Na te informacje nabierał się nawet Bank Światowy, nie mówiąc już o dobrodusznych i dziecinnie naiwnych żurnalistach z lewicowego dziennika „Guardian”, którzy pisali o cudzie gospodarczym w Wenezueli i o tym, że socjalizm działa.
Socjalizm jednak nie działa, więc statystyczne kłamstwa musiały w końcu ustąpić prawdzie. Kraj zmaga się z inflacją na poziomie 275 proc. i brakiem podstawowych towarów: od papieru toaletowego po trumny. Nicolás Maduro, obecny prezydent, próbuje zarządzać gospodarką dyktatorskimi dekretami, ale – co za dziwy! – bez skutku. Jest tylko gorzej.
Co ma GUS w koszyku
A może zabawa statystyką to cecha wyłącznie reżimów autorytarnych, dyktatur i innych niedemokracji? Niestety, ustrój nie ochroni nas przed kłamstwem statystyki. Tyle tylko, że w demokracjach przyjmuje ono bardziej zawoalowaną formułę.
Weźmy ponownie inflację. Bez względu na to, czy mieszkamy w USA, we Francji, czy w Polsce, mamy tendencję do narzekania na rosnące ceny. Tymczasem rzut oka na urzędowe statystyki dotyczące inflacji skłania do weryfikacji naszych prywatnych odczuć. Inflacja, jeśli jest, to mała. W 2015 r. w Polsce odnotowano nawet okresową deflację (ceny wówczas spadają). Jak wyjaśnić tę rozbieżność między odczuciami konsumentów a danymi płynącymi z urzędów statystycznych?
Pierwsze wyjaśnienie brzmi: bez względu na koniunkturę społeczeństwo jest raczej pesymistyczne w ocenie trendów gospodarczych. To według ekonomistów (np. Bryana Caplana z George Mason University) rodzaj skazy wynikającej z braku dobrego ekonomicznego poinformowania.
Drugi, mniej przyjazny twórcom statystyk rodzaj wyjaśnienia wspomnianego paradoksu także ma wielu zwolenników wśród ekonomistów (zwłaszcza wśród przedstawicieli teorii wyboru publicznego, którzy w działaniu publicznych instytucji upatrują nieidealistycznych motywacji.) Oto rządzący politycy zazwyczaj chcą, by dane gospodarcze przedstawiały się lepiej niż w rzeczywistości. Zyskują wówczas ten wspaniały argument: jesteśmy skuteczni. Politycy rządzą państwem i wypłacają pensję szefom urzędów statystycznych. Czy będą skłonni wpływać na statystyków i czy statystycy będą skłonni owym wpływom ulegać? Teoretyk wyboru publicznego powiedziałby, że sami statystycy świadomi w głębi duszy takich zależności i oczekiwań polityków będą „cenzurować” dane. Nie potrzeba do tego rządowych nacisków.
W stabilnej demokracji „cenzura” będzie odbywać się w sposób subtelny. Można na przykład co jakiś czas zmieniać bez rozgłosu metody analizy danych. Zwraca na to uwagę John Williams, założyciel firmy badawczej American Business Analytics & Research. Do pomiarów zjawisk gospodarczych, takich jak inflacja, dług publiczny czy wzrost gospodarczy, używa on metod zaczerpniętych z lat 80. i 90. XX w. Wyniki są szokujące.
Mierzona starymi metodami inflacja wynosi obecnie w USA ok. 4 proc., podczas gdy dane oficjalne mówią o cenach balansujących na granicy deflacji (każdy może sprawdzić to na portalu ShadowStats.com). Oto wyjaśnienie. Narzędziem służącym najczęściej do pomiaru inflacji jest tzw. Consumer Price Index (CPI). Do wspólnego koszyka wrzuca się te towary i usługi, które według statystyków odzwierciedlają przeciętną krajową konsumpcję. Udział danego towaru w konsumpcji określa jego znaczenie w koszyku. Jak podkreślają krytycy wskaźnika CPI, jest on tak skonstruowany, że pozwala na kamuflowanie rosnących cen.
Peter Schiff, amerykański ekonomista i znany inwestor, stworzył własny koszyk inflacyjny, ale postanowił nie manipulować „wagą” znajdujących się w nich towarów. Chciał oszacować zmiany cen koszyka w relacji do oficjalnej inflacji CPI. W latach 2002–2012 koszyk mierzony metodą CPI wzrósł o 27,5 proc., a metodą Schiffa o 44 proc. Zastosowanie tego pomiaru do okresu 1970–1980 przyniosło znacznie mniejszą różnicę – metoda Schiffa pokazała inflację o zaledwie 5 punktów procentowych wyższą niż CPI. Schiff tłumaczy tę tendencję manipulacjami w statystycznej metodologii Amerykańskiego Biura Statystyki Pracy.
Zmiana udziału poszczególnych dóbr w koszyku, mając charakter ilościowy, pomija ich cechy jakościowe, które są dla gospodarki kluczowe, istotnie zafałszowując gospodarczą rzeczywistość. Załóżmy, że koszyk inflacyjny składa się z dwóch dóbr: kiełbasy Taniej i Dobrej. Wydatki konsumpcyjne to 100 zł, a udział w nich kiełbas Dobrej i Taniej (obie kosztują 10 zł) wynosi po 50 proc. Jeśli Dobra zdrożeje do 15 zł, to aby ukryć 25-proc. wzrost cen, wystarczy zmniejszyć jej udział w koszyku do np. 10 proc. Zanotowana inflacja wyniesie zaledwie 5 proc., a urząd statystyczny powie wówczas, że ta zmiana odzwierciedla zmianę w strukturze konsumpcji. Oto ludzie z kiełbasy Dobrej przerzucili się na Tanią i wydają niemal tyle samo. Tylko czy coś tu aby nie „cuchnie”? Oczywiście, że cuchnie – i to dosłownie – kiełbasa Tania, bo okazała się nie taka dobra, jak kiełbasa Dobra.
Niski rating ratingu
Zrozummy się dobrze. Statystyka oczywiście nie jest z gruntu zmanipulowana, a dane statystyczne nie są z zasady wyssane z palca. Prawdopodobnie nawet, gdyby ktoś pokusił się o statystyczne zbadanie wiarygodności statystyk, to te wiarygodne przeważałyby nad niewiarygodnymi. Problem w tym, że – by użyć biblijnego sformułowania – i „odrobina kwasu całe ciasto zakwasza”.
Jeśli nawet, powiedzmy, 80 proc. statystyk jest godnych zaufania, te 20 proc. nierzetelnych ma potężną destrukcyjną siłę rażenia. Schiff podkreśla, że stare miary inflacji w sposób bardziej precyzyjny pozwalały na szacowanie ruchów cenowych i gdyby były stosowane nadal, wymuszałyby znacznie bardziej restrykcyjną politykę pieniężną banków centralnych. „Nie dałoby się stymulować gospodarki w takim zakresie, jak obecnie. Rezultat jest taki, że Fed działa tak, jakby inflacja była ekstremalnie niska. Jest ślepy na inflację, tak jak ślepy był na bańkę na rynku nieruchomości, która doprowadziła do kryzysu. Popełniamy błąd, za który przyjdzie nam zapłacić” – przekonuje Schiff w artykule „Inflation Propaganda Exposed” z 2013 r.
Co ciekawe, to właśnie kryzys finansowy 2008 r. ujawnia o statystykach jeszcze jedną niewygodną prawdę: sektor prywatny także produkuje statystyczne fabrykacje, które pustoszą gospodarkę. Słyszeliście o agencjach ratingowych? Na pewno. Przecież to one są wyrocznią delficką inwestorów całego świata w kwestii inwestowania m.in. w obligacje. Jedna z nich – S&P – obniżyła ostatnio ocenę wiarygodności kredytowej Polsce. Powodem były kwestie instytucjonalne, ale równie ważne dla agencji ratingowych są makroekonomiczne statystyki.
Cofnijmy się do pierwszej dekady millenium, gdy na amerykańskim rynku robiły furorę skomplikowane i niezwykle zyskowne instrumenty pochodne powiązane z różnego typu długami, głównie kredytami hipotecznymi (chodzi m.in. o CDOs i MBS). Ceny domów nieustannie rosły i wszyscy – w tym analitycy agencji ratingowych – byli przekonani, że nawet jeśli część kredytów pozostanie niespłacona, to przejęte domy łatwo będzie sprzedać z zyskiem. Agencje nie wahały się więc przyznawać rzeczonym instrumentom pochodnym najwyższych not zaufania. Kiedy rynek nieruchomości tąpnął, agencje zaczęły nerwowo obniżać ratingi z najwyższego do tzw. śmieciowego poziomu. Banki i inwestorzy próbowali odsprzedać swoje toksyczne aktywa, lecz bez skutku. Zaczęła się rynkowa pożoga.
Jak można było się aż tak pomylić? „Byliśmy tylko statystykami, a nie policjantami długów” – z rozbrajającą szczerością wyznał jeden z analityków agencji Moody’s. Ale nie chodziło tylko o złe statystyki. Jak wykazały późniejsze śledztwa, agencje ratingowe wiedziały już w pewnej chwili, że ceny zaczną spadać, ale celowo ukrywały to w swoich raportach.
Psycholog Philip E. Tetlock, wykładowca Uniwersytetu Pensylwanii, uważa, że z jednej strony faktycznie pełno jest osób i instytucji, które nadużywają statystyk, a z drugiej – że możliwe jest twórcze wykorzystanie statystyki, rachunku prawdopodobieństwa i „superprognozowania”, czyli rzetelne i w dużej mierze trafne wypowiadanie się na temat możliwych scenariuszy na przyszłość. „Gdy ktoś mówi, że w przyszłym roku w lutym PKB wzrośnie o 5,3 proc., powołując się na dane statystyczne, to prawdopodobnie zmyśla. Te 5,3 proc. to fałszywa precyzja. W prawdziwym prognozowaniu chodzi o próbę określenia relatywnego prawdopodobieństwa zdarzeń. Bardziej wiarygodny jest ten prognosta, który stwierdza, że np. szanse na 3-proc. wzrost PKB w przyszłym roku kształtują się na poziomie 40 proc., szanse na 2-proc. wzrost to już 50 proc., a recesja to tylko 5 proc. szans, a potem uzasadnia to w przejrzysty sposób” – przekonuje Tetlock.
Naukowiec zasłynął z tego, że w latach 1984–2003 przeprowadzał w USA „turnieje prognozowania”, w których brało udział kilkuset ekspertów (od samozwańczych po profesorów) z różnych dziedzin. Szczególnie źle wypadli ci eksperci, których otaczała sława wybitnych specjalistów i którzy byli często zapraszani do mediów.
Najwyraźniej wybitni eksperci za najważniejszy podręcznik w dziedzinie statystyki uznają klasyczną już książeczkę „Jak kłamać z pomocą statystyki?” Darrella Huffa. Była ona pomyślana jako pomoc w unikaniu statystycznych nadużyć, ale oni najwyraźniej czerpią z niej inspirację.
Wykrywacz bzdur
Amerykański trader, filozof i badacz zagadnień związanych z ryzykiem Nicolas Nassim Taleb widzi przyczynę nietrafnych prognoz i nadużywania statystyk w powszechnej intelektualnej korupcji. Jak mocno możemy ufać stwierdzeniom „głównego ekonomisty” takiej czy innej firmy wypowiadanym z tak wielką pewnością siebie w programie telewizji biznesowej?
Zdaniem Taleba wcale, ponieważ od tego, co taki ekspert powie, zależą jego zarobki. Ekonomista bankowy nie przyzna publicznie, że niektóre z produktów sprzedawanych przez jego bank mogą być niebezpieczne. Ekonomista pracujący dla ZUS nie przyzna, że jego instytucja jest faktycznym bankrutem. A ekspert związków zawodowych do końca życia będzie przytaczał dane pokazujące zbawienny wpływ płacy minimalnej na zarobki.
Istotność tego, kto wygłasza dane twierdzenie statystyczne, podkreślał już 60 lat temu wspomniany mimochodem Darrell Huff w ostatnim rozdziale „Jak kłamać z pomocą statystyki?”: „Nie wszystkie statystyki mogą być sprawdzone z pewnością analizy chemicznej, ale podstawę do oceny ich wiarygodności może stanowić zadanie kilku prostych pytań” – pisał. Oprócz pytania o to, „kto tak twierdzi”, pytać należy o to, „skąd to wie?”. I tak Huff podaje przykład ankiety, którą pewna gazeta rozsyłała do 1200 firm i na którą większość z tych firm nie odpowiadała. Co czytamy w gazecie? Że z 1200 badanych firm 9 proc. twierdzi, że nie podniosło cen, 5 proc., że podniosło, a 86 proc. nie chce ujawnić tych informacji. Tyle że właśnie te 86 proc. może mieć dla wniosków z tej „statystyki” rozstrzygające znaczenie. Próbka statystyczna jest za mała, by określić stan faktyczny.
Huff zachęca nas, byśmy pytali także o to, czy forsowana w danym wypadku konkluzja na pewno wynika z przytaczanych danych. Nie zawsze tak jest. Większa liczba notowanych przypadków choroby nie oznacza zawsze większej liczby zachorowań.
I w końcu zgodnie z radą Huffa powinniśmy zadać pytanie o fundamentalną sensowność danego zestawienia statystycznego. Czy jest sensowne, by przystępność książek oceniać po długości użytych w nich słów i zdań? „Taka formuła każe »Legendę o Sennej Kotlinie« Washingtona Irvinga oceniać jako o połowę łatwiejszą w odbiorze niż »Państwo« Platona, a obyczajową powieść »Małżeństwa« Sinclaira Lewisa jako trudniejszą niż estetyczno-teologiczny esej Jacques'a Maritaina »Duchowa wartość sztuki«. Niezwykle prawdopodobne!” – kpi Huff.
Nonsensowne statystyki spotykamy na co dzień. W poszczególnych stanach USA liczba otyłych dzieci jest pozytywnie i mocno skorelowana z liczbą wyszukiwań utworu „Purple Rain”. Czy to znaczy, że fani Prince’a mają grubsze dzieci? Nie. To przykład nonsensownej statystyki, którymi zaśmieca się nasze głowy. Niektórzy przekonują, że nawet metoda obliczania wskaźnika PKB zawiera w sobie porcję nonsensu. PKB bowiem może rosnąć, gdy gospodarka realnie się wykrwawia. Ekonomista Frank Shostak z Instytutu Misesa podkreśla, że gdy faraon budował piramidę, to gospodarka Egiptu mierzona metodą PKB mogła „rosnąć”, choć budowa pochłaniała życie dziesiątek tysięcy osób. PKB, rzecz jasna, nie jest całkowitym nonsensem i lepszej miary wzrostu gospodarczego, co do której nie istniałyby poważniejsze trudności, nie wymyślono.
Wniosek jest taki, że do danych, które mamy, należy podchodzić z ostrożnością, bo nawet z dobrych danych statystycznych robimy często zły użytek, łącząc ją w sojusz z kłamstwem. Przestrzega przed tym Taleb, który zasłynął jako twórca pojęcia „czarny łabędź”. Oznacza ono rzadkie nieoczekiwane zdarzenia o doniosłych konsekwencjach. Taleb zauważa, że gdy dochodzi do takiego zdarzenia, próbujemy często ex post na bazie statystyki udowodnić, że było ono przewidywalne. Gdy wydaje nam się, że taki dowód mamy, próbujemy wysnuwać z tego prognozy i zaczynamy zgodnie z nimi działać. Błądzimy, ponieważ nie dość, że kierujemy się źle zdiagnozowaną relacją przyczynowości, to jeszcze wydaje nam się, że świat jest statyczny, i trendy, które wychwytujemy, będą powtarzać się w przyszłości. Tragiczne rezultaty są tylko kwestią czasu. Taleb zaleca, by pielęgnować w sobie zmysł sceptycyzmu. Nazywa go po prostu „wykrywaczem bzdur” (bullshit detector). Powinien on uruchamiać się nam zwłaszcza wtedy, kiedyś ktoś przekonuje, jak wiele wie o przyszłości, wymachując nam przed nosem tabelami.