Dawno, dawno temu pewien kanadyjski astronom udał się do amerykańskiego States Naval Observatory, które dziś nazwalibyśmy Centrum Obliczeniowym Marynarki. Potrzebował dokładnych tablic logarytmicznych do obliczeń astronomicznych, które później byłyby wykorzystywane w nawigacji. Takie to były czasy – nie było systemu GPS, nie było komputerów ani nawet kalkulatorów. Były tablice logarytmiczne.
CO LEPSZE AKTYWA
Czytelników tego felietonu możemy podzielić na dwie grupy. Tych, którzy korzystali w młodości z suwaka logarytmicznego i tych, którzy tego nie robili. Niedługo (albo i już) ten podział będzie dotyczył tego, czy ktoś wie, czym taki suwak był. A w przyszłości tego, czy ktoś wie, czym są logarytmy. To ostatnie pytanie teoretycznie zależy od opracowywanego właśnie nowego programu nauczania. Ale zobaczycie, że tak będzie. Logarytmy są trudne i nudne, więc większość nie będzie chciała się tego uczyć, a większość ma rację.
Wróćmy do tablic. Wspomniany astronom – Simon Newcomb – stwierdził, że początkowe strony tablic logarytmicznych są dużo bardziej zniszczone niż końcowe, a to oznacza, że są one częściej używane. A skoro tak jest, to z jakiegoś powodu korzystający z tablic częściej szukali logarytmów z liczb zaczynających się na jeden niż z liczb zaczynających się na dwa, i tak dalej. W swoim opracowaniu z 1881 r. opublikował nawet częstość występowania poszczególnych cyfr na początku liczb. Stwierdził, że tych zaczynających się od jedynki jest 30,1 proc., tych zaczynających się od dwójki – 17,6 proc., a tych zaczynających się od dziewiątki tylko 4,6 proc. Ale różnych dziwnych opracowań było wówczas wiele, nieraz magicznych, nieraz mistycznych, a najczęściej niezrozumiałych. Nasz bohater o sprawie zapomniał, zajął się swoim głównym projektem, czyli przygotowaniem tablic astronomicznych.
Po raz drugi to samo zjawisko opisał w 1937 r. Frank Benford, inżynier pracujący dla koncernu General Electric. Również zwrócił uwagę na to, że początkowe strony tablic logarytmicznych są bardziej zabrudzone. Benford poszedł dalej i zaczął sprawdzać, czy teoria dotycząca pierwszych cyfr znajduje potwierdzenie na rzeczywistych danych. Zaczął sprawdzać długość rzek, statystyki ligi baseballowej, populację miast, drukowane w gazetach notowania akcji czy ceny w sklepach. Rozkłady były zbliżone. Gdyby analizował ceny w dzisiejszych supermarketach, to szybko doszedłby do wniosku, że najczęściej występującą liczbą jest dziewięć, i nie uzyskałby potwierdzenia swojej teorii. Zresztą zaraz później zwątpiłby w swoją umiejętność dodawania, bo przekonałby się, że dwa produkty o cenie jednostkowej cztery złote każdy kupione razem kosztują siedem złotych.
Rozkład Benforda, nazywany prawem pierwszych cyfr, określa prawdopodobieństwo, z jakim dana cyfra będzie na początku danej liczby. W tym miejscu przyznać muszę, że często sam mam problem z intuicyjnym zaakceptowaniem tego rozkładu. Sądzę, że dzieje się tak dlatego, że zawsze, gdy gram z dziećmi w gry planszowe, prawdopodobieństwo wyrzucenia kostką jedynki i szóstki jest takie samo. Aby poczuć logikę tego prawa, warto policzyć, ile razy jedynka jest na początku w zbiorze liczb naturalnych od jeden do dwadzieścia. Jedenaście liczb (1 oraz 10 do 19) ma na początku jeden, dwie mają dwa (2 i 20), a każda z pozostałych ośmiu występuje tylko raz. Jest jedno zastrzeżenie: że badany rozkład nie jest ograniczony. Nie można w ten sposób analizować np. wzrostu dorosłych ludzi albo numerów telefonów.
Co to ma wspólnego z finansami? Opisane prawo jest wykorzystywane do analizowania poprawności sprawozdań finansowych czy rozliczeń podatkowych. Dla osób, które ręcznie dodają i zmieniają różne liczby w dokumentach księgowych, wystąpienie 4, 5 i 6 na początku liczby jest tak samo prawdopodobne jak 1, 2 i 3. A dla statystyków już nie. Dlatego analizowany jest rozkład pierwszej, a teraz także i drugiej cyfry w liczbach w księgach rachunkowych (oczywiście z uwzględnieniem dziewiątek charakterystycznych dla supermarketów). Jednym z pierwszych wykrytych dzięki tej metodzie przestępstw było fałszowanie czeków przez skarbnika stanu Arizona na początki lat dziewięćdziesiątych ubiegłego wieku. Blisko 40 proc. defraudowanych kwot miało jako pierwsze cyfry 8 i 9, a 15 proc. cyfrę 7. Cyfry 3, 4, 5 i 6 nie występowały, a 1 i 2 stanowiły każda mniej niż 5 proc. I na tej podstawie rozpoczęto śledztwo. Wynik – 1,9 mln dol., wyrok – 5 lat.
Dla pewności sprawdziłem rozkład Benforda dla notowań na warszawskiej giełdzie – cena akcji (w tym w groszach) zaczyna się od jedynki dla 29,4 proc. spółek, od dwójki dla 18,4 proc., a od trójki dla 13,3 proc. Ulżyło mi, widać ceny nie są ręcznie ustawiane, ale mała hossa by pomogła. Sprawdziłem również rozkład sum bilansowych i otrzymałem odpowiednio 32,6 proc., 15,7 proc. i 12,3 proc. Również może być.
Cena akcji zaczyna się od jedynki dla 29,4 proc. spółek, od dwójki dla 18,4 proc., a od trójki dla 13,3 proc. Ulżyło mi, widać ceny nie są ręcznie ustawiane, ale mała hossa by pomogła