Skąd się wzięła liczba pi w rozkładzie Gaussa, czyli o niepojętej skuteczności matematyki w naukach przyrodniczych

Eugene Wigner, należał do „Marsjan”, jak nazywano w Stanach Zjednoczonych grupę niezwykle wybitnych uczonych z Węgier. Na pytanie Enrica Fermiego, dlaczego wysoce rozwinięte cywilizacje z kosmosu nie odwiedziły do tej pory Ziemi, Leo Szilard odpowiedział, że owszem, już tutaj są, ale sami siebie nazywają Węgrami. Była to niezwykła konstelacja talentów: Paul Erdős, Paul Halmos, Theodore von Kármán, John G. Kemeny, John von Neumann, George Pólya, Leó Szilárd, Edward Teller. Ukształtowały ich naukowo Niemcy, zwłaszcza Getynga i Berlin. Po dojściu nazistów do władzy uczeni ci z racji żydowskiego pochodzenia zmuszeni zostali do emigracji i w Stanach Zjednoczonych pracowali nad aerodynamiką, budową bomby atomowej i wodorowej, budową pierwszych komputerów, jak też dokonywali odkryć w matematyce czystej, jak najdalszych od zastosowań. Wigner był ekspertem w zastosowaniach teorii grup w mechanice kwantowej, laureatem Nagrody Nobla, a więc kimś, kto na co dzień stykał się z tym, że abstrakcyjna z pozoru matematyka znajduje wciąż nowe eksperymentalne potwierdzenia.

Słynny jest esej Wignera pt. Niepojęta skuteczność matematyki w naukach przyrodniczych. Zaczyna się on następująco:

Istnieje opowiadanie o dwóch ludziach, którzy przyjaźnili się ze sobą w czasie wyższych studiów, a którzy spotkawszy się, opowiadają sobie o swojej pracy. Jeden z nich zajął się statystyką i badał trendy społeczne. Pokazał on dawnemu koledze jeden ze swych artykułów. Artykuł rozpoczynał się, jak zwykle, uwagami na temat rozkładu Gaussa i autor wyjaśnił swemu rozmówcy znaczenie poszczególnych symboli dla sytuacji aktualnego społeczeństwa, dla przeciętnego społeczeństwa i tak dalej. Jego kolega okazał pewne niedowierzanie i nie był zupełnie pewny, czy przyjaciel nie żartuje sobie z niego. „Skąd ta twoja wiedza?” brzmiało jego pytanie. „I czym jest ten tu symbol?”. „Och”, odpowiedział statystyk, „to jest \pi”. „Co to jest?” „Stosunek obwodu koła do jego średnicy”. „No, teraz już twoje dowcipy zaszły za daleko”, rzekł na to kolega, „z całą pewnością społeczeństwo nie ma nic wspólnego z obwodem koła”. (przeł. J. Dembek)

Matematyka jest sztuką wyprowadzania wniosków, najlepiej nieoczywistych, z pewnych przyjętych założeń. W zasadzie nie możemy więc za jej pomocą otrzymać niczego istotnie nowego, co nie tkwiłoby niejako w tych założeniach. Jednak droga od np. podstawowych praw arytmetyki i definicji liczb pierwszych do sformułowania Wielkiego Twierdzenia Fermata i jego dowodu zajęła zajęła ludzkości parę tysięcy lat i przez ostatnie stulecia wielu wybitnych uczonych straciło całe lata na bezowocne próby. Jednak najbardziej zdumiewającym aspektem matematyki są jej zastosowania w innych naukach. Nie rozstrzygniemy tu pytania, czy kryje się w tym głęboka tajemnica, czy też w zasadzie rzecz jest trywialna (bo np. matematyka w gruncie rzeczy pochodzi z doświadczenia albo, jak wierzył Platon, świat zmysłowy stanowi jedynie niedoskonałą kopię świata idei, gdzie linie nie mają grubości, a sfery są zbiorami punktów równooddalonych od swego środka).

W zastosowaniach matematyki, takich jak statystyka albo fizyka, musimy przyjąć wiele dodatkowych założeń, które często są trudne do bezpośredniego zweryfikowania. Mimo to wiemy np., że rozkład Gaussa, krzywa dzwonowa, stosuje się nie tylko do rozkładu prędkości cząsteczek w gazie, ale i np. cen akcji albo wzrostu grupy ludzi (w dwóch ostatnich przypadkach lepsze wyniki daje rozpatrywanie logarytmu tych wielkości). Istnieją matematyczne powody wszędobylskości rozkładu Gaussa: jeśli dana wielkość jest sumą zmiennych losowych, to można oczekiwać, iż bedzie dążyć do rozkładu Gaussa, gdy liczba tych zmiennych staje się coraz większa i gdy są one od siebie niezależne.

Wróćmy teraz do anegdoty Wignera. Skąd wzięła się liczba \pi w rozkładzie Gaussa? Rozkład ten ma postać

p(x)=\dfrac{1}{\sqrt{2\pi}\sigma}e^{-\frac{x^2}{2\sigma^2}},

gdzie \sigma jest parametrem opisującym szerokość krzywej: może ona być bardziej albo mniej rozłożysta. Poniważ opisuje prawdopodobieństwa, pole powierzchni pod krzywą musi być równe 1. Na wykresie \sigma=1.

Wartość p(0)  jest więc związana z \pi:

p(0)=0,39894\approx \dfrac{1}{\sqrt{2\pi}}.

Liczba \pi pojawia się tu dlatego, że pole powierzchni pod krzywą musi być równe 1. Inaczej mówiąc chodzi o wartość następującej całki (gdzie dla wygody pzbyliśmy się dwójki):

\displaystyle \int_{-\infty}^{\infty} e^{-x^{2}} dx=\sqrt{\pi}.

Całka nieoznaczona w tym wypadku nie wyraża się przez funkcje elementarne i obliczenie tej wartości wymaga pomysłu. Prawdopodobnie całkę tę pierwszy obliczył Pierre Simon Laplace (i to co najmniej na dwa sposoby). Prostszą metodę podał Denis Poisson, a my przedstawimy współczesne wariacje tej metody. Należy rozpatrzyć całkę dwuwymiarową po całej płaszczyżnie xy:

I^2= \displaystyle \iint e^{-x^2-y^2} dx dy=\left( \int e^{-x^2} dx\right)^2.

Zadanie sprowadza się do obliczenia objętości pod powierzchnią przypominającą (nieskończony) kapelusz z=e^{-x^2-y^2}.

Narysowaliśmy tylko jego środkową część. Inaczej mówiąc, jest to bryła powstająca z obrotu krzywej z=e^{-r^2} wokół osi z.

Objętość tej bryły możemy obliczyć dzieląc ją na walce o grubości dz i promieniu r^2=-\ln z:

I^2=-\displaystyle \int_0^1 \pi \ln z dz=\pi.

Możemy też podzielić naszą bryłę na wydrążone walce o grubości dr, promieniu r i wysokości z:

I^2=\displaystyle \int_0^{\infty} 2\pi r e^{-r^2}=\pi.

Ostatnią całkę oblicza się przez oczywiste podstawienie t=r^2.

Oba te rozwiązania sugerowałyby, że „nasze” \pi z rozkładu Gaussa ma jednak coś wspólnego z okręgami. W matematyce związki arytmetyki z geometrią są wszakże nieoczywiste: pokazywaliśmy przykłady szeregów Leibniza i Newtona prowadzących do liczby \pi (por. też tutaj). Także w naszym przypadku możemy sprowadzić problem do arytmetyki.

Rozkład Gaussa jest granicą rozkładu dwumianowego, czyli np. rozkładu liczby orłów (ktoś mniej patriotyczny niż ja mógłby rozważać liczbę reszek, ale my odrzucamy takie podejście) w serii rzutów monetą. Prawdopodobieństwa wyglądają wówczas następujaco:

Na histogramie przedstawiliśmy przypadek n=20 rzutów oraz stosowny rozkład Gaussa, który jest, jak widać całkiem dobrym przybliżeniem histogramu. Obliczmy prawdopodobieństwo, że w połowie rzutów otrzymamy orła – co odpowiada maksimum histogramu i krzywej Gaussa. Ponieważ prawdopodobieństwa wyrzucenia orła i reszki są równe, więc prawdopodobieństwo każdej serii jest równe iloczynowi: (\frac{1}{2})^n. Można przy tym tę połowę orłów uzyskać w rozmaitej kolejności – każdy konkretny wynik będzie wybraniem spośród zbioru n elementów podzbioru n/2 orłów. Można to zrobić na {n}\choose{n/2} sposobów (liczba kombinacji). Prawdopodobieństwo w środku naszego rozkładu będzie zatem równe (wzięliśmy n=2m):

P_m= \displaystyle {{2m}\choose{m}} \dfrac{1}{2^{2m}}.

Gdzie jak gdzie, ale w tym wyrażeniu nie ma chyba liczby \pi? Oczywiście, jest. Okazuje się, że

\displaystyle \lim_{m\rightarrow\infty} \sqrt{m}P_m=\dfrac{1}{\sqrt{\pi}}.

Inaczej mówiąc dla dużych wartości m mamy P_m\sim \frac{1}{\sqrt{\pi m}} – pojawia się pierwiastek z \pi, zmodyfikowany dodatkowym czynnikiem, który łatwo zrozumieć: rozkład dwumianowy przy rosnącym m coraz bardziej przypomina rozkład Gaussa, ale też staje się coraz szerszy, co skutkuje mniejszą wysokością, i tę właśnie zależność opisuje powyższy wzór.

W jaki sposób otrzymać ten wynik? Leonhard Euler w 1736 r. uzyskał przedstawienie funkcji sinus za pomocą nieskończonego iloczynu. Pomysł jest prosty. Każdy wielomian możemy przedstawić za pomocą iloczynu

f(x))=a(x-x_1)(x-x_2)\ldots (x-x_n),

gdzie x_1,x_2,\ldots, x_n to pierwiastki tego wielomianu, a jest stałą. Funkcja sinus jest też czymś w rodzaju wielomianu, tyle że ma nieskończenie wiele pierwiastków: 0, \pm\pi,\pm 2\pi,\ldots. Możemy zatem spróbować przedstawić ją następująco:

\sin x=x(1-\frac{x}{\pi}) (1+\frac{x}{\pi}) (1-\frac{x}{2\pi}) (1+\frac{x}{2 \pi}) \ldots.

Czynniki w nawiasach zapisane są tak, by dążyły do 1 wraz ze wzrostem numeru. Intuicja Eulera była trafna, przyglądając się temu rozwinięciu można uzyskać ciekawe wyniki, jak np.

\displaystyle \dfrac{\pi^2}{6}=1+\dfrac{1}{4}+\dfrac{1}{9}+\ldots.

Gdy podstawimy do tego iloczynu x=\pi/2, otrzymamy przedstawienie liczby \pi za pomocą nieskończonego iloczynu, tzw. wzór Wallisa. Nieco go przekształcając, można uzyskać naszą granicę \sqrt{m}P_m.

Kolejność historyczna była taka: najpierw John Wallis w roku 1655 odgadł swój wzór. Później w roku 1733 Abraham de Moivre udowodnił naszą równość. Jeszcze później, w 1736 r. Euler odkrył iloczyn nieskończony dla sinusa, w wieku XIX Karl Weierstrass pokazał, że pewna grupa wyjątkowo regularnych funkcji (funkcje całkowite) mają w istocie postać iloczynów.

Szczegół dotyczący P_m. Rozkład dwumianowy ma szerokość \sigma=\sqrt{m/2}, zatem związek de Moivre’a daje to samo co współczynnik \frac{1}{\sqrt{2\pi}\sigma} .