Skąd się wzięła liczba pi w rozkładzie Gaussa, czyli o niepojętej skuteczności matematyki w naukach przyrodniczych

Eugene Wigner, należał do „Marsjan”, jak nazywano w Stanach Zjednoczonych grupę niezwykle wybitnych uczonych z Węgier. Na pytanie Enrica Fermiego, dlaczego wysoce rozwinięte cywilizacje z kosmosu nie odwiedziły do tej pory Ziemi, Leo Szilard odpowiedział, że owszem, już tutaj są, ale sami siebie nazywają Węgrami. Była to niezwykła konstelacja talentów: Paul Erdős, Paul Halmos, Theodore von Kármán, John G. Kemeny, John von Neumann, George Pólya, Leó Szilárd, Edward Teller. Ukształtowały ich naukowo Niemcy, zwłaszcza Getynga i Berlin. Po dojściu nazistów do władzy uczeni ci z racji żydowskiego pochodzenia zmuszeni zostali do emigracji i w Stanach Zjednoczonych pracowali nad aerodynamiką, budową bomby atomowej i wodorowej, budową pierwszych komputerów, jak też dokonywali odkryć w matematyce czystej, jak najdalszych od zastosowań. Wigner był ekspertem w zastosowaniach teorii grup w mechanice kwantowej, laureatem Nagrody Nobla, a więc kimś, kto na co dzień stykał się z tym, że abstrakcyjna z pozoru matematyka znajduje wciąż nowe eksperymentalne potwierdzenia.

Słynny jest esej Wignera pt. Niepojęta skuteczność matematyki w naukach przyrodniczych. Zaczyna się on następująco:

Istnieje opowiadanie o dwóch ludziach, którzy przyjaźnili się ze sobą w czasie wyższych studiów, a którzy spotkawszy się, opowiadają sobie o swojej pracy. Jeden z nich zajął się statystyką i badał trendy społeczne. Pokazał on dawnemu koledze jeden ze swych artykułów. Artykuł rozpoczynał się, jak zwykle, uwagami na temat rozkładu Gaussa i autor wyjaśnił swemu rozmówcy znaczenie poszczególnych symboli dla sytuacji aktualnego społeczeństwa, dla przeciętnego społeczeństwa i tak dalej. Jego kolega okazał pewne niedowierzanie i nie był zupełnie pewny, czy przyjaciel nie żartuje sobie z niego. „Skąd ta twoja wiedza?” brzmiało jego pytanie. „I czym jest ten tu symbol?”. „Och”, odpowiedział statystyk, „to jest \pi”. „Co to jest?” „Stosunek obwodu koła do jego średnicy”. „No, teraz już twoje dowcipy zaszły za daleko”, rzekł na to kolega, „z całą pewnością społeczeństwo nie ma nic wspólnego z obwodem koła”. (przeł. J. Dembek)

Matematyka jest sztuką wyprowadzania wniosków, najlepiej nieoczywistych, z pewnych przyjętych założeń. W zasadzie nie możemy więc za jej pomocą otrzymać niczego istotnie nowego, co nie tkwiłoby niejako w tych założeniach. Jednak droga od np. podstawowych praw arytmetyki i definicji liczb pierwszych do sformułowania Wielkiego Twierdzenia Fermata i jego dowodu zajęła zajęła ludzkości parę tysięcy lat i przez ostatnie stulecia wielu wybitnych uczonych straciło całe lata na bezowocne próby. Jednak najbardziej zdumiewającym aspektem matematyki są jej zastosowania w innych naukach. Nie rozstrzygniemy tu pytania, czy kryje się w tym głęboka tajemnica, czy też w zasadzie rzecz jest trywialna (bo np. matematyka w gruncie rzeczy pochodzi z doświadczenia albo, jak wierzył Platon, świat zmysłowy stanowi jedynie niedoskonałą kopię świata idei, gdzie linie nie mają grubości, a sfery są zbiorami punktów równooddalonych od swego środka).

W zastosowaniach matematyki, takich jak statystyka albo fizyka, musimy przyjąć wiele dodatkowych założeń, które często są trudne do bezpośredniego zweryfikowania. Mimo to wiemy np., że rozkład Gaussa, krzywa dzwonowa, stosuje się nie tylko do rozkładu prędkości cząsteczek w gazie, ale i np. cen akcji albo wzrostu grupy ludzi (w dwóch ostatnich przypadkach lepsze wyniki daje rozpatrywanie logarytmu tych wielkości). Istnieją matematyczne powody wszędobylskości rozkładu Gaussa: jeśli dana wielkość jest sumą zmiennych losowych, to można oczekiwać, iż bedzie dążyć do rozkładu Gaussa, gdy liczba tych zmiennych staje się coraz większa i gdy są one od siebie niezależne.

Wróćmy teraz do anegdoty Wignera. Skąd wzięła się liczba \pi w rozkładzie Gaussa? Rozkład ten ma postać

p(x)=\dfrac{1}{\sqrt{2\pi}\sigma}e^{-\frac{x^2}{2\sigma^2}},

gdzie \sigma jest parametrem opisującym szerokość krzywej: może ona być bardziej albo mniej rozłożysta. Poniważ opisuje prawdopodobieństwa, pole powierzchni pod krzywą musi być równe 1. Na wykresie \sigma=1.

Wartość p(0)  jest więc związana z \pi:

p(0)=0,39894\approx \dfrac{1}{\sqrt{2\pi}}.

Liczba \pi pojawia się tu dlatego, że pole powierzchni pod krzywą musi być równe 1. Inaczej mówiąc chodzi o wartość następującej całki (gdzie dla wygody pzbyliśmy się dwójki):

\displaystyle \int_{-\infty}^{\infty} e^{-x^{2}} dx=\sqrt{\pi}.

Całka nieoznaczona w tym wypadku nie wyraża się przez funkcje elementarne i obliczenie tej wartości wymaga pomysłu. Prawdopodobnie całkę tę pierwszy obliczył Pierre Simon Laplace (i to co najmniej na dwa sposoby). Prostszą metodę podał Denis Poisson, a my przedstawimy współczesne wariacje tej metody. Należy rozpatrzyć całkę dwuwymiarową po całej płaszczyżnie xy:

I^2= \displaystyle \iint e^{-x^2-y^2} dx dy=\left( \int e^{-x^2} dx\right)^2.

Zadanie sprowadza się do obliczenia objętości pod powierzchnią przypominającą (nieskończony) kapelusz z=e^{-x^2-y^2}.

Narysowaliśmy tylko jego środkową część. Inaczej mówiąc, jest to bryła powstająca z obrotu krzywej z=e^{-r^2} wokół osi z.

Objętość tej bryły możemy obliczyć dzieląc ją na walce o grubości dz i promieniu r^2=-\ln z:

I^2=-\displaystyle \int_0^1 \pi \ln z dz=\pi.

Możemy też podzielić naszą bryłę na wydrążone walce o grubości dr, promieniu r i wysokości z:

I^2=\displaystyle \int_0^{\infty} 2\pi r e^{-r^2}=\pi.

Ostatnią całkę oblicza się przez oczywiste podstawienie t=r^2.

Oba te rozwiązania sugerowałyby, że „nasze” \pi z rozkładu Gaussa ma jednak coś wspólnego z okręgami. W matematyce związki arytmetyki z geometrią są wszakże nieoczywiste: pokazywaliśmy przykłady szeregów Leibniza i Newtona prowadzących do liczby \pi (por. też tutaj). Także w naszym przypadku możemy sprowadzić problem do arytmetyki.

Rozkład Gaussa jest granicą rozkładu dwumianowego, czyli np. rozkładu liczby orłów (ktoś mniej patriotyczny niż ja mógłby rozważać liczbę reszek, ale my odrzucamy takie podejście) w serii rzutów monetą. Prawdopodobieństwa wyglądają wówczas następujaco:

Na histogramie przedstawiliśmy przypadek n=20 rzutów oraz stosowny rozkład Gaussa, który jest, jak widać całkiem dobrym przybliżeniem histogramu. Obliczmy prawdopodobieństwo, że w połowie rzutów otrzymamy orła – co odpowiada maksimum histogramu i krzywej Gaussa. Ponieważ prawdopodobieństwa wyrzucenia orła i reszki są równe, więc prawdopodobieństwo każdej serii jest równe iloczynowi: (\frac{1}{2})^n. Można przy tym tę połowę orłów uzyskać w rozmaitej kolejności – każdy konkretny wynik będzie wybraniem spośród zbioru n elementów podzbioru n/2 orłów. Można to zrobić na {n}\choose{n/2} sposobów (liczba kombinacji). Prawdopodobieństwo w środku naszego rozkładu będzie zatem równe (wzięliśmy n=2m):

P_m= \displaystyle {{2m}\choose{m}} \dfrac{1}{2^{2m}}.

Gdzie jak gdzie, ale w tym wyrażeniu nie ma chyba liczby \pi? Oczywiście, jest. Okazuje się, że

\displaystyle \lim_{m\rightarrow\infty} \sqrt{m}P_m=\dfrac{1}{\sqrt{\pi}}.

Inaczej mówiąc dla dużych wartości m mamy P_m\sim \frac{1}{\sqrt{\pi m}} – pojawia się pierwiastek z \pi, zmodyfikowany dodatkowym czynnikiem, który łatwo zrozumieć: rozkład dwumianowy przy rosnącym m coraz bardziej przypomina rozkład Gaussa, ale też staje się coraz szerszy, co skutkuje mniejszą wysokością, i tę właśnie zależność opisuje powyższy wzór.

W jaki sposób otrzymać ten wynik? Leonhard Euler w 1736 r. uzyskał przedstawienie funkcji sinus za pomocą nieskończonego iloczynu. Pomysł jest prosty. Każdy wielomian możemy przedstawić za pomocą iloczynu

f(x))=a(x-x_1)(x-x_2)\ldots (x-x_n),

gdzie x_1,x_2,\ldots, x_n to pierwiastki tego wielomianu, a jest stałą. Funkcja sinus jest też czymś w rodzaju wielomianu, tyle że ma nieskończenie wiele pierwiastków: 0, \pm\pi,\pm 2\pi,\ldots. Możemy zatem spróbować przedstawić ją następująco:

\sin x=x(1-\frac{x}{\pi}) (1+\frac{x}{\pi}) (1-\frac{x}{2\pi}) (1+\frac{x}{2 \pi}) \ldots.

Czynniki w nawiasach zapisane są tak, by dążyły do 1 wraz ze wzrostem numeru. Intuicja Eulera była trafna, przyglądając się temu rozwinięciu można uzyskać ciekawe wyniki, jak np.

\displaystyle \dfrac{\pi^2}{6}=1+\dfrac{1}{4}+\dfrac{1}{9}+\ldots.

Gdy podstawimy do tego iloczynu x=\pi/2, otrzymamy przedstawienie liczby \pi za pomocą nieskończonego iloczynu, tzw. wzór Wallisa. Nieco go przekształcając, można uzyskać naszą granicę \sqrt{m}P_m.

Kolejność historyczna była taka: najpierw John Wallis w roku 1655 odgadł swój wzór. Później w roku 1733 Abraham de Moivre udowodnił naszą równość. Jeszcze później, w 1736 r. Euler odkrył iloczyn nieskończony dla sinusa, w wieku XIX Karl Weierstrass pokazał, że pewna grupa wyjątkowo regularnych funkcji (funkcje całkowite) mają w istocie postać iloczynów.

Szczegół dotyczący P_m. Rozkład dwumianowy ma szerokość \sigma=\sqrt{m/2}, zatem związek de Moivre’a daje to samo co współczynnik \frac{1}{\sqrt{2\pi}\sigma} .

 

 

 

Adolphe Quetelet, krzywa dzwonowa i statystyczny człowiek (1835)

Był z wykształcenia matematykiem, z temperamentu organizatorem, lecz do historii przeszedł głównie dzięki swej niepohamowanej namiętności do stosowania metod statystycznych. Pragnął stworzyć statystyczną naukę o człowieku, opartą na rozmaitych szczegółowych spisach dotyczących narodzin, rozwoju, zdolności, karalności, chorób i zgonów ludnosci różnych obszarów czy grup. Jego dwutomowe dzieło z roku 1835 zatytułowane Sur l’homme et le développement de ses facultés, ou Essai de physique sociale („O człowieku i rozwoju jego zdolności, czyli zarys fizyki społecznej”) stało się szybko klasyczne. Quetelet wprowadził pojęcie statystycznego czy też przeciętnego człowieka (l’homme moyen), wyobrażając sobie, iż istnieje pewien idealny wzór, od którego poszczególni ludzie odchylają się za sprawą wielu różnych przyczyn. Pojęcie rozkładu statystycznego, który mieści całe spektrum badanej cechy, dopiero się kształtowało. Wcześniej  uczeni stosowali rozkłady statystyczne takie, jak rozkład Gaussa, do analizy błędów pomiarowych, gdy wiadomo, że mierzona wielkość przyjmuje pewną określoną wartość, a problemem jest jej ustalenie na podstawie obarczonych błędami pomiarów. Równolegle przebiegał społeczny proces uznania różnic między ludźmi za coś naturalnego, a nawet potrzebnego, nie za błąd w rozwoju czy niedostatek.

Jak to zwykle bywa w przypadku badań pionierskich, wiele wyników zostało potem zrewidowanych, niektóre stwierdzenia rażą dziś naiwnością. W swojej epoce był jednak Quetelet powszechnie uznawany za postać ważną, jego prace czytali uczeni tak różni, jak James Clerk Maxwell (który idee statystyczne zastosował do gazów) i Charles Darwin. Kontynuatorem prac Queteleta stał się kuzyn Darwina Francis Galton (to on ochrzcił rozkład Gaussa mianem rozkładu normalnego).

Znany powszechnie indeks masy ciała BMI (iloraz masy i kwadratu wzrostu) jest wynikiem obserwacji Queteleta, iż objętość ciała człowieka dorosłego nie jest proporcjonalna do sześcianu, lecz raczej do kwadratu wzrostu:

Gdyby człowiek rósł jednakowo we wszystkich wymiarach, ciężar w różnym wieku byłby proporcjonalny do sześcianu wzrostu. Obserwuje się jednak co innego. Wzrost masy jest mniej gwałtowny, z wyjątkiem pierwszego roku po urodzeniu, kiedy rzeczywiście na ogół obserwuje się powyższą proporcję. Potem jednak aż do okresu pokwitania ciężar ciała rośnie mniej więcej jak kwadrat wzrostu. (Sur l’homme, t. 2, s. 52)

Quetelet nie interesował się wszakże różnicami między ludźmi, starał się raczej odnaleźć typ idealny. Wskaźnik BMI zaczął być stosowany dopiero w drugiej połowie wieku XX, gdy problemem medycznym i ubezpieczeniowym w społeczeństwach zachodnich stały się nadwaga i otyłość.

W swym traktacie podał też Quetelet zaskakujący wzór na skłonność do przestępstwa y (mierzoną statystycznie) jako funcję wieku w latach x:

y=(1-\sin x)\,\dfrac{1}{1+2^{18-x}},

gdzie argument funkcji sinus podany jest w gradach: 100 gradów odpowiada kątowi prostemu. Wykres obserwowanej skłonności do przestępstwa wygląda u Qeteleta następująco:

źródło ilustracji: gallica.bnf.fr

Drugi wykres z płaskim obszarem szczytowym między trzydziestym a czterdziestym piątym rokiem życia dotyczy zdolności literackich. Wróćmy jeszcze do owej skłonności do przestępstwa.

Zależność Queteleta jest iloczynem dwóch funkcji: malejącej funkcji 1-\sin x w pierwszej ćwiartce (czyli czegoś zbliżonego do paraboli) oraz funkcji logistycznej, która opisuje szybki wzrost w okolicy x=18. Nb. krzywa logistyczna zastosowana została kilka lat później przez Pierre’a François Verhulsta, ucznia Quteleta, do modelowania ograniczonego wzrostu populacji, który zaczyna się wykładniczo (nieograniczone rozmnażanie), lecz osiąga naturalną barierę (np. brak pożywienia). Tutaj, w pracy Queteleta, krzywa logistyczna zdaje sprawę z osiągania dojrzałości przez człowieka, na dobre i złe. Oczywiście, nie powinniśmy zbyt serio traktować tego wzoru. Sam Quetelet w późniejszych latach ograniczał się do opisu danych statystycznych, nie upierając się przy żadnym wyrażeniu.

Wykres skłonności do przestępstw wg płci. Widzimy, że kobiety wkraczają później na ścieżkę kryminalną, lecz dłużej są aktywne.

Trwałym dorobkiem Queteleta okazało się stosowanie krzwej dzwonowej do opisu rozkładu statystycznego. Sam po raz pierwszy zastosował ją do statystyki obwodu w piersiach szkockich rekrutów. Jego dane wyglądały następująco:

Obwód w klatce piersiowej wyrażony jest w calach. Quetelet starał się dopasować do tych danych krzywą Gaussa, lecz w praktyce użył rozkładu dwumianowego z prawdopodobieństwami sukcesu/porażki 1/2 oraz liczbą prób równą 999 (tak, żeby mieć 1000 różnych wyników). Inaczej mówiąc, są to prawdopodobieństwa uzyskania k orłów w 999 rzutach monetą.

Jako uczeń Fouriera i Laplace’a wiedział dobrze, że rozkład dwumianowy dąży przy dużych wartościach liczby prób do rozkładu Gaussa. W ten sposób zaczęła się oszałamiająca kariera krzywej Gaussa w zastosowaniach statystycznych. W latach późniejszych przesadne stosowanie rozkładu Gaussa do wszelkich możliwych danych zaczęto nawet nazywać „quetelizmem” – bo, oczywiście, istnieją też inne rozkłady, choć w wielu sytuacjach właśnie rozkład Gaussa prawidłowo opisuje stan faktyczny.

Carl Friedrich Gauss i jego funkcja błędu (1809)

Gauss był cudownym dzieckiem, jego zdolności zwróciły uwagę księcia, dzięki czemu młody człowiek mógł się kształcić: najpierw w rodzinnym Brunszwiku, potem w Getyndze. Syn skromnego ogrodnika i murarza początkowo nie znał nawet dokładnej daty swego urodzenia – matka pamiętała jedynie, że była to środa, osiem dni przed Wniebowstąpieniem Pańskim – w 1799 roku młody uczony obliczył, że musiało to być 30 kwietnia 1777 roku. Już jego wczesne prace matematyczne, Disquisitiones Arithmeticae, poświęcone teorii liczb, oraz doktorat, zawierający dowód podstawowego twierdzenia algebry (każde równanie wielomianowe ma przynajmniej jeden pierwiastek zespolony), zawierały istotne wyniki, szeroki rozgłos zdobył jednak dzięki astronomii. W Nowy Rok 1801 teatyn z Palermo, Giuseppe Piazzi, zaobserwował słaby obiekt, który okazał się nową planetą (według współczensej terminologii: planetą karłowatą), zwaną dziś Ceres. Planeta zbliżyła się po pewnym czasie pozornie do Słońca i Piazzi nie potrafił jej później odnaleźć. Odkrył więc nową planetę i ją zagubił. Próbowano obliczyć orbitę Ceres na podstawie dostępnych obserwacji, zadanie to rozwiązał najlepiej właśnie Gauss: jego metoda nie wymagała żadnych upraszczających założeń, np. że orbita nowo odkrytego ciała niebieskiego jest okręgiem. Dzięki obliczeniom Gaussa, który był nie tylko znakomitym matematykiem, ale też bardzo sprawnym rachmistrzem, Ceres została odnaleziona. Kilka lat później uczonemu zaproponowano stanowisko dyrektora obserwatorium w Getyndze, które zajmował aż do śmierci. W roku 1809 opublikował swoją metodę wyznaczania orbity pt. Theoria motus corporum coelestium in sectionibus conicis solem ambientium (Teoria ruchu ciał niebieskich krążących wokół Słońca po krzywych stożkowych). Był to rok tragiczny dla Gaussa, we wrześniu urodziło się jego trzecie dziecko, syn Louis, miesiąc później wskutek komplikacji poporodowych zmarła jego żona Johanna. Louis przeżył swą matkę o zaledwie kilka miesięcy. Uczony ożenił się wprawdzie niedługo później ponownie: miał dwoje małych dzieci na wychowaniu, ale tragedia ta odcisnęła się głęboko na jego psychice.

Bendixen_-_Carl_Friedrich_Gauß,_1828

Portret z 1828 roku (Wikipedia)

Theoria motus zawiera rozważania na temat błędów i metody najmniejszych kwadratów. Sama ta metoda została wcześniej opublikowana przez Adriena Marie Legendre’a, lecz rozważania Gaussa poszły dalej, inspirując z kolei Laplace’a. Przedstawimy podejście Gaussa do funkcji błędu – dziś nazywamy ją rozkładem Gaussa bądź rozkładem normalnym. Gauss założył, że prawdopodobieństwo otrzymania w pomiarze wyniku różniącego się o (x, x+dx) od rzeczywistej wartości równe jest p(x)dx. Naszym zadaniem jest wyznaczenie kształtu owej funkcji. Można przypuszczać, że powinna mieć ona kształt dzwonowy: błędy przeciwnych znaków powinny być jednakowo prawdopodobne, dla dużych wartości |x| prawdopodobieństwo powinno być niewielkie.

Załóżmy, że dysponujemy serią niezależnych wyników pomiaru pewnej wielkości \mu: x_0, x_1,\ldots, x_n. Jeśli za każdym razem funkcją błędu jest p(x), to prawdopodobieństwo powinno być proporcjonalne do iloczynu:

p(x_0-\mu)p(x_1-\mu)\ldots p(x_n-\mu).

Szukamy wartości najbardziej prawdopodobnej, traktując iloczyn jako funkcję \mu. Możemy zlogarytmować nasz iloczyn i poszukać maksimum sumy logarytmów:

\ln{p(x_0-\mu)}+\ln{p(x_1-\mu)}+\ldots+\ln{p(x_n-\mu)}.

W maksimum pochodna równa jest zero, oznaczając tę pochodną przez g(x)=\frac{d\ln{p(x)}}{dx}, mamy

g(x_0-\mu)+g(x_1-\mu)+\ldots+g(x_n-\mu)=0.\mbox{(*)}

Funkcje p(x), g(x) przedstawione są jakościowo na rysunku.

error_function

Następnie Gauss robi założenie, że prawidłową wartością \mu powinna być średnia arytmetyczna wszystkich wyników. Jeśli tak, to równanie (*) słuszne jest dla każdej liczby składników i dowolnych wyników pomiaru. Możemy wziąć np. wartości

x_0-(n+1)y=x_1=\ldots=x_n,

gdzie y jest dowolną liczbą. Równanie (*) przyjmuje wówczas postać:

g(ny)+ng(-y)=0\Rightarrow g(ny)=ng(y).

Łatwo zauważyć, że oznacza to, iż g musi być funkcją liniową, którą zapiszemy jako g(y)=-y/h^2, gdzie h jest pewną stałą; uwzględniając definicję g(x), dostajemy

p(x)=C\exp{(-\frac{x^2}{2h^2})}.

Mamy więc słynną krzywą dzwonową Gaussa. Stała C musi być tak dobrana, aby pole pod krzywą było równe 1.

normal67

Parametr h zależy od dokładności pomiarów i określa szerokość krzywej, nazywamy go odchyleniem standardowym (na wykresie jest on jednostką na osi x). Iloczyn gęstości prawdopodobieństwa przyjmuje postać:

\exp{(-(x_0-\mu)^2-(x_1-\mu)^2+\ldots-(x_n-\mu)^2)}.

Szukanie najbardziej prawdopodobnej wartości \mu odpowiada więc minimalizacji sumy kwadratów odchyleń w wykładniku:

(x_0-\mu)^2+(x_1-\mu)^2+\ldots+(x_n-\mu)^2.

Rok 1859, Hipoteza Riemanna

W czasach PRL-u krążył dowcip, że socjalizm polega na heroicznych próbach rozwiązania problemów, które sam stworzył. To samo stosuje się w znacznej mierze do matematyki, która mimo swych rozlicznych zastosowań pozostaje dziedziną samowystarczalną, labiryntem, gdzie można błądzić latami, napotykając wciąż nowe cuda platońskiego świata. Jednym z najważniejszych nierozwiązanych problemów matematyki jest kwestia prawdziwości tzw. hipotezy Riemanna. Za jej udowodnienie Instytut Matematyczny Claya wyznaczył nagrodę równą milion dolarów.

Teoria liczb

Liczby naturalne, obok podstaw geometrii, poznajemy we wczesnym dzieciństwie. Zwykle też w szkole podstawowej uczono trochę o podzielności liczb i istnieniu liczb pierwszych: tj. takich, które mają dokładnie dwa dzielniki: 1 oraz samą siebie. Sposób na odsianie liczb pierwszych spośród całej reszty, podał jeszcze w starożytności Eratostenes, zwany przez zawistnych kolegów Betą – ponieważ zajmował się niemal każdą dziedziną i w każdej był drugi.

Sieve_of_Eratosthenes_animation

Zaczynamy od liczby 2. Jest ona liczbą pierwszą, ale wszystkie jej wielokrotności – czyli liczby parzyste – musimy wykluczyć. Następna jest liczba 3, która też jest liczbą pierwszą. Wykluczamy wszystkie jej wielokrotności: 6, 9, 12, … Postępując w ten sposób możemy ustalić, które liczby są pierwsze, a które złożone. Widać, że liczb pierwszych jest „dużo mniej” niż wszystkich liczb naturalnych, zachodzi pytanie, czy liczb pierwszych jest nieskończenie wiele. Okazuje się, że tak, co także dobrze wiedzieli starożytni. Ze sposobu działania sita Eratostenesa widzimy, że im większa jest liczba, tym większa szansa, że będzie ona jakąś wielokrotnością. Inaczej mówiąc zbiór liczb pierwszych staje się coraz rzadszy, w miarę jak przechodzimy do coraz większych wartości. Nie jest to jednak cała prawda: bo eksplorując zbiór liczb naturalnych napotyka się dowolnie długie obszary bez liczb pierwszych, choć można też napotkać pary liczb pierwszych różniących się tylko o dwa. Wszystko wskazuje na to, że takich par jest nieskończenie wiele, ale nikt tego nie udowodnił. Podobnie jak nieudowodniona jest hipoteza Goldbacha, że każda parzysta liczba naturalna większa niż 2 jest sumą dwóch liczb pierwszych.

Do rozmieszczenia liczb pierwszych można podejść statystycznie. Carl Friedrich Gauss, zauważył w ich rozmieszczeniu pewną prawidłowość. Jeśli oznaczymy przez π(x) liczbę liczb pierwszych mniejszych niż x, otrzymujemy dwie pierwsze kolumny poniższej tabeli:

x

π(x)

x/π(x)

przyrost

x/ln(x)

10

4

2,50

 

4,3

100

25

4,00

1,50

21,7

1000

168

5,95

1,95

144,8

10000

1229

8,14

2,18

1085,7

100000

9592

10,43

2,29

8685,9

1000000

78498

12,74

2,31

72382,4

Dziesięciokrotny wzrost x daje mniej więcej stały przyrost wartości w trzeciej kolumnie, tak zachowują się logarytmy. W dodatku wygląda na to, że wartość przyrostu stabilizuje się w okolicy liczby \ln(10)\approx 2,3

Ostatecznie funkcja π(x) powinna zachowywać się następująco przy dużych wartościach x:

1x

Być może nie wydaje się to szczególnie trudne. Musimy jednak pamiętać, że Gauss miał wówczas jakieś 16 albo 17 lat. Było to pod koniec XVIII wieku. Gauss nigdy nie potrafił udowodnić swojej hipotezy.

Liczby zespolone

Liczby naturalne łatwo rozszerzyć tak, aby obejmowały zero i liczby ujemne. Dzielenie liczb naturalnych prowadzi często do ułamków – w ten sposób uzyskujemy liczby wymierne (które można zapisać jako ułamek z naturalnym licznikiem i mianownikiem). W wielu zagadnieniach liczby wymierne nie wystarczają. Rozpatrzmy np. proste równanie

2x

Wiemy, że √2 jest liczbą niewymierną, można ją przybliżać kolejnymi cyframi po przecinku, ale nie da się jej zapisać skończonym rozwinięciem dziesiętnym. Także w zbiorze liczb rzeczywistych wiele równań algebraicznych nie ma rozwiązań, np. równanie różniące się tylko znakiem od poprzedniego.

3x

Aby temu zaradzić wprowadza się jednostkę urojoną i:

4xTeraz nasze ostatnie równanie także ma dwa pierwiastki, oba czysto urojone.

5x

W pierwszej chwili postępowanie takie może wyglądać na arbitralne, ale wprowadzenie liczb urojonych nie prowadzi do żadnych sprzeczności. Liczby te możemy dodawać do liczb rzeczywistych, w ogólnym przypadku otrzymujemy więc liczbę zespoloną:

6x

Liczby zespolone możemy przedstawiać jako punkty na płaszczyźnie albo wektory wychodzące z początku układu. Np. na rysunku zaznaczona jest liczba z=2+3i

polartri

Zamiast pary x, y można podać długość wektora r oraz kąt θ.

Na liczbach zespolonych można wykonywać wszystkie działania dozwolone dla liczb rzeczywistych, każde równanie algebraiczne stopnia n ma dokładnie n pierwiastków zespolonych (niektóre mogą być wielokrotne). Najciekawsze wyniki daje jednak teoria funkcji zespolonych, ujawniając różne nieoczekiwane powiązania, np. między funkcjami trygonometrycznymi a funkcją wykładniczą. Okazuje się, że gdy funkcje zespolone mają pochodną, to muszą być różniczkowalne nieskończenie wiele razy.

Bernhard Riemann

W maju roku 1859 w wieku 54 lat zmarł Johann Peter Gustav Lejeune Dirichlet, profesor zwyczajny matematyki na uniwersytecie w Getyndze. Dzięki temu katedrę mógł objąć Bernhard Riemann. Dirichlet był wybitnym matematykiem i został profesorem zwyczajnym dopiero po śmierci Gaussa, zaledwie kilka lat wcześniej. Riemann był jednym z najbardziej twórczych matematyków w historii, mimo swych niespełna 33 lat, miał już bardzo poważny dorobek. Także i jemu nie było dane długo piastować katedrę, zapadł bowiem na gruźlicę i zmarł w 1866 roku.

Praca z 1859 jest jedyną pracą Riemanna poświęconą teorii liczb. Wprowadził on w niej pewną funkcję zwaną od tej pory ζ [zeta] Riemanna. Oto jej definicja:

8x

Po prawej stronie mamy nieskończony szereg, aby wyrażenie takie miało sens, powinno ono zmierzać do jakiejś ustalonej wartości, gdy sumujemy coraz więcej wyrazów. Wiadomo było, że szereg taki jest zbieżny dla s>1. Niektóre przypadki badał już kiedyś Leonhard Euler, który udowodnił, że

10x
Także Euler zauważył, iż można szereg taki zamienić na nieskończony iloczyn przebiegający wyłącznie liczby pierwsze:
9x

Mamy więc związek funkcji ζ z liczbami pierwszymi. Rewolucyjnym posunięciem Riemanna było rozszerzenie dziedziny funkcji ζ na liczby zespolone. Dzięki temu można było do jej zbadania użyć metod analizy zespolonej. Funkcja ζ okazała się niezwykle regularna. Wiadomo było, że szereg jest rozbieżny dla s=1 i to się oczywiście nie zmieniło po rozszerzeniu dziedziny do liczb zespolonych. Jednak oprócz tego jednego punktu funkcja ζ jest wszędzie gładka i nie ma żadnych osobliwości.

arg osie

Na rysunku przedstawione jest zachowanie funkcji ζ na płaszczyźnie zespolonej (oś x odpowiada liczbom rzeczywistym, y – urojonym). Ponieważ wartości funkcji są liczbami zespolonymi, więc w każdym punkcie powinniśmy narysować parę liczb. Zamiast tego przedstawiony został jedynie kąt θ za pomocą koloru. W okolicach miejsc zerowych funkcji oraz w okolicy punktu s=1 zbiegają się wszystkie kolory. Jeśli pamiętamy o iloczynowym przedstawieniu funkcji ζ, to jasne jest, że wartości liczb pierwszych wpływają na wartości funkcji ζ. Riemann zauważył, że także odwrotnie: w funkcji ζ zakodowane są liczby pierwsze. Dokładniej, znajomość położenia zer funkcji ζ w pionowym pasie krytycznym (na rysunku barwnym mamy tylko trzy pierwsze zera z tego pasa, na schemacie z prawej strony pas ten zaznaczony jest na niebiesko) określa funkcję rozkładu liczb pierwszych π(x). Sformułował też hipotezę, że wszystkie zera funkcji ζ mają postać:

11x

Leżą więc nie tylko w pasie krytycznym, lecz na biegnącej jego środkiem linii prostej (czerwona linia na prawym rysunku).
Hipoteza Riemanna nie została dotąd udowodniona, słabsze od niej założenia pozwoliły (dopiero kilkadziesiąt lat po śmierci Riemanna!) udowodnić przypuszczenie Gaussa nt. zachowania π(x), od którego rozpoczęliśmy. Okazuje się, że znając położenie zer funkcji ζ, można przybliżać funkcję π(x). Nie podajemy wzoru, wykres poniżej pokazuje, jak zmienia się wynik w zależności od liczby zer wziętych pod uwagę.

psi

(Animacja ze strony http://empslocal.ex.ac.uk/people/staff/mrwatkin/zeta/encoding2.htm, ściśle biorąc nie jest to nasza funkcja π(x), lecz inna, spokrewniona z nią funkcja rozkładu liczb pierwszych). Warto też obejrzeć aplet modelujący formułę Riemanna.

Istnieją przypuszczenia, że zera funkcji ζ mogą być wartościami energii jakiegoś nieznanego układu kwantowego. Jak zwykle, gdy w grę wchodzi teoria liczb, istnieją zaskakujące sformułowania hipotezy Riemanna. Każda liczba naturalna ma parzystą bądź nieparzystą liczbę czynników pierwszych, na które się rozkłada. Np. liczby pierwsze mają tylko jeden taki czynnik, 8 jest iloczynem trzech czynników pierwszych, a 9 – dwóch. Hipoteza Riemanna równoważna jest temu, że prawdopodobieństwa, iż dana liczba naturalna ma parzystą bądź nieparzystą liczbę czynników pierwszych, są jednakowe.

Czytelnikowi nieobawiającemu się matematyki, lecz niezbyt zaawansowanemu, polecam gorąco książkę Jeffreya Stopple’a, A Primer of Analytic Number Theory, Cambridge University Press 2003.