Carl Friedrich Gauss i jego funkcja błędu (1809)

Gauss był cudownym dzieckiem, jego zdolności zwróciły uwagę księcia, dzięki czemu młody człowiek mógł się kształcić: najpierw w rodzinnym Brunszwiku, potem w Getyndze. Syn skromnego ogrodnika i murarza początkowo nie znał nawet dokładnej daty swego urodzenia – matka pamiętała jedynie, że była to środa, osiem dni przed Wniebowstąpieniem Pańskim – w 1799 roku młody uczony obliczył, że musiało to być 30 kwietnia 1777 roku. Już jego wczesne prace matematyczne, Disquisitiones Arithmeticae, poświęcone teorii liczb, oraz doktorat, zawierający dowód podstawowego twierdzenia algebry (każde równanie wielomianowe ma przynajmniej jeden pierwiastek zespolony), zawierały istotne wyniki, szeroki rozgłos zdobył jednak dzięki astronomii. W Nowy Rok 1801 teatyn z Palermo, Giuseppe Piazzi, zaobserwował słaby obiekt, który okazał się nową planetą (według współczensej terminologii: planetą karłowatą), zwaną dziś Ceres. Planeta zbliżyła się po pewnym czasie pozornie do Słońca i Piazzi nie potrafił jej później odnaleźć. Odkrył więc nową planetę i ją zagubił. Próbowano obliczyć orbitę Ceres na podstawie dostępnych obserwacji, zadanie to rozwiązał najlepiej właśnie Gauss: jego metoda nie wymagała żadnych upraszczających założeń, np. że orbita nowo odkrytego ciała niebieskiego jest okręgiem. Dzięki obliczeniom Gaussa, który był nie tylko znakomitym matematykiem, ale też bardzo sprawnym rachmistrzem, Ceres została odnaleziona. Kilka lat później uczonemu zaproponowano stanowisko dyrektora obserwatorium w Getyndze, które zajmował aż do śmierci. W roku 1809 opublikował swoją metodę wyznaczania orbity pt. Theoria motus corporum coelestium in sectionibus conicis solem ambientium (Teoria ruchu ciał niebieskich krążących wokół Słońca po krzywych stożkowych). Był to rok tragiczny dla Gaussa, we wrześniu urodziło się jego trzecie dziecko, syn Louis, miesiąc później wskutek komplikacji poporodowych zmarła jego żona Johanna. Louis przeżył swą matkę o zaledwie kilka miesięcy. Uczony ożenił się wprawdzie niedługo później ponownie: miał dwoje małych dzieci na wychowaniu, ale tragedia ta odcisnęła się głęboko na jego psychice.

Bendixen_-_Carl_Friedrich_Gauß,_1828

Portret z 1828 roku (Wikipedia)

Theoria motus zawiera rozważania na temat błędów i metody najmniejszych kwadratów. Sama ta metoda została wcześniej opublikowana przez Adriena Marie Legendre’a, lecz rozważania Gaussa poszły dalej, inspirując z kolei Laplace’a. Przedstawimy podejście Gaussa do funkcji błędu – dziś nazywamy ją rozkładem Gaussa bądź rozkładem normalnym. Gauss założył, że prawdopodobieństwo otrzymania w pomiarze wyniku różniącego się o (x, x+dx) od rzeczywistej wartości równe jest p(x)dx. Naszym zadaniem jest wyznaczenie kształtu owej funkcji. Można przypuszczać, że powinna mieć ona kształt dzwonowy: błędy przeciwnych znaków powinny być jednakowo prawdopodobne, dla dużych wartości |x| prawdopodobieństwo powinno być niewielkie.

Załóżmy, że dysponujemy serią niezależnych wyników pomiaru pewnej wielkości \mu: x_0, x_1,\ldots, x_n. Jeśli za każdym razem funkcją błędu jest p(x), to prawdopodobieństwo powinno być proporcjonalne do iloczynu:

p(x_0-\mu)p(x_1-\mu)\ldots p(x_n-\mu).

Szukamy wartości najbardziej prawdopodobnej, traktując iloczyn jako funkcję \mu. Możemy zlogarytmować nasz iloczyn i poszukać maksimum sumy logarytmów:

\ln{p(x_0-\mu)}+\ln{p(x_1-\mu)}+\ldots+\ln{p(x_n-\mu)}.

W maksimum pochodna równa jest zero, oznaczając tę pochodną przez g(x)=\frac{d\ln{p(x)}}{dx}, mamy

g(x_0-\mu)+g(x_1-\mu)+\ldots+g(x_n-\mu)=0.\mbox{(*)}

Funkcje p(x), g(x) przedstawione są jakościowo na rysunku.

error_function

Następnie Gauss robi założenie, że prawidłową wartością \mu powinna być średnia arytmetyczna wszystkich wyników. Jeśli tak, to równanie (*) słuszne jest dla każdej liczby składników i dowolnych wyników pomiaru. Możemy wziąć np. wartości

x_0-(n+1)y=x_1=\ldots=x_n,

gdzie y jest dowolną liczbą. Równanie (*) przyjmuje wówczas postać:

g(ny)+ng(-y)=0\Rightarrow g(ny)=ng(y).

Łatwo zauważyć, że oznacza to, iż g musi być funkcją liniową, którą zapiszemy jako g(y)=-y/h^2, gdzie h jest pewną stałą; uwzględniając definicję g(x), dostajemy

p(x)=C\exp{(-\frac{x^2}{2h^2})}.

Mamy więc słynną krzywą dzwonową Gaussa. Stała C musi być tak dobrana, aby pole pod krzywą było równe 1.

normal67

Parametr h zależy od dokładności pomiarów i określa szerokość krzywej, nazywamy go odchyleniem standardowym (na wykresie jest on jednostką na osi x). Iloczyn gęstości prawdopodobieństwa przyjmuje postać:

\exp{(-(x_0-\mu)^2-(x_1-\mu)^2+\ldots-(x_n-\mu)^2)}.

Szukanie najbardziej prawdopodobnej wartości \mu odpowiada więc minimalizacji sumy kwadratów odchyleń w wykładniku:

(x_0-\mu)^2+(x_1-\mu)^2+\ldots+(x_n-\mu)^2.

Rok 1859, Hipoteza Riemanna

W czasach PRL-u krążył dowcip, że socjalizm polega na heroicznych próbach rozwiązania problemów, które sam stworzył. To samo stosuje się w znacznej mierze do matematyki, która mimo swych rozlicznych zastosowań pozostaje dziedziną samowystarczalną, labiryntem, gdzie można błądzić latami, napotykając wciąż nowe cuda platońskiego świata. Jednym z najważniejszych nierozwiązanych problemów matematyki jest kwestia prawdziwości tzw. hipotezy Riemanna. Za jej udowodnienie Instytut Matematyczny Claya wyznaczył nagrodę równą milion dolarów.

Teoria liczb

Liczby naturalne, obok podstaw geometrii, poznajemy we wczesnym dzieciństwie. Zwykle też w szkole podstawowej uczono trochę o podzielności liczb i istnieniu liczb pierwszych: tj. takich, które mają dokładnie dwa dzielniki: 1 oraz samą siebie. Sposób na odsianie liczb pierwszych spośród całej reszty, podał jeszcze w starożytności Eratostenes, zwany przez zawistnych kolegów Betą – ponieważ zajmował się niemal każdą dziedziną i w każdej był drugi.

Sieve_of_Eratosthenes_animation

Zaczynamy od liczby 2. Jest ona liczbą pierwszą, ale wszystkie jej wielokrotności – czyli liczby parzyste – musimy wykluczyć. Następna jest liczba 3, która też jest liczbą pierwszą. Wykluczamy wszystkie jej wielokrotności: 6, 9, 12, … Postępując w ten sposób możemy ustalić, które liczby są pierwsze, a które złożone. Widać, że liczb pierwszych jest „dużo mniej” niż wszystkich liczb naturalnych, zachodzi pytanie, czy liczb pierwszych jest nieskończenie wiele. Okazuje się, że tak, co także dobrze wiedzieli starożytni. Ze sposobu działania sita Eratostenesa widzimy, że im większa jest liczba, tym większa szansa, że będzie ona jakąś wielokrotnością. Inaczej mówiąc zbiór liczb pierwszych staje się coraz rzadszy, w miarę jak przechodzimy do coraz większych wartości. Nie jest to jednak cała prawda: bo eksplorując zbiór liczb naturalnych napotyka się dowolnie długie obszary bez liczb pierwszych, choć można też napotkać pary liczb pierwszych różniących się tylko o dwa. Wszystko wskazuje na to, że takich par jest nieskończenie wiele, ale nikt tego nie udowodnił. Podobnie jak nieudowodniona jest hipoteza Goldbacha, że każda parzysta liczba naturalna większa niż 2 jest sumą dwóch liczb pierwszych.

Do rozmieszczenia liczb pierwszych można podejść statystycznie. Carl Friedrich Gauss, zauważył w ich rozmieszczeniu pewną prawidłowość. Jeśli oznaczymy przez π(x) liczbę liczb pierwszych mniejszych niż x, otrzymujemy dwie pierwsze kolumny poniższej tabeli:

x

π(x)

x/π(x)

przyrost

x/ln(x)

10

4

2,50

 

4,3

100

25

4,00

1,50

21,7

1000

168

5,95

1,95

144,8

10000

1229

8,14

2,18

1085,7

100000

9592

10,43

2,29

8685,9

1000000

78498

12,74

2,31

72382,4

Dziesięciokrotny wzrost x daje mniej więcej stały przyrost wartości w trzeciej kolumnie, tak zachowują się logarytmy. W dodatku wygląda na to, że wartość przyrostu stabilizuje się w okolicy liczby \ln(10)\approx 2,3

Ostatecznie funkcja π(x) powinna zachowywać się następująco przy dużych wartościach x:

1x

Być może nie wydaje się to szczególnie trudne. Musimy jednak pamiętać, że Gauss miał wówczas jakieś 16 albo 17 lat. Było to pod koniec XVIII wieku. Gauss nigdy nie potrafił udowodnić swojej hipotezy.

Liczby zespolone

Liczby naturalne łatwo rozszerzyć tak, aby obejmowały zero i liczby ujemne. Dzielenie liczb naturalnych prowadzi często do ułamków – w ten sposób uzyskujemy liczby wymierne (które można zapisać jako ułamek z naturalnym licznikiem i mianownikiem). W wielu zagadnieniach liczby wymierne nie wystarczają. Rozpatrzmy np. proste równanie

2x

Wiemy, że √2 jest liczbą niewymierną, można ją przybliżać kolejnymi cyframi po przecinku, ale nie da się jej zapisać skończonym rozwinięciem dziesiętnym. Także w zbiorze liczb rzeczywistych wiele równań algebraicznych nie ma rozwiązań, np. równanie różniące się tylko znakiem od poprzedniego.

3x

Aby temu zaradzić wprowadza się jednostkę urojoną i:

4xTeraz nasze ostatnie równanie także ma dwa pierwiastki, oba czysto urojone.

5x

W pierwszej chwili postępowanie takie może wyglądać na arbitralne, ale wprowadzenie liczb urojonych nie prowadzi do żadnych sprzeczności. Liczby te możemy dodawać do liczb rzeczywistych, w ogólnym przypadku otrzymujemy więc liczbę zespoloną:

6x

Liczby zespolone możemy przedstawiać jako punkty na płaszczyźnie albo wektory wychodzące z początku układu. Np. na rysunku zaznaczona jest liczba z=2+3i

polartri

Zamiast pary x, y można podać długość wektora r oraz kąt θ.

Na liczbach zespolonych można wykonywać wszystkie działania dozwolone dla liczb rzeczywistych, każde równanie algebraiczne stopnia n ma dokładnie n pierwiastków zespolonych (niektóre mogą być wielokrotne). Najciekawsze wyniki daje jednak teoria funkcji zespolonych, ujawniając różne nieoczekiwane powiązania, np. między funkcjami trygonometrycznymi a funkcją wykładniczą. Okazuje się, że gdy funkcje zespolone mają pochodną, to muszą być różniczkowalne nieskończenie wiele razy.

Bernhard Riemann

W maju roku 1859 w wieku 54 lat zmarł Johann Peter Gustav Lejeune Dirichlet, profesor zwyczajny matematyki na uniwersytecie w Getyndze. Dzięki temu katedrę mógł objąć Bernhard Riemann. Dirichlet był wybitnym matematykiem i został profesorem zwyczajnym dopiero po śmierci Gaussa, zaledwie kilka lat wcześniej. Riemann był jednym z najbardziej twórczych matematyków w historii, mimo swych niespełna 33 lat, miał już bardzo poważny dorobek. Także i jemu nie było dane długo piastować katedrę, zapadł bowiem na gruźlicę i zmarł w 1866 roku.

Praca z 1859 jest jedyną pracą Riemanna poświęconą teorii liczb. Wprowadził on w niej pewną funkcję zwaną od tej pory ζ [zeta] Riemanna. Oto jej definicja:

8x

Po prawej stronie mamy nieskończony szereg, aby wyrażenie takie miało sens, powinno ono zmierzać do jakiejś ustalonej wartości, gdy sumujemy coraz więcej wyrazów. Wiadomo było, że szereg taki jest zbieżny dla s>1. Niektóre przypadki badał już kiedyś Leonhard Euler, który udowodnił, że

10x
Także Euler zauważył, iż można szereg taki zamienić na nieskończony iloczyn przebiegający wyłącznie liczby pierwsze:
9x

Mamy więc związek funkcji ζ z liczbami pierwszymi. Rewolucyjnym posunięciem Riemanna było rozszerzenie dziedziny funkcji ζ na liczby zespolone. Dzięki temu można było do jej zbadania użyć metod analizy zespolonej. Funkcja ζ okazała się niezwykle regularna. Wiadomo było, że szereg jest rozbieżny dla s=1 i to się oczywiście nie zmieniło po rozszerzeniu dziedziny do liczb zespolonych. Jednak oprócz tego jednego punktu funkcja ζ jest wszędzie gładka i nie ma żadnych osobliwości.

arg osie

Na rysunku przedstawione jest zachowanie funkcji ζ na płaszczyźnie zespolonej (oś x odpowiada liczbom rzeczywistym, y – urojonym). Ponieważ wartości funkcji są liczbami zespolonymi, więc w każdym punkcie powinniśmy narysować parę liczb. Zamiast tego przedstawiony został jedynie kąt θ za pomocą koloru. W okolicach miejsc zerowych funkcji oraz w okolicy punktu s=1 zbiegają się wszystkie kolory. Jeśli pamiętamy o iloczynowym przedstawieniu funkcji ζ, to jasne jest, że wartości liczb pierwszych wpływają na wartości funkcji ζ. Riemann zauważył, że także odwrotnie: w funkcji ζ zakodowane są liczby pierwsze. Dokładniej, znajomość położenia zer funkcji ζ w pionowym pasie krytycznym (na rysunku barwnym mamy tylko trzy pierwsze zera z tego pasa, na schemacie z prawej strony pas ten zaznaczony jest na niebiesko) określa funkcję rozkładu liczb pierwszych π(x). Sformułował też hipotezę, że wszystkie zera funkcji ζ mają postać:

11x

Leżą więc nie tylko w pasie krytycznym, lecz na biegnącej jego środkiem linii prostej (czerwona linia na prawym rysunku).
Hipoteza Riemanna nie została dotąd udowodniona, słabsze od niej założenia pozwoliły (dopiero kilkadziesiąt lat po śmierci Riemanna!) udowodnić przypuszczenie Gaussa nt. zachowania π(x), od którego rozpoczęliśmy. Okazuje się, że znając położenie zer funkcji ζ, można przybliżać funkcję π(x). Nie podajemy wzoru, wykres poniżej pokazuje, jak zmienia się wynik w zależności od liczby zer wziętych pod uwagę.

psi

(Animacja ze strony http://empslocal.ex.ac.uk/people/staff/mrwatkin/zeta/encoding2.htm, ściśle biorąc nie jest to nasza funkcja π(x), lecz inna, spokrewniona z nią funkcja rozkładu liczb pierwszych). Warto też obejrzeć aplet modelujący formułę Riemanna.

Istnieją przypuszczenia, że zera funkcji ζ mogą być wartościami energii jakiegoś nieznanego układu kwantowego. Jak zwykle, gdy w grę wchodzi teoria liczb, istnieją zaskakujące sformułowania hipotezy Riemanna. Każda liczba naturalna ma parzystą bądź nieparzystą liczbę czynników pierwszych, na które się rozkłada. Np. liczby pierwsze mają tylko jeden taki czynnik, 8 jest iloczynem trzech czynników pierwszych, a 9 – dwóch. Hipoteza Riemanna równoważna jest temu, że prawdopodobieństwa, iż dana liczba naturalna ma parzystą bądź nieparzystą liczbę czynników pierwszych, są jednakowe.

Czytelnikowi nieobawiającemu się matematyki, lecz niezbyt zaawansowanemu, polecam gorąco książkę Jeffreya Stopple’a, A Primer of Analytic Number Theory, Cambridge University Press 2003.