Gauss, lemniskata i wyjątkowy algorytm (30 V 1799)

Pisałem o tym, jak metodą Archimedesa obliczano liczbę \pi. Można tę starożytną metodę sformułować jako algorytm niezależny od geometrii. Bierzemy dwie dodatnie liczby rzeczywiste a_0,b_0 (niech b_0<a_0). Potem rekurencyjnie obliczamy kolejne wartości ciągów

\dfrac{1}{a_{n+1}}=\dfrac{1}{2}\left(\dfrac{1}{a_n}+\dfrac{1}{b_n}\right), \; b_{n+1}=\sqrt{a_{n+1}b_{n}}.

Kolejne wyrazy są tu średnimi harmonicznymi i średnimi geometrycznymi poprzednich wyrazów. Średnia harmoniczna dwóch liczb to np. średnia prędkość na pewnej drodze, gdy połowę drogi jedziemy z pierwszą prędością, a drugą połowę z drugą prędkością. Można pokazać bez trudu (*), że ciąg a_n jest malejący, a ciąg b_n rosnący. Ponieważ oba są ograniczone, muszą być zbieżne, i to do wspólnej granicy równej

a_{\infty}=b_{\infty}=\dfrac{a_0 b_0}{\sqrt{a_0^2-b_0^2}}\arccos \dfrac{b_0}{a_0}.

Wynik ten znał nauczyciel Carla Friedricha Gaussa Johann Friedrich Pfaff, uważany za najwybitniejszego niemieckiego matematyka epoki przed Gaussem.

Biorąc a_0=2\sqrt{3} oraz b_0=3, otrzymujemy w granicy liczbę \pi.

Gdy b_0>a_0, należy zamienić kolejność pod pierwiastkiem oraz arcus cosinus zamienić na arcosh. W roku 1880 odkrył ponownie ten algorytm Carl Wilhelm Borchardt, znany najbardziej jako redaktor „Journal für die reine und angewandte Mathematik”, zwanego też Żurnalem Crelle’a od nazwiska pierwszego redaktora. Dlatego w literaturze nazywa się go algorytmem Borchardta albo Archimedesa-Borchardta.

Młody Gauss od dziecka zapowiadał się na wyjątkowy talent matematyczny i w tym przypadku cudowne dziecko wyrosło na czołowego matematyka Europy. Podobnie jak Euler należał on do matematyków, którzy lubią i potrafią sprawnie wykonywać rozmaite rachunki numeryczne. 

Zainteresował się on następującym algorytmem:

a_{n+1}=\dfrac{a_n+b_n}{2},\;b_{n+1}=\sqrt{a_n b_n},

gdzie a_0>b_0>0. Zauważmy, że jest to „kuzyn” algorytmu Archimedesa: średnie harmoniczne zostały zastąpione tu średnimi arytmetycznymi. Łatwo wykazać, że oba ciągi dążą do wspólnej granicy, którą oznaczymy M(a_0,b_0) i będziemy nazywać średnią arytmetyczno-geometryczną obu wyjściowych liczb. Oto przykładowe rachunki Gaussa, a_0=\sqrt{2}, b_0=1. Widać, że zbieżność jest niezwykle szybka (dokładność danych w tabeli odpowiada rachunkom Gaussa, który oczywiście musiał przeprowadzać je ręcznie z całym mozołem, ale też chyba i radością.  

tabella

Mamy więc znakomity algorytm, ale nie wiemy, co jest jego granicą. Gauss potrafił udowodnić, że granica jest w tym przypadku związana z długością lemniskaty Bernoulliego, eleganckiej krzywej, przez którą bracia Jakob i Johann Bernoulli skłócili się śmiertelnie w 1694 roku (poszło o kwestie pierwszeństwa – nie tylko w tamtej epoce traktowane niezwykle ambicjonalnie, choć dziś trochę więcej wiemy o nieuniknionej równoległości pewnych odkryć i rozumowań). Oto lemniskata.

tmp_tr67pffh

Jest to miejsce geometryczne punków, których iloczyn odległości od dwóch ognisk jest stały (przy warunku, że środek odcinka łączącego ogniska leży na krzywej, w przeciwnym razie otrzymamy owal Cassiniego). Równanie biegunowe lemniskaty ma postać r^2=\cos2\theta (to lemniskata jednostkowa, wszelkie inne są do niej geometrycznie podobne). Możemy za jego pomocą wyrazić element łuku krzywej jako

ds^2=dr^2+r^2d\theta^2=\dfrac{dr^2}{1-r^4}.

Zatem długość całkowita lemniskaty jest równa

{\displaystyle 2\,\widetilde{\omega}\equiv 4\int_{0}^{1}\dfrac{dt}{\sqrt{1-t^4}}}.

Gauss najpierw zauważył, porównując liczby, a następnie udowodnił, że 

\widetilde{\omega}=\dfrac{\pi}{M(\sqrt{2},1)}.

Wielkość ta przypomina liczbę \pi: też jest stosunkiem długości krzywej do jej „promienia”. Jak wskazuje to postać całki dającej długość łuku lemniskaty, mamy tu do czynienia z pierwiastkiem z wielomianu czwartego stopnia. Wiadomo, że całki pierwiastków z wielomianu drugiego stopnia dają się wyrazić przez funkcje elementarne. W przypadku wielomianów stopnia trzeciego i czwartego otrzymujemy tzw. całki eliptyczne: jest to nazwa wspólna, wywiedziona z zagadnienia obliczania długości łuku elipsy. Tak się składa, że całki dające długość łuku elipsy są całkami eliptycznymi drugiego rodzaju. Całkę pierwszego rodzaju spotkaliśmy w zagadnieniu wahadła matematycznego. Możemy także za Gaussem dowieść, że całkę eliptyczną zupełną pierwszego rodzaju K(k) można wyrazić przez średnią arytmetyczno-geometryczną.

{ \displaystyle K(k)\equiv \int_0^{ \frac{\pi}{2} } \dfrac{d\varphi}{ \sqrt{1-k^2\sin^2\varphi} } ,\; \mbox{gdzie } 0\le k<1.}

Mamy równość

\dfrac{1}{M(1,k')}=\dfrac{2}{\pi}K(k),\,\mbox{gdzie } k'=\sqrt{1-k^2}.

Można ją wyrazić:

{\mathcal AGM}(1,\sqrt{1-k^2})={\mathcal AGM}(1/min,1/max)=\left\langle \dfrac{1}{ \sqrt{1-k^2\sin^2\varphi} } \right\rangle,

gdzie min, max oznaczają najmniejszą i największą wartość funkcji podcałkowej na przedziale [0,\frac{\pi}{2}], a nawiasy kątowe oznaczają uśrednienie funkcji po przedziale całkowania. Twierdzenie to zapewnia szybki algorytm do obliczania całek eliptycznych, w istocie tak szybki, że można go stosować także do innych celów: obliczania liczby \pi albo funkcji w rodzaju \ln x, jeśli powiąże się je odpowiednio z całkami eliptycznymi.

Jeden z takich algorytmów, podany przez Eugene’a Salamina, korzysta z trzech ciągów a_n, b_n zdefiniowane jak wyżej oraz s_{n+1}=s_n-2^n(a_n-a_{n+1})^2; przy s_0=\frac14; \, a_0=1;\; b_0=1/\sqrt{2}. Otrzymuje się wówczas nierówność, którą spełnia \pi:

\dfrac{a_n^2}{s_n}>\pi>\dfrac{a_{n+1}^2}{s_n}.

Daje to w kolejnych iteracjach:

0 : 2.914213562373095048801689 < π < 4.000000000000000000000000
1 : 3.140579250522168248311331 < π < 3.187672642712108627201930
2 : 3.141592646213542282149344 < π < 3.141680293297653293918070
3 : 3.141592653589793238279513 < π < 3.141592653895446496002915
4 : 3.141592653589793238462643 < π < 3.141592653589793238466361

Dla porównania oryginalny algorytm Archimedesa:

0 : 3.0000000 < π < 3.4641017
1 : 3.1058285 < π < 3.2153904
2 : 3.1326286 < π < 3.1596600
3 : 3.1393502 < π < 3.1460863
4 : 3.1410319 < π < 3.1427146

Widzimy, jak bardzo średnie arytmetyczno-geometryczne przyspieszają zbieżność, przy czym algorytm Salamina pochodzi z roku 1976 i od tamtej pory przedstawiono znacznie szybsze.

Na koniec pokażemy, czemu całka eliptyczna pierwszego rodzaju daje się obliczać w sposób odkryty przez Gaussa (dla ścisłości historycznej należy dodać, że nie tylko Gauss odkrył takie podejście, trochę wcześniej był Joseph Lagrange, choć zdaje się tylko Gauss zrozumiał dobrze od razu aspekt numeryczny sprawy).

Oznaczmy I(a,b) (0<b<a) następującą całkę:

{\displaystyle I(a,b)=\int_0^{\frac{\pi}{2}} \dfrac{d\varphi}{\sqrt{a^2\cos^2\varphi+b^2\sin^2\varphi}}=\dfrac{1}{a}K(k'),\, k=\dfrac{b}{a}. }

Pokażemy, że I(a,b) nie zmienia się, kiedy przechodzimy do kolejnych kroków rekurencyjnych:

I(a,b)=I(\dfrac{a+b}{2},\sqrt{ab}) \;\; \mbox{(**)}.

 A skoro tak jest (szczegóły niżej), to kolejne wartości I(a_n,b_n) są takie same i przechodząc do granicy otrzymamy

{\displaystyle I(a,b)=I(M(a,b),M(a,b))=\int_0^{\frac{\pi}{2}} \dfrac{d\varphi}{M(a,b)\sqrt{\cos^2\varphi+\sin^2\varphi}}=\dfrac{\pi}{2 M(a,b)}}.

Jako przykład pokażemy, jak procedura tego rodzaju pozwala obliczać okres wahadła matematycznego „niemal stającego na głowie” dla amplitud bliskich 180^{\circ}. Np. dla amplitudy 179^{\circ} otrzymamy k'=\sin 89,5^{\circ}=0,008726535498374. Obliczamy średnią M(k',1):

a_n                       b_n

0,008726535498374 1,00000000000000
0,504363267749187 0,093415927434105
0,298889597591646 0,217061195105173
0,257975396348409 0,254710292798989
0,256342844573699 0,256337645964924
0,256340245269312 0,256340245256133

Okres wahadła wydłuża się przy tak dużym wychyleniu 1/0,256340245256133=3,90106516038909 razy. Euler w pracy E503, na którą powoływaliśmy się w poprzednim poście, także pokazuje rachunki dla takiego wychylenia, jednak jego wynik jest błędny.  

(*) Nasze liczby wyjściowe a_0,\,b_0 można zapisać jako

b_0=\lambda\sin\theta,\;a_0=\lambda \,\mbox{tg }\theta

dla pewnych wartości \lambda i \theta. Pierwszy związek rekurencyjny daje nam

\dfrac{1}{a_1}=\dfrac{1}{2\lambda}\left( \mbox{ctg }\theta+\dfrac{1}{\sin\theta}\right)=\dfrac{1}{2\lambda \,\mbox{tg }\frac{\theta}{2}}\Rightarrow a_1=2\lambda\,\mbox{tg}\,\dfrac{\theta}{2} .

Drugi związek rekurencyjny przyjmuje postać

b_1=\sqrt{a_1 b_0}=\sqrt{2\lambda \,\mbox{tg}\,\dfrac{\theta}{2}\cdot\lambda 2\sin\dfrac{\theta}{2}\cos\dfrac{\theta}{2}}=2\lambda\sin\dfrac{\theta}{2}.

Widać, że wzór ogólny będzie

a_n=2^{n}\lambda \,\mbox{tg}\,\dfrac{\theta}{2^{n}},\; b_n=2^{n}\lambda \sin\dfrac{\theta}{2^{n}}.

Oba ciągi zbieżne są do granicy \lambda\theta. Związek z geometrią wielokątów wpisanych i opisanych na okręgu przedstawia rysunek. Zaczynając od sześciokąta, otrzymamy wartości początkowe przytoczone w tekście.

borchardt

Wykażemy tożsamość (**). Topornym sposobem jej udowodnienia jest odpowiednia zamiana zmiennych pod całką. Wadą tego podejścia jest to, że podstawienie pojawia się jako deus ex machina i nam zostaje tylko sprawdzenie rachunków. Można też tożsamość przekształcić do postaci bardziej przydatnej w naszym przypadku

K(\dfrac{2\sqrt{k}}{1+k})=(1+k)K(k).

Funkcja podcałkowa po obu stronach jest odwrotnością pierwiastka, będziemy więc korzystać z rozwinięcia dwumianowego

{\displaystyle (1+t)^{-\frac12}=\sum_{m=0}^{\infty} {-\frac{1}{2}\choose m} t^{m},\;\mbox{gdzie}\; {\alpha\choose m}\equiv\dfrac{\alpha(\alpha-1)\ldots(\alpha-m+1)}{m!}.}

Dla m=0 przyjmujemy z definicji {\alpha\choose 0}=1

Rozwinięcie K(k) ma postać

{\displaystyle K(k)=\sum_{m=0}^{\infty} {-\frac{1}{2}\choose m} (-1)^m k^{2m} \int_0^{\frac{\pi}{2}} \sin^{2m}\varphi d\varphi.}

Całka, która się tu pojawia, może być zapisana w postaci

{\displaystyle \int_0^{\frac{\pi}{2}}\sin^{2m}\varphi d\varphi=\dfrac{\pi}{2}{-\frac12\choose m}(-1)^{m}.} 

Mamy więc dla K(k) rozwinięcie

{\displaystyle K(k)=\dfrac{\pi}{2}\sum_{m=0}^{\infty}{-\frac12\choose m}^2 k^{2m}. }

Funkcję podpierwiastkową po lewej stronie tożsamości możemy zapisać przy użyciu tożsamości 2\sin^2\varphi=1-\cos2\varphi jako

\dfrac{1+k^2+2k\cos2\varphi}{(1+k)^2}=\dfrac{(1+ke^{i2\varphi})(1+ke^{-i2\varphi})}{(1+k)^2}.

Otrzymujemy wówczas

{\displaystyle 2K\left(\dfrac{2\sqrt{k}}{1+k}\right)=(1+k)\int_0^{\pi}(1+ke^{i2\varphi})^{-\frac12}(1+ke^{-i2\varphi})^{-\frac12}d\varphi = }

Dwójce przed K(\frac{2\sqrt{k}}{1+k}) odpowiada podwojenie przedziału całkowania: [0,\pi]. Rozwijamy oba pierwiastki w szereg:

{\displaystyle =(1+k)\sum_{m,m'=0}^{\infty}{-\frac12\choose m}{-\frac12\choose m'}k^mk^{m'}\int_0^{\pi}e^{i 2(m-m')\varphi}d\varphi=. }

Tylko wyrazy diagonalne m=m' przeżywają całkowanie, zostaje nam

{\displaystyle 2\dfrac{\pi}{2}(1+k)\sum_{m=0}^{\infty}{-\frac12\choose m}^2 k^{2m}=2(1+k)K(k). }

Całkę z sinusa w potędze łatwo znaleźć zauważając, że

\sin\varphi=\dfrac{e^{i\varphi}-e^{-i\varphi}}{2i},

a także rozszerzając przedział całkowania do [0,2\pi]. W rozwinięciu dwumianowym \sin^{2m}\varphi całkowanie przeżywają tylko wyrazy, w których wykładniki są przeciwne, stąd przytoczony wyżej wzór. Korzystałem ze sformułowania Petera Durena w świetnej książce Invitation to Classical Analysis.

 

Leonhard Euler: wahadło (1777)

Pisałem o początkach kariery Leonharda Eulera. Później przez całe długie życie, dzień po dniu niestrudzenie prowadził obliczenia, tworząc setki prac, jakby na potwierdzenie kalwińskiej doktryny predestynacji: to Stwórca wybiera, a jego wybrani właściwie nawet nie odczuwają rozterek, jak postępować, bo muszą czynić dobrze. W naszych sceptycznych oczach był człowiekiem ambitnym, który wciąż musiał rozwiązywać zagadki i mało kto potrafił mu w tym dorównać. Czasem d’Alembert i Clairaut we Francji potrafili z nim konkurować. Pomysłowość metod łączył Euler z nadzwyczajną sumiennością w rachunkach. Spis prac Eulera liczy ponad 800 pozycji. Pisał, później raczej dyktował, ponieważ niemal całkiem stracił wzrok, co nie tylko nie zahamowało tempa jego pracy, lecz nawet je przyspieszyło, gdyż mniej spraw go rozpraszało, a rachunki i tak robił w pamięci. My zajmiemy się pracą E503, poświęconą ruchowi wahadła o dużej amplitudzie (wydrukowaną w roku 1780). Pojawia się w niej całka eliptyczna pierwszego rodzaju. To niejako zapowiedź wielkiego tematu matematyki w XIX wieku, a mianowicie funkcji eliptycznych, rozwijanych później przez Legendre’a, Abela, Jacobiego, Weierstrassa i Riemanna.

Pokażemy, jak okres oscylacji wahadła zależy od amplitudy. I pokażemy, jak zrobić o jeden krok dalej niż Euler, bo nauka to jedyny może obszar ludzkiej działalności, gdzie postęp jest rzeczywisty, co oznacza, że niemal każdy później urodzony może sięgać dalej niż dawni mistrzowie.

W czasach Eulera zegary wahadłowe wciąż były najdokładnieszym przyrządem do mierzenia czasu, teoria wahadła miała więc pewne znaczenie praktyczne. Euler zajmował się także wcześniej ruchami brył sztywnych, potrafił więc wykazać, że wahadłem może być jakakolwiek bryła o dowolnym kształcie. Jej ruch zawsze jest taki sam jak wahadła matematycznego o pewnej długości. Dlatego wystarczy rozważać wahadło matematyczne. Możemy sobie wyobrażać takie wahadło jako czerwony koralik o masie m=1 ślizgający się bez tarcia po okręgu o promieniu L. II zasada dynamiki daje wtedy

\ddot{\varphi}=-\dfrac{g}{L}\sin\varphi,

kropki oznaczają różniczkowanie po czasie. Możemy też zacząć nie od II zasady dynamiki, lecz od zasady zachowania energii (technicznie biorąc mamy wtedy o jedną całkę mniej). Ponieważ prędkość koralika to \dot{\varphi}L (\dot{\varphi} jest prędkością kątową), otrzymujemy równanie

\dfrac{L^2\dot{\varphi}^2}{2}+gL(1-\cos\varphi)=gL(1-\cos\varphi_m),

gdzie g jest przyspieszeniem ziemskim, a \varphi_m – kątem maksymalnego wychylenia. Nie rozpatrujemy przypadku energii na tyle dużej, by nasz koralik obiegał okrąg, nie jest to przypadek szczególnie interesujący. Możliwe ruchy wahadła przedstawia portret fazowy, wykres rozmaitych ruchów we współrzędnych (\varphi,\dot{varphi}).

Energia potencjalna ma kształt sinusoidy. Dla niewielkich energii ruch jest oscylacyjny w przedziale [-\vartheta,\vartheta], dla dużych energii prędkość kątowa \dot{\varphi} nie zmienia znaku. Jest wreszcie energia graniczna pozwalająca dotrzeć koralikowi do punktu \varphi=\pi, tym przypadkiem zajmiemy się osobno, bo jest ciekawy. Zasadę zachowania energii możemy przekształcić do postaci

\dot{\varphi}^2+4\omega^2\sin^2{\dfrac{\varphi}{2}}=4\omega^2\sin^2{\dfrac{\varphi_m}{2}},

wprowadziliśmy tu oznaczenie \omega=\sqrt{g/L} – jest to zwykła częstość kołowa wahadła przy małych wychyleniach. Możemy to sprawdzić. Przy małych wychyleniach \varphi\approx\sin\varphi. Mamy więc

\dot{\varphi}^2=\omega^2(\varphi_m^2-\varphi^2), \mbox{(*)}

i przekształcając

{\displaystyle  \int\dfrac{d\varphi}{\sqrt{\varphi_m^2-\varphi^2}}=\omega t+C \;\; \Rightarrow \arcsin{\dfrac{\varphi}{\varphi_m}}=\omega t+C,}

otrzymujemy zatem znane rozwiązanie oscylacyjne \varphi=\varphi_m\sin (\omega t+C).

Ruch przy małych wychyleniach ma własność izochronizmu, którą zaobserwował według legendy młody Galileusz w katedrze w Pizie, gdy zamiast skupiać się na przesłaniu duchowym, obserwował kołyszący się kandelabr. Amplituda wahań malała z czasem, ale okres się nie zmieniał. Widzimy, że wniosek ten jest słuszny, póki wychylenia są niewielkie. Gdybyśmy chcieli zbudować wahadło ściśle izochroniczne, zamiast łuku okręgu należy wziąć łuk cykloidy, co odkrył Christiaan Huygens.

W dalszym ciągu przyjmiemy \omega=1, czyli okresem wahadła przy małych wychyleniach bedzie okres sinusa, jaki przyjmują matematycy, tzn. 2\pi. Przy dużych wychyleniach okres będzie większy. Wygląda to następująco.

Można uzyskać takie krzywe numerycznie (por. Dziewiąty wykład Feynmana: Co mówi druga zasada dynamiki?), można je także wyrazić przez funkcje eliptyczne, znane każdemu programowi matematycznemu, jak darmowy SageMath albo kosztowna i ciężka Mathematica). Euler nie znał takich krzywych, choć musiał zdawać sobie sprawę z ich jakościowego przebiegu.

Wracając do równania (*), wprowadzamy podstawienie Eulera: k\sin\psi=\sin\varphi/2, gdzie k=\sin\varphi_m/2. Ma ono taką zaletę, że \psi może rosnąć monotonicznie, podczas gdy \varphi oscyluje. Równanie przyjmuje postać:

\left(\dfrac{d\psi}{dt}\right)^2=1-k^2\sin^2\psi.

Okres ruchu wahadła jest cztery razy większy niż czas potrzebny na zmianę \psi od 0 do do \pi/2:

{\displaystyle T=4\int_{0}^{\frac{\pi}{2}}\dfrac{d \psi}{\sqrt{1-k^2\sin^2\psi}}\equiv 4 K(k)}.

Wprowadziliśmy standardowe oznaczenie: K(k) nazywa się całką eliptyczną zupełną pierwszego rodzaju. Euler zastosował do jej obliczenia rozwinięcie funkcji podcałkowej w szereg dwumianowy. Otrzymuje się wówczas rozwinięcie

{\displaystyle K(k)=\dfrac{\pi}{2}\sum_{m=0}^{\infty}\left[\dfrac{(2m-1)!!}{(2m)!!}\right]^2 k^{2m}. }

Podwójna silnia to iloczyn kolejnych liczb parzystych bądź nieparzystych aż do największej. Zapis jest współczesny. Po drodze potrzebna jest całka \int_{0}^{\pi/2} \sin^{2m}\psi d\psi, którą Euler oczywiście znał. Szereg ten jest zbieżny dla k<1, choć jego praktyczna przydatność ogranicza się do niezbyt wielkich amplitud. Okres wahadła jest więc w przybliżeniu równy

T=2\pi\sqrt{\dfrac{L}{g}}\left(1+\dfrac{1}{4}\sin^2{\dfrac{\vartheta}{2}}+\dfrac{9 }{64}\sin^4 {\dfrac{\vartheta}{2}}+\ldots\right).

Na wykresie mamy stosunek okresu wahadła przy danej amplitudzie do okresu dla niewielkich amplitud. Widzimy, skąd się wziął obserwowany izochronizm: trzeba mocno wychylić wahadło, żeby dostrzec wydłużenie okresu. Jednak przy amplitudach bliskich \pi=180^{\circ} wydłużenie staje się duże, całka K(k)\rightarrow \infty.

Zajmiemy się teraz przypadkiem, gdy amplituda \varphi_m=\pi-\alpha_m, gdzie \alpha_m\ll 1. Korzystamy tu z poglądowego podejścia z pracy E. Butikova, Oscillations of a simple pendulum with extremely large amplitudes. Asymptotyczna postać całki eliptycznej przy wartościach k bliskich 1 jest dobrze znana (por. np. F. Bowman, Introduction to elliptic functions with applications), ale podejście Butikova pozwala nam lepiej zrozumieć ruch przy dużych amplitudach.

Najpierw zajmijmy się ruchem wahadła dla przypadku \varphi_m=\pi. Mamy wtedy

\dot{\varphi}=\cos\dfrac{\phi}{2}.

Rozwiązanie, w którym \varphi(0)=0, jest postaci

\varphi=\pi-4\;\mbox{arctg }(e^{-\omega t}).

Na wykresie kąty wyrażone są w stopniach. Widzimy, że położenie \varphi=\pi=190^{\circ} koralik osiąga po nieskończenie długim ruchu. Większość tego ruchu odbywa się w okolicach t=0, gdzie wykres stromo się wznosi. Jednak takie przybliżenie nie wystarczy do tego, aby znaleźć skończony okres odpowiadający \alpha_m\ne 0. Możemy zastosować je aż do pewnego kąta 1 \gg\alpha_c>0 i drugi odcinek ruchu od \alpha_c do maksymalnego wychylenia \alpha_m obliczyć w przybliżeniu małych kątów. Najłatwiej o tym myśleć jako o czasie potrzebnym do tego, by koralik znajdujący się początkowo w punkcie \alpha_m ześliznął się do punktu \alpha_c. Przyjmujemy, że oba te punkty leżą blisko najwyższego punktu okręgu. II zasada dynamiki przybiera postać (kąt \alpha liczony jest od szczytu okręgu)

\ddot{\alpha}=\omega^2 \sin \alpha\approx \omega^2\alpha \;\Rightarrow \alpha=\alpha_m \cosh \omega t.

Stąd znajdujemy czas t_1 potrzebny na osiągnięcie punktu \alpha_c:

\omega t_1=\ln \dfrac{2\alpha_c}{\alpha_m}.

Korzystając z poprzedniego rozwiązania, znajdujemy czas t_2 potrzebny na dotarcie od \varphi=0 do \varphi=\pi-\alpha_c:

\omega t_2=\ln\dfrac{4}{\alpha_c}.

Ćwierć okresu wahadła to t_1+t_2, otrzymujemy więc

T=\dfrac{2}{\pi}T_0 \ln\dfrac{8}{\alpha_m},

gdzie T_0 jest okresem przy niewielkich wychyleniach. Z równań wypadło pośrednie położenie \alpha_c. Okres wahadła jest więc logarytmicznie rozbieżny gdy \alpha_m\rightarrow 0.

I tutaj Euler zawiódł. Wiedział, że graniczne rozwiązanie ma postać, której użyliśmy powyżej. Próbował obliczyć czas, pisząc równanie

{\displaystyle \int\dfrac{d\alpha}{2 \sqrt{ \sin^2\dfrac{\alpha}{2}-\sin^2\dfrac{\alpha_m}{2}}}=\omega t+C}

i rozwijając je w szereg, a następnie sumując ten szereg. Niestety, jego wyrażenie asymptotyczne okazało się błędne. W czasach Eulera nie przywiązywano nadmiernej wagi do zbieżności szeregów, prawdopodobnie w tym tkwi problem. Bo rachunki wydają się prawidłowe.

Flaszki Kleista i butelki lejdejskie: elektryczny szok uczonej Europy (1745-1746)

Ważne odkrycia niemal zawsze są niespodziewane, bywają także niebezpieczne, gdyż odkrywcy zwykle są w roli ucznia czarnoksiężnika, rozpętując moce, nad którymi nie potrafią zapanować. Odkrycie butelki lejdejskiej stanowiło przełom w badaniach elektryczności. Do tej pory była ona jedynie źródłem interesujących i zabawnych pokazów. Elektron znaczy po grecku bursztyn, i to bursztyn był pierwszą substancją używaną do wywołania zjawisk przyciągania i odpychania lekkich drobnych przedmiotów w rodzaju skrawków papieru. Zauważono, że także inne materiały, jak siarka albo szkło, elektryzują się przez tarcie. Znane było doświadczenie Graya, pokazujące, że elektryczność może być przekazywana także przez ciało ludzkie.

0154.P.2.1612.1032

Stephen Gray, farbiarz, astronom i okazjonalnie demonstrator eksperymentów w Towarzystwie Królewskim, został pod koniec życia pensjonariuszem Charterhouse, czegoś w rodzaju szpitala z domem starców dla gentlemanów (pojęcie w Anglii bardzo rozciągliwe) połączonego z sierocińcem i szkołą. Do eksperymentów używał czterdziestosiedmiofuntowego chłopca zawieszonego na jedwabnych izolujących pasach. Na rysunku widzimy jeden z wariantów takiego doświadczenia. Osoba B obraca tu za pomocą przekładni szklaną kulę C, która jest pocierana ręką osoby D. Zawieszony w powietrzu chłopiec stopami dotyka kuli, podając rękę dziewczynce G (stojącej na izolacyjnej podkładce z żywicy albo smoły). Jej ręka przyciąga skrawki złotej folii leżące na gerydonie H. Na drugim rysunku mamy naelektryzowaną szklaną rurkę TT, która za pomocą brązowego drutu B połączona jest z dzwonkiem A. Młoteczek C zawieszony jest na jedwabnym sznurze i jest na przemian przyciągany oraz odpychany przez A, w rezultacie oscyluje między dzwonkami A i E, wywołując ich dzwonienie.

Georg Matthias Bose, profesor filozofii naturalnej z Wittenbergi i autor marnych francuskich wierszy, w swych eksperymentach przejawiał iście germańskie poczucie humoru. Jeden z nich, znany jako Venus electrificata, polegał na tym, by naelektryzować damę stojącą na izolowanej podkładce. Gdy następnie jakiś kawaler próbował ją pocałować, rażony był iskrą wybiegającą z warg wybranki. Innym jego popisowym doświadczeniem była „beatyfikacja”: delikwent wkładał na głowę specjalną koronę, która po naelektryzowaniu świeciła. Mimo tak bezceremonialnego podejścia do aureoli i świętości starał się Bose o uznanie wszędzie, nawet w Turcji i u Ojca Świętego Benedykta XIV. To ostatnie ściągnęło na niego represje na macierzystej uczelni, kolebce luteranizmu, spór musiał zażegnywać król Fryderyk.

bub_gb_FSJWAAAAcAAJ-xx

Jesienią 1745 roku eksperymentami elektrycznymi zajął się dziekan luterańskiej kapituły katedralnej w Kamieniu Pomorskim, Ewald Georg von Kleist. Dwadzieścia lat wcześniej studiował on w Lipsku i w Lejdzie i mógł się już wtedy zetknąć z elektrycznością, choć bezpośredniej inspiracji dostarczyły mu stosunkowo niedawne eksperymenty Bosego, m.in. uzyskiwanie iskry z wody oraz zapalanie spirytusu za pomocą elektryczności. Wyobrażano sobie wówczas elektryczność jako jakiś pewien rodzaj rodzaj subtelnej materii jakoś spowinowaconej z ogniem, mówiono nawet o ogniu elektrycznym. Eksperymenty z czerpaniem ognia z wody bądź zamianą iskry elektrycznej na rzeczywisty płomień zdawały się potwierdzać bliski związek obu tych tajemniczych substancji. Kleist pragnął naelektryzować wodę i udało mu się to w następujący sposób: butelkę napełniał częściowo wodą, rtęcią albo spirytusem, następnie zatykał korkiem, przez który przechodził drut albo gwóźdź. Jeśli trzymało się ten wynalazek w ręku, podczas gdy gwóźdź podłączony był do machiny elektrostatycznej, można było go bardzo mocno naelektryzować. Kolba średnicy czterech cali po naelektryzowaniu potrafiła powalić chłopca w wieku ośmiu bądź dziewięciu lat, jak starannie odnotował dobry dziekan (nie podając wszakże wagi chłopca). Po raz pierwszy wytworzona przez człowieka elektryczność przestała być niewinną salonową zabawą. Jak pisał Kleist, każdemu odechciałoby się całowania tak naelektryzowanej Wenus.

flasche-xx

Rysunek von Kleista z listu do Pawła Świetlickiego, diakona luterańskiego kościoła św. Jana w Gdańsku, przedstawiający jego urządzenie (z listu tego korzystał D. Gralath)

Odkrycie von Kleista było przypadkowe: nie rozumiał on, dlaczego musi trzymać swoje urządzenie w ręku, aby działało. Chcąc nagromadzić dużą ilość elektrycznego ognia, należałoby raczej izolować naczynie zamiast trzymać je w ręku i w ten sposób uziemiać. Dziś wiemy, że flaszka Kleista, jak nazywano ją czasem w Niemczech, była po prostu kondensatorem: ręka i woda z gwoździem stanowiły jego dwie okładki rozdzielone szkłem. Z punktu widzenia ówczesnej wiedzy działanie tego urządzenia było jednak niezrozumiałe. Spośród kilku uczonych, którzy otrzymali listowne doniesienia Kleista, eksperyment zdołał powtórzyć chyba tylko Daniel Gralath (a właściwie jego pomocnik Gottfried Reyger) w Gdańsku. Niedługo później, już w roku 1746, podobne doświadczenie przeprowadzono niezależnie w Lejdzie. Także i tu pierwszym odkrywcą był naukowy amator, Andreas Cunaeus, prawnik, zabawiający się eksperymentami w pracowni miejscowego profesora Pietera van Musshenbroeka. Przypadkowo zauważył on to samo co Kleist, jego eksperyment powtórzył później pomocnik profesora, Jean Nicolas Allamand, a na koniec i sam Musshenbroek, który był nim tak mocno wstrząśnięty, że, jak wyznał swemu paryskiemu koledze, nawet za całe królestwo Francji nie chciałby tego przeżyć po raz drugi.

leiden exp-x

Strach niebawem minął i elektrowstrząsy za pomocą butelek lejdejskich zaczęli wytwarzać wszyscy eksperymentatorzy, choć przez pewien czas do dobrego tonu należało informować o przypadkach konwulsji, paraliżu, zawrotów głowy itp. Żona profesora z Lipska, Johanna Heinricha Wincklera, po dwóch wyładowaniach poczuła się tak słabo, że ledwie mogła mówić. Tydzień później mąż zaaplikował jej jeszcze jedno wyładowanie, po którym krew się jej puściła z nosa. Profesor Winckler humanitarnie wstrzymał się jednak od przeprowadzania eksperymentów na ptakach, nie chcąc zadawać owym stworzeniom niepotrzebnych cierpień. Abbé Jean Antoine Nollet, mistrz pokazów fizycznych, utrzymujący się z produkcji naukowych urządzeń dla bogatych klientów, takich jak np. Voltaire i pani du Châtelet, zaprezentował w obecności króla Ludwika XV żywy łańcuch 180 grenadierów, poprzez który rozładowywała się butelka lejdejska. Wszyscy oni jednocześnie podskakiwali, co tak bardzo podobało się suwerenowi, że kazał sobie ten eksperyment powtarzać.

Henry Cavendish: serce jak lód, głowa i ręce wirtuoza (1797-1798)

Zdarzają się ludzie, którzy nie przepadają za bliskością innych. Nie wiadomo, co z takimi zrobić – nie dają się wciągnąć do rozrywek i zabaw ludzkiego stada, unikają nawet miłości, nie mówiąc już o różnych grach społecznych w rodzaju: „popatrz, ile posiadam”, „popatrz, jaki jestem ważny i zewsząd okazały” itd. Piękny obraz takiego człowieka dał Claude Sautet w filmie Serce jak lód. Być może wzorował się do jakiegoś stopnia na postaci Maurice’a Ravela, któremu różni „badacze owadzich nogów” do dziś nie potrafili przekonująco przypisać żadnego życia uczuciowego.

„Nasze praktyczne, realne życie jest, mianowicie, nudne i mdłe, o ile nie targają nim namiętności, jeśli zaś one wkraczają, staje się niebawem bolesne; szczęśliwi są zatem ci tylko, którym przypada w udziale jakaś nadwyżka intelektu ponad tę miarę, jakiej wymaga służenie woli. W ten sposób bowiem wiodą prócz życia realnego ponadto jeszcze życie intelektualne, które bez bólu daje im stale ciekawe zajęcie i rozrywkę”. To oczywiście Arthur Schopenhauer, wielki filozof i nie mniejszy mizantrop (Aforyzmy o mądrości życia, przeł. J. Garewicz).

Uczeni powinni służyć ludzkości, pomnażać wiedzę ku powszechnemu zadowoleniu oraz własnej sławie – w końcu na jaką inną nieśmiertelność może liczyć człowiek rozumny? Co jednak myśleć o kimś, kto wyrzeka się zwyczajnego życia, nie szuka bliskości, więzów uczuciowych, nie dąży nawet do sławy? Henry Cavendish, najstarszy syn lorda Charlesa Cavendisha, starał się w życiu nie zajmować niczym oprócz nauki eksperymentalnej. Zainteresowania naukowe, podobnie jak majątek i członkostwo w Towarzystwie Królewskim odziedziczył po ojcu. Charles był tylko pełnym zapału amatorem, Henry natomiast okazał się uczonym wyjątkowo utalentowanym i pomysłowym. Nieśmiałość, a może słabe rozeznanie w wartości własnych prac, sprawiły, że nie opublikował wszystkich swoich dokonań. W 1772 roku zmierzył siły oddziaływania między ładunkami. Kilkanaście lat później podobne doświadczenia przeprowadził Charles Augustin Coulomb. Ponieważ tylko Coulomb ogłosił swoje wyniki, ładunek mierzymy dziś w kulombach, a nie w kawendiszach.

Cavendish_Henry_signature

Matka odumarła go bardzo wcześnie, unikał potem kobiet, krępowała go nawet ich obecność. Większą część życia spędził przy ojcu, żyjąc dość skromnie jak na syna lorda. Gdy ojciec umarł, a Henry był już po pięćdziesiątce, nic się nie zmieniło, oprócz tego, że teraz to on musiał decydować o wszystkim. Ubierał się zawsze skromnie i wedle mody sprzed dwóch pokoleń. Rzadko przyjmował gości i podejmował ich zawsze tym samym: podawano udziec barani i nic ponadto. Sam bywał tylko na spotkaniach uczonych z Towarzystwa Królewskiego, a w poniedziałki przez piętnaście lat jadał kolację w innym, nieformalnym zgromadzeniu uczonych, zwanym Monday Club. Nie znaczy to, że rozmawiał tam z kolegami. Odzywał się rzadko i mało, choć zwykle z sensem i precyzyjnie. Wystąpienia takie sprawiały mu widoczną trudność: peszył się, mamrotał. Miał przy tym piskliwy głos, co jeszcze bardziej wzmagało jego nieśmiałość. Nie mógł znieść pochwał i uciekał, gdy ktoś próbował zawrzeć z nim znajomość, zaczynając od komplementów i pochlebstw.

Charakter Cavendisha sprawiał kłopot biografom. Nie miał poglądów politycznych. Wolny był od snobizmu rodowego, podpisywał się samym imieniem i nazwiskiem, choć obaj jego dziadkowie byli książętami, a ród należał do najstarszych w kraju. Nie wyznawał żadnej religii. Doświadczenia prowadził nawet w niedziele – dzień czczony w Anglii jako święty przez wszystkie bodaj konkurujące tam ze sobą wyznania chrześcijańskie. Gdy umierał, wolał być sam, odesłał nawet lokaja. Nie wezwał też żadnego duchownego. Za życia nie interesował się zbytnio swoim majątkiem, głównym problemem było raczej znalezienie uczciwego stewarda, który miał nim zarządzać. A było czym: zostawił po sobie 700 000 funtów (ówczesny funt to 100-10 000 dzisiejszych funtów, zależnie od sposobu liczenia). Słabo orientował się w wartości pieniądza. Gdy proszono go, aby jakoś pomógł człowiekowi w finansowych tarapatach, zapytał, co mógłby zrobić. Gdy zasugerowano jakieś niewielkie wsparcie finansowe, Cavendish spytał, czy może to być czek na 10 000 funtów. Chodziło o Niemca, Heidingera, który zaczął prowadzić bibliotekę Cavendisha (dostępną na równych prawach także innym uczonym, właściciel wypisywał skrupulatnie rewersy, gdy coś wypożyczał). Ogólnie biorąc, Cavendish nie budził wszakże sympatii, nawet gdy wspierał potrzebujących. Mówiono, że jest suchy, pedantyczny, niewrażliwy na piękno, patrzący na krajobraz okiem geodety. Nie było w nim nic sentymentalnego, romantycznego ani też rycerskiego, o ile nie liczyć epizodu, kiedy to na przechadzce przyszedł z pomocą jakiejś kobiecie zaatakowanej przez rozwścieczoną krowę.

Jego praca naukowa była bezsprzecznie najwyższej próby. Towarzystwo Królewskie było swoistą kuźnią demokracji: na równych prawach współpracowali tam arystokrata Cavendish, syn cieśli okrętowego James Watt i syn rzemieślnika zajmującego się wykańczaniem tkanin Joseph Priestley (może zresztą dlatego, że społeczeństwo angielskie najwcześniej zarzuciło feudalne myślenie, nie doszło tam do rewolucji w rodzaju francuskiej). Cavendish, Priestley i Watt prowadzili niemal równocześnie ważne doświadczenia na temat powstawania wody z wodoru i tlenu. Watt rozniecił nawet spór o pierwszeństwo odkrycia, jak się zdaje, Cavendish zbytnio się tą kwestią nie przejmował. Sytuację wyjaśnił zresztą Francuz, Antoine Lavosier, który dowiódł, że wodę można rozłożyć na składowe pierwiastki – nie jest więc ona substancją prostą i nieredukowalną (Cavendish traktował ten proces powstawania w ramach koncepcji flogistonu, skazanej już wtedy na naukową śmierć).

Cavendish stwierdził też, że gdy pięć części zdeflogisotonowanego powietrza (czyli tlenu) zmieszać z trzema częściami zwykłego powietrza i przymusić do reakcji za pomocą wyładowań elektrycznych, niemal całe powietrze znika (tworzy się kwas azotawy). Zostawała jednak część: „nie więcej niż 1/120”, która nie zamieniała się w kwas. Precyzja Cavendisha okazała się tu niezwykle ważna: pod koniec XIX wieku zainteresował się tymi wynikami William Ramsay, a także lord Rayleigh, o którym pisaliśmy – niereagująca część okazała się nowym, chemicznie obojętnym gazem, który nazwano argon.

Najważniejsze okazały się chyba doświadczenia Cavendisha, pozwalające wyznaczyć średnią gęstość naszej planety. Wedle jego pomiarów gęstość Ziemi równa jest 5,45 g/cm3 – błąd wyniósł jedynie 1%. Chodziło o zmierzenie przyciągania grawitacyjnego w warunkach laboratoryjnych.

Teoria powszechnego ciążenia Newtona była śmiałym uogólnieniem danych astronomicznych. Postulowała, że ta sama siła, którą na Ziemi nazywamy ciężarem, działa także we wszechświecie. Była trudna do przyjęcia m.in. dlatego, że przecież nie obserwujemy, aby dwie masy się przyciągały – siły te są zbyt małe. Próbowano je wprawdzie w XVIII wieku szacować badając przyciąganie dużych mas skalnych. W ich pobliżu zawieszony ciężarek (tzw. pion) powinien odchylać się od kierunku pionowego w sensie geometrycznym (czyli przedłużenia promienia Ziemi w punkcie obserwacji). Jak można to stwierdzić? Można wykonać pomiary astronomiczne wysokości (kątowej) tych samych gwiazd z dwóch miejsc: na południe i na północ od jakiejś góry. Kwadrant służący do pomiaru wysokości nad horyzontem ustawiamy korzystając z pionu. Ponieważ kierunki pionu w obu miejscach powinny się różnić, różnić się też będą nasze wyniki. Pierwszy raz pomiary takie wykonali Bouguer i La Condamine podczas wyprawy do Peru w celu zmierzenia kształtu Ziemi (pisałem o tym zagadnieniu: niemal cały rozgłos przypadł Maupertuis, który wcześniej przedstawił wyniki). Metoda taka miała jednak tę wadę, że trudno porządnie obliczyć masę jakiejkolwiek góry.

Od sierpnia 1797 do maja następnego roku przeprowadził Cavendish serię pomiarów siły grawitacji. Idea pochodziła od wielebnego Johna Michella, który planował takie doświadczenie, ale nie zdążył go wykonać przed śmiercią. Jego przyrządy trafiły do wielebnego Francisa Johna Hyde’a Wollastone’a, profesora w Cambridge, który nie miał warunków do przeprowadzenia eksperymentu, przekazał więc urządzenia Cavendishowi. W rzeczywistości Cavendish bardzo udoskonalił różne szczegóły i tylko dzięki temu osiągnął sukces. Główną częścią aparatury był drążek z parą ołowianych kul o średnicy 5 cm; drążek zawieszony był na cienkim drucie. Układ taki, gdy obrócić nieco drążek, wykonywał powolne drgania skrętne. Wyznaczając okres drgań, można było określić czułość tego układu na parę sił skręcających. Jeśli następnie zbliżyć do tej wagi skręceń inną parę dużych kul ołowianych (każda o masie 158 kg), położenie równowagi układu nieco się przesuwa. Cavendish mierzył odchylenia układu z drugiego pokoju za pomocą dwóch lunet. Chodziło o to, że układ pomiarowy był niezwykle czuły na wszelkie zakłócenia w rodzaju zmian temperatury, prądów powietrza czy drgań podłoża i dlatego, lepiej było, gdy był odizolowany od zewnętrznych wpływów. Uczony wyznaczał położenie równowagi obserwując starannie wahania układu i wyznaczając maksymalne wychylenia.

07861996_0062

Waga skręceń: lg – drut, hh – zawieszenie małych kul, L – lunety do obserwacji ruchu układu..

07861996_0063

Widok z góry: ww oraz w’w’ – duże kule obracające nieco położenie równowagi wagi skręceń.

To piękne i precyzyjne doświadczenie wyraża też chyba w jakimś stopniu osobowość Henry’go Cavendisha: ta ustawiana z delikatnością i uwagą aparatura, drgania w pustym pokoju, idealny obserwator na zewnątrz, dostrzegający wszystko, kontrolujący wszystko: pierwszy człowiek, który zobaczył na własne oczy, jak przyciągają się masy.

D.A. Henderson, synek Franklina i racjonalność decyzji o szczepieniu

W roku 2016 zmarł D.A. Henderson, epidemiolog, który walnie przyczynił się do zlikwidowania ospy na świecie. Był to wynik wieloletniej planowej pracy zespołu ludzi, którymi kierował najpierw w amerykańskiej CDC, a później w WHO. Fachowcy mówią, że to największy wymierny sukces w historii medycyny. Dramatem naszego świata jest fakt, że ludzie tacy jak on są niezbyt znani w przeciwieństwie do różnej maści celebrytów, skandalistów i kokainistów płci obojga.  OB-Henderson__13981471621450

Pisałem o epidemii w roku 1721 w Bostonie i tragicznym losie małego synka Benjamina Franklina. Stosując rachunek prawdopodobieństwa, nietrudno uzasadnić racjonalność decyzji o szczepieniu nawet przy niepełnych danych z XVIII wieku. Musimy pamiętać, że ówczesne szczepienie, tzw. inokulacja albo wariolizacja, różniły się od późniejszej metody. Zaszczepiano bowiem ludziom ospę ludzką, co w niektórych przypadkach kończyło się śmiercią. Dopiero pod koniec stulecia Edward Jenner odkrył, że bezpieczniejsze jest zaszczepianie ludziom ospy krowiej.

Zazwyczaj w podręcznikach matematyki mamy do czynienia z urnami, z których wyciąga się kule i w zależności od tego, co wyciągniemy, pojawiają się różne możliwości i budujemy drzewo rozmaitych ewentualności. Szczepienia są przykładem lepiej chyba przemawiającym do wyobraźni niż losowania białych i czarnych kul z urny.

Oto dane dla epidemii w Bostonie w roku 1721.

  • Liczba ludności miasta: 10 700
  • Poddanych inokulacji 281, z czego 6 zmarło
  • Spośród niepoddanych inokulacji 4917 zachorowało i przeżyło, 842 osoby zachorowały i zmarły, a 4654 osoby w ogóle nie zachorowały

Będziemy prawdopodobieństwa przybliżać częstościami, zazwyczaj nie mamy na to lepszego sposobu, należy pamiętać, że dane pochodzące z niewielkiej próby mogą się okazać niedokładne i dysponując większą statystyką, otrzymalibyśmy nieco inne wyniki. Mamy więc prawdopodobieństwo zgonu po inokulacji równe 6/281=0,021 i przeżycia inokulacji 1-0,021=0,979.

Prawdopodobieństwo zgonu wśród niepoddanych inokulacji oraz zarażonych jest równe 842/(842+4917)=0,146, a prawdopodobieństwo przeżycia w tej samej grupie równa się 1-0,146=0,854.

Prawdopodobieństwo zarażenia osoby niepoddanej inokulacji możemy próbować oszacować na podstawie naszych danych jako (4917+842)/(4654+4917+842)=0,553. Jest to szacowanie z dołu: musimy pamiętać, że część spośród 4654 osób, które nie zachorowały, przeszła już kiedyś ospę i była uodporniona na resztę życia. Jeśli prawdopodobieństwo zarażenia osoby, która nie przeszła ospy, oznaczymy przez x, mamy następujące drzewo możliwości.

qc23465.f1

Rysunek z pracy M Best, A Katamba, and D Neuhauser, Making the right decision: Benjamin Franklin’s son dies of smallpox in 1736.

Jeśli przyjmiemy x=0,553, to prawdopodobieństwo przeżycia bez inokulacji będzie równe (1-x)+x cdot 0,854=0,919. Jak widać, wartość ta jest mniejsza od prawdopodobieństwa przeżycia inokulacji, zatem statystycznie biorąc, zabieg ten zwiększa szanse przeżycia. Gdybyśmy mieli więcej informacji, wartość x mogłaby się okazać jeszcze większa, a to by oznaczało, że prawdopodobieństwo przeżycia bez inokulacji jest jeszcze mniejsze (można zapisać to prawdopodobieństwo jako 1-x+0,854x=1-0,146x, jest to więc malejąca funkcja zmiennej x).

Można też się zastanowić, jaka musi być najmniejsza wartość x, żeby inokulacja była racjonalnym zabiegiem. Granicą racjonalności będą równe prawdopodobieństwa zgonu: xcdot 0,146=0,021, skąd x> 0,144. Ponieważ dane wskazują, że prawie na pewno ostatni warunek jest spełniony, inokulacja jest racjonalnym zabiegiem.

Nie mamy, niestety, danych dla epidemii w 1736 roku w Filadelfii, gdzie mieszkał Benjamin Franklin z rodziną. Mamy jednak dane dla późniejszej epidemii w Bostonie w roku 1752.

  • Boston liczył wówczas 15 684 mieszkańców
  • 5998 osób przeszło już ospę i nie musiało się jej obawiać
  • 2124 osoby poddały się inokulacji (znacznie więcej niż w roku 1721), 30 z nich zmarło
  • 1843 osoby uciekły na wieś, by przeczekać epidemię, nie wiemy, jak wiele spośród nich zmarło.
  • 5719 osób nie poddało się inokulacji ani nie uciekło; 97% spośród nich zachorowało, a 539 zmarło

Prawdopodobieństwo zgonu po inokulacji równe jest 30/2124=0,014; prawdopodobieństwo przeżycia: 0,986. Wartości zbliżone są do tego, co otrzymaliśmy wyżej dla roku 1721.

Wśród niezaszczepionych i narażonych na zachorowanie śmiertelność była równa 539/(0,97cdot 5719)=0,097, prawdopodobieństwo przeżycia choroby równało się 1-0,097=0,903. Oznaczało to, że nie robiąc nic, ma się prawdopodobieństwo przeżycia 0,03+0,97cdot 0,903=0,906. Należy porównywać to z wartością 0,986 dla zaszczepionych. Inokulacja była więc znacznie lepszą decyzją.

Statystyka z roku 1752 obejmuje jeszcze możliwość ucieczki z miasta. Była to najprostsza metoda unikania chorób epidemicznych i kogo było na nią stać, ten ją stosował. Nie znamy prawdopodobieństwa zachorowania wśród tych, co uciekli. Oznaczmy je przez y. Mamy więc następujące drzewo możliwości.

qc23465.f2

(Rysunek z pracy jw.)

Można zadać pytanie, jakie powinno być y, aby ucieczka była lepszym wyjściem niż pozostanie w Bostonie i poddanie się inokulacji. Prawdopodobieństwo zgonu osoby uciekającej to 0,097y, należy je porównać z prawdopodobieństwem zgonu po inokulacji, równym 0,014. A zatem, jeśli y< 0,144, to ucieczka jest racjonalna. Trudno jest oczywiście oszacować wartość y, zależy ona np. od tego, czy uciekniemy, zanim jeszcze epidemia się rozwinie, czy w jej późniejszej fazie (choroba ma pewien okres inkubacji, możemy więc wyjeżdżając czuć się dobrze mimo zarażenia). W dodatku uciekając, nadal nie mamy odporności na ospę, a w Bostonie w ciągu osiemnastego wieku większe epidemie wystąpiły w latach 1721, 1730, 1752, 1764, 1776, 1778 oraz 1792. Można się było spodziewać, że za kilkanaście lat choroba znów się pojawi.

Zabdiel Boylston, czarna ospa w Bostonie i siła charakteru (1721-1722)

W XX wieku czarna ospa zabiła 300 mln. ludzi – trzy razy więcej niż zginęło w obu wojnach światowych. I w tym samym XX wieku udało się tę chorobę wyeliminować. Można, oczywiście, buntować się przeciwko nowoczesnej cywilizacji, ale żadna z tych 300 mln osób nie zrozumiałaby, o co nam właściwie chodzi. Nie ma jednak szczepionki przeciwko głupocie i w naszych światłych czasach dzieci chorują albo będą chorować na rozmaite groźne przypadłości jedynie dlatego, że ich rodzice albo rodzice ich kolegów są podejrzliwymi idiotami, którzy sądzą, że wiedzą lepiej niż eksperci.

W XVIII wieku nie znano przyczyn ani mechanizmu szerzenia się ospy, jasne było tylko, że jest to choroba zakaźna. Ponieważ objawy występują dopiero po 12 dniach, więc izolacja chorych była na ogół spóźniona i zdążyli oni już zarazić osoby, z którymi się stykali. Wiadomo też było z obserwacji, że ci, którzy przeszli chorobę i przeżyli, byli na nią później odporni. Ryzyko było tak duże, że w Anglii w XVII wieku był zwyczaj, by nie zapisywać majątku dzieciom, zanim nie przeszły ospy, ponieważ ich przyszłość była wciąż bardzo niepewna. Spośród tych, co przeżyli, wielu było oślepionych albo oszpeconych na całe życie. Jedną z takich osób, których urodę zniszczyła ospa, była Mary Wortley Montagu, arystokratka, pisarka (sama nauczyła się łaciny w ojcowskiej bibliotece) i żona ambasadora brytyjskiego w Konstantynopolu. Dowiedziała się ona o praktyce wariolizacji stosowanej w imperium osmańskim: pobierano płyn z pęcherzyków na skórze chorego i zaszczepiano go osobom zdrowym. Pacjenci chorowali wówczas na ogół w sposób łagodny, nabywając przy tym odporności. Nie zawsze wariolizacja przynosiła pożądane efekty, zdarzały się przy jej stosowaniu wypadki śmiertelne. Montagu propagowała tę metodę w Londynie, przekonując m.in. księżnę Walii Karolinę do zaszczepienia dzieci. Metoda była kontrowersyjna. Wyglądała na jakiś rodzaj zabobonu, w dodatku przychodziła do Europy z krajów niecieszących się zaufaniem w sprawach medycznych i naukowych: stosowano ją na Kaukazie, w Afryce. W Konstantynopolu szczepieniami zajmowały się zwykle stare kobiety, co też nie wyglądało wiarygodnie w oczach Zachodu. Z punktu widzenia dzisiejszej wiedzy wariolizacja stanowiła postęp, lecz była obarczona ryzykiem. Dopiero pod koniec XVIII wieku Edward Jenner wynalazł skuteczną odmianę tej metody szczepienia: należy zaszczepiać ospę krowią, pacjenci wówczas nie chorują i nabierają odporności na ospę ludzką. Także i wtedy nie rozumiano, dlaczego szczepienie jest skuteczne i jak działa, opierano się wyłącznie na obserwacjach.

W kwietniu 1721 roku do Bostonu, stolicy Massachusetts, zawinął okręt „Seahorse”, płynący z Barbadosu. Jeden z członków załogi zachorował na ospę i został odizolowany w domu z czerwoną ostrzegawczą flagą. Później zachorowali także inni marynarze z tej jednostki i stało się jasne, że kwarantanna nie wystarczy, ponieważ choroba zdążyła się już rozprzestrzenić. Ówczesny Boston był małym miastem, liczącym sobie około jedenastu tysięcy mieszkańców. Rządy duchowe sprawowała w nim dynastia purytańskich ministrów: wiekowy Increase Mather i jego dobiegający sześćdziesiątki syn, Cotton Mather. Obaj zapisali się poprzednio w annałach ścigania czarownic i czarowników: to za ich aprobatą toczyła się sprawa w Salem w roku 1692. Wszechstronnie wykształcony w Ameryce i w Anglii, Cotton Mather, członek Towarzystwa Królewskiego, był zarazem ciasnym bigotem, głęboko wierzącym w realność i szkodliwość czarów. W swym dziele Pamiętne zrządzenia opatrzności opisywał przypadek irlandzkiej praczki, niejakiej Glover, która jako czarownica nękała pobożną rodzinę Goodwinów, którzy podczas owych diabelskich ataków głuchli, niemieli, ślepli albo wszystko to na raz. Mather przyczynił się do prześladowań w Salem, choć zarazem podkreślał potrzebę niezbitych dowodów w każdym przypadku. Teraz, wobec zagrożenia ospą, także starał się interweniować i tym razem jego wpływ okazał się jednoznacznie korzystny. Mather przekonany był bowiem do wariolizacji: czytał o niej wcześniej w „Transactions of the Royal Society”, miał też w domu niewolnika z Afryki, który mu opowiadał o tej metodzie. Minister skierował do lekarzy bostońskich pismo przedstawiające zalety wariolizacji. Medycy zareagowali wrogo, obawiając się, że wskutek wariolizacji epidemia jeszcze bardziej się rozszerzy. Wrogo też reagowali niektórzy duchowni. Ich zdaniem człowiek nie powinien ingerować w naznaczony przez Boga bieg wypadków. Znaleziono nawet pierwowzór wariolizacji w Księdze Hioba: „Odszedł szatan sprzed oblicza Pańskiego i obsypał Hioba trądem złośliwym, od palca stopy aż do wierzchu głowy. [Hiob] wziął więc skorupę, by się nią drapać siedząc na gnoju” (Hi 2, 7-8). A więc także Pismo św. wskazywało więc wyraźnie, że nie należy nikogo szczepić. Pismo św, jak zawsze, wskazuje we wszystkich kierunkach jednocześnie.

Jedynie chirurg Zabdiel Boylston gotów był spróbować wariolizacji. Nie miał on wykształcenia akademickiego, uczył się medycyny od swego ojca i innego jeszcze lekarza, w Ameryce nie było zresztą żadnej szkoły medycznej. Boylston dał się poznać jako sprawny chirurg, który nie obawiał się przeprowadzać ryzykownych operacji, jak usuwanie kamieni żółciowych czy pierwsza mastektomia w Ameryce. Operacje przeprowadzało się bez znieczulenia, należało wszystko robić błyskawicznie, żeby pacjent nie zmarł wskutek szoku i upływu krwi. Później groziły mu oczywiście wszelkie infekcje, Boylston był ponoć pedantycznie czysty i zapewne pomagało to jego pacjentom (nikt wówczas nie kojarzył chirurgii z czystością). Pierwsze szczepienia ospy przeprowadził na własnym synu oraz parze swych niewolników: ojcu i synu. Wszyscy trzej przeżyli. Boylston zaczął więc stosować tę metodę, choć przyjmowano to wrogo i lekarz obawiał się o swe bezpieczeństwo. W pewnym momencie rada miejska oficjalnie zakazała mu tych praktyk. Nie ujął się też za nim Mather, nie do końca chyba przekonany do wariolizacji (nie zaszczepił np. własnego syna). Ostatecznie Boylston przeprowadzał szczepienia na niezbyt dużą skalę, tylko u pacjentów, którzy sami się z tym do niego zwracali. Był także ostro krytykowany w miejscowej prasie. W tygodniowej gazecie wydawanej przez Jamesa Franklina (terminował u niego wtedy młodszy brat, Benjamin, który z czasem miał zostać najsławniejszym uczonym Ameryki) szczepienia atakowano jako szkodliwy przesąd. W pewnym stopniu postawa gazety wynikała z jej opozycyjności: James Franklin był przeciwny rządom Mathera i atmosferze moralnego terroru wprowadzanej przez purytanów, nietrudno więc było go przekonać, że duchowny także i tym razem broni jakichś przesądów. Ostatecznie w ciągu niecałego roku zachorowało w Bostonie około 6000 osób – ponad połowa ludności (około tysiąca bogatszych wyjechało na wieś i tam przeczekali epidemię). Zmarły w tym czasie na ospę 844 osoby, czyli 14% zainfekowanych. Za Boylstonem przemawiały liczby: spośród 286 osób, jakie zaszczepił, zmarło jedynie sześć. W dodatku nie zawsze było jasne, czy osoby te były zdrowe w momencie wariolizacji, być może choroba już się u nich rozwijała, lecz nie dawała jeszcze widocznych objawów. Tak czy inaczej było to tylko 2,4% – statystycznie biorąc, wariolizacja działała.

smallpox account-x

Doświadczenia swe Boylston opisał w książce, przyjęto go też do Towarzystwa Królewskiego. Wariolizację zaczęto, choć z oporami, uznawać. Nabrał do niej przekonania także Benjamin Franklin, choć obawiał się związanego z nią ryzyka. Pisze w swej autobiografii:

W roku 1736 straciłem jednego z mych synów, pięknego czteroletniego chłopca. Umarł na ospę, którą się w zwykły sposób zaraził. Długo i gorzko żałowałem potem i nadal żałuję, że nie kazałem go szczepić. Wspominam o tym ku przestrodze rodziców, którzy nie szczepią swych dzieci z obawy, że mogłyby wskutek tego umrzeć, czego nigdy nie mogliby sobie wybaczyć. Mój przykład świadczy, że żałować trzeba nieraz i w przeciwnym wypadku, a wobec tego lepiej wybierać drogę bezpieczniejszą. (przeł. J. Stawiński)

Czemu rozkład Gaussa jest ,,normalny”? De Moivre, wzór Stirlinga i Laplace

Skąd się bierze wszechobecność rozkładu Gaussa? Jednym z powodów jest rozkład dwumianowy. Rozpatrzmy prościutki model. Przyjmijmy, że wzrost dorosłego mężczyzny warunkowany jest czterdziestoma genami w taki sposób, że każdy z nich może zwiększyć wzrost o 2 cm ponad pewne minimum albo nie zwiększyć. Zygota, z której powstaliśmy, wylosowała 40 genów i każdy z nich z prawdopodobieństwem p=\frac{1}{2} mógł dodać nam 2 cm wzrostu. Jeśli za minimum fizjologiczne uznamy 140 cm, to możliwy jest każdy wynik z przedziału (140, 220). Oczywiście, nie należy traktować tego przykładu dosłownie. Matematycznie oznaczałoby to 40 niezależnych losowań z prawdopodobieństwem sukcesu p. Rozkład liczby sukcesów wygląda wówczas następująco:

Dyskretny rozkład dwumianowy został tu przedstawiony z przybliżającym go rozkładem Gaussa. Naszym celem będzie zrozumienie, czemu takie przybliżenie działa, gdy mamy do czynienia z dużą liczbą prób.

Zacznijmy od samego rozkładu dwumianowego. Dla dwóch prób sytuacja wygląda tak (p – prawdopodobieństwo sukcesu, q=1-p – prawdopodobieństwo porażki):

Każda droga z lewa na prawo oznacza konkretny wynik. Wzdłuż drogi prawdopodobieństwa się mnożą, ponieważ są to niezależne próby (definicja zdarzeń niezależnych). Zeru sukcesów odpowiada prawdopodobieństwo q^2, dwóm sukcesom p^2. Jeden sukces możemy osiągnąć na dwa sposoby: sukces-porażka albo porażka-sukces, prawdopodobieństwa należy dodać, jeśli interesuje nas wyłącznie całkowita liczba sukcesów, a nie jej konkretna realizacja. Łatwo zauważyć związek z dwumianem Newtona

(p+q)^n=(p+q)(p+q)\ldots (p+q),

gdzie mamy n czynników. Każdy wynik to wybór jednego z dwóch składników nawiasu: p albo q. Mnożymy je kolejno przez siebie, co odpowiada losowaniom, a następnie dodajemy. Oczywiście suma wszystkich prawdopodobieństw równa jest 1. Składniki zawierające k sukcesów mają czynnik p^k. Wzór Newtona (znany zresztą przed Newtonem) daje nam

(p+q)^n=\displaystyle \sum_{k=0}^{n}{n\choose k}p^k q^{n-k}.

Prawdopodobieństwo k sukcesów jest równe

P(k)=\displaystyle {n\choose k}p^k q^{n-k}.

Jest to nasz punkt wyjścia. Przy dużych wartościach n obliczanie symboli Newtona było w XVIII wieku trudne, ponieważ występują tam silnie dużych liczb. Zwłaszcza w rejonie środka rozkładu obliczenia takie były kłopotliwe, ponieważ zostaje wiele czynników, które się nie skracają. Abraham de Moivre, francuski protestant zmuszony do emigracji z ojczyzny z przyczyn religijnych, spędził życie w Londynie, ucząc matematyki. Podobno jeździł po Londynie od ucznia do ucznia z kolejnymi kartkami wyrwanymi z Matematycznych zasad Newtona i w wolnym czasie zgłębiał treść tej masywnej księgi. De Moivre podał sposób przybliżania P(k) oraz wartości silni – to drugie przybliżenie nazywamy dziś wzorem Stirlinga od nazwiska drugiego matematyka, który w tym czasie zajmował się tym zagadnieniem.

Zaczniemy od P(k). Jeśli spojrzeć na histogram z obrazka rzuca się w oczy ogromna dysproporcja miedzy prawdopodobieństwami różnych wyników. Dlatego będziemy szukać przybliżenia nie dla P(k), lecz dla \ln P(k).

Wykres przedstawia histogram \ln P(k), a także przybliżającą go parabolę. Każdą przyzwoitą funkcję możemy przybliżyć rozwinięciem Taylora:

f(k)=f(k_0)+(k-k_0)f'(k_0)+\dfrac{1}{2!}(k-k_0)^2 f''(k_0)+\ldots.

W maksimum znika pierwsza pochodna, mamy więc

f(k)=f(k_0)+\dfrac{ (k-k_0)^2 f''(k_0)}{2}+\ldots.

Naszą funkcją jest

f(k)=\ln P(k)=\ln n!-\ln k!-\ln (n-k)! +k \ln p+(n-k) \ln q.

Potrzebujemy pochodnej z silni dla dużych wartości k oraz (n-k). Pochodna to przyrost funkcji odpowiadający jednostkowemu przyrostowi argumentu. Ponieważ

\ln k!=\ln 1+\ln 2+\ldots \ln k,

powinna ona być równa

\dfrac{d\ln k!}{dk}=\ln k.

Poniżej uzasadnimy to precyzyjnie, choć ostatni wzór powinien być zrozumiały intuicyjnie: nachylenie funkcji logarytmicznej stopniowo maleje, więc sumę można coraz lepiej przybliżać za pomocą pola pod krzywą.

Odpowiada to przybliżeniu

\ln k! \approx \displaystyle \int_{1}^{k} \ln t \, dt \Rightarrow \dfrac{d\ln k!}{dk}=\ln k.

Warunek na maksimum funkcji przybiera postać

\dfrac{d\ln P(k)}{dk}=-\ln k+\ln (n-k)+\ln p -\ln q =0 \Rightarrow k_0=np.

Druga pochodna równa jest

\dfrac{d^2 \ln P(k)}{dk^2}=-\dfrac{1}{k}-\dfrac{1}{n-k}=-\dfrac{1}{npq}.

Ostatnia równość daje wartość pochodnej w punkcie k=np. Nasze przybliżenie przybiera więc postać

P(k)=P(0) \exp\left(-\dfrac{(k-np)^2}{2npq}\right)+\ldots.

Jest to rozkład Gaussa o wartości średniej np oraz szerokości (odchyleniu standardowym) npq. Wartość P(0) można wyznaczyć z warunku normalizacji: pole pod naszą krzywą powinno być równe 1. Można ściśle pokazać, że przy dużych wartościach n wyrazy wyższych rzędów są do pominięcia przy obliczaniu prawdopodobieństw: różnice między parabolą a histogramem na wykresie dotyczą sytuacji, gdy prawdopodobieństwa są bardzo małe.

Przyjrzymy się teraz bliżej obliczaniu silni z dużych liczb. Zacznijmy od następującej funkcji zdefiniowanej jako całka:

g(t):=\displaystyle \int_{0}^{\infty}\exp(-\alpha t)\, dt,\alpha>0.

Różniczkując ją kolejno n razy po \alpha i kładąc na koniec \alpha=1, otrzymamy

n!=\displaystyle \int_{0}^{\infty} t^{n}\exp(- t)\, dx\equiv \Gamma (t+1).

Otrzymaliśmy funkcję gamma Eulera, która jest uogólnieniem silni, ponieważ zdefiniowana jest nie tylko dla wartości całkowitych n, lecz może być uogólniona na płaszczyznę zespoloną i określona wszędzie oprócz argumentów całkowitych ujemnych. Nam wystarczą tutaj wartości rzeczywiste dodatnie, szukamy przybliżenia dla dużych n. Zapiszmy funkcję podcałkową w postaci wykładniczej i zastosujmy rozwinięcie Taylora wokół maksimum, dokładnie tak jak powyżej dla funkcji P(k):

n!=\displaystyle \int_{0}^{\infty} \exp(n\ln t- t)\, dx\approx \exp(n\ln n-n)\int_{0}^{\infty} \exp\left(-\frac{(t-n)^2}{2n}\right) dt.

Wykres przedstawia przybliżenie gaussowskie oraz (na czerwono) wartości funkcji po wyłączeniu czynnika \exp (n\ln n-n). W przybliżeniu gaussowskim możemy rozszerzyć dolną granicę całkowania do -\infty, co nawet zmniejsza błąd przy niedużych wartościach n, a niczego nie psuje przy dużych wartościach n. Jeśli przeskalujemy funkcję gaussowską tak, aby miała jednostkową szerokość, porównanie wypadnie jeszcze lepiej.

 

Widzimy więc, że można ostatnią całkę wziąć po całej prostej. Jej wartość jest równa \sqrt{2\pi n}. Otrzymujemy wzór Stirlinga:

\ln n!\approx n\ln-n +\ln\sqrt{2\pi n}+O(1/12n).

Zaznaczyliśmy też wielkość następnego wyrazu w szeregu malejących potęg n. W wielu zastosowaniach można pominąć zupełnie całkę gaussowską i wnoszony przez nią wyraz \sqrt{2\pi n}. Jak się trochę popracuje nad dalszymi wyrazami rozwinięcia Taylora, można otrzymać i tę poprawkę 1/12n.

Pierre Simon Laplace rozwinął techniki szacowania wartości asymptotycznych całek. Jego wyprowadzenie wzoru Stirlinga było elegantsze, lecz rachunkowo trudniejsze (wymagało odwrócenia rozwinięcia w szereg). Laplace wykazał także, iż sumy zmiennych losowych zachowują się jak zmienne gaussowskie także w ogólniejszych sytuacjach niż ta przez nas rozpatrywana. Innymi słowy pierwszy zauważył, że zachodzi tzw. centralne twierdzenie graniczne. Ścisły dowód pojawił się znacznie później.

Skąd się wzięła liczba pi w rozkładzie Gaussa, czyli o niepojętej skuteczności matematyki w naukach przyrodniczych

Eugene Wigner, należał do „Marsjan”, jak nazywano w Stanach Zjednoczonych grupę niezwykle wybitnych uczonych z Węgier. Na pytanie Enrica Fermiego, dlaczego wysoce rozwinięte cywilizacje z kosmosu nie odwiedziły do tej pory Ziemi, Leo Szilard odpowiedział, że owszem, już tutaj są, ale sami siebie nazywają Węgrami. Była to niezwykła konstelacja talentów: Paul Erdős, Paul Halmos, Theodore von Kármán, John G. Kemeny, John von Neumann, George Pólya, Leó Szilárd, Edward Teller. Ukształtowały ich naukowo Niemcy, zwłaszcza Getynga i Berlin. Po dojściu nazistów do władzy uczeni ci z racji żydowskiego pochodzenia zmuszeni zostali do emigracji i w Stanach Zjednoczonych pracowali nad aerodynamiką, budową bomby atomowej i wodorowej, budową pierwszych komputerów, jak też dokonywali odkryć w matematyce czystej, jak najdalszych od zastosowań. Wigner był ekspertem w zastosowaniach teorii grup w mechanice kwantowej, laureatem Nagrody Nobla, a więc kimś, kto na co dzień stykał się z tym, że abstrakcyjna z pozoru matematyka znajduje wciąż nowe eksperymentalne potwierdzenia.

Słynny jest esej Wignera pt. Niepojęta skuteczność matematyki w naukach przyrodniczych. Zaczyna się on następująco:

Istnieje opowiadanie o dwóch ludziach, którzy przyjaźnili się ze sobą w czasie wyższych studiów, a którzy spotkawszy się, opowiadają sobie o swojej pracy. Jeden z nich zajął się statystyką i badał trendy społeczne. Pokazał on dawnemu koledze jeden ze swych artykułów. Artykuł rozpoczynał się, jak zwykle, uwagami na temat rozkładu Gaussa i autor wyjaśnił swemu rozmówcy znaczenie poszczególnych symboli dla sytuacji aktualnego społeczeństwa, dla przeciętnego społeczeństwa i tak dalej. Jego kolega okazał pewne niedowierzanie i nie był zupełnie pewny, czy przyjaciel nie żartuje sobie z niego. „Skąd ta twoja wiedza?” brzmiało jego pytanie. „I czym jest ten tu symbol?”. „Och”, odpowiedział statystyk, „to jest \pi”. „Co to jest?” „Stosunek obwodu koła do jego średnicy”. „No, teraz już twoje dowcipy zaszły za daleko”, rzekł na to kolega, „z całą pewnością społeczeństwo nie ma nic wspólnego z obwodem koła”. (przeł. J. Dembek)

Matematyka jest sztuką wyprowadzania wniosków, najlepiej nieoczywistych, z pewnych przyjętych założeń. W zasadzie nie możemy więc za jej pomocą otrzymać niczego istotnie nowego, co nie tkwiłoby niejako w tych założeniach. Jednak droga od np. podstawowych praw arytmetyki i definicji liczb pierwszych do sformułowania Wielkiego Twierdzenia Fermata i jego dowodu zajęła zajęła ludzkości parę tysięcy lat i przez ostatnie stulecia wielu wybitnych uczonych straciło całe lata na bezowocne próby. Jednak najbardziej zdumiewającym aspektem matematyki są jej zastosowania w innych naukach. Nie rozstrzygniemy tu pytania, czy kryje się w tym głęboka tajemnica, czy też w zasadzie rzecz jest trywialna (bo np. matematyka w gruncie rzeczy pochodzi z doświadczenia albo, jak wierzył Platon, świat zmysłowy stanowi jedynie niedoskonałą kopię świata idei, gdzie linie nie mają grubości, a sfery są zbiorami punktów równooddalonych od swego środka).

W zastosowaniach matematyki, takich jak statystyka albo fizyka, musimy przyjąć wiele dodatkowych założeń, które często są trudne do bezpośredniego zweryfikowania. Mimo to wiemy np., że rozkład Gaussa, krzywa dzwonowa, stosuje się nie tylko do rozkładu prędkości cząsteczek w gazie, ale i np. cen akcji albo wzrostu grupy ludzi (w dwóch ostatnich przypadkach lepsze wyniki daje rozpatrywanie logarytmu tych wielkości). Istnieją matematyczne powody wszędobylskości rozkładu Gaussa: jeśli dana wielkość jest sumą zmiennych losowych, to można oczekiwać, iż bedzie dążyć do rozkładu Gaussa, gdy liczba tych zmiennych staje się coraz większa i gdy są one od siebie niezależne.

Wróćmy teraz do anegdoty Wignera. Skąd wzięła się liczba \pi w rozkładzie Gaussa? Rozkład ten ma postać

p(x)=\dfrac{1}{\sqrt{2\pi}\sigma}e^{-\frac{x^2}{2\sigma^2}},

gdzie \sigma jest parametrem opisującym szerokość krzywej: może ona być bardziej albo mniej rozłożysta. Poniważ opisuje prawdopodobieństwa, pole powierzchni pod krzywą musi być równe 1. Na wykresie \sigma=1.

Wartość p(0)  jest więc związana z \pi:

p(0)=0,39894\approx \dfrac{1}{\sqrt{2\pi}}.

Liczba \pi pojawia się tu dlatego, że pole powierzchni pod krzywą musi być równe 1. Inaczej mówiąc chodzi o wartość następującej całki (gdzie dla wygody pzbyliśmy się dwójki):

\displaystyle \int_{-\infty}^{\infty} e^{-x^{2}} dx=\sqrt{\pi}.

Całka nieoznaczona w tym wypadku nie wyraża się przez funkcje elementarne i obliczenie tej wartości wymaga pomysłu. Prawdopodobnie całkę tę pierwszy obliczył Pierre Simon Laplace (i to co najmniej na dwa sposoby). Prostszą metodę podał Denis Poisson, a my przedstawimy współczesne wariacje tej metody. Należy rozpatrzyć całkę dwuwymiarową po całej płaszczyżnie xy:

I^2= \displaystyle \iint e^{-x^2-y^2} dx dy=\left( \int e^{-x^2} dx\right)^2.

Zadanie sprowadza się do obliczenia objętości pod powierzchnią przypominającą (nieskończony) kapelusz z=e^{-x^2-y^2}.

Narysowaliśmy tylko jego środkową część. Inaczej mówiąc, jest to bryła powstająca z obrotu krzywej z=e^{-r^2} wokół osi z.

Objętość tej bryły możemy obliczyć dzieląc ją na walce o grubości dz i promieniu r^2=-\ln z:

I^2=-\displaystyle \int_0^1 \pi \ln z dz=\pi.

Możemy też podzielić naszą bryłę na wydrążone walce o grubości dr, promieniu r i wysokości z:

I^2=\displaystyle \int_0^{\infty} 2\pi r e^{-r^2}=\pi.

Ostatnią całkę oblicza się przez oczywiste podstawienie t=r^2.

Oba te rozwiązania sugerowałyby, że „nasze” \pi z rozkładu Gaussa ma jednak coś wspólnego z okręgami. W matematyce związki arytmetyki z geometrią są wszakże nieoczywiste: pokazywaliśmy przykłady szeregów Leibniza i Newtona prowadzących do liczby \pi (por. też tutaj). Także w naszym przypadku możemy sprowadzić problem do arytmetyki.

Rozkład Gaussa jest granicą rozkładu dwumianowego, czyli np. rozkładu liczby orłów (ktoś mniej patriotyczny niż ja mógłby rozważać liczbę reszek, ale my odrzucamy takie podejście) w serii rzutów monetą. Prawdopodobieństwa wyglądają wówczas następujaco:

Na histogramie przedstawiliśmy przypadek n=20 rzutów oraz stosowny rozkład Gaussa, który jest, jak widać całkiem dobrym przybliżeniem histogramu. Obliczmy prawdopodobieństwo, że w połowie rzutów otrzymamy orła – co odpowiada maksimum histogramu i krzywej Gaussa. Ponieważ prawdopodobieństwa wyrzucenia orła i reszki są równe, więc prawdopodobieństwo każdej serii jest równe iloczynowi: (\frac{1}{2})^n. Można przy tym tę połowę orłów uzyskać w rozmaitej kolejności – każdy konkretny wynik będzie wybraniem spośród zbioru n elementów podzbioru n/2 orłów. Można to zrobić na {n}\choose{n/2} sposobów (liczba kombinacji). Prawdopodobieństwo w środku naszego rozkładu będzie zatem równe (wzięliśmy n=2m):

P_m= \displaystyle {{2m}\choose{m}} \dfrac{1}{2^{2m}}.

Gdzie jak gdzie, ale w tym wyrażeniu nie ma chyba liczby \pi? Oczywiście, jest. Okazuje się, że

\displaystyle \lim_{m\rightarrow\infty} \sqrt{m}P_m=\dfrac{1}{\sqrt{\pi}}.

Inaczej mówiąc dla dużych wartości m mamy P_m\sim \frac{1}{\sqrt{\pi m}} – pojawia się pierwiastek z \pi, zmodyfikowany dodatkowym czynnikiem, który łatwo zrozumieć: rozkład dwumianowy przy rosnącym m coraz bardziej przypomina rozkład Gaussa, ale też staje się coraz szerszy, co skutkuje mniejszą wysokością, i tę właśnie zależność opisuje powyższy wzór.

W jaki sposób otrzymać ten wynik? Leonhard Euler w 1736 r. uzyskał przedstawienie funkcji sinus za pomocą nieskończonego iloczynu. Pomysł jest prosty. Każdy wielomian możemy przedstawić za pomocą iloczynu

f(x))=a(x-x_1)(x-x_2)\ldots (x-x_n),

gdzie x_1,x_2,\ldots, x_n to pierwiastki tego wielomianu, a jest stałą. Funkcja sinus jest też czymś w rodzaju wielomianu, tyle że ma nieskończenie wiele pierwiastków: 0, \pm\pi,\pm 2\pi,\ldots. Możemy zatem spróbować przedstawić ją następująco:

\sin x=x(1-\frac{x}{\pi}) (1+\frac{x}{\pi}) (1-\frac{x}{2\pi}) (1+\frac{x}{2 \pi}) \ldots.

Czynniki w nawiasach zapisane są tak, by dążyły do 1 wraz ze wzrostem numeru. Intuicja Eulera była trafna, przyglądając się temu rozwinięciu można uzyskać ciekawe wyniki, jak np.

\displaystyle \dfrac{\pi^2}{6}=1+\dfrac{1}{4}+\dfrac{1}{9}+\ldots.

Gdy podstawimy do tego iloczynu x=\pi/2, otrzymamy przedstawienie liczby \pi za pomocą nieskończonego iloczynu, tzw. wzór Wallisa. Nieco go przekształcając, można uzyskać naszą granicę \sqrt{m}P_m.

Kolejność historyczna była taka: najpierw John Wallis w roku 1655 odgadł swój wzór. Później w roku 1733 Abraham de Moivre udowodnił naszą równość. Jeszcze później, w 1736 r. Euler odkrył iloczyn nieskończony dla sinusa, w wieku XIX Karl Weierstrass pokazał, że pewna grupa wyjątkowo regularnych funkcji (funkcje całkowite) mają w istocie postać iloczynów.

Szczegół dotyczący P_m. Rozkład dwumianowy ma szerokość \sigma=\sqrt{m/2}, zatem związek de Moivre’a daje to samo co współczynnik \frac{1}{\sqrt{2\pi}\sigma} .

 

 

 

Joseph Louis Lagrange i „wektor Laplace’a-Rungego-Lenza” (1781)

Pisałem kiedyś o zasadzie Arnolda: „Jeśli jakieś pojęcie nazwano czyimś imieniem, to nie jest to imię odkrywcy”. Przykładem może tu być tzw. wektor Rungego-Lenza, niemal odkryty przez Jakoba Hermanna, a na pewno odkryty przez Josepha Lagrange’a.

Joseph Louis Lagrange jest mało znany poza kręgiem profesjonalnych matematyków i fizyków. Wiele jego dokonań weszło do języka nauki i stała się dobrem powszechnym, funkcjonującym często bezimiennie. Urodzony w Turynie jako Giuseppe Luigi Lagrangia, poddany królestwa Sardynii, syn urzędnika królewskiego francuskiego pochodzenia, odkrył w sobie talent matematyczny jako nastolatek-samouk. Ojciec stracił fortunę w ryzykownych spekulacjach i syn potrzebował płatnego zajęcia. Pod koniec życia uczony twierdził, że gdyby nie potrzeba zarabiania, pewne nie zostałby matematykiem. Zapewne przesadzał. Talent tej wielkości nie daje chyba możliwości wyboru. W każdym razie młody Lagrange zadziwił Leonharda Eulera, z którym zaczął korespondować na temat rachunku wariacyjnego. W wieku dziewiętnastu lat został też mianowany sostituto – „zastępcą” profesora matematyki w szkole artyleryjskiej w Turynie. Uczył tam młodzieńców starszych od siebie, artyleria była uczonym rodzajem wojsk – to ze szkoły artylerii Napoleon Bonaparte wyniósł swój szacunek do przedmiotów ścisłych. Niezbyt przedsiębiorczy i cichy Lagrange spędził w Turynie wiele lat. Dopiero w wieku trzydziestu lat dzięki protekcji Jeana d’Alemberta został powołany do Akademii Nauk w Berlinie w miejsce Eulera, który wolał carową Katarzynę II od Fryderyka II pruskiego. Piemontczyk spędził w Prusach dwie dekady, narzekając na chłody i pisząc wciąż nowe ważne prace. W Berlinie powstało jego największe dzieło Méchanique analitique (sic!), opublikowane w dwóch tomach już w Paryżu, gdzie spędził resztę życia. Tam podczas Rewolucji zajmował się wprowadzeniem metrycznego systemu miar oraz nowego kalendarza i nowego podziału doby. Metr zdefiniowano wtedy jako jedną czterdziestomilionową część południka paryskiego, lecz babiloński, sześćdziesiątkowy podział godzin i minut okazał się zbyt głęboko zakorzeniony i tutaj zmiany się nie przyjęły. Został też Lagrange pierwszym profesorem analizy w École polytechnique, elitarnej i bardzo nowoczesnej na swe czasy szkole wyższej, modelu dla licznych politechnik na całym świecie.

Książka Lagrange’a była, niemal równo sto lat po Zasadach matematycznych Isaaca Newtona, podsumowaniem dorobku Newtonowskiej mechaniki za pomocą metod analitycznych spod znaku Leibniza, Bernoullich i Eulera.

W książce tej nie znajdzie Czytelnik żadnych rysunków. Metody, jakie w niej wykładam, nie wymagają żadnych konstrukcji ani rozumowań geometrycznych bądź mechanicznych, lecz jedynie operacji algebraicznych poddanych regularnym i jednolitym procedurom. Ci, co kochają Analizę, z przyjemnością zobaczą, jak mechanika staje się jej kolejną gałęzią i będą mi wdzięczni za takie poszerzenie jej domeny.

Newton byłby zapewne wstrząśnięty lekturą dzieła Lagrange’a. Zwyciężyła w nim algebra, metody formalnego przekształcania równań. Algorytmy zwyciężyły z wyobraźnią, ponieważ do ich stosowania wystarczy trzymać się prostych reguł. W ten sposób druga zasada dynamiki stała się układem trzech (lub więcej, zależnie od problemu) równań różniczkowych. Zagadnienie trzech przyciągających się ciał – jeden z wielkich problemów epoki, wymaga dwunastu całkowań. Lagrange pokazał w jednej ze swych prac, jak z dwunastu potrzebnych całkowań, zostaje do wykonania tylko siedem. Osiągnięcia tego rodzaju musiały być elitarne, choć miały też szersze znaczenie. Wielkim problemem epoki ponewtonowskiej była stabilność Układu Słonecznego. Newton przypuszczał, że wzajemne przyciąganie planet doprowadzi z czasem do rozregulowania się kosmicznego zegara, co zresztą może leżeć w boskim planie stwórczym: jako gorliwy czytelnik i komentator Apokalipsy św. Jana traktował znaną nam postać świata jako przejściową, próbował nawet oszacować, kiedy nastąpi ponowne przyjście Chrystusa. Lagrange, a po nim Pierre Simon Laplace (obaj raczej indyferentni religijnie) podjęli zagadnienie stabilności Układu Słonecznego. Wyglądało na to, że system planetarny zmienia się jedynie okresowo i nie ma w nim jednokierunkowych zmian parametrów orbit takich, jak ich rozmiar czy mimośród – a zatem grawitacja nie musi prowadzić do katastrofy kosmicznej. Zagadnienie to okazało się zresztą bardziej skomplikowane, niż sądzili Lagrange i Laplace. Pokazał to pod koniec wieku XIX Henri Poincaré. W wieku XX zrozumiano, że w układach takich jak planetarne powszechnie występują zjawiska chaotyczne. Chaos nie jest jednak nieuchronny, niezbyt wielkie zaburzenia nie naruszają bowiem regularnego charakteru ruchu. Wielkim osiągnięciem dwudziestowiecznej mechaniki analitycznej jest teoria KAM, zwana tak od nazwisk jej twórców: Andrieja Kołmogorowa, Vladimira Arnolda (to jego nazwisko pojawia się w zasadzie Arnolda – sformułowanej oczywiście nie przez niego, lecz przez Michaela Berry’ego) i Jürgena Mosera.

Pokażemy, jak Lagrange wprowadził trzy stałe ruchu Keplerowskiego, które dziś nazywa się powszechnie wektorem (Laplace’a)-Rungego-Lenza. Było to w roku 1779, a dwa lata później zostało opublikowane w pracach Akademii Berlińskiej (w Oeuvres de Lagrange, t. 5, s. 127-133). Algebraiczne podejście Lagrange’a łatwo daje się uogólnić na przestrzeń n-wymiarową {\mathbb R}^n, dlatego tak je pokażemy, uwspółcześniając nieco zapis. Siła grawitacji jest odwrotnie proporcjonalna do kwadratu odległości od centrum, działa wzdłuż promienia wodzącego planety (wektor o współrzędnych x_i/r jest wektorem jednostkowym o kierunku promienia wodzącego). Przyspieszenie planety zapisane jako składowe kartezjańskie spełnia równania

\ddot{x}_i=-\dfrac{\mu x_i}{r^3},\,i=1\ldots n,

gdzie kropki oznaczają pochodne po czasie t, \mu jest iloczynem masy Słońca i stałej grawitacyjnej, a r=x_ix_i\equiv x_1^2+\ldots+x_n^2. Po powtarzających się wskaźnikach sumujemy – jest to konwencja sumacyjna Einsteina, którą uczony żartobliwie nazywał swoim największym odkryciem matematycznym (nigdy nie uważał się za matematyka, lecz za fizyka, któremu przyszło stosować nowe techniki matematyczne i który przychodził do matematyki z innej strony). Za czasów Lagrange’a i jeszcze długo później pisano po trzy równania dla współrzędnych x,y,z, co wydłużało (niepotrzebnie z naszego dzisiejszego punktu widzenia) prace. Sam zapis równań jako trzech składowych kartezjańskich nie był czymś oczywistym za życia Newtona, a więc nawet na początku XVIII wieku. Jakob Hermann uważał, iż wymaga to uzasadnienia.

Szukamy wyrażeń, kombinacji współrzędnych i prędkości, które pozostają stałe podczas ruchu (są to tzw. całki pierwsze). Znanym wyrażeniem tego rodzaju jest energia E będąca sumą energii kinetycznej i potencjalnej:

E=\dfrac{1}{2}\dot{x}_1^2-\dfrac{\mu}{r}.

Lagrange podał jeszcze inne całki ruchu Keplerowskiego (w istocie wystarczy, aby siła działająca ze strony centrum skierowana była radialnie, konkretna jej postać jest nieistotna):

L_{ij}=x_i\dot{x}_j-x_j\dot{x}_i.

Mamy tych całek tyle, ile możliwości wyboru dwóch różnych wskaźników spośród n, czyli {n\choose 2}=\frac{n(n-1}{2}. Naprawdę jest to Keplerowskie prawo pól w przebraniu, a właściwie prawo pól plus stwierdzenie, że ruch zachodzi w płaszczyźnie (to ostatnie bywa nazywane zerowym prawem Keplera, co jest o tyle słuszne historycznie, że od niego Johannes Kepler zaczął swoje badania – przyjął je jako założenie. Kopernik nie wiedział, że tory planet są płaskie!). Zawsze możemy wybrać współrzędne tak, żeby co najwyżej dwie były różne od zera podczas ruchu, np. x_1, x_2. W przypadku 3D trzy całki (L_{23},L_{31},L_{12}) zachowują się jak wektor, jest to wektor momentu pędu.

Trzecia grupa całek, odkryta przez Lagrange’a i właściwa tylko siłom grawitacji, daje się zapisać w postaci

\mu e_i=-\dfrac{\mu x_i}{r}+\dot{x}_j L_{ij},\,i=1 \ldots n.

Wartości e_i są stałe. Jest to wektor zwany powszechnie w literaturze wektorem Rungego-Lenza. Lepiej poinformowani piszą o wektorze Laplace’a-Rungego-Lenza. W istocie jest to wektor Lagrange’a, którego szczególny przypadek podał Jakob Hermann, o czym Lagrange zapewne nie wiedział. Nie interesował go zresztą fakt, że jest to wektor, ważne dla niego były trzy całki ruchu. Laplace zaczerpnął te całki z pracy Lagrange’a i spopularyzował je, umieszczając w słynnym traktacie o mechanice niebios: Traité de mécanique céleste. Laplace, który uczył się pracy naukowej, czytając Lagrange’a, nie zawsze był lojalny wobec starszego kolegi. Ten zaś był chyba zbyt dumny, aby stale jak kupiec podkreślać swoje zasługi, co czyniła większość uczonych, konkurujących między sobą o niewielką pulę płatnych posad. Całki Lagrange’a z dzieł Laplace’a czerpali później inni bądź też sami odkrywali je niezależnie, jak William Rowan Hamilton. Runge i Lenz trafili do historii przypadkiem, z lenistwa późniejszych autorów, zbyt zajętych bieżącą pracą, aby włożyć wysiłek w przypisy.

Zobaczmy jeszcze, jak z wektora Lagrange’a wynika kształt toru planety. Mnożąc obie strony ostatniego równania przez x_i i sumując po powtarzającym się wskaźniku i, otrzymujemy

r +e_i x_i=L^2, 

gdzie L^2= \frac{1}{2} L_{ij}L_{ij}.Jest to równanie stożkowej o mimośrodzie e=\sqrt{e_i e_i}.

Trzeba podkreślić, że dla Lagrange’a nie było to jakieś szczególne osiągnięcie, lecz jedynie punkt wyjścia do pracy nad bardziej skomplikowanym zagadnieniem, gdy do problemu Keplera dodamy jeszcze siłę zaburzającą, jak w rzeczywistym problemie ruchu planet przyciąganych nie tylko przez Słońce, ale także przez inne planety.

Pokażemy jeszcze powyższe wyniki w zapisie wektorowym. Mamy wówczas

{\bf \ddot{r}}=-\dfrac{\mu {\bf r}}{r^3}.

Moment pędu równa się

{\bf L = r\times\dot{r}},

a wektor Lagrange’a:

\mu {\bf e}=-\dfrac{\mu {\bf r}}{r}+{\bf \dot{r}\times L}.

Mnożąc obie strony skalarnie przez {\bf r}, otrzymamy

r+{\bf e\cdot r}=\dfrac{L^2}{\mu}.

Uwaga techniczna. Łatwo sprawdzić, że podane wielkości są całkami pierwszymi, trudniej było je oczywiście odgadnąć. Kluczem jest tutaj obliczenie pochodnej po czasie z wektora jednostkowego, co Lagrange robi pozornie bez powodu, to znaczy powód wyjaśnia się po chwili. Mamy bowiem

\dfrac{d}{dt}\left(\dfrac{x_i}{r}\right)=\dfrac{\dot{x}_i r-\dot{r} x_i}{r^2}=\dfrac{x_jL_{ji}}{r^3}.

Korzystamy z faktu, że r\dot{r}=x_i\dot{x}_i (jest to zróżniczkowane tw. Pitagorasa: r^2=\sum_i x^2_i). Postać wektorowa jest przejrzysta, lecz ograniczona do {\bf R}^3.

 

 

Jakob Hermann pisze do Johanna Bernoulliego na temat ruchu planet, 12 lipca 1710 r.

Ulmenses sunt mathematici – mieszkańcy Ulm to matematycy – głosiło stare porzekadło. Znamy jednego matematyka z Ulm Johannesa Faulhabera, który miał kontakty z Keplerem i być może z Kartezjuszem. Słynna ogrzewana komora, w której rozmyślał francuski filozof pewnej jesieni, mieściła się w Neuburgu niezbyt oddalonym od Ulm. No i w Ulm urodził się Albert Einstein, lecz rodzina rok później się przeprowadziła i uczony jako człowiek dorosły nigdy potem nie odwiedził już swego miasta rodzinnego.

Prawdziwą kolebką matematyków była natomiast leżąca niezbyt daleko od Ulm Bazylea. Stąd pochodziła rozgałęziona rodzina Bernoullich, a także Leonhard Euler i Jakob Hermann. Protoplastą naukowego rodu był Jakob Bernoulli, to od niego uczyli się matematyki jego brat Johann oraz Jakob Hermann. Johann z kolei był ojcem wybitnego Daniela i nauczycielem genialnego Eulera. Ponieważ posad dla matematyków nie było w Europie wiele, więc wszyscy ci matematycy sporo podróżowali. Dzięki bazylejskim matematykom rachunek różniczkowy i całkowy Leibniza stał się podstawą nowożytnej matematyki.

Drugim wielkim zadaniem uczonych od końca XVII wieku stało się przyswojenie osiągnięć Isaaca Newtona. Matematyczne zasady filozofii przyrody zawierały rewolucyjną fizykę przedstawioną za pomocą indywidualnego języka matematycznego, stworzonego przez autora. Nie było w historii nauki traktatu tak oryginalnego zarówno pod względem treści fizycznej, jak i matematycznej. Toteż jego zrozumienie i opanowanie zajmowało całe lata nawet wybitnym uczonym. Na kontynencie panował matematyczny idiom Leibniza i twierdzenia Newtona tłumaczono niejako na tę zrozumiałą wśród uczonych symbolikę.

Jakob Hermann pierwszy podał różniczkowe sformułowanie II zasady dynamiki. Miało ono u niego postać

G=M dV: dT,

gdzie G,M oznaczały siłę i masę, a dV, dT – różniczki prędkości i czasu. Zapis ten pojawił się dopiero na 57 stronie jego traktatu Phoronomia (1716) i odnosił się do siły ciężkości zależnej od położenia. Oczywiście, Newton już w 1687 r. rozważał takie siły, ale wyłącznie w postaci geometrycznej. Jego II prawo brzmiało: „Zmiana ruchu jest proporcjonalna do przyłożonej siły poruszającej i następuje w kierunku prostej, wzdłuż której siła ta jest przyłożona.” Newton miał na myśli zmiany pędu ciała w pewnym krótkim czasie. Jednym problemem tego sformułowania była kwestia opisywania zmian w czasie, drugim problemem był wektorowy charakter siły: ilość ruchu, pęd, zmienia się w kierunku przyłożonej siły.

Pokażemy, jak Hermann rozwiązał problem ruchu ciała przyciąganego siłą odwrotnie proporcjonalną do kwadratu odległości od nieruchomego centrum. Zwolennicy Leibniza mieli zastrzeżenia do Newtonowskiego dowodu tego faktu, zbyt szkicowego. Pragnęli wyraźnego wykazania, że tylko stożkowe (albo część linii prostej) mogą być torem ciała. Opisywałem kiedyś rozwiązanie tego problemu podane w XIX wieku przez Williama Rowana Hamiltona.

Wyobrażamy sobie przyciągane przez centrum S ciało zakreślające krzywą CD. Jego ruch w nieskończenie krótkim czasie dt można przedstawić jako sumę wektorową ruchu bezwładnego od C do E oraz spadania od E do D wzdłuż kierunku siły w punkcie C, tzn. odcinki SC i DE są równoległe. Zmiana współrzędnej x w ruchu bezwładnym byłaby równa dx. Efekt działania siły przyciągającej to różniczka drugiego rzędu ddx (co później zapisywano d^{2}x). Oczywiście do ddx wchodzi tylko x-owa składowa siły.

Dziś narysowalibyśmy to tak, Hermann odnajduje trójkąty podobne na swoim rysunku i dochodzi do wniosku, że

ddx \propto F\dfrac{x}{r} dt^2.

Pole SCD zakreślane w czasie dt można przedstawić jako pole trójkąta o bokach [x,y] oraz [dx,dy], a więc jest ono równe połowie pola równoległoboku dt\propto y dx-x dy.
Ostatecznie różniczkę ddx możemy zapisać następująco (siła jest odwrotnie proporcjonalna do kwadratu odległości):

-a ddx=\dfrac{x}{r^3}(y dx-x dy)^2,

gdzie a jest stałą proporcjonalności. Naszym zadaniem jest znalezienie równania krzywej.
Całką tego równania jest

a dx=\dfrac{y}{r}(ydx-xdy).

Dzieląc obustronnie przez x^2 i całkując ponownie, otrzymujemy

-\dfrac{a}{x}+c=-\dfrac{r}{x}\;\Rightarrow\; a-cx=r,

gdzie c jest stałą całkowania. Jest to równanie stożkowej (po obustronnym podniesieniu do kwadratu otrzymamy wielomian kwadratowy w zmiennych x,y).

Postępowanie Hermanna jest pomysłowe, choć całkowania są nieintuicyjne. Można jednak, jak zawsze, sprawdzić je, idąc od końca do początku, tzn. wykonując dwa kolejne różniczkowania. Tak naprawdę sztuka rozwiązywania równań różniczkowych jest często zamaskowanym odgadywaniem całek. Różniczkowania wynikają z reguły Leibniza dla iloczynu d(uv)=v du+u dv.
W naszym przypadku mamy np. dla drugiego równania

d\left(\dfrac{y}{r}\right)=\dfrac{rdy-ydr}{r^2}=\dfrac{r^2 dy-y rdr}{r^3}.

Pamiętając, że r^2=x^2+y^2, mamy rdr=xdx+ydy. Itd. itp. rachunki „od końca” są łatwe. W pierwszym całkowaniu przyjęliśmy stałą całkowania równą zeru, co nie zmniejsza ogólności wyniku, bo Hermann zakłada, iż oś Sx jest osią toru planety, tzn. przecięcie z osią x z lewej strony punktu S następuje w peryhelium albo aphelium, czyli przy y=0 powinno być dx=0.
Johann Bernoulli, który miał dość nieznośny charakter (nigdy nie dość wypominania mu, jak to konkurował ze swym synem Danielem) odpowiedział wybrzydzaniem na procedurę Hermanna i przedstawił swoją ogólniejszą, opartą na innym podejściu.

Z dzisiejszego punktu widzenia Hermann odkrył pewną całkę pierwszą problemu Keplera (tak się dziś nazywa problem ruchu wokół centrum przyciągającego jak 1/r^2). Całka pierwsza to wyrażenie, którego wartość nie zmienia się podczas ruchu. U Hermanna jest to

-\dfrac{dx}{dt}L_{z}-\dfrac{y}{r}=A_{y}=const.

W wyrażeniu tym L_z=xp_{y}-yp_{x}. Gdyby zająć się przyspieszeniem wzdłuż osi Sy, otrzymalibyśmy drugą całkę. Razem składają się one na wektor

\vec{A}=\vec{p}\times \vec{L}-\dfrac{\vec{r}}{r}.

Nazywa się go wektorem Rungego-Lenza, choć odkrył go właściwie Jakob Hermann. W pełni zdał sobie sprawę z faktu, że mamy trzy takie całki pierwsze, czyli w istocie wektor, Joseph Lagrange, a po nim Pierre Simon Laplace. Laplace przedyskutował też systematycznie wszystkie całki pierwsze problemu Keplera (trzy to moment pędu, trzy to nasz wektor, jedna to energia całkowita planety). Carl David Runge (ur. 1856) oraz Wilhelm Lenz (ur. 1888) pojawiają się w tej historii późno i w rolach dość przypadkowych. Pierwszy (znany z algorytmu Rungego-Kutty) użył tego wektora w swoim podręczniku analizy wektorowej, drugi zastosował go do pewnego problemu w starej teorii kwantów, przepisując go z podręcznika Rungego. Zupełnie niekosztowny sposób wejścia do historii. Wilhelm Lenz jest natomiast autorem tzw. modelu Isinga (Ernst Ising był jego doktorantem). Wektor odegrał pewną rolę w powstaniu mechaniki kwantowej. Stosując go, Wolfgang Pauli otrzymał wartości energii w atomie wodoru na podstawie formalizmu macierzowego Heisenberga. Chwilę później Erwin Schrödinger zrobił to samo w swoim formalizmie i wielu fizyków nie wiedziało, co o tym myśleć, bo na pierwszy rzut oka oba podejścia różniły się kompletnie.