Wieczny powrót od Retyka i Kopernika do Poincarégo

Niebo Greków składało się z wirujących z różną prędkością sfer. Jak pisał Platon w Timajosie:

…aby dać jasną miarę relatywnej powolności i szybkości, z którymi gwiazdy wykonują swoich osiem ruchów, Bóg umieścił na drugiej po Ziemi orbicie światło, które nazywamy teraz Słońcem, aby całe niebo było oświetlone, a jestestwa żyjące, wszelkie, jakie natura zamierzyła, mogły uczestniczyć w Liczbie, ucząc się arytmetyki przez obroty Tego Samego i podobnego. (…)  A na obieg innych gwiazd ludzie, z bardzo małymi wyjątkami, nie zwracają uwagi, nie nadają im nazw, nie porównują ich obiegów ilościowo, tak, że powiedzieć można, nie wiedzą, że czas to błędne wędrówki tych gwiazd nieprzeliczone i przedziwnie różnorodne. Mimo to można pojąć, że doskonała liczba czasu wypełnia rok doskonały wtedy, gdy wszystkie osiem obrotów, mających swoje względne stopnie szybkości, dokona się wspólnie i zakończy w tym samym czasie, mierzonym obrotem Tego Samego, które się porusza w sposób jednostajny. (39 c-39d)

Według Platona po 36 000 lat cykl kosmiczny się powtarza. W XVI w. Georg Joachim Retyk, jedyny uczeń Kopernika, powiązał epoki historyczne ze zmianami mimośrodu orbity Ziemi. Środek orbity Ziemi poruszał się bowiem u Kopernika po niewielkim kółku , a okres tego ruchu wynosił 3434 lat egipskich. Kiedy mimośród orbity Ziemi był największy Rzym stał się z republiki cesarstwem. Po ćwierci obiegu owego małego kółka powstał islam, a po następnej ćwierci ok. 1652 r. – upadnie, jak prorokował. Drugie przyjście Chrystusa miało nastąpić w roku 2510, gdy mimosród wróci po raz drugi do swej wartości w chwili stworzenia. W książce Kopernika nie znajdziemy rozważań tego typu. Nie ma jednak podstaw by sądzić, że ich nie aprobował. Astrologia była dziedziną respektowaną, głównym powodem badania położeń planet na niebie. Więc choć Kopernik nie był z pewnością entuzjastycznym astrologiem – nie zachowały się tworzone jego ręką horoskopy, to mógł wierzyć, że los Ziemi i jej mieszkańców jest powiązany ze zjawiskami niebieskimi. O obrotach było dziełem czysto astronomicznym i matematycznym, zatem umieszczanie w nim astrologicznych konkretów byłoby nie na miejscu.

Środek orbity Ziemi \bar{S} porusza się po małym kółku, rzeczywiste Słońce spoczywa sobie spokojnie obok, nie biorąc udziału w tych „rewolucjach”. Słowo użyte przez Kopernika w tytule De revolutionibus oznaczało obroty, a więc coś cyklicznego, z czasem zaczęło oznaczać wszelkie dramatyczne przemiany, na ogół już jednokierunkowe. Proporcje na rysunku są oczywiście przesadzone, inaczej niewiele byłoby widać.

Wraz z upadkiem idei sfer niebieskich znaczenie cyklów planetarnych zmalało, a czas zaczął wydawać się nieskończony niczym prosta euklidesowa: od minus do plus nieskończoności. Oczywiście, chrześcijanie obowiązani byli wierzyć w stworzenie świata i jego koniec, ale z braku dopływu nowych bodźców wiara ta wyraźnie słabła. Już w XVIII wieku niezbyt się buntowano, gdy Buffon obliczył wiek Ziemi na mniej więcej dziesięć razy dłuższy, niż wynikałby z Biblii. Potem Fourier, zajmując się stygnięciem Ziemi, jeszcze powiększył tę wartość. Mechanistyczny wszechświat najłatwiej było sobie wyobrażać jako trwający od zawsze i mający istnieć zawsze. Od połowy XIX w. do obrazu tego doszły dwie zasady termodynamiki. Według pierwszej – zasady zachowania energii – istnieje wielkość, która we wszystkich przemianach się nie zmienia, co przemawia za tym, że wszechświat nie ma końca. Według drugiej zasady energia rozkłada się z czasem coraz bardziej równomiernie, świat powinien stawać się jednolitym ośrodkiem o stałej gęstości i temperaturze. Tak więc choć istniałby zawsze, po pewnym czasie przechodziłby w postać mało interesującą i praktycznie martwą. Mówiło się o „śmierci cieplnej” wszechświata.

Pomysł wiecznego powrotu pojawił się w latach osiemdziesiątych XIX stulecia nie u uczonego, lecz u filozofa, Friedricha Nietzschego. Pisał on:

Jeśli wszechświat należy uważać za pewną ilość energii, za pewną liczbę ośrodków energii, a każda inna koncepcja pozostaje nieokreślona i przez to bezużyteczna, to wynika stąd, że wszechświat przejść musi przez obliczalną liczbę kombinacji w wielkiej grze losowej, którą jest jego istnienie. W nieskończoności, w takim albo innym momencie, zrealizowana musi zostać każda możliwa kombinacja; a nawet więcej: musi ona zostać zrealizowana nieskończenie wiele razy. (…) wszechświat ukazuje się więc jako ruch kolisty, który zdążył się już powtórzyć nieskończenie wiele razy i który toczy swą grę przez całą wieczność.

Nietzsche, pogrążający się już w szaleństwie, przekonany był, że rozumowanie takie przeczy mechanistycznej nauce, którą traktował pogardliwie. Jednak w roku 1889 Henri Poincaré udowodnił, że w newtonowskiej mechanice także mamy do czynienia z wiecznym powrotem. Jego rozprawa zatytułowana O problemie trzech ciał i równaniach dynamiki zawierała nowatorskie podejście do klasycznego tematu za pomocą metod topologii, czyli rozważań operujących ogólnymi pojęciami takimi jak ciągłość, które okazały się bardzo owocne. Poincaré stał się prekursorem teorii chaosu. A metody topologiczne wykazywały jeszcze nieraz swą przydatność: np. w badaniu osobliwości w ogólnej teorii względności (czarne dziury, początek wszechświata) czy w badaniach osobliwych stanów materii (Nobel 2016).

Poincaré udowodnił następujące twierdzenie: Jeśli dopuszczalne stany układu mechanicznego zawarte są w pewnym ograniczonym obszarze D, to w dowolnym otoczeniu U każdego punktu obszaru D znajdzie się punkt s, który powraca do otoczenia U.

Można to narysować. Przestrzeń stanów to zbiór punktów, których współrzędnymi są położenia i pędy x,p (same położenia nie wystarczą, bo nie precyzują, jak zachodzi ruch; jest to tzw. przestrzeń fazowa układu). Naszym obszarem D jest niebieska elipsa (obszar ograniczony odpowiada temu, że np. energia układu jest stała). Rozpatrujemy dowolnie mały obszar U (u nas ma postać czerwonego kółka). Stany z obszaru U po jakimś kroku czasowym przechodzą w stany g(U), niemające wspólnego punktu z U (gdyby tak nie było, to już mamy tezę twierdzenia). Po kolejnych krokach czasowych otrzymujemy g^2(U),\ldots g^n(U). Wiadomo z mechaniki, że objętości tych wszystkich obszarów U, g(U),\ldots g^n(U) są jednakowe (twierdzenie Liouville’a). Skoro tak, to któryś z obszarów ciągu g^n(U) musi przeciąć się z U, a tym samym istnieć będzie punkt s należący zarówno do U, jak i g^n(U) (*)

Oznacza to, że wybierając dowolny stan początkowy i czekając dostatecznie długo, doczekamy się powrotu naszego układu jeśli nie do punktu początkowego to dowolnie blisko tego punktu. Wynik jest zupełnie ogólny, nie musimy nic wiedzieć na temat działających sił, a nasz układ może być dowolnie duży. Twierdzenie Poincarégo pokazuje więc, że na gruncie mechaniki mamy do czynienia z wiecznym powrotem. Można pokazać, że powroty takie będą się powtarzać nieskończenie wiele razy. Idea powrotu nie przeczy więc mechanicznemu światu, choć niezgodna jest ze śmiercią cieplną wszechświata. Poincaré zauważył filozoficzne konsekwencje swego twierdzenia. Zauważył je także młody matematyk Ernst Zermelo, asystent Plancka, który wystąpił z polemiką przeciwko koncepcji entropii Boltzmanna. Zermelo dał się potem poznać jako wybitny specjalista od podstaw matematyki, jego aksjomaty teorii mnogości stosowane są dziś powszechnie.

(*) Idea dowodu twierdzenia Poincarégo opiera się na zachowaniu objętości w przestrzeni fazowej. Kolejne zbiory g^k(U) mają takie same objętości, nie mogą więc być parami rozłączne, gdyż wtedy suma ich objętości przekroczyłaby każdą zadaną liczbę, a wszystko musi się zmieścić w większym obszarze D. Jeśli zaś jakaś para tych obszarów nie jest rozłączna, np. g^k(U) \cap g^l(U)\neq \O przy pewnych k>l\geq 0, to g^{k-l}(U)\cap U \neq\O , co oznacza, że dla jakiegoś punktu s\in U mamy s=g^{k-l}y, gdzie y\in S.

Zachowanie objętości kolejnych obszarów wynika stąd, że gdybyśmy wyobrazili sobie punkty przestrzeni fazowej jako punkty w poruszającej się cieczy, to dywergencja pola prędkości owej cieczy równa się zeru, a to jest warunek dla cieczy nieściśliwej, czyli zachowującej objętość. Oznaczając wektor prędkości \vec{q}=(\dot{x}_i,\dot{p}_i) dla i=1,\ldots, 3N (gdzie N jest liczbą cząstek składających się na układ), mamy

\mbox{div } \vec{q}=\dfrac{\partial\dot{x}_i}{\partial x_i}+\dfrac{\partial\dot{p}_i}{\partial p_i}=\dfrac{\partial^2 H}{\partial x_i \partial p_i}-\dfrac{\partial^2 H}{\partial p_i \partial x_i}=0,

gdzie H=H(x,p) jest hamiltonianem układu, po wskaźniku i sumujemy.

Dodatek matematyczny, twierdzenie Poincarégo w nowoczesnym sformułowaniu. Ujęcie to zawdzięczamy Constantinowi Carathéodory’emu, matematykowi z Getyngi, był już rok 1919. Pojawiło się pojęcie miary, będące uogólnieniem zwykłej objętości. Twierdzenie Poincarégo można uściślić w ten sposób, że zbiór punktów przestrzeni fazowej, które nigdy nie powracają do wybranego otoczenia jest miary zero. Zbiory miary zero, czyli zerowej objętości, mogą mieć skomplikowaną strukturę, ale są rzadkie w tym sensie, że nie można im przypisać żadnej dodatniej objętości. Nowoczesne pojęcie miary zbioru rozszerza dodawanie miar na zbiory przeliczalne (dające się ponumerować liczbami naturalnymi, ciągi zbiorów). Miara spełnia więc warunek:

\mu(\bigcup\limits_{i=1}^{\infty} A_i)=\sum\limits_{i=1}^{\infty} \mu(A_i),

gdy zbiory są parami rozłączne: A_i\cap A_j=\O, dla różnych wskaźników i,j. Pokażemy, że jeśli odwzorowanie g zachowuje miarę, a miara obszaru D jest skończona, to miara zbioru tych punktów D, które nie mają własności powracania, jest równa zeru. W tym sensie prawie każdy stan ma własność powracania.

Dla dowodu pokrywamy obszar D przeliczalną liczbą kul U_1, U_2, \ldots, . Dla każdej kuli U_n definiujemy jej podzbiór B_n jako zbiór tych s\in U_n, dla których g^k(s)\in U_n tylko dla skończenie wielu wartości wskaźnika k. Zbiór B=\bigcup\limits_{i=1}^{\infty} B_i jest zbiorem punktów niepowracających. Ponieważ \mu(B)\leq \sum\limits_{i=1}^{\infty} \mu(B_i), wystarczy udowodnić, że każdy ze zbiorów B_n jest miary zero.

W tym celu wybierzmy dowolny wskaźnik i. Będziemy teraz pisać oznaczenia U_i bez indeksu dla  uproszczenia zapisu.

Rozpatrzmy zbiór C=U\setminus \bigcup\limits_{p=1}^{\infty}g^{-p}(U). Punkt s\in g^{-k}(U) wtedy i tylko wtedy, gdy g^k(s)\in U oraz g^m(s)\notin U przy m>k. Zbiory g^{-i}(C), g^{-j}(C) są parami rozłączne, gdy wskaźniki i, j są różne, przy czym dopuszczamy, aby któryś z nich równał się zeru (g^{-0}(C)=C). Zbiór B_i=\bigcup\limits_{p=0}^{\infty}g^{-p}(C). Zatem mamy

\mu(B_i)=\sum\limits_{p=0}^{\infty}\mu(g^{-p}(C)).

Miary wszystkich zbiorów po prawej stronie są takie same, bo nasze odwzorowanie zachowuje miarę. Gdyby miary te były dodatnie, suma byłaby nieskończona, co jest niemożliwe, gdyż B_i\subset U_i, więc jego miara musi być skończona. Zatem wszystkie miary po prawej stronie są zerowe i \mu(B_i)=0. Zbiór B jest przeliczalną sumą B_i, zatem i on musi być miary zero. Dowód ten pochodzi z artykułu R. Daniela Mouldina, Probability and Nonlinear Systems, „Los Alamos Science” nr poświęcony Stanisławowi Ulamowi.

Twierdzenie Poincarégo o powracaniu ilustruje tzw. kot Arnolda (chodzi o Vladimira Arnolda, wybitnego matematyka rosyjskiego). Mamy tu ograniczoną przestrzeń stanów i pewną grupę stanów początkowych, które ułożone są w kształt kociego pyszczka. Gdy puścimy w ruch tę animację, zobaczymy, że w pewnych chwilach kot powraca.

 

Reklamy

Od igły Buffona do metody Monte Carlo: statystyczne wyznaczenie liczby pi oraz wielkości mrowiska

Jean Marie Leclerc, hrabia de Buffon, był obok swego rówieśnika ze Szwecji Carla Linneusza najsławniejszym naturalistą drugiej połowy XVIII wieku. Za jego życia ukazało się trzydzieści sześć tomów historii naturalnej, a jeszcze kilka po jego śmierci z pozostawionych przez uczonego materiałów. W młodości nic nie zapowiadało, że zdolny jest do tak gigantycznej pracy. Studiował nauki przyrodnicze i Newtona zamiast poświęcić się prawu i być jak ojciec, adwokat parlamentu Burgundii oraz poborca podatku od soli. W Angers zabił w pojedynku chorwackiego oficera i musiał uciekać. Podróżował dłuższy czas po Europie razem z Evelynem Pierrepontem, drugim diukiem Kingston-upon-Hall, potem osiadł w Paryżu i zaczął starać się o przyjęcie do Akademii Nauk. Bardziej od zasług naukowych liczyły się kontakty, Buffon napisał jednak oryginalną, choć nietrudną pracę dotyczącą pewnej gry hazardowej, le jeu du franc-carreau. Polegała ona na tym, aby upuszczać przypadkowo monetę na posadzkę z drobnych płytek. Liczyło się, czy moneta mieści się całkowicie wewnątrz jednej z płytek, czy przecina jakieś granice między nimi. Buffon zastanawiał się, jak duże muszą być monety w stosunku do długości boku kwadratowej płytki, aby gra taka była sprawiedliwa. Przedstawił też jej prostszą odmianę: rzucamy w sposób przypadkowy igły długości l na podłogę z desek o szerokości d i sprawdzamy, czy igła przecina linię oddzielającą deski. Znów można zadać pytanie, przy jakim stosunku l/d gra będzie sprawiedliwa.

BuffonsNeedle

http://demonstrations.wolfram.com/BuffonsNeedleProblem/

Okazuje się, że prawdopodobieństwo przecięcia którejś linii równe jest

p=\dfrac{2}{\pi}\dfrac{l}{d}.

Wzór ten słuszny jest dla l\le d.Buffon ogłosił swe rozważania, po czterdziestu z górą latach, w roku 1777, w długiej rozprawie Essai d’arithmétique morale (arytmetyka moralna to rachunek prawdopodobieństwa). Dla kogoś, kto przełożył na francuski Traktat o fluksjach Isaaca Newtona, nie było to trudne zagadnienie. W roku 1812 Pierre Simon de Laplace zwrócił uwagę, że jeśli znamy stosunek długości igły do odległości linii, możemy eksperymentalnie wyznaczyć wartość liczby \pi. Np. na rysunku powyżej wylosowano 100 rzutów i igła przecina linię 66 razy oraz l=d. Wartość liczby \pi oszacowana na podstawie tego eksperymentu równa jest

\pi=\dfrac{2}{0,66}\approx 3,03

 My pokażemy, jak znaleźć to prawdopodobieństwo, nie korzystając z żadnych całek. Jeśli igła dowolnej długości l pada losowo na układ równoległych linii, to może je przeciąć pewną skończoną liczbę razy. Załóżmy, że zliczamy liczby przecięć dla kolejnych rzutów.

buffon1

Wartość oczekiwana liczby przecięć równa jest

E(l)=p_1+2p_2+3p_3+\ldots.

 Prawdopodobieństwo, że przecięć będzie k oznaczyliśmy p_k, suma zawiera tyle składników, ile trzeba dla danej długości igły. Jeśli podzielimy naszą igłę na dwie części o długościach l=l_1+l_2, to można ustalić zawsze, która część przecina daną linię.

buffon1_5

Jeśli przecięcia obu części będziemy zliczać oddzielnie, a następnie je zsumujemy, wynik nie może być inny niż przed podzieleniem igły:

E(l)=E(l_1)+E(l_2).

Moglibyśmy podzielić igłę na dowolną liczbę kawałków, łatwo widać, że E(cl)=cE(l) dla dowolnych wymiernych wartości c. Funkcja E(l) jest rosnąca, możemy więc napisać

E(l)=E(1)l=cl.

Wyznaczenie E(l) sprowadza się więc do znalezienia stałej c, która jest niezależna od długości igły.

Wyobraźmy sobie, że nasza igła to kawałek drutu, który zaginamy, jak na rysunku. Wartość oczekiwana liczby przecięć nadal będzie sumą wartości oczekiwanych liczby przecięć obu części. Inaczej mówiąc, wygięcie drutu nie zmieni wartości oczekiwanej całkowitej liczby liczby przecięć.

buffon2

A skoro tak, to możemy wyobrazić sobie, że rzucamy jakieś wielokąty foremne i obliczamy wartość oczekiwaną całkowitej liczby przecięć wielokąta z liniami prostymi. Nadal powinna to być ta sama funkcja E(l).

buffon2_5

Aby znaleźć wartość stałej c rozpatrzymy zamiast wielokątów ich graniczny przypadek czyli okrąg o średnicy d. Okręgi takie przecinają nasze linie proste dokładnie w dwóch punktach.

buffon3

Możemy więc napisać równość

2=E(d\pi)=d\pi E(1) \Rightarrow E(l)=\dfrac{2l}{\pi d}.

Obliczyliśmy w ten sposób wartość oczekiwaną liczby przecięć dla dowolnej igły. Co to ma wspólnego z prawdopodobieństwem pojedynczego przecięcia? Jeśli nasza igła jest krótsza niż odległość linii, to może przeciąć najwyżej jedną z nich, a więc E(l)=p_1.

Nietrudno zauważyć, że nasze obliczenie sprowadza się do ustalenia stosunku dwóch pól powierzchni z rysunku, czyli inaczej mówiąc do obliczenia pola powierzchni między sinusoidą a osią odciętych.

buffon0Można sobie wyobrazić bardziej bezpośredni sposób obliczenia pola powierzchni i tym samym liczby \pi. Wyobraźmy sobie kwadrat i załóżmy, że losujemy w sposób całkowicie przypadkowy punkty wewnątrz tego kwadratu. Jeśli w kwadrat wpiszemy okrąg, to niektóre z nich znajdą się wewnątrz okręgu, inne na zewnątrz.

MonteCarlo1000

Na rysunku wylosowano 1000 punktów, 773 leżą wewnątrz okręgu, zatem

\dfrac{\pi}{4}\approx\dfrac{773}{1000}\Rightarrow \pi\approx 3,092

Obliczenie to stanowi prosty przykład działania metody Monte Carlo. Jest ona dość powolna, bo trzeba wygenerować wiele punktów, aby wynik był w miarę dokładny. Zauważmy jednak, że moglibyśmy w ten sposób zmierzyć pole pod dowolną krzywą, czyli mówiąc inaczej, obliczyć dowolną całkę. Metodę tę zaproponował w roku 1946 Stanisław Ulam, pracujący wówczas w Los Alamos. Dzięki pierwszemu komputerowi ENIAC można już było generować liczby losowe. Podczas rekonwalescencji po chorobie Ulam, specjalista od metod probabilistycznych, a do tego wielki miłośnik gier i hazardu, układał sobie pasjanse Canfielda i zaczął zastanawiać się, jak obliczyć w tym przypadku prawdopodobieństwo sukcesu. Było to trudne, ale można by np. wymodelować pewną liczbę gier i oszacować prawdopodobieństwo na podstawie częstości sukcesów. Razem z Johnem von Neumannem zastosowali po raz pierwszy metodę Monte Carlo do obliczeń dyfuzji neutronów.

Ciekawe zastosowania rozumowania typu igły Buffona można napotkać w biologii. Wyobraźmy sobie płaski obszar wypukły o polu powierzchni S. Zamiast igieł mamy dwa zestawy łuków krzywych. Ich całkowita długość to l_1 oraz l_2. Jeśli będziemy losowo umieszczać krzywe obu rodzajów w naszym obszarze, to średnia liczba przecięć między krzywymi obu rodzajów dana jest wzorem analogicznym do wzoru Buffona:

E=\dfrac{2l_1l_2}{\pi S}.

Możemy np. posłużyć się tą zależnością do statystycznego wyznaczenia pod mikroskopem długości pewnej krzywej (np. kawałka korzenia rośliny). Umieszczamy losowo w naszym obszarze badaną krzywą wraz z odcinkami prostej o ustalonej długości. Teraz wystarczy obliczyć, ile razy badana krzywa przecina się z odcinkami prostoliniowymi, co jest znacznie prostsze niż śledzenie za konkretną krzywą (wyobraźmy sobie, że mamy do zbadania tysiące takich korzeni).

root

Niech N będzie liczbę przecięć, zaś H całkowitą długością wylosowanych odcinków, wówczas długość krzywej równa jest

R=\dfrac{\pi NS}{2H}.

Zależność ta (oraz rysunek) pochodzą z klasycznej pracy E.I. Newmana, A Method of Estimating the total length of root in a SampleJournal of Applied Ecology, t. 3, (May, 1966), s. 139-145. Wzór Newmana można też wykorzystać do znalezienia pola powierzchni S, gdy znane są pozostałe wielkości. Sugerowano, że algorytmu tego rodzaju używają mrówki, szacując, czy jakieś miejsce nadaje się na nowe mrowisko. Dwa zestawy krzywych byłyby w tym przypadku dwoma trasami tej samej mrówki-zwiadowcy: liczyłaby ona, ile razy pierwsza trasa i druga się przecinają (trasy są znaczone feromonami, zakłada się, że mrówka reaguje na swoje indywidualne feromony). Nie potrafię ocenić, czy to dobra hipoteza, z pewnością ciekawa. Szczegóły można znaleźć w pracy: E.B. Mallon, N.R. Franks, Ants estimate area using Buffon’s needle, „Proc. R. Soc. London” B, t. 267 (2000) s. 765-770.