Joseph Louis Lagrange i „wektor Laplace’a-Rungego-Lenza” (1781)

Pisałem kiedyś o zasadzie Arnolda: „Jeśli jakieś pojęcie nazwano czyimś imieniem, to nie jest to imię odkrywcy”. Przykładem może tu być tzw. wektor Rungego-Lenza, niemal odkryty przez Jakoba Hermanna, a na pewno odkryty przez Josepha Lagrange’a.

Joseph Louis Lagrange jest mało znany poza kręgiem profesjonalnych matematyków i fizyków. Wiele jego dokonań weszło do języka nauki i stała się dobrem powszechnym, funkcjonującym często bezimiennie. Urodzony w Turynie jako Giuseppe Luigi Lagrangia, poddany królestwa Sardynii, syn urzędnika królewskiego francuskiego pochodzenia, odkrył w sobie talent matematyczny jako nastolatek-samouk. Ojciec stracił fortunę w ryzykownych spekulacjach i syn potrzebował płatnego zajęcia. Pod koniec życia uczony twierdził, że gdyby nie potrzeba zarabiania, pewne nie zostałby matematykiem. Zapewne przesadzał. Talent tej wielkości nie daje chyba możliwości wyboru. W każdym razie młody Lagrange zadziwił Leonharda Eulera, z którym zaczął korespondować na temat rachunku wariacyjnego. W wieku dziewiętnastu lat został też mianowany sostituto – „zastępcą” profesora matematyki w szkole artyleryjskiej w Turynie. Uczył tam młodzieńców starszych od siebie, artyleria była uczonym rodzajem wojsk – to ze szkoły artylerii Napoleon Bonaparte wyniósł swój szacunek do przedmiotów ścisłych. Niezbyt przedsiębiorczy i cichy Lagrange spędził w Turynie wiele lat. Dopiero w wieku trzydziestu lat dzięki protekcji Jeana d’Alemberta został powołany do Akademii Nauk w Berlinie w miejsce Eulera, który wolał carową Katarzynę II od Fryderyka II pruskiego. Piemontczyk spędził w Prusach dwie dekady, narzekając na chłody i pisząc wciąż nowe ważne prace. W Berlinie powstało jego największe dzieło Méchanique analitique (sic!), opublikowane w dwóch tomach już w Paryżu, gdzie spędził resztę życia. Tam podczas Rewolucji zajmował się wprowadzeniem metrycznego systemu miar oraz nowego kalendarza i nowego podziału doby. Metr zdefiniowano wtedy jako jedną czterdziestomilionową część południka paryskiego, lecz babiloński, sześćdziesiątkowy podział godzin i minut okazał się zbyt głęboko zakorzeniony i tutaj zmiany się nie przyjęły. Został też Lagrange pierwszym profesorem analizy w École polytechnique, elitarnej i bardzo nowoczesnej na swe czasy szkole wyższej, modelu dla licznych politechnik na całym świecie.

Książka Lagrange’a była, niemal równo sto lat po Zasadach matematycznych Isaaca Newtona, podsumowaniem dorobku Newtonowskiej mechaniki za pomocą metod analitycznych spod znaku Leibniza, Bernoullich i Eulera.

W książce tej nie znajdzie Czytelnik żadnych rysunków. Metody, jakie w niej wykładam, nie wymagają żadnych konstrukcji ani rozumowań geometrycznych bądź mechanicznych, lecz jedynie operacji algebraicznych poddanych regularnym i jednolitym procedurom. Ci, co kochają Analizę, z przyjemnością zobaczą, jak mechanika staje się jej kolejną gałęzią i będą mi wdzięczni za takie poszerzenie jej domeny.

Newton byłby zapewne wstrząśnięty lekturą dzieła Lagrange’a. Zwyciężyła w nim algebra, metody formalnego przekształcania równań. Algorytmy zwyciężyły z wyobraźnią, ponieważ do ich stosowania wystarczy trzymać się prostych reguł. W ten sposób druga zasada dynamiki stała się układem trzech (lub więcej, zależnie od problemu) równań różniczkowych. Zagadnienie trzech przyciągających się ciał – jeden z wielkich problemów epoki, wymaga dwunastu całkowań. Lagrange pokazał w jednej ze swych prac, jak z dwunastu potrzebnych całkowań, zostaje do wykonania tylko siedem. Osiągnięcia tego rodzaju musiały być elitarne, choć miały też szersze znaczenie. Wielkim problemem epoki ponewtonowskiej była stabilność Układu Słonecznego. Newton przypuszczał, że wzajemne przyciąganie planet doprowadzi z czasem do rozregulowania się kosmicznego zegara, co zresztą może leżeć w boskim planie stwórczym: jako gorliwy czytelnik i komentator Apokalipsy św. Jana traktował znaną nam postać świata jako przejściową, próbował nawet oszacować, kiedy nastąpi ponowne przyjście Chrystusa. Lagrange, a po nim Pierre Simon Laplace (obaj raczej indyferentni religijnie) podjęli zagadnienie stabilności Układu Słonecznego. Wyglądało na to, że system planetarny zmienia się jedynie okresowo i nie ma w nim jednokierunkowych zmian parametrów orbit takich, jak ich rozmiar czy mimośród – a zatem grawitacja nie musi prowadzić do katastrofy kosmicznej. Zagadnienie to okazało się zresztą bardziej skomplikowane, niż sądzili Lagrange i Laplace. Pokazał to pod koniec wieku XIX Henri Poincaré. W wieku XX zrozumiano, że w układach takich jak planetarne powszechnie występują zjawiska chaotyczne. Chaos nie jest jednak nieuchronny, niezbyt wielkie zaburzenia nie naruszają bowiem regularnego charakteru ruchu. Wielkim osiągnięciem dwudziestowiecznej mechaniki analitycznej jest teoria KAM, zwana tak od nazwisk jej twórców: Andrieja Kołmogorowa, Vladimira Arnolda (to jego nazwisko pojawia się w zasadzie Arnolda – sformułowanej oczywiście nie przez niego, lecz przez Michaela Berry’ego) i Jürgena Mosera.

Pokażemy, jak Lagrange wprowadził trzy stałe ruchu Keplerowskiego, które dziś nazywa się powszechnie wektorem (Laplace’a)-Rungego-Lenza. Było to w roku 1779, a dwa lata później zostało opublikowane w pracach Akademii Berlińskiej (w Oeuvres de Lagrange, t. 5, s. 127-133). Algebraiczne podejście Lagrange’a łatwo daje się uogólnić na przestrzeń n-wymiarową {\mathbb R}^n, dlatego tak je pokażemy, uwspółcześniając nieco zapis. Siła grawitacji jest odwrotnie proporcjonalna do kwadratu odległości od centrum, działa wzdłuż promienia wodzącego planety (wektor o współrzędnych x_i/r jest wektorem jednostkowym o kierunku promienia wodzącego). Przyspieszenie planety zapisane jako składowe kartezjańskie spełnia równania

\ddot{x}_i=-\dfrac{\mu x_i}{r^3},\,i=1\ldots n,

gdzie kropki oznaczają pochodne po czasie t, \mu jest iloczynem masy Słońca i stałej grawitacyjnej, a r=x_ix_i\equiv x_1^2+\ldots+x_n^2. Po powtarzających się wskaźnikach sumujemy – jest to konwencja sumacyjna Einsteina, którą uczony żartobliwie nazywał swoim największym odkryciem matematycznym (nigdy nie uważał się za matematyka, lecz za fizyka, któremu przyszło stosować nowe techniki matematyczne i który przychodził do matematyki z innej strony). Za czasów Lagrange’a i jeszcze długo później pisano po trzy równania dla współrzędnych x,y,z, co wydłużało (niepotrzebnie z naszego dzisiejszego punktu widzenia) prace. Sam zapis równań jako trzech składowych kartezjańskich nie był czymś oczywistym za życia Newtona, a więc nawet na początku XVIII wieku. Jakob Hermann uważał, iż wymaga to uzasadnienia.

Szukamy wyrażeń, kombinacji współrzędnych i prędkości, które pozostają stałe podczas ruchu (są to tzw. całki pierwsze). Znanym wyrażeniem tego rodzaju jest energia E będąca sumą energii kinetycznej i potencjalnej:

E=\dfrac{1}{2}\dot{x}_1^2-\dfrac{\mu}{r}.

Lagrange podał jeszcze inne całki ruchu Keplerowskiego (w istocie wystarczy, aby siła działająca ze strony centrum skierowana była radialnie, konkretna jej postać jest nieistotna):

L_{ij}=x_i\dot{x}_j-x_j\dot{x}_i.

Mamy tych całek tyle, ile możliwości wyboru dwóch różnych wskaźników spośród n, czyli {n\choose 2}=\frac{n(n-1}{2}. Naprawdę jest to Keplerowskie prawo pól w przebraniu, a właściwie prawo pól plus stwierdzenie, że ruch zachodzi w płaszczyźnie (to ostatnie bywa nazywane zerowym prawem Keplera, co jest o tyle słuszne historycznie, że od niego Johannes Kepler zaczął swoje badania – przyjął je jako założenie. Kopernik nie wiedział, że tory planet są płaskie!). Zawsze możemy wybrać współrzędne tak, żeby co najwyżej dwie były różne od zera podczas ruchu, np. x_1, x_2. W przypadku 3D trzy całki (L_{23},L_{31},L_{12}) zachowują się jak wektor, jest to wektor momentu pędu.

Trzecia grupa całek, odkryta przez Lagrange’a i właściwa tylko siłom grawitacji, daje się zapisać w postaci

\mu e_i=-\dfrac{\mu x_i}{r}+\dot{x}_j L_{ij},\,i=1 \ldots n.

Wartości e_i są stałe. Jest to wektor zwany powszechnie w literaturze wektorem Rungego-Lenza. Lepiej poinformowani piszą o wektorze Laplace’a-Rungego-Lenza. W istocie jest to wektor Lagrange’a, którego szczególny przypadek podał Jakob Hermann, o czym Lagrange zapewne nie wiedział. Nie interesował go zresztą fakt, że jest to wektor, ważne dla niego były trzy całki ruchu. Laplace zaczerpnął te całki z pracy Lagrange’a i spopularyzował je, umieszczając w słynnym traktacie o mechanice niebios: Traité de mécanique céleste. Laplace, który uczył się pracy naukowej, czytając Lagrange’a, nie zawsze był lojalny wobec starszego kolegi. Ten zaś był chyba zbyt dumny, aby stale jak kupiec podkreślać swoje zasługi, co czyniła większość uczonych, konkurujących między sobą o niewielką pulę płatnych posad. Całki Lagrange’a z dzieł Laplace’a czerpali później inni bądź też sami odkrywali je niezależnie, jak William Rowan Hamilton. Runge i Lenz trafili do historii przypadkiem, z lenistwa późniejszych autorów, zbyt zajętych bieżącą pracą, aby włożyć wysiłek w przypisy.

Zobaczmy jeszcze, jak z wektora Lagrange’a wynika kształt toru planety. Mnożąc obie strony ostatniego równania przez x_i i sumując po powtarzającym się wskaźniku i, otrzymujemy

r +e_i x_i=L^2, 

gdzie L^2= \frac{1}{2} L_{ij}L_{ij}.Jest to równanie stożkowej o mimośrodzie e=\sqrt{e_i e_i}.

Trzeba podkreślić, że dla Lagrange’a nie było to jakieś szczególne osiągnięcie, lecz jedynie punkt wyjścia do pracy nad bardziej skomplikowanym zagadnieniem, gdy do problemu Keplera dodamy jeszcze siłę zaburzającą, jak w rzeczywistym problemie ruchu planet przyciąganych nie tylko przez Słońce, ale także przez inne planety.

Pokażemy jeszcze powyższe wyniki w zapisie wektorowym. Mamy wówczas

{\bf \ddot{r}}=-\dfrac{\mu {\bf r}}{r^3}.

Moment pędu równa się

{\bf L = r\times\dot{r}},

a wektor Lagrange’a:

\mu {\bf e}=-\dfrac{\mu {\bf r}}{r}+{\bf \dot{r}\times L}.

Mnożąc obie strony skalarnie przez {\bf r}, otrzymamy

r+{\bf e\cdot r}=\dfrac{L^2}{\mu}.

Uwaga techniczna. Łatwo sprawdzić, że podane wielkości są całkami pierwszymi, trudniej było je oczywiście odgadnąć. Kluczem jest tutaj obliczenie pochodnej po czasie z wektora jednostkowego, co Lagrange robi pozornie bez powodu, to znaczy powód wyjaśnia się po chwili. Mamy bowiem

\dfrac{d}{dt}\left(\dfrac{x_i}{r}\right)=\dfrac{\dot{x}_i r-\dot{r} x_i}{r^2}=\dfrac{x_jL_{ji}}{r^3}.

Korzystamy z faktu, że r\dot{r}=x_i\dot{x}_i (jest to zróżniczkowane tw. Pitagorasa: r^2=\sum_i x^2_i). Postać wektorowa jest przejrzysta, lecz ograniczona do {\bf R}^3.

 

 

Einstein w Aarau: czyli co mówią równania Maxwella? (1896)

Aarau

Do szkoły w Aarau trafił Einstein po oblanych egzaminach na Politechnikę w Zurychu. Szesnastolatek zdawał tam jako młodzieniec nad wiek rozwinięty, lecz bez matury. Politechnika dopuszczała takich kandydatów, ponieważ sito stanowiły egzaminy wstępne z wielu przedmiotów. Einstein okazał się zbyt słaby z przedmiotów innych niż fizyka i matematyka, toteż poradzono mu, aby zdał jednak maturę.
Szkoła w Aarau, dobrze wyposażona i liberalna, wolna od wojskowego drylu, który tak obrzydł Albertowi w Monachium, zostawiła mu miłe wspomnienia na resztę życia. Uczył się tam niemieckiego, francuskiego, włoskiego, historii, geografii, matematyki, chemii, rysunku technicznego i artystycznego, śpiewu i gry na skrzypcach. Otrzymywał dobre albo bardzo dobre oceny niemal ze wszystkich przedmiotów, słabo wypadał tylko z francuskiego. Zasłużył nawet na pochwałę inspektora na egzaminie z muzyki: „Jeden z uczniów, o nazwisku Einstein, wyróżnił się wykonaniem z głębokim zrozumieniem adagia z jednej z sonat Beethovena”.

Szkolny kolega, Hans Byland, opisywał Alberta z owego okresu jako „zuchwałego Szwaba”: „Pewny siebie, z kapeluszem zsuniętym zawadiacko na tył głowy okrytej grubymi czarnymi włosami. Przechadzał się w tę i z powrotem szybkimi krokami. W ogóle poruszał się w jakimś szalonym tempie, właściwym niespokojnym duchom, które noszą w sobie cały świat. Nic nie mogło umknąć przenikliwemu spojrzeniu jego dużych brązowych oczu. Każdy, kto go poznał, był pod wrażeniem jego dominującej osobowości. Kpiący uśmieszek jego pełnych warg, z których dolna była wyraźnie wysunięta, nie zachęcał filistrów do prób fraternizacji z tym młodzieńcem”.

Górny rząd od lewej: Adolf Lüthy (1878), Hans Frösch (1877), Karl Walter (1876),  Ernst  Hunziker (1876), Eduard Haury (1877), Emil Ott (1877). Dolny rząd od lewej: , Albert Einstein (1879), Cäsar Hofer (1878), Oskar Schmidt (1876), Guido Müller (1877)

Atmosfera Aarau służyła Einsteinowi. Mógł swobodnie myśleć, a to było dla niego zawsze najważniejsze. Toteż nic dziwnego, że właśnie tam zaczął się zastanawiać nad problemami, które miały go z czasem doprowadzić do teorii względności. „Podczas tego roku w Aarau przyszło mi do głowy następujące pytanie: gdyby poruszać się razem z falą świetlną z prędkością światła, to widziałoby się pofalowane pole niezależne od czasu. Wydaje się jednak, że coś takiego nie istnieje! To był pierwszy, młodzieńczy eksperyment myślowy mający związek z teorią względności. Pomysł nie jest wytworem logicznego myślenia, nawet jeśli produkt końcowy związany jest z jakąś strukturą logiczną”.
Idea poruszania się razem z falą świetlną, a nawet szybciej od niej, pojawiała się wcześniej u różnych pisarzy popularnonaukowych, takich jak Camille Flammarion albo Felix Eberty. W powieści Flammariona jej bohater, Lumen, potrafił po śmierci, jako dusza, wyprzedzić światło i obserwować rozmaite wydarzenia z przeszłości: siebie na pierwszej randce albo w wieku sześciu lat, a nawet „władcze i zamyślone czoło” Napoleona podczas rewii wojsk na Placu Marsowym. Gdy uważamy światło za falę w pewnym ośrodku – tak jak dźwięk – nic nie stoi na przeszkodzie wyobrażaniu sobie, że podróżujemy razem z falą. Wiadomo jednak z fizyki, że nie ma takich fal elektromagnetycznych, które zmieniałyby się w przestrzeni, a były niezmienne w czasie, i Albert Einstein czuł to wówczas intuicyjnie. Później, już w trakcie studiów, musiał zdać sobie sprawę, że takie „zamrożone” fale nie mogą być rozwiązaniami równań Maxwella, to znaczy sprzeczne są z naszą wiedzą o przyrodzie.

Co mówią równania Maxwella?

W każdym punkcie przestrzeni możemy określić dwa wektory: jeden opisujący pole elektryczne \vec{E}, drugi – pole magnetyczne \vec{B}. Aby je zmierzyć, należałoby zaobserwować, jakie siły działają w tym punkcie przestrzeni na umieszczony tu ładunek elektryczny: pierwsze z pól działa niezależnie od tego, czy ładunek się porusza, drugie – tylko na ładunki w ruchu.
Zajmiemy się przypadkiem przestrzeni wolnej od ładunków, czyli polem elektromagnetycznym w próżni. Zmienne pole magnetyczne generuje pole elektryczne – jest to zjawisko indukcji elektromagnetycznej odkryte przez Michaela Faradaya i będące fizyczną zasadą działania generatorów prądu. Z kolei zmienne pole elektryczne generuje pole magnetyczne, co odkrył James Clerk Maxwell. W ten sposób powstaje fala elektromagnetyczna, w której oba pola podtrzymują się nawzajem.
Sformułujmy matematycznie prawo indukcji Faradaya. Wyobraźmy sobie krzywą zamkniętą i rozpiętą na niej powierzchnię. Przez powierzchnię tę przechodzi pewien strumień pola magnetycznego, równy iloczynowi składowej pola normalnej do powierzchni B_n i pola powierzchni \Delta S:

\Phi_B=B_n\Delta S.

Gdyby wektor \vec{B} był prędkością cieczy, strumień byłby objętością owej cieczy przecinającą w jednostce czasu powierzchnię. Mówi się czasem, że strumień to liczba linii sił przecinających powierzchnię (linie sił biegną blisko siebie tam, gdzie pole jest duże i rozrzedzają się tam, gdzie pole maleje).


Potrzebujemy jeszcze drugiego obok strumienia pojęcia związanego z polami wektorowymi, a mianowicie krążenia. W przypadku pola elektrycznego jest to suma iloczynów składowej stycznej wektora pola E_t pomnożonych przez długości boków prostokąta na naszym obrazku

{\displaystyle \oint E_t dl=\sum E_t \Delta l.}

Prawo indukcji Faradaya mówi, że krążenie pola elektrycznego wzdłuż krzywej jest równe szybkości zmian strumienia pola magnetycznego w czasie ze znakiem minus:

{\displaystyle \oint E_t dl=\sum E_t \Delta l=-\dfrac{\Delta \Phi_B}{ dt}.}

Dodatni kierunek obiegania krzywej i dodatni strumień związane są regułą śruby prawoskrętnej: gdyby śruba taka obracała się, jak na obrazku, dodatni byłby strumień z dołu do góry. Znak minus w tym prawie fizycznie oznacza tzw. regułę Lenza: gdyby zamiast krzywej ułożyć pętlę z drutu, to pole elektryczne wywołałoby przepływ prądu. Prąd ten wytworzyłby własne pole magnetyczne i byłoby ono takie, żeby zmniejszać zmiany strumienia: gdy strumień rośnie z czasem, pole to powinno go zmniejszać. Sens tej zasady tkwi w tym, że prąd indukcyjny nie może nasilać zjawiska indukcji, które generuje jeszcze większy prąd: mielibyśmy elektrownię dostarczającą prądu za darmo, co jest niemożliwe.
Drugie potrzebne nam równanie Maxwella jest bardzo podobne, zamienione są jedynie rolami oba pola:

{\displaystyle \oint B_t dl=\sum B_t \Delta l=\mu_0\varepsilon_0 \dfrac{\Delta \Phi_E}{d t}.}

Stałe \mu_0,\,\varepsilon_0 są to przenikalności magnetyczna i elektryczna próżni, wielkości znane z pomiarów pola wytwarzanego przez ładunki i prądy. Nie ma znaku minus. Zamienione są miejscami pola elektryczne i magnetyczne.
Dla porządku dodajmy, że istnieją jeszcze dwa równania Maxwella. W przypadku próżniowym mówią one, że strumienie pola elektrycznego i magnetycznego wypływające z każdej zamkniętej powierzchni równe są zeru. W takiej postaci zapisał te równania dopiero Oliver Heaviside.

Najprostsza fala elektromagnetyczna

Obliczmy prędkość rozchodzenia się najprostszej konfiguracji pól. Jest to fala w kształcie tsunami: wartości pola równe zeru skaczą w półprzestrzeni do pewnej stałej wartości. Ponieważ równania Maxwella zawierają pola w pierwszej potędze, są liniowe, więc można z takich rozwiązań zbudować fale prostokątne, a z fal prostokątnych każde inne, wnioski będą zatem słuszne także w przypadku ogólnym.

Nasze tsunami pól elektrycznych i magnetycznych powinno rozchodzić się wzdłuż osi z, żeby strumienie przez zamknięte krzywe się zmieniały.
Gdy fala wchodzi na obszar prostokątnej pętli o szerokości w, prędkość zmiany pola powierzchni zajętego przez falę równa jest wv. Czyli szybkość zmian strumienia równa się B_y wv. Krążenie pola elektrycznego jest wyjątkowo proste, ponieważ tylko jeden bok prostokąta ma niezerowe pole. Mamy więc

-E_x w=- B_y wv\,\Rightarrow E_x=B_y v.

Podobnie, stosując równanie Maxwella do pętli prostokątnej w płaszczyźnie yz, otrzymamy

B_y w=\mu_0\varepsilon_0 E_x w v\,\Rightarrow B_y=\mu_0\varepsilon_0 E_x v.

Wstawiając pierwsze z otrzymanych równań do drugiego dostajemy

B_y=\mu_0\varepsilon_0 v^2 B_y.

Niezerowe rozwiązanie oznacza więc, że prędkość jest równa

v=\pm \dfrac{1}{\sqrt{\mu_0\varepsilon_0}}=\pm c.

Nasze „tsunami” musi rozchodzić się wzdłuż osi z z prędkością światła w próżni (możliwe są oba zwroty prędkości). Ponieważ z takich konfiguracji można zbudować dowolną falę, więc każda fala elektromagnetyczna musi rozchodzić się z prędkością c. (Przy okazji pokazaliśmy, że pola są prostopadłe do kierunku rozchodzenia się fali oraz E=cB).


W roku 1896 Albert Einstein prawdopodobnie nie potrafił tego jasno pokazać. Nawet podczas studiów na Politechnice równania Maxwella nie należały do programu, choć oczywiście Albert się tego dowiedział z własnych lektur.
Jak wówczas rozumiano ten wynik? Wydawało się naturalne, że równania Maxwella opisują zachowanie eteru – ośrodka, w którym rozchodzą się fale elektromagnetyczne tak, jak fale dźwiękowe w powietrzu. Prędkość c oznaczałaby więc prędkość względem eteru. Okazało się jednak z różnych doświadczeń, jak też i prac teoretycznych Lorentza, że jeśli poruszamy się względem eteru, to i tak prędkość się nie zmienia. Wymagało to jednak dodatkowych założeń na temat materii (skrócenie Lorentza-Fitzgeralda). W roku 1905 Einstein uznał, że najprościej jest uznać, że równania Maxwella nie opisują eteru, lecz zmiany pól w przestrzeni i czasie. Wtedy wartość c otrzymamy bez względu na to, jak szybko się poruszamy. Lumen nie mógłby więc prześcignąć fal świetlnych: bez względu na to, jak szybko by pędził, światło uciekałoby mu z prędkością c. Oczywiście, możliwe teoretycznie jest wysłanie ku nam z powrotem sygnałów z przeszłości. Tak się dzieje w powieści SF Carla Sagana Kontakt. Odebrane sygnały z kosmosu okazują się tam transmisją telewizyjną z otwarcia Igrzysk Olimpijskich w Berlinie z udziałem Adolfa Hitlera (była to jedna z najwcześniejszych prób tego rodzaju, pokaz technicznej potęgi III Rzeszy).

Louis Bachelier: Teoria spekulacji (1900)

Louis Bachelier był o dziewięć lat starszy od Einsteina. Prawdopodobnie nigdy się nie zetknęli i nie wiedzieli, że ich badania mają ze sobą coś wspólnego. Pierwszy badał ceny akcji na giełdzie, drugi – podstawowe prawa fizyki. Obaj stosowali metody rachunku prawdopodobieństwa. Na początku XX wieku podejście takie było awangardowe, zdarzenia losowe wydawały się marginesem dobrze naoliwionej i przewidywalnej machiny świata. Machina ta jest jednak zbyt złożona i zbyt wielka, abyśmy potrafili wyobrazić sobie wszystkie jej trybiki jednocześnie. Nie sposób np. przewidzieć ruchu cząstek w gazie, gdyż jest ich zbyt wiele i nie znamy dokładnie ich położeń i prędkości, a w dodatku zderzenia, które są nadwrażliwe na warunki początkowe, stale „tasują” owe położenia i prędkości. (Z podobnego powodu nigdy nie uda się obliczyć, jaka będzie pogoda za rok.) Także giełda zachowuje się w sposób przypadkowy:

Niezliczone są okoliczności, które mogą wpływać na ruchy giełdy: zdarzenia przeszłe, obecne, bądź tylko przewidywane, nie mając często widocznego związku z jej zachowaniem, wpływają jednak na notowania. Obok tych przyczyn niejako naturalnych wpływ mają także przyczyny sztuczne: giełda reaguje na samą siebie i bieżące jej ruchy są nie tylko funkcją ruchów uprzednich, ale także jej obecnego stanu. Określenie tych ruchów zależy od nieskończenie wielu czynników, nie można tu więc mieć nadziei na matematyczną przewidywalność. Sprzeczne opinie na temat tych zmian są tak podzielone, że kupujący liczą na wzrost cen, sprzedający zaś na ich spadek.

Tymi słowami zaczyna się praca doktorska Bacheliera, zatytułowana  Théorie de la spéculation, czyli „Teoria spekulacji”, obroniona na Sorbonie w roku 1900. Opiekunem pracy był Henri Poincaré, matematyk, fizyk, filozof, uczony uniwersalny, który rozumiał, że matematyka powinna sięgać poza swe tradycyjne obszary zastosowań. Rzecz była pionierska, choć z czysto matematycznego punktu widzenia Bachelier nie osiągnął zbyt wiele. Rachunek prawdopodobieństwa nie miał wówczas ścisłych podstaw aksjomatycznych, te zapewnił mu dopiero Andriej Kołmogorow w latach trzydziestych. Kołmogorow cytował zresztą Bacheliera w odróżnieniu od jego francuskich kolegów. Kariera naukowa Bacheliera nie ułożyła się zbyt dobrze. Przed pierwszą wojną światową zajmował kiepsko płatną posadę wykładowcy na Sorbonie, potem jako szeregowy żołnierz brał udział w wojnie. Dopiero w 1927 toku udało mu się zostać profesorem w prowincjonalnym Besançon. Dziś nazywany założycielem matematyki finansowej, za życia pozostawał niezauważony. To zresztą typowy los pionierów w nauce. Ważną rolę w tłumieniu nowatorstwa odgrywają granice dyscyplin: Bachelier pojawił się zbyt wcześnie, by docenili go ekonomiści. Pół wieku później jego doktorat z uznaniem czytali późniejsi laureaci ekonomicznych Nagród im. Nobla. Słynny model Blacka-Scholesa dla ceny opcji mógłby w zasadzie powstać już przed pierwszą wojną światową, praca Bacheliera po niewielkich zmianach zupełnie by do tego wystarczyła. Trudność leżała tu nie po stronie matematyki, lecz ekonomii. Inaczej było w przypadku fizyki: tam prace Einsteina i Smoluchowskiego zostały szybko zaakceptowane. Być może czas potrzebny był w tym przypadku na pogodzenie się z myślą, że procesy zachodzące w ekonomii nie różnią się diametralnie  od zjawisk fizycznych. Być może po prostu język prawdopodobieństw i statystyk wszedł na trwałe do myślenia naukowego.

Bachelier wyobrażał sobie, że istnieje jakaś fundamentalna cena akcji, od której z czasem odchyla się cena rzeczywista. Jego rozważania dotyczyły odchyleń od tej wartości fundamentalnej. Przyjmował, że ich rozkład prawdopodobieństwa dla danego czasu t opisany jest słynną krzywą dzwonową Gaussa:

p(x,t) dx=C(t)\exp{({-a(t)^2 x^2})} dx,

gdzie p(x)dx jest prawdopodobieństwem znalezienia ceny w niewielkim przedziale (x,x+dx). Inaczej mówiąc, pole pod tą krzywą ma sens prawdopodobieństwa. Bachelier napisał też równanie, jakie powinny spełniać funkcje p(x,t). Zakładając, że ruchy naszej akcji w ciągu czasu t_1 i potem w ciągu czasu t_2 są niezależne statystycznie, mamy następujące równanie

p(x,t_1+t_2)=\displaystyle{\int p(x-y,t_2)p(y,t_1) dy. }

Sens tego wyrażenia jest następujący: prawdopodobieństwo, że cena w czasie t_1 odchyli się o y od początkowej wartości to p(y,t_1); prawdopodobieństwo, że w czasie t_2 cena przejdzie od wartości y do x jest równe p(x-y,t_2). Prawdopodobieństwa te mnożymy, ponieważ zdarzenia są niezależne, następnie sumujemy po wszystkich wartościach y, czyli całkujemy. Dziś równanie to nazywamy równaniem Chapmana-Kołmogorowa, a operację tworzenia z dwóch rozkładów prawdopodobieństwa trzeciego – splotem. Splatając dwie krzywe Gaussa, otrzymujemy trzecią krzywą Gaussa, przy czym spełniona musi być zależność:

\dfrac{1}{a(t_1+t_2)^2}=\dfrac{1}{a(t_1)^2}+\dfrac{1}{a(t_2)^2}.

Łatwo stąd zauważyć, że 1/a^2 powinno być proporcjonalne do czasu. Ostatecznie otrzymujemy dla funkcji p(x,t) wyrażenie

{\displaystyle p(x,t)=\dfrac{1}{\sqrt{4\pi kt}}\exp{\left(-\dfrac{x^2}{4kt}\right)}.}

Gęstość prawdopodobieństwa ceny akcji rozpływa się z czasem coraz szerzej. Współczynnik k określa, jak szybko. Wariancja naszego rozkładu równa jest 2kt. Mamy tu analogię ze zjawiskiem dyfuzji.

I nie jest to przypadek, gęstość prawdopodobieństwa spełnia bowiem równanie dyfuzji:

\dfrac{\partial p(x,t)}{\partial t}=k\dfrac{\partial^2 p(x,t)}{\partial t^2}.

Te samo równanie opisuje przewodnictwo cieplne, co badał Joseph Fourier. W nowoczesnej matematyce finansowej stosuje się rozkład Gaussa nie do wartości ceny, lecz do wartości jej logarytmu. Usuwa to natychmiast kłopotliwą obiekcję, jaką można mieć do rozważań Bacheliera: rozkład Gaussa jest niezerowy dla każdego x, więc cena dowolnej akcji mogłaby spaść poniżej zera z niezerowym prawdopodobieństwem.

 

Problem Keplera: Planety poruszają się po okręgach

Jednym z najważnieszych wątków w historii nauk ścisłych było badanie ruchów planet. Starożytni i Kopernik starali się je przedstawić jako złożenie jednostajnych lub prawie ruchów po okręgach. Doskonała machina kosmosu powinna być swego rodzaju majstersztykiem, czyli działającym dowodem umiejętności Majstra, który ją stworzył. Johannes Kepler włączył do tych rozważań nową, barokową wizję świata i estetykę. W sfery niebieskie wpisane zostały elipsy, a kosmos stał się dynamiczny, dopuszczalne było teraz przyspieszanie i zwalnianie ruchu, geometria pożeniona została z fizyką. Dopiero jednak Isaac Newton podał matematyczne wyjaśnienie fizyki ruchu planet: działa na nie ze strony Słońca siła grawitacji odwrotnie proporcjonalna do kwadratu odległości. Wyjaśnił w ten sposób odkryte przez Keplera prawidłowości za pomocą siły, która w tajemniczy sposób oddziaływała poprzez próżnię. Można powiedzieć, że dalszy rozwój fizyki to dzieje przyzwyczajania się do prawa ciążenia Newtona. Okazało się one niezwykle precyzyjne i płodne, dopiero w 1915 r. Albert Einstein zaproponował lepszą, to znaczy bliższą obserwacjom teorię grawitacji.

Także spora część matematyki po Newtonie dotyczyła mechaniki niebios, czyli rozmaitych ruchów pod wpływem siły ciążenia. Problemem Keplera nazywają matematycy zagadnienie ruchu wokół nieruchomego centrum pod działaniem siły odwrotnie proporcjonalnej do kwadratu odległości. Jest to zerowe przybliżenie dla Układu Słonecznego: gdy pominiemy siły grawitacji pomiędzy planetami i innymi małymi ciałami tego Układu. Przyspieszenie planety \vec{a} jest równe

\vec{a}=-\dfrac{\vec{r}}{r^3},

gdzie \vec{r} jest zależnym od czasu położeniem i pominęliśmy nieistotne dla matematyka stałe. Oczywiście rozwiązania tego równania są doskonale znane. Jak się jednak okazuje, wciąż można coś nowego na ich temat powiedzieć. Korzystamy tu z pracy Jespera Göranssona z roku 2015, na którą zwrócił uwagę John Baez. Rzecz jest tym bardziej interesująca przez to, że Göransson nie jest chyba akademickim uczonym, lecz amatorem w ściśle etymologicznym znaczeniu słowa, czyli miłośnikiem (nie mylić z amatorszczyzną, którą można spotkać bez trudu i na uczelniach).

Rozwiązaniami problemu Keplera są ruchy po elipsach, parabolach bądź hiperbolach – zależnie od znaku całkowitej energii E (v jest prędkością cząstki):

E=\dfrac{v^2}{2}-\dfrac{1}{r}.

Zajmiemy się poniżej przypadkiem eliptycznym, gdy energia jest ujemna. Zamiast opisywać zależność położenia od czasu t wprowadzimy nową zmienną u, która spełnia równanie

\dfrac{dt}{du}=r.

Wszystkie orbity elipityczne mają u nas okres 2\pi, zarówno gdy używamy czasu t, jak i przy użyciu „czasu” u. Gdy planeta jest bliżej centrum u biegnie szybciej. Możemy ruch planety opisać podając czterowymiarowy wektor (t,\vec{r}). Oznaczmy prędkości mierzone wzgledem nowego czasu primami. Równanie energii przybiera postać

(x')^2+(y')^2+(z')^2+(t'-1)^2=1.

Koniec wektora czterowymiarowej prędkości (t',\vec{r'}) leży na sferze S^3 o środku (1,0,0,0). Narysowaliśmy sferę S^2, pomijając zmienną z'. Okazuje się, że możliwe ruchy naszego punktu są kołami wielkimi w S^3, tzn. kołami o promieniu 1. Koła wielkie są najkrótszymi drogami łączącymi punkty na sferze, z tego powodu wybierają je samoloty na długich trasach – dlatego np. lecąc z Londynu do Seattle, przelatujemy nad Grenlandią. Kiedy się spojrzy na globus, widać, że to ma sens. A więc wszystkie ruchy w problemie Keplera odpowiadają kołom wielkim w przestrzeni prędkości i odbywają się ze stałą jednostkową prędkością. Inaczej mówiąc, „czas” u jest kątem mierzonym ze środka sfery. Narysowaliśmy jedno z takich kół wielkich, nachylone pod kątem \alpha do równika. Gdy kąt \alpha=0, planeta zakreśli okrąg w płaszczyźnie xy. Gdy kąt \alpha=\frac{\pi}{2}, planeta będzie się poruszać wzdłuż osi x, to także jeden z możliwych ruchów: spadanie wprost na centrum. Mówiliśmy o obrotach w płaszczyźnie ty. W czterowymiarowej przestrzeni mamy sześć możliwych płaszczyzn i dowolny obrót czterowymiarowy przeprowadza koło wielkie w jakieś inne koło wielkie. Ruchy planety mają więc symetrię czterowymiarowej grupy obrotów SO(4). Możemy więc powiedzieć, że planeta zawsze porusza się jednostajnie po okręgu na sferze S^3, a elipsy, które obserwujemy, wynikają z rzutowania czterowymiarowej czasoprzestrzeni na przestrzeń trójwymiarową. Wektor prędkości (x',y',z') zakreśla elipsę wynikającą wprost z rzutowania.

Łatwo pokazać, że położenia planety leżą na elipsie o mimośrodzie e związanym z kątem \alpha związkiem

e=\sin\alpha.

Ta elipsa jest przesunięta o e tak, że początek układu (centrum siły, Słońce) jest w jej ognisku.

„Nowy czas” u jest w istocie znaną od czasów Keplera anomalią mimośrodową.

Jest to szczególna konstrukcja: gdy planeta P zakreśla elipsę, to punkt P', jej swoisty cień, zakreśla okrąg jednostkowy. Kąt u związany jest z fizycznym czasem t równaniem Keplera:

t=u-e\sin u.

Odległość planety od Słońca dana jest prostym równaniem oscylacyjnym:

r=1-e\cos u.

Fakt ten odkrył kiedyś Kepler podczas swej „wojny z Marsem”. Göransson pokazał też analogiczne konstrukcje dla energii dodatniej i zerowej. W pierwszym przypadku ruch odbywa się po hiperboloidzie z metryką Minkowskiego (grupą symetrii jest grupa Lorentza), w drugim po paraboloidzie (grupą symetrii są izometrie euklidesowe).

 

 

Religia Einsteina i Spinoza

W związku z publicznym zainteresowaniem postacią Barucha Spinozy pragnę przypomnieć, że do wiary w Boga Spinozy przyznawał się wielokrotnie Albert Einstein. Uczony czytał Spinozę, zwiedził jego dom zamieniony na muzeum i wielokrotnie się wypowiadał na temat filozofa. Więcej o Spinozie pisałem tutaj. Przypominam wpis z roku 2012, choć nie sądzę, żeby w wiadomościach TVP pojawił się pasek o treści: „Einstein wierzył w Boga Spinozy”

Przez media przewinęła się ostatnio wiadomość o wystawieniu na aukcji listu Einsteina z 1954 roku, a więc napisanego niedługo przed śmiercią uczonego. List dotyczy religii i skierowany był do filozofa Erika Gutkinda. Może to objaw nasilenia wojny kultur (a może szukania dobrych lokat kapitału w niepewnych czasach), w każdym razie list został sprzedany za przeszło trzy miliony dolarów, podczas gdy w 2008 kosztował zaledwie 400 000 dolarów.

Einstein mówi w tym liście rzeczy, jakie wielokrotnie powtarzał w ciągu swego życia. „Słowo Bóg jest dla mnie jedynie wyrazem i wytworem ludzkiej słabości, a Biblia zbiorem dostojnych, lecz jednak mocno prymitywnych legend. Żadna, nawet najbardziej subtelna interpretacja nie może tego (moim zdaniem) zmienić. Te wysubtelnione  interpretacje są ze swej natury wielce różnorodne i nie mają prawie nic wspólnego z pierwotnym tekstem. Nieskażona religia żydowska jest dla mnie, tak samo jak wszystkie inne religie, wcieleniem prymitywnych przesądów. I naród żydowski, do którego chętnie należę i z którego mentalnością czuję się głęboko zrośnięty, nie ma w moich oczach żadnej szczególnej godności, odmiennej niż inne narody”.

Jeszcze w okresie międzywojennym Einstein został zaatakowany przez kardynała Bostonu Williama Henry’ego O’Connella: „Zwątpienie i mgliste spekulacje na temat czasu i przestrzeni prowadzą jedynie do stworzenia zasłony, poza którą skrywa się upiorne widmo ateizmu”. Także rabin Herbert S. Goldstein z Nowego Jorku poczuł się zaniepokojony i wysłał do Einsteina telegram: „Czy wierzy pan w Boga? Stop. Odpowiedź opłacona do 50 słów”. Odpowiedź uczonego, choć telegraficznie skrótowa, nie zadowoliła chyba rabina: „Wierzę w Boga Spinozy, który objawia się w regularnej harmonii wszystkiego, co istnieje, ale nie w Boga, który zajmuje się losami i uczynkami ludzkości”.

A jednak mimo wypowiedzi, które sprawiać musiały spory zawód rozmaitym przedstawicielom Boga na ziemi, Albert Einstein był głęboko religijny z natury. Kiedy mówił o Bogu, który nie rzuca kośćmi albo jest wyrafinowany, lecz nie złośliwy, mówił bardziej serio, niż mogło się zdawać. Bóg w jego ustach był czymś więcej niż tylko façon de parler. Uczonemu bliżej było do bogobojnego protestanta Keplera niż do obrazoburcy Galileusza. Wypowiadał się otwarcie, nie ukrywał poglądów, ale nie miał temperamentu bojownika, polemisty, dyskutanta, pragnącego odnieść zwycięstwo za wszelką cenę. Choćby za cenę prawdy. Wspominany przeze mnie Max Brod wydał w 1948 roku jeszcze jedną powieść historyczną o uczonych. Nosiła tytuł Galilei in Gefangenschaft („Galileusz uwięziony”) i zapewne nie była lepsza od książki o Tychonie Brahe. Autor przesłał ją Einsteinowi, a ten odpisał z podziękowaniem i uwagami po lekturze. „Wyobrażam go sobie inaczej. Nie należy wątpić w to, że walczył on namiętnie o prawdę – bardziej niż ktokolwiek inny. Ale trudno uwierzyć, aby człowiek dojrzały widział sens połączenia odnalezionej prawdy z płytkimi myślami tłumu, zaplątanego w groszowe interesy. (…) Bez szczególnej potrzeby udaje się on do Rzymu, by walczyć z klechami i innymi politykierami. Taki obraz nie odpowiada memu wyobrażeniu o niezależności wewnętrznej starego Galileusza. Nie mogę sobie wyobrazić, bym ja na przykład przedsięwziął coś w tym rodzaju, by bronić teorii względności. Pomyślałbym, że prawda jest znacznie silniejsza ode mnie i wydawałoby mi się śmieszną donkiszoterią bronić jej mieczem, osiodławszy Rosynanta”.

Intuicja Einsteina była częściowo trafna. Galileusz niewątpliwie bardziej od Einsteina gustował w polemikach (choć nie był chyba bardziej od Einsteina uparty, jeśli chodzi o pryncypia). Jednak Galileusz nie jeździł do Rzymu jedynie po to, by zaspokoić swoją potrzebę wielkości i chwały. Być może z początku wiodła go ambicja. Szybko jednak zrozumiał, że gra toczy się o elementarną swobodę dyskusji i ocalenie własnej skóry. Był szanowanym uczonym, który chciał ogłosić dzieło życia, wiedząc, że nie zostanie ono dobrze przyjęte przez władze kościelne. Dzieło nie dotyczyło religii, wydawało się więc, że jakiś kompromis będzie możliwy, aby obie strony mogły wyjść z twarzą.  Kościół zawsze deklarował poparcie dla nauk. Jednak układy z władzą absolutną obowiązują tylko jedną stronę. Galileusz zapewne musiał przegrać, ponieważ był zbyt mało cyniczny.

Albert Einstein miał zdecydowane poglądy w wielu sprawach, ale był też człowiekiem mądrym (to nie to samo, co być wybitnym uczonym: głupich, choć wybitnych był legion). Rozumiał, że nie każda dyskusja może zostać rozstrzygnięta, czy to w nauce, czy w życiu publicznym. Podejrzewam też, że rozumiał, jak niewiele w istocie dzieli ludzi, jeśli chcą się poważnie zastanowić nad swoimi poglądami i swoją wiarą, a nie podporządkować sobie innych. Większość tzw. debat publicznych nie ma niestety nic wspólnego z namysłem, bardzo zaś wiele z władzą i dominacją. Poszukiwanie prawdy jest czymś zgoła innym.

Newton, Leibniz i liczba pi z szeregu Fouriera

Pisałem niedawno o szeregach odkrytych przez Leibniza i Newtona, a związanych z liczbą \pi. Oba te szeregi można łatwo powiązać ze sobą za pomocą rozwinięcia Fouriera. Kiedyś już pisałem o Josephie Fourierze i jego nieśmiertelnym wynalazku. Tutaj pokażemy tylko, jak to się wiąże z szeregami Leibniza:

\dfrac{\pi}{4}=1-\dfrac{1}{3}+\dfrac{1}{5}-\dfrac{1}{7}+\ldots

i Newtona:

\dfrac{\pi}{2\sqrt{2}}=1+\dfrac{1}{3}-\dfrac{1}{5}+\dfrac{1}{7}+\ldots.

Rozwinięcie w szereg Fouriera stosuje się do funkcji okresowych. Weźmy np. funkcję f(x)=x w przedziale x\in (-\pi,\pi).

Możemy zrobić z niej funkcję okresową powtarzając jedynie zęby piły na kolejnych przedziałach. Funkcja ta jest nieciągła na końcach przedziałów, ale to nie szkodzi. Idea Fouriera polega na przybliżeniu dowolnej funkcji f(x) nieskończoną sumą sinusów i cosinusów o coraz mniejszych okresach. W naszym przypadku okresem f(x) jest 2\pi, a funkcja jest nieparzysta, jak sinus. Szukamy więc rozwinięcia następującej postaci:

{\displaystyle f(x)=\sum_{i=1}^{\infty}a_{n}\sin nx}.

Żeby znaleźć wartości współczynników rozwinięcia, mnożymy obie strony przez \sin mx. Ponieważ całka po okresie z iloczynu dwóch sinusów znika, więc z prawej strony przeżywa tylko wyraz n=m (*):

{\displaystyle \int_{-\pi}^{\pi} f(x)\sin mx dx =a_m \int_{-\pi}^{\pi} \sin^2 mx dx=a_m \pi}.

Ostatnia równość po prawej stronie wynika stąd, że kwadrat sinusa scałkowany po wielokrotności okresów daje \frac{1}{2} razy długość przedziału całkowania.
W naszym przypadku

x=2\left(\dfrac{\sin x}{1}-\dfrac{\sin 2x}{2}+\dfrac{\sin 3x}{3}+\ldots\right),

gdzie cały czas ograniczamy się do przedziału (-\pi,\pi). Proszę zobaczyć, co otrzymamy, biorąc coraz większe liczby składników sumy.


Widać gołym okiem, że szereg jest zbieżny oprócz może końców przedziału, gdzie nasza funkcja ma skok.
Teraz wystarczy wziąć dwie wartości argumentu. Dla x=\frac{\pi}{2} otrzymamy szereg Leibniza, dla x=\frac{\pi}{4} – szereg Newtona. Warto zauważyć, że jesteśmy daleko od końców przedziału, gdzie mogą być kłopoty ze zbieżnością. Oczywiście Joseph Fourier to już XIX wiek, czyli matematyka bogatsza o 150 lat rozwoju od czasów Leibniza i Newtona. Najprostszy znany mi wykład o szeregach Fouriera znaleźć można w rozdz. 50 t.1 Wykładów Feynmana.

(*) Wynika to z tożsamości:

2\sin mx\sin nx=\cos(n-m)x-\cos(n+m)x.

Całka z cosinusa po okresie równa jest zero, więc tylko pierwszy wyraz po prawej stronie dla m=n przeżywa całkowanie.

Jakob Hermann pisze do Johanna Bernoulliego na temat ruchu planet, 12 lipca 1710 r.

Ulmenses sunt mathematici – mieszkańcy Ulm to matematycy – głosiło stare porzekadło. Znamy jednego matematyka z Ulm Johannesa Faulhabera, który miał kontakty z Keplerem i być może z Kartezjuszem. Słynna ogrzewana komora, w której rozmyślał francuski filozof pewnej jesieni, mieściła się w Neuburgu niezbyt oddalonym od Ulm. No i w Ulm urodził się Albert Einstein, lecz rodzina rok później się przeprowadziła i uczony jako człowiek dorosły nigdy potem nie odwiedził już swego miasta rodzinnego.

Prawdziwą kolebką matematyków była natomiast leżąca niezbyt daleko od Ulm Bazylea. Stąd pochodziła rozgałęziona rodzina Bernoullich, a także Leonhard Euler i Jakob Hermann. Protoplastą naukowego rodu był Jakob Bernoulli, to od niego uczyli się matematyki jego brat Johann oraz Jakob Hermann. Johann z kolei był ojcem wybitnego Daniela i nauczycielem genialnego Eulera. Ponieważ posad dla matematyków nie było w Europie wiele, więc wszyscy ci matematycy sporo podróżowali. Dzięki bazylejskim matematykom rachunek różniczkowy i całkowy Leibniza stał się podstawą nowożytnej matematyki.

Drugim wielkim zadaniem uczonych od końca XVII wieku stało się przyswojenie osiągnięć Isaaca Newtona. Matematyczne zasady filozofii przyrody zawierały rewolucyjną fizykę przedstawioną za pomocą indywidualnego języka matematycznego, stworzonego przez autora. Nie było w historii nauki traktatu tak oryginalnego zarówno pod względem treści fizycznej, jak i matematycznej. Toteż jego zrozumienie i opanowanie zajmowało całe lata nawet wybitnym uczonym. Na kontynencie panował matematyczny idiom Leibniza i twierdzenia Newtona tłumaczono niejako na tę zrozumiałą wśród uczonych symbolikę.

Jakob Hermann pierwszy podał różniczkowe sformułowanie II zasady dynamiki. Miało ono u niego postać

G=M dV: dT,

gdzie G,M oznaczały siłę i masę, a dV, dT – różniczki prędkości i czasu. Zapis ten pojawił się dopiero na 57 stronie jego traktatu Phoronomia (1716) i odnosił się do siły ciężkości zależnej od położenia. Oczywiście, Newton już w 1687 r. rozważał takie siły, ale wyłącznie w postaci geometrycznej. Jego II prawo brzmiało: „Zmiana ruchu jest proporcjonalna do przyłożonej siły poruszającej i następuje w kierunku prostej, wzdłuż której siła ta jest przyłożona.” Newton miał na myśli zmiany pędu ciała w pewnym krótkim czasie. Jednym problemem tego sformułowania była kwestia opisywania zmian w czasie, drugim problemem był wektorowy charakter siły: ilość ruchu, pęd, zmienia się w kierunku przyłożonej siły.

Pokażemy, jak Hermann rozwiązał problem ruchu ciała przyciąganego siłą odwrotnie proporcjonalną do kwadratu odległości od nieruchomego centrum. Zwolennicy Leibniza mieli zastrzeżenia do Newtonowskiego dowodu tego faktu, zbyt szkicowego. Pragnęli wyraźnego wykazania, że tylko stożkowe (albo część linii prostej) mogą być torem ciała. Opisywałem kiedyś rozwiązanie tego problemu podane w XIX wieku przez Williama Rowana Hamiltona.

Wyobrażamy sobie przyciągane przez centrum S ciało zakreślające krzywą CD. Jego ruch w nieskończenie krótkim czasie dt można przedstawić jako sumę wektorową ruchu bezwładnego od C do E oraz spadania od E do D wzdłuż kierunku siły w punkcie C, tzn. odcinki SC i DE są równoległe. Zmiana współrzędnej x w ruchu bezwładnym byłaby równa dx. Efekt działania siły przyciągającej to różniczka drugiego rzędu ddx (co później zapisywano d^{2}x). Oczywiście do ddx wchodzi tylko x-owa składowa siły.

Dziś narysowalibyśmy to tak, Hermann odnajduje trójkąty podobne na swoim rysunku i dochodzi do wniosku, że

ddx \propto F\dfrac{x}{r} dt^2.

Pole SCD zakreślane w czasie dt można przedstawić jako pole trójkąta o bokach [x,y] oraz [dx,dy], a więc jest ono równe połowie pola równoległoboku dt\propto y dx-x dy.
Ostatecznie różniczkę ddx możemy zapisać następująco (siła jest odwrotnie proporcjonalna do kwadratu odległości):

-a ddx=\dfrac{x}{r^3}(y dx-x dy)^2,

gdzie a jest stałą proporcjonalności. Naszym zadaniem jest znalezienie równania krzywej.
Całką tego równania jest

a dx=\dfrac{y}{r}(ydx-xdy).

Dzieląc obustronnie przez x^2 i całkując ponownie, otrzymujemy

-\dfrac{a}{x}+c=-\dfrac{r}{x}\;\Rightarrow\; a-cx=r,

gdzie c jest stałą całkowania. Jest to równanie stożkowej (po obustronnym podniesieniu do kwadratu otrzymamy wielomian kwadratowy w zmiennych x,y).

Postępowanie Hermanna jest pomysłowe, choć całkowania są nieintuicyjne. Można jednak, jak zawsze, sprawdzić je, idąc od końca do początku, tzn. wykonując dwa kolejne różniczkowania. Tak naprawdę sztuka rozwiązywania równań różniczkowych jest często zamaskowanym odgadywaniem całek. Różniczkowania wynikają z reguły Leibniza dla iloczynu d(uv)=v du+u dv.
W naszym przypadku mamy np. dla drugiego równania

d\left(\dfrac{y}{r}\right)=\dfrac{rdy-ydr}{r^2}=\dfrac{r^2 dy-y rdr}{r^3}.

Pamiętając, że r^2=x^2+y^2, mamy rdr=xdx+ydy. Itd. itp. rachunki „od końca” są łatwe. W pierwszym całkowaniu przyjęliśmy stałą całkowania równą zeru, co nie zmniejsza ogólności wyniku, bo Hermann zakłada, iż oś Sx jest osią toru planety, tzn. przecięcie z osią x z lewej strony punktu S następuje w peryhelium albo aphelium, czyli przy y=0 powinno być dx=0.
Johann Bernoulli, który miał dość nieznośny charakter (nigdy nie dość wypominania mu, jak to konkurował ze swym synem Danielem) odpowiedział wybrzydzaniem na procedurę Hermanna i przedstawił swoją ogólniejszą, opartą na innym podejściu.

Z dzisiejszego punktu widzenia Hermann odkrył pewną całkę pierwszą problemu Keplera (tak się dziś nazywa problem ruchu wokół centrum przyciągającego jak 1/r^2). Całka pierwsza to wyrażenie, którego wartość nie zmienia się podczas ruchu. U Hermanna jest to

-\dfrac{dx}{dt}L_{z}-\dfrac{y}{r}=A_{y}=const.

W wyrażeniu tym L_z=xp_{y}-yp_{x}. Gdyby zająć się przyspieszeniem wzdłuż osi Sy, otrzymalibyśmy drugą całkę. Razem składają się one na wektor

\vec{A}=\vec{p}\times \vec{L}-\dfrac{\vec{r}}{r}.

Nazywa się go wektorem Rungego-Lenza, choć odkrył go właściwie Jakob Hermann. W pełni zdał sobie sprawę z faktu, że mamy trzy takie całki pierwsze, czyli w istocie wektor, Joseph Lagrange, a po nim Pierre Simon Laplace. Laplace przedyskutował też systematycznie wszystkie całki pierwsze problemu Keplera (trzy to moment pędu, trzy to nasz wektor, jedna to energia całkowita planety). Carl David Runge (ur. 1856) oraz Wilhelm Lenz (ur. 1888) pojawiają się w tej historii późno i w rolach dość przypadkowych. Pierwszy (znany z algorytmu Rungego-Kutty) użył tego wektora w swoim podręczniku analizy wektorowej, drugi zastosował go do pewnego problemu w starej teorii kwantów, przepisując go z podręcznika Rungego. Zupełnie niekosztowny sposób wejścia do historii. Wilhelm Lenz jest natomiast autorem tzw. modelu Isinga (Ernst Ising był jego doktorantem). Wektor odegrał pewną rolę w powstaniu mechaniki kwantowej. Stosując go, Wolfgang Pauli otrzymał wartości energii w atomie wodoru na podstawie formalizmu macierzowego Heisenberga. Chwilę później Erwin Schrödinger zrobił to samo w swoim formalizmie i wielu fizyków nie wiedziało, co o tym myśleć, bo na pierwszy rzut oka oba podejścia różniły się kompletnie.

Leibniz, Newton i liczba pi (1676)

W roku 1676 dobiegł końca czteroletni pobyt Gottfrieda Wilhelma Leibniza w Paryżu. Teologiczno-dyplomatyczne cele jego misji nie zostały osiągnięte, Leibniz zetknął się jednak w Paryżu z najnowszymi naukami ścisłymi, w szczególności zajął się bliżej matematyką. Były to najświetniejsze lata paryskiej działalności Christiaana Huygensa, którego traktat o zegarze wahadłowym wtedy właśnie ujrzał światło dzienne. Leibniz chłonął nowości i robił szybkie postępy. Już w roku 1673 udało mu się znaleźć słynne przedstawienie liczby pi za pomocą szeregu. Odkrycie to zrobiło spore wrażenie zarówno na paryskich uczonych, jak i na samym odkrywcy, zachęcając go do dalszej pracy w dziedzinie matematyki (w przypadku uczonego tak wszechstronnie uzdolnionego, jak Leibniz, wybór dziedziny nie był bynajmniej czymś oczywistym). Dwa lata później odkrył Leibniz rachunek różniczkowy i całkowy. Ale szereg stanowił wciąż jego powód do dumy. Toteż pochwalił się nim, pisząc w roku 1676 do Henry’ego Oldenburga, sekretarza londyńskiego Royal Society. Z pewnym niedowierzaniem dowiedział się, że „jego” szereg znany jest na Wyspach. Było to trochę tak, jakby ktoś wracając z Princeton z wynikiem, który wszystkich zachwycił, usłyszał, że w Rosji na prowincji dawno już o tym wiedzą.

Szereg to uogólnienie sumy na przypadek nieskończonej liczby wyrazów. Znanym przykładem jest szereg geometryczny. Np.

\dfrac{1}{2}+\dfrac{1}{4}+\dfrac{1}{8}+\ldots =1.

Co można zilustrować dzieleniem pola kwadratu jednostkowego na kolejne połowy.

Oczywiście, nie zawsze suma taka jest dobrze określona. Jednym z najprostszych nieoczywistych szeregów jest szereg harmoniczny, odwrotności kolejnych liczb naturalnych:

1+\dfrac{1}{2}+\dfrac{1}{3}+\dfrac{1}{4}+\ldots

Można łatwo pokazać, że szereg ten jest rozbieżny, tzn. jego sumy częściowe przekraczają dowolną z góry zadaną liczbę – należy tylko zsumować odpowiednio wiele składników. Podobnie rozbieżny jest szereg odwrotności liczb nieparzystych (mimo że z poprzedniego szeregu wybraliśmy jedynie co drugi wyraz):

1+\dfrac{1}{3}+\dfrac{1}{5}+\dfrac{1}{7}+\ldots

Nawet gdy ograniczymy się jedynie do odwrotności liczb pierwszych, szereg pozostanie rozbieżny, ten ostatni fakt udowodnił Leonhard Euler.

Szereg Leibniza ma następującą postać:

\dfrac{\pi}{4}=1-\dfrac{1}{3}+\dfrac{1}{5}-\dfrac{1}{7}+\ldots

Jest on naprzemienny, tzn. znaki kolejnych wyrazów się przeplatają. Szereg taki na pewno jest zbieżny, jeśli tylko jego wyraz ogólny dąży do zera. Nie zawsze jednak łatwo jest znaleźć wartość takiej sumy. Leibnizowi udało się odkryć powiązanie z liczbą \pi, znaną z geometrii. Na pierwszy rzut oka nie ma żadnych powodów, aby taki szereg, zbudowany za pomocą prostej arytmetyki, doprowadzić miał do liczby \pi. Stąd wrażenie, jakie to odkrycie wywarło. Jak ujął to dwudziestowieczny matematyk K.H.D. Knopp: „Dzięki temu rozwinięciu opadła jakby zasłona spowijająca tę dziwną liczbę [\pi]”.

Za pośrednictwem Oldenburga Isaac Newton reprezentował wyspiarzy. Profesor z Cambridge (które było wtedy matematyczną pustynią) przesłał mu dwa obszerne listy z przeznaczeniem dla Leibniza. Newton znany był wtedy w Europie jedynie z prac optycznych. Był jednak, i może przede wszystkim, matematykiem, najwybitniejszym w tamtej epoce. Derek T. Whiteside poświęcił najlepsze lata życia na wydanie jego rękopisów matematycznych w ośmiu ogromnych tomach. Większość tego materiału z różnych powodów nie ukazała się drukiem za życia Newtona. W chwili gdy napisał Leibniz, Newton był – by tak rzec – w trakcie czwartego tomu swoich dzieł, dawno po odkryciu rachunku fluksji i fluent, czyli swojej wersji rachunku różniczkowego i całkowego (a jak zwykle u matematyków pierwsze tomy dzieł zebranych są najciekawsze). Obaj uczeni chwalili się wynikami, nie przedstawiając dowodów i tylko mgliście napomykając o rachunku. Tak się składa, że rozwinięcia w szereg stanowiły inny ulubiony temat Newtona. Odkrył np., że naprzemienny szereg harmoniczny związany jest z wartościami funkcji logarytmicznej:

\ln{2}=1-\dfrac{1}{2}+\dfrac{1}{3}-\dfrac{1}{4}+\ldots .

Przemawiała do niego elegancja samych rozwinięć, a także ich aspekt praktyczny: pozwalały one obliczać wartości różnych funkcji albo stałych matematycznych, takich jak \pi. Posługując się odkrytym przez siebie rozwinięciem w szereg funkcji logarytmicznej, młody Isaac Newton obliczył kiedyś dla zabawy wartość

\ln{1,1}=0,09531 01798 04324 86004 39521 23280 76509 22206 05365  30864 4199183.

Prócz ludycznego miało to też aspekt praktyczny. Tablice logarytmów stosowane były w geodezji, nawigacji, astronomii. Znając z dużą dokładnością jedną lub kilka wartości logarytmu, można zbudować tablice, już z mniejszą liczbą cyfr znaczących (ze względu na błędy zaokragleń). Newton znał oczywiście szereg Leibniza. Zrewanżował mu się innym szeregiem, łudząco podobnym:

\dfrac{\pi}{2\sqrt{2}}=1+\dfrac{1}{3}-\dfrac{1}{5}+\dfrac{1}{7}+\ldots.

Dokumenty Leibniza pokazują, że mimo wskazówki, jak można ten szereg otrzymać, sztuka ta nie udała się Leibnizowi.

Henry Oldenburg niedługo później zmarł i Newton stracił na długo kontakt z Royal Society i z szerszym światem. Zresztą w tamtych latach pochłaniała go raczej teologia niż matematyka. Żaden z nich nie opisał drugiemu rachunku różniczkowego i całkowego. Po latach obaj zaczęli podejrzewać tego drugiego o kradzież intelektualną. Był to objaw paranoi, o którą nietrudno było w sytuacji, gdy matematycy chętniej publikowali wyniki niż metody zastosowane do ich uzyskania.

Spójrzmy na koniec na szczegóły. Otóż Leibniz, czytając pewien artykuł Pascala, wpadł na pomysł, aby szukanie pola pod jedną krzywą przekształcić w szukanie pola pod inną krzywą. Nazwał to metodą transmutacji. Opierała się ona na następującej obserwacji.

Rysujemy styczną do krzywej w pewnym punkcie, przecina ona oś y w pewnym punkcie. Rozpatrujemy następnie krzywoliniowy „trójkąt” złożony z małego odcinka krzywej i dwóch boków równoległych do osi. Gdy ów „trójkąt” staje się coraz mniejszy, zbliża się do prawdziwego trójkąta. Możemy napisać proporcję

\dfrac{dx}{ds}=\dfrac{h}{y} \, \Rightarrow y dx=h ds.

Pola infinitezymalnego (=„nieskończenie małego”) trójkąta utworzonego z dwóch promieni wodzących (linie przerywane) i odcinka krzywej równe jest \frac{1}{2} h ds. Sumując takie pola, czyli całkując, możemy obliczyć pole skończonego wycinka krzywej. Korzystając zaś z powyższej proporcji pole to można zamienić polem pewnej innej krzywej y(x): \frac{1}{2}\int{h ds}=\frac{1}{2}\int{ y dx}. Wynik ten może się przydać, jeśli zamiana jednej krzywej drugą prowadzi do uproszczenia problemu. Leibniz zastosował swoją metodę do okręgu.

Leibniz chciał obliczyć pole ćwiartki koła (\frac{\pi}{4}, składającej się z wycinka kołowego i trójkąta. Pole wycinka znaleźć można obliczając pole pod krzywą y(x), która ma równanie zapisane na rysunku. Łatwiej jest obliczyć pole między osią y a krzywą:

Szczegóły rachunku znaleźć można tutaj. Ostatecznie otrzymujemy

\dfrac{\pi}{4}={\displaystyle \int_{0}^{1}\dfrac{dx}{1+x^2}}.

Ułamek po prawej stronie zastępujemy szeregiem geometrycznym:

\dfrac{1}{1+x^2}=1-x^2+x^4-x^6+\ldots

i całkujemy wyraz po wyrazie. Wynik Newtona uzyskuje się z całki

{\displaystyle \int_{-1}^{1}\dfrac{dx}{1+\sqrt{2} x+x^2}=\dfrac{\pi}{\sqrt{2}}=2\int_{0}^{1}\dfrac{1+x^2}{1+x^4}dx}.

Całkę po prawej stronie rozwijamy w szereg jw. Leibniz nie znał, jak się wydaje, rozkładu na czynniki

1+x^4=(1+\sqrt{2}x+x^2)(1-\sqrt{2}x+x^2).

Johann Bernoulli i krzywa łańcuchowa (1690)

Matematycy XVII wieku lubili badać rozmaite osobliwe krzywe i uwielbiali chełpić się swoimi umiejętnościami. Krzywe stożkowe: elipsa, parabola i hiperbola, czyli krzywe opisywane równaniami drugiego stopnia, już im nie wystarczały. Isaac Newton przeprowadził klasyfikację wszystkich krzywych trzeciego stopnia, co jest znacznie trudniejsze niż dla drugiego stopnia. Chętnie też zajmowali się krzywymi powstającymi wskutek ruchu (jak cykloida) albo jako rozwiązanie pewnego problemu z mechaniki. Jedną z takich krzywych była linia łańcuchowa, czyli kształt, jak przyjmuje giętki i ciężki łańcuch zawieszony na dwóch końcach.
Jeszcze w XVI wieku młody Galileusz starał się poznać kształt krzywej łańcuchowej, sądząc, że jest to ta sama krzywa, jaką zakreśla rzucone ciało. Prowadził wraz z Guidobaldem del Monte eksperymenty, aby porównać obie krzywe. Krzywą balistyczną rysowali puszczając kulkę zamoczoną w atramencie po równi pochyłej, jak na obrazku.

Okazało się, że krzywa balistyczna przypomina parabolę, lecz krzywa łańcuchowa różni się od niej znacząco. Jak wiemy, Galileuszowi udało się znaleźć mechaniczne wyjaśnienie dla krzywej balistycznej. Jednak kształtu krzywej łańcuchowej nie potrafił opisać matematycznie.
W 1690 roku Jacob Bernoulli, matematyk z Lozanny, rzucił na łamach „Acta Eruditorum” – pierwszego niemieckiego czasopisma naukowego, założonego z inicjatywy Leibniza – wyzwanie do innych matematyków, by opisali kształt krzywej łańcuchowej. Jeszcze w tym samym roku zagadnienie to rozwiązali Gottfried Wilhelm Leibniz, a także młodszy brat Jacoba, dwudziestoczteroletni Johann, kształcący się na medyka. Kilka lat wcześniej Leibniz w tym samym czasopiśmie ogłosił zarysy rachunku różniczkowego i całkowego. Bracia Bernoulli pilnie przestudiowali tę technikę formułowania i rozwiązywania problemów, obaj też wkrótce przewyższyli Leibniza, zwłaszcza Johann, który stał się szybko jednym z mistrzów rachunku różniczkowego i całkowego. Ambitny Johann nie został medykiem (podobnie jak niegdyś Galileusz). Niedługo później zrobił furorę w matematycznych kręgach Paryża. Jego wykłady częściowo opublikował pod swoim nazwiskiem markiz de L’Hôpital (któremu Johann sprzedał wyniki), druga ich część opublikowana została dopiero pół wieku później w t.3 Opera omnia Johanna.
Po roku „Acta Eruditorum” opublikowały wyniki Leibniza, Huygensa i Johanna Bernoulliego, lecz bez dowodów. Ówcześni matematycy niechętnie ujawniali metody, woleli raczej drażnić konkurentów swymi umiejętnościami.
Praca Christiaana Huygensa była niezadowalająca, stary mistrz nie znał nowych technik. Rozpatrywał łańcuch zbudowany z odcinków i próbował wykonać przejście graniczne do krzywej ciągłej, gdy długość każdego odcinka dąży do zera. Leibniz podał rozwiązanie w najprostszy sposób jako konstrukcję średniej arytmetycznej z dwóch krzywych wykładniczych („curva logarithmica”). Kilka lat później Leibniz opisał szczegółowo swoje rozwiązanie w liście do Huygensa. Nie było ono zbyt eleganckie, lecz ukazywało siłę metody postępowania, dzięki której nawet mało inteligentne podejście do problemu dawało się skutecznie przeforsować. Sam Jacob nie zdołał rozwiązać problemu i niezbyt mu się podobało, że dokonał tego jego młodszy brat.

Johann Bernoulli wyraził swoje rozwiązanie w postaci pola pod pewną krzywą, czyli całki. Przeanalizował też szczegółowo cały problem i rozwiązał go w sposób zdecydowanie elegantszy. Podał szereg twierdzeń, które przedstawione są na kolejnych rysunkach.

Punktem wyjścia jest zasada następująca: (Fig. 131) siły działające w dwóch dowolnych punktach A i C po różnych stronach minimum mają kierunek styczny do krzywej (łańcuch jest giętki) i muszą dodane wektorowo zrównoważyć ciężar łańcucha pomiędzy A i C. Środek ciężkości odcinka AC łańcucha znajdzie się dokładnie nad punktem D. Jeśli (Fig. 133) utniemy jakiś kawałek łańcucha, np. powyżej F, pozostała część nie zmieni kształtu. W szczególności (Fig. 132 i 135) możemy wybrać jako jedną z sił styczną w minimum, pozwala to szczególnie prosto sformułować warunek, jaki musi spełniać nasza krzywa. Fig. 136 daje konstrukcję Leibniza, równoważną Fig. 137 konstrukcję Johanna.
Podstawowa własność krzywej łańcuchowej daje się odczytać ze współczesnej wersji Fig. 132.

Aby utrzymać w równowadze odcinek łańcucha o długości s i ciężarze \varrho s potrzebna jest równa temu ciężarowi składowa pionowa siły (fioletowa). Składowe poziome (czerwone) równoważą się nawzajem, co oznacza, że składowa pozioma jest niezależna od wysokości. Możemy więc zapisać dla naszej krzywej

\dfrac{dy}{dx}=\mbox{tg }\alpha = s.

Nachylenie stycznej proporcjonalne jest do odległości od minimum. Bez zmniejszenia ogólności możemy przyjąć, że stała proporcjonalności równa jest 1 – możemy to zawsze osiągnąć wybierając odpowiednio jednostkę długości. Reszta jest zastosowaniem cudownej metody Leibniza (*), która szybko prowadzi do wyniku:

y(x)=\cosh x\equiv \dfrac{e^x+e^{-x}}{2}.

Obecnie sumę taką jak w kształcie krzywej łańcuchowej zapisujemy jako cosinus hiperboliczny: algebra funkcji hiperbolicznych jest podobna do trygonometrycznych, z tą istotną różnicą, że jedynka trygonometryczna zastąpiona jest wyrażeniem \cosh^2 x-\sinh^2 x=1 i pochodna cosinusa hiperbolicznego jest równa sinusowi hiperbolicznemu (bez minusa).
Krzywa łańcuchowa różni się od paraboli tym bardziej, im dalej od minimum się znajdziemy.

(*) Oznaczmy pochodną szukanej funkcji przez u. Różniczkując obie strony równania krzywej łańcuchowej, otrzymujemy

\dfrac{du}{dx}=\dfrac{ds}{dx}=\dfrac{\sqrt{dy^2+dx^2}}{dx}=\sqrt{u^2+1}.

Stąd

{\displaystyle \int {\dfrac{du}{\sqrt{u^2+1}}}=\int dx=x+A,}

Całkę możemy obliczyć korzystając z jedynki hiperbolicznej: \cosh^2 z=\sinh^2 z+1. Podstawiając u=\sinh z, mamy du=\cosh z dz i po lewej stronie zostaje całka z 1:

z=x+A.

Możemy wziąć sinh z obu stron, otrzymamy wówczas

\sinh z=u=\dfrac{dy}{dx}=\sinh (x+A).

Całkując ostatnią równość, otrzymujemy y=\cosh x. Stałe całkowania powinny być równe 0, jeśli chcemy mieć wykres taki, jak na obrazkach powyżej.

Josef Loschmidt i wielkość cząsteczek powietrza (1865)

Richard Feynman pisał, że gdyby cała obecna nauka miała ulec zniszczeniu w jakimś kataklizmie i można było ocalić tylko jedno zdanie, to powinno ono brzmieć: „Wszystko składa się z atomów – małych cząstek, poruszających się bezładnie, przyciągających się, gdy są od siebie nieco oddalone, odpychających się zaś, gdy je zbytnio ścieśnić”.

Pomysł istnienia takich cząstek, jak i ich nazwę: atomy, czyli „niepodzielne” (a to zaprzeczenie, tomos – cięty, tnący, dzielący się na części, stąd np. określenia anatomia i tomografia) zawdzięczamy starożytnym Grekom Leucypowi i Demokrytowi. Rzeczy zbudowane są z atomów jak słowa z liter. Pisma atomistów były już w starożytności atakowane za wizję świata bez bogów, poddanego tylko konieczności. Istniała w nim tylko materia, nawet dusze, czyli zasady ruchu, miały być bowiem materialne.

Żyjący w I w. p.n.e. Rzymianin Lukrecjusz opisał tę wizję w długim i dydaktycznym, i o dziwo poetycko wybitnym, poemacie heksametrem. Lukrecjusz był epikurejczykiem, a więc nie tylko atomistą, lecz także wyznawcą etyki opartej na wartościach doczesnych – bogowie nie zajmują się bowiem ludźmi, a ci powinni sami zadbać o swe szczęście, żyć tak, by o ile to możliwe szukać przyjemności i unikać cierpienia. Etyka epikurejska była rozsądna i wyważona, obce im było wszelkie zatracanie się w pogoni za szczęściem, jak i nadużycia zmysłowe. Ceniono natomiast proste przyjemności i czystą radość życia. Atomizm, objaśniając funkcjonowanie świata, miał dopomóc ludziom w uwolnieniu się od lęku przed śmiercią, zemstą bogów i wizją wiecznego cierpienia po śmierci. Z tego względu już w starożytności epikureizm uznawano za filozofię bezbożną.

Kanoniczny obraz atomizmu to drobinki pyłu wirujące w smudze światła słonecznego. W mikroskali tak miały wyglądać wszystkie zjawiska: wiecznie poruszające się i zderzające atomy. Niezmienność ukryta pod zmieniającą się powierzchnią zjawisk.

Bo spojrzyj jeno, gdy promienie słonecznego światła wedrą się i rozleją po mrocznym domostwie! Zobaczysz w tym promiennym snopie wiele maleńkich ciałek, mieszających się w próżni na wiele sposobów. Jakoby w wiekuistej wojnie staczają potyczki i bitwy, walczą całymi hufcami bez chwili spoczynku, w utrapieniu ustawicznych skupień i rozłączeń. Z tego więc możesz zmiarkować, jak wygląda wieczne miotanie się zarodków rzeczy w ogromie próżni, o ile mała rzecz może dać przykład i tropy poznania wielkich. A jeszcze z tego powodu winieneś zwrócić baczniejszą uwagę na owe ciałka, co wichrzą dostrzegalnie w promieniach słonecznych, że takie wichrzenia zdradzają nadto istnienie tajnych i niewidocznych ruchów materii. Zobaczysz tam bowiem, że wiele ciałek, podrażnionych niewidzialnymi ciosami, zmienia drogę i w tył zawraca po odepchnięciu, to tu to tam, na wszystkie zewsząd strony. (Lukrecjusz, ks. II, przeł. A. Krokiewicz) (*)

Po Rzymianach rzeczywiście wydarzył się kataklizm: starożytna cywilizacja upadła, o atomistach wiedziano niewiele więcej niż to, że Arystoteles ich zwalczał. Ich pisma przepadły. Półtora tysiąca lat później, w 1417 r., osobliwy poemat Lukrecjusza odnalazł humanista i „łowca rękopisów”, papieski sekretarz, Poggio Bracciolini, prawdopodobnie w alzackim klasztorze w Murbach, gdzie dobrzy mnisi nie bardzo rozumieli, co za tekst przechowują na półkach. Przez następne wieki poemat był wielokrotnie wydawany i tłumaczony na języki narodowe, w tym na język angielski po raz pierwszy w XVII wieku. Atomizm nadal wzbudzał lęk: zderzające się atomy trudno było pogodzić z Opatrznością, choć niektórzy uczeni, jak Isaac Newton, potrafili zbudować jakąś chwiejną syntezę obu koncepcji. Jego Bóg był jednak surowym Pantokratorem, Wszechwładnym Ojcem, nie znoszącym sprzeciwu.

Benjamin Franklin, bystry i zaradny drukarz z Filadelfii, jeden z ojców założycieli Stanów Zjednoczonych, nie był zawodowym uczonym, nigdy nie miał takich ambicji. Ze swoim sposobem uprawiania nauki mieścił się zresztą znakomicie w tradycji Towarzystwa Królewskiego, które od samego początku zrzeszało przede wszystkim hobbystów i amatorów: lekarzy, pastorów, wiejskich dżentelmenów, podróżników (co zresztą nie przeszkadzało niektórym z nich dokonać ważnych odkryć).

Interesował się on legendarnym zjawiskiem uśmierzania fal przez rozlewanie oleju i poczynił w związku z tym pewne obserwacje. Wyniki doświadczeń Franklina przedstawione zostały w listach wymienianych między nim a medykiem Williamem Brownriggiem oraz wielebnym Farishem, opublikowanych w „Philosophical Transactions”. Po opisaniu swych wcześniejszych obserwacji podczas podróży morskich Franklin relacjonuje:

Będąc w Clapham, gdzie na wspólnych gruntach znajduje się duży staw, i widząc pewnego dnia, iż jego powierzchnia jest bardzo wzburzona wiatrem, przyniosłem ampułkę oleju i wylałem go trochę na wodę. Widziałem, jak rozprzestrzenia się on ze zdumiewającą szybkością po powierzchni; lecz efekt uspokojenia fal nie powstał, gdyż zastosowałem go początkowo po nawietrznej stronie stawu, gdzie fale były największe i wiatr zwiewał mój olej z powrotem na brzeg. Następnie przeszedłem na stronę zawietrzną, gdzie [fale] się tworzyły, i tam olej, w ilości nie większej niż łyżeczka do herbaty, spowodował natychmiastowe uspokojenie na obszarze wielu jardów kwadratowych; poszerzało się ono stopniowo w zadziwiający sposób, aż dotarło do przeciwnego brzegu, czyniąc jedną czwartą stawu, jakieś pół akra, gładką jak zwierciadło.

Franklin zwrócił uwagę na zdumiewająco wielką powierzchnię plamy oleju na wodzie.

Jeśli upuścić kroplę oleju na gładki marmurowy stół czy na zwierciadło, kropla pozostanie na swoim miejscu, tylko nieznacznie się rozszerzając. Lecz gdy upuścić ją na wodę, rozprzestrzenia się na wiele stóp dookoła i staje się tak cienka, że na znacznym obszarze wytwarza barwy pryzmatyczne, a jeszcze dalej staje się tak cienka, że aż niewidoczna, prócz efektu wygładzania fal na znacznie większych odległościach. Wydaje się, że wzajemne odpychanie cząsteczek pojawia się, kiedy tylko dotkną one wody, i że jest ono tak silne, iż działa także na inne ciała znajdujące się na powierzchni, takie jak słomki, liście, wióry itp., zmuszając je do ustąpienia ze wszystkich stron wokół kropli niczym centrum i pozostawiając duży pusty obszar.

Te obserwacje z roku 1773 zostały podjęte po przeszło stu latach przez wybitnego fizyka brytyjskiego lorda Rayleigha, w celu oszacowania rozmiarów cząsteczek oleju. Jeśli przyjąć, że zgodnie z tym, co spostrzegł Franklin, 2 cm3 oleju rozprzestrzeniają się na powierzchni pół akra, czyli 2000 m2, otrzymujemy grubość warstwy równą 1 nm. Wiemy obecnie, że olej tworzy na wodzie warstwę o grubości jednej cząsteczki, więc dane te pozwalają oszacować jej rozmiary. Amerykanin nie wykonał jednak tego rachunku, zadowolił się samą obserwacją.

Atomy zaczęły odgrywać bardziej konkretną rolę dzięki chemii Johna Daltona. W drugiej połowie XIX wieku fizycy tacy, jak James Clerk Maxwell i Rudolf Clausius, zauważyli, że obraz zderzających się molekuł można rozwinąć w teorię kinetyczną gazów. Ciśnienie gazu było objaśniane bombardowaniem ścianek naczynia przez jego cząsteczki poruszające się z ogromnymi prędkościami (rzędu prędkości dźwięku w danym gazie). Teoria ta dawała też zaskakujący wynik: otóż lepkość gazu miała być niezależna od jego gęstości. Maxwell z pomocą żony przeprowadził odpowiednie pomiary, które potwierdziły teorię. Znając lepkość, można było obliczyć średnią drogę swobodną cząsteczek. W powietrzu w warunkach normalnych wynosiła ona wg Maxwella \lambda=620 \mbox{ nm} .

Pierwszym fizykiem, który wyznaczył wielkość cząsteczek powietrza, był Josef Loschmidt. Urodzony w 1821 r. niedaleko Karlsbadu (dziś Karlovy Vary) w rodzinie chłopskiej, przeszedł długą i nieoczywistą drogę do działalności naukowej, pracował nad zagadnieniami z pogranicza matematyki i psychologii, skończył studia politechniczne w Wiedniu, założył własną firmę, zbankrutował, potem był nauczycielem i dopiero w 1866 r., a więc dobrze po czterdziestce, zaczął uczyć na Uniwersytecie Wiedeńskim, zrobił doktorat i został profesorem. Z młodym Ludwigiem Boltzmannem chodzili na koncerty i spierali się o Eroikę Beethovena.

Praca dotycząca wielkości cząsteczek była pionierska, do dziś mówi się czasem o liczbie Loschmidta (liczba cząsteczek gazu w 1 cm3 w warunkach normalnych), choć sam uczony nie podał jej wartości w swej pracy. Znany był związek między koncentracją n, drogą swobodną \lambda oraz przekrojem czynnym cząsteczek \sigma:

n\sigma \lambda=\dfrac{1}{\sqrt{2}}. \mbox{ (**)}

Zakładając, że cząsteczki są kuliste o średnicy s, przekrój czynny zapisać można jako pole powierzchni koła o  średnicy 2s (cząsteczki zderzają się, gdy ich środki są w odległości s od siebie). Nie znamy koncentracji ani promienia, potrzebne jest więc jeszcze jedno równanie. Loschmidt przyjął, że w stanie ciekłym cząsteczki upakowane są ciasno, a więc porównując objętość grama cieczy do objętości gazu, możemy określić, jaką część \varepsilon objętości gazu zajmują cząsteczki. Mamy więc

\varepsilon=n \dfrac{\pi s^3}{6}.

Wyznaczając z obu równań s, otrzymujemy

s=6\sqrt{2}\varepsilon \lambda.

W przypadku powietrza, które nie było jeszcze wtedy skroplone (Wróblewski, Olszewski 1883 r.), Loschmidt wyznaczył wartość \varepsilon pośrednio, uzyskując 0,000866 zamiast 0,0014. Wyznaczona przez niego średnica cząsteczki równa była około 1 nm, a więc nieco za dużo. Drugą nieznaną wielkością w tym układzie równań jest koncentracja powietrza w warunkach normalnych, czyli właśnie liczba Loschmidta.

Ludwig Boltzmann po śmierci przyjaciela wygłosił wspomnienie o nim. Znalazły się w nim słowa:

Ciało Loschmidta rozpadło się już na atomy: na ile konkretnie atomów – możemy obliczyć, korzystając z ustanowionych przez niego zasad. I aby w przemówieniu dotyczącym fizyka eksperymentatora, nie obyło się bez pokazu, poprosiłem, by napisano tę liczbę na tablicy: 10^{25}. (***)

Sprawa istnienia atomów nie była wszakże wtedy przesądzona. Boltzmann wierzył w ich istnienie, ale Ernst Mach, fizyk i filozof z tego samego uniwersytetu w nie nie wierzył. Dopiero doświadczenia Jeana Perrina przypieczętowały tę kwestię już w XX wieku.

(*) W przekładzie wierszowanym fragment ten brzmi następująco:

Przypatrz się bowiem promieniom słonecznym, kiedy wtargnęły

Do domu i rozlewają światło po ciemnych zakątkach:

Zobaczysz w strumieniu światła bez liku drobniutkich pyłków,

Które mieszają się z sobą w próżni na wiele sposobów;

I jakby ścierał się zastęp z zastępem w wieczystej wojnie,

Wiodąc potyczki i bitwy bez jednej chwili wytchnienia,

Tak one na przemian ciągle to schodzą się, to rozchodzą;

Gdyś widział to, możesz sobie przedstawić, jak w wielkiej próżni

Miotają się bez żadnego przestanku zarodki rzeczy –

O ile rzecz drobna może wystarczyć za podobiznę

Rzeczy ogromnych i wskazać drogę do ich zrozumienia.

Z jednego jeszcze powodu winieneś zwrócić uwagę

Na pyłki, które widomie się kłębią w promieniach słońca:

Ich pomieszanie oznacza, że również wewnątrz materii

Istnieją ruchy, tajemne dla oczu, niedostrzegalne.

Zobaczysz, że wiele pyłków, niedostrzegalnie rażonych,

Odmienia drogę, że wiele pchniętych do tyłu zawraca,

Pędzą to w jedną, to w drugą stronę, we wszystkich kierunkach.

(przeł. G. Żurek, T. Lucretius Carus, O naturze rzeczy, ks. II, w. 113-141)

(**) Sens tego równania jest bardzo prosty: cząsteczka poruszając się, zakreśla w ruchu miedzy zderzeniami walec o objętości \sigma\lambda , średnia liczba cząsteczke w takim walcu równa jest n\sigma\lambda i powinna być rzędu jedności, dokładny współczynnik dają ściślejsze rozważania, nb. Loschmidt użył w tym miejscu współczynnika \frac{3}{4} wynikającego z pracy Clausiusa.

(***) Ciało ludzkie liczy jakieś 7\cdot 10^{27} atomów. Boltzmann nie był tu zbyt precyzyjny.