Skąd się bierze Maxwellowski rozkład prędkości cząsteczek w gazie doskonałym?

James Clerk Maxwell podał w roku 1859 postać rozkładu prawdopodobieństwa prędkości cząsteczek w gazie doskonałym. Okazuje się, że prawdopodobieństwo, iż np. x-owa składowa prędkości losowo wybranej cząsteczki należy do przedziału (x, x+dx) równe jest

p(x)dx=C\exp(-\alpha x^2)dx,

gdzie C jest stałą normalizacyjną (wybraną tak, aby prawdopodobieństwo zdarzenia pewnego było równe 1). Jest to słynny rozkład Gaussa, zwany też rozkladem normalnym, gdyż pojawia się on w najróżniejszych kontekstach.

Składowa x-owa prędkości danej cząsteczki zmienia się wskutek zderzeń z innymi cząsteczkami w sposób przypadkowy i w rezultacie opisywana jest takim rozkładem o kształcie dzwonu. Jeśli całkowita energia gazu jest stała, to stała jest także suma kwadratów wszystkich prędkości:

E=\dfrac{m{\vec{v}_1}\,^2}{2}+\ldots+\dfrac{m\vec{v}_N\,^2}{2}=const.

(m jest masą cząseczki gazu). Kwadrat każdego wektora jest sumą trzech kwadratów jego współrzędnych. Oznaczając więc wszystkie składowe wszystkich prędkości cząsteczek gazu jako x_1,x_2, \ldots, x_{3N}, mamy 3N-wymiarową przestrzeń prędkości. Warunek stałości energii przyjmuje postać:

x_1^2+x_2^2+\ldots+x_{3N}^2=R^2,

co geometrycznie oznacza, że koniec wektora prędkości Y=[x_1, x_2,\ldots, x_{3N}] leży na powierzchni sfery S^{3N-1} o promieniu R (sfera ma o jeden wymiar mniej niż przestrzeń).

Aby wyprowadzić rozkład Maxwella, przyjmijmy najprostsze założenie: każde położenie końca wektora Y na sferze jest jednakowo prawdopodobne.

Szukamy teraz rozkładu prawdopodobieństwa którejkolwiek pojedynczej składowej np. x\equiv x_1 (jest ona jednocześnie x-ową składową prędkości cząsteczki nr 1). W przypadku sfery S^2 możemy to narysować.

Prawdopodobieństwo, że x bedzie leżeć w cienkim pasie sfery zaznaczonym na rysunku jest proporcjonalne do pola powierzchni pasa sferycznego równej iloczynowi długości razy szerokość:

\Delta S=2\pi R\sin\vartheta \times R\Delta \vartheta.

Sumując pola powierzchni takich pasów, czyli całkując, otrzymamy wzór na pole powierzchni sfery S^2:

S_2(R)={\displaystyle \int_{0}^{\pi} 2\pi R^2 \sin\vartheta d\vartheta}=4\pi R^2.

Prawdopodobieństwo znalezienia końca wektora Y w pasie sferycznym byłoby w takim razie równe ilorazowi obu tych wielkości

p(\vartheta)\Delta\vartheta=\dfrac{2\pi R \sin\vartheta}{4\pi R^2}\times R\Delta\vartheta= \dfrac{S_1(R\sin\vartheta)}{S_2(R)} R\Delta \vartheta.

Szerokość naszego pasa jest zarazem „polem” sfery S^1, tzn. długością okręgu o promieniu R\sin\vartheta (co widać z rysunku). Dla trójwymiarowego wektora Y rozkład ten nie jest szczególnie interesujący. Fizycznie odpowiadałby jednocząstkowemu gazowi doskonałemu. Prędkość tej jednej jedynej cząsteczki przyjmuje z równym prawdopodbieństwem dowolny kierunek w przestrzeni. Długość wektora jest określona przez energię tej cząstki.

Ostatnie wyrażenie dla prawdopodobieństwa można zastosować równie dobrze w przestrzeni 3N-wymiarowej. Możemy zawsze ustalić wartość jednej ze współrzędnych x_1\equiv x. Pozostałe współrzędne spełniają wtedy warunek

x_2^2+x_3^2+\ldots+x_{3N}^2=R^2-x^2

i jest to jedyne ograniczenie. Znaczy to, że pozostałe składowe leżą na sferze wymiarze o jeden mniejszym i mniejszym promieniu. Pole powierzchni sfery S^n jest równe pewnej stałej zależnej od wymiaru razy promień sfery do potęgi n-tej:

S_n(r)=C_n r^n.

Korzystając z tego faktu możemy szukane prawdopodobieństwo zapisać w postaci

p(x)dx=\dfrac{S_{3N-2}(\sqrt{R^2-x^2})}{S_{3N-1}(R)} R\Delta\vartheta \sim \left(1-\dfrac{x^2}{R^2}\right)^{\frac{3N}{2}}dx.

Ostatnie wyrażenie możemy dla dużych wartości N zapisać jako potęgę liczby e:

\left(1-\dfrac{x^2}{R^2}\right)^{R^2\cdot\frac{3N}{2R^2}}dx=\exp(-\alpha x^2) dx.

Parametr \alpha jest równy

\alpha=\dfrac{3N}{2R^2}=\dfrac{3Nm}{4E}=\dfrac{3m}{4\epsilon},

gdzie \epsilon jest energią przypadającą na jedną cząsteczkę gazu. Możemy wyrazić tę ostatnią energię za pomocą temperatury T:

\epsilon=\dfrac{3}{2}kT \Rightarrow \alpha=\dfrac{m}{2kT}.

Otrzymaliśmy rozkład Maxwella. Stałą C można znaleźć z warunku unormowania (można ją też obliczyć bezpośrednio, potrzeba jednak wówczas wiedzieć więcej nt. stałych C_n, czyli postaci wzoru na pole sfery S^n).

Rozkład Maxwella wynika więc z założenia o równomiernym rozkładzie prawdopodobieństwa na sferze w przestrzeni 3N-wymiarowej. Założenie to nazywane jest rozkładem mikrokanonicznym i jest jednym z postulatów fizyki statystycznej. Wyobrażamy sobie, że stan naszego układu, czyli wektor Y wędruje po dozwolonej powierzchni w taki sposób, że jego koniec może znaleźć się z jednakowym prawdopodobieństwem w otoczeniu każdego punktu sfery. Jest to założenie ergodyczności.

Oczywiście, nie znaczy to, że układ zderzających się cząstek gazu musi być ergodyczny. Jak to często bywa w fizyce: z jednej strony pośrednio sprawdzamy to założenie, badając rozmaite jego konsekwencje i porównując z doświadczeniem. Z drugiej strony, można badać pewne proste przypadki, aby sprawdzić, czy założenie ergodyczności jest prawdziwe w tych sytuacjach. W 1963 r. Yakov Sinai, wybitny matematyk rosyjski, udowodnił, że gaz doskonały sztywnych zderzających się kul jest ergodyczny.

W pewnej chwili zamieniliśmy R \Delta\vartheta wartoscią dx. Nie są one ściśle biorąc równe, mamy bowiem

dx=-R\sin\vartheta d \vartheta \Rightarrow Rd\vartheta=\dfrac{dx}{\sqrt{1-\frac{x^2}{R^2}}}.

Dodatkowy czynnik pod pierwiastkiem nie ma znaczenia, gdy wartości R są duże. Widać to też z rysunku: gdy |x|\ll R, to R d\vartheta \approx dx.

Reklamy

Stanisław Ulam (2/2)

Wciąż jest dla mnie źródłem nieustającego zdziwienia, że kilka znaków nagryzmolonych na tablicy lub na kartce papieru może zmienić bieg ludzkich spraw. [S. Ulam]

Każdego roku, od 1936 aż do 1939, Stanisław Ulam spędzał lato w Polsce. Spotykał się ze swoimi matematycznymi przyjaciółmi, w tym Banachem i Mazurem, we Lwowie albo gdzieś w okolicach, gdzie spędzali wakacje. Jego dorobek matematyczny obejmował szereg dziedzin: teorię mnogości, teorię miary i rachunek prawdopodobieństwa, teorię transformacji, teorię grup. Były to na ogół niewielkie prace rozwiązujące lub stawiające jakiś problem. Na uniwersytecie Harvarda we współpracy z Johnem Oxtobym Ulam napisał swoją najdłuższą pracę, opublikowaną następnie w „Annals of Mathematics”, wysoko cenionym piśmie wydawanym w Princeton. Praca dotyczyła teorii ergodycznej. W mechanice klasycznej każdy nietrywialny układ fizyczny wędruje po swojej przestrzeni stanów (in. przestrzeni fazowej) w taki sposób, że wraca kiedyś w sąsiedztwo każdego punktu już odwiedzonego. Fakt ten jest podstawą fizyki statystycznej, w której zakłada się, że wszystkie stany o określonej energii są jednakowo prawdopodobne. Praca Ulama i Oxtoby’ego dowodziła, że przekształcenia spełniające warunek ergodyczności są w pewnym sensie typowe. Uzyskany przez nich wynik nie mógł być wprost zastosowany do fizyki, ale tak jest bardzo często: ścisłe potwierdzenie intuicji fizyków zazwyczaj nie jest łatwe.

Stanisław Ulam łatwo przywykł do amerykańskiego życia i z przyjemnością wracał do niego po wakacjach. Latem 1939 roku zabrał ze sobą młodszego brata, Adama. Na statek w Gdyni odprowadzili ich ojciec i stryj. Widmo wojny wisiało nad Polską, choć, jak zauważył Ulam, zagrożenie to wyraźniej dostrzegano w Stanach Zjednoczonych niż w Polsce, gdzie do ostatniej chwili łudzono się nadziejami na jakiś zwrot dyplomatyczny w zaostrzającym się napięciu. Różnice w sposobie oceny wynikały zapewne nie tylko z dystansu Amerykanów. Do Stanów Zjednoczonych dotarło w ostatnich latach wielu uchodźców z Niemiec, którzy lepiej niż inni rozumieli istotę nazistowskiego reżimu. W Polsce prasa, koła wojskowe i politycy zgodnie uprawiali propagandę w stylu „nie oddamy ani guzika”, co skończyło się klęską nie tylko militarną i polityczną, ale także klęską moralną – kraj był bowiem zupełnie nieprzygotowany do wojny i tysiące, może miliony ludzi, rzuciły się do panicznej i bezładnej ucieczki: jedni na wschód, inni na zachód. Dowódcy niemieccy zdumieni byli łatwością tego zwycięstwa, które po dwu tygodniach było już w zasadzie zupełne.

Dla Stanisława Ulama wojna oznaczała nie tylko lęk o najbliższych i przyjaciół pozostawionych w kraju, ale i obowiązek utrzymywania młodszego brata, który zaczął jesienią studia (z czasem został znanym sowietologiem). Znalezienie płatnej pracy akademickiej nie było łatwe, Ulam musiał zadowolić się uniwersytetem stanu Wisconsin w Madison. Po Harvardzie i Princeton nie było to wymarzonym rozwiązaniem, jednak uczelnia okazała się całkiem przyzwoita, Ulam zaprzyjaźnił się tam z wieloma wykładowcami, nie tylko zresztą z matematykami, ale i z fizykami, ekonomistami. Wygłosił kiedyś zaimprowizowany wykład na zjeździe astronomów (na temat wyboru układu odniesienia, w którym ruch ciał wygląda prościej – była to topologiczna wersja problemu kopernikańskiego). W tym okresie wielu wybitnych uczonych, zwłaszcza pochodzących z Europy, pracowało na mniejszych uczelniach, fala emigracji wywołała bowiem nadmiar szukających pracy akademików. W Madison pracował Eugene Wigner, fizyk i szkolny kolega von Neumanna, przyszły noblista. Na seminaria prowadzone przez Ulama przyjeżdżali do Madison matematycy tej klasy co André Weil, urodzony w Warszawie Samuel Eilenberg czy Paul Erdös, wszyscy oni stali się sławami światowego formatu. Erdös zaprzyjaźnił się z Ulamem i odwiedzał go czasami, rozmowy były jego ulubioną formą pracy matematycznej, z czasem opublikował wspólne prace z kilkuset innymi badaczami. Matematycy obliczają liczbę Erdösa: on sam ma liczbę zero; ci, którzy z nim pracowali, mają liczbę jeden; ci, którzy pracowali z posiadającymi liczbę jeden, mają liczbę dwa itd. Oczywiście, Ulam miał liczbę Erdösa równą jeden. Zabawa ta unaocznia, jak silną rolę odgrywa współpraca nawet w dziedzinie tak z pozoru indywidualnej jak matematyka (choć trzeba też dodać, że Erdös, podobnie jak Ulam, wyjątkowo lubił pracę w towarzystwie innych).

W 1941 roku Ulam otrzymał obywatelstwo amerykańskie i kiedy Stany Zjednoczone przystąpiły do wojny, chciał pracować na rzecz wojska. Dzięki rekomendacji von Neumanna trafił do Los Alamos i Projektu Manhattan jako jeden z niewielu matematyków. Spotkał tam i poznał osobiście wielu fizyków i chemików o głośnych nazwiskach, nigdy chyba w historii nie zgromadzono w jednym miejscu w pracy nad wspólnym projektem tak wielu wybitnych specjalistów. Wielu z nich było emigrantami, których dotychczasowe życie zburzył mniej lub bardziej nazizm. Wśród kierujących projektem byli dwaj znakomici fizycy jądrowi: Hans Bethe i Enrico Fermi. Pierwszy miał babkę Żydówkę, przez co stracił profesurę w Tybindze, drugi miał za żonę Żydówkę i w roku 1938 zmuszony był opuścić Włochy. Ulam obu uczonych bardzo szanował, lecz szczególny respekt budził w nim Fermi – ostatni chyba fizyk będący zarazem eksperymentatorem i teoretykiem. Nie rozstający się z suwakiem logarytmicznym Fermi, który umiał szybko obliczyć każdą potrzebną wielkość, miał też solidne przygotowanie matematyczne i okazało się, że zna np. pracę Oxtoby’ego i Ulama. Dzięki Projektowi Manhattan Stanisław Ulam zaczął pracować z fizykami i tak już miało zostać przez długie lata. Jego talent matematyczny niespodziewanie okazał się przydatny w zagadnieniach z pogranicza inżynierii. Taki przeskok z podstaw matematyki do zagadnień praktycznych byłby niewyobrażalny dla większości matematyków. Ulam trafił do grupy kierowanej przez Edwarda Tellera, jeszcze jednego emigranta z Węgier. Pierwszym zagadnieniem, którym się tam zajął, było oddziaływanie gazu elektronowego z promieniowaniem. Teller uzyskał z rozważań wymiarowych postać równania, chciał aby te rozważania uściślić. Ulam zaproponował własne dość elementarne rozwiązanie, z którego wynikało, że wzór Tellera trzeba uzupełnić współczynnikiem cztery. Niezadowolony Teller zlecił to samo zadanie komuś innemu, kto posługując się znacznie bardziej rozbudowanym aparatem matematycznym, uzyskał dla owego współczynnika liczbowego także wartość zbliżoną do czterech.

Ulam, Richard Feynman i John von Neumann w Los Alamos

Rodzaj talentu matematycznego Stanisława Ulama był nietypowy, jedyny w swoim rodzaju. Posiadał on dar formułowania problemów w sposób jak najprostszy, zachowując jedynie najistotniejsze ich cechy. Wyobrażał sobie przy tym zjawiska, a nie tylko równania, które je opisują. Łatwo też przychodziły mu oszacowania liczbowe, co w Los Alamos było niezwykle ważne – nie chodziło tam przecież o zrozumienie idealnej sytuacji laboratoryjnej, ale o skonstruowanie jak najefektywniejszej bomby. Należało więc wejść w świat rzeczywistych obiektów, kształtów, własności różnych materiałów, współwystępowania rozmaitych zjawisk. Zazwyczaj praca fizyków polega na czymś odwrotnym: szuka się najprostszych i „najczystszych” sytuacji, w których można zmierzyć dane zjawisko.

Po zakończeniu wojny i Projektu Manhattan Stanisław Ulam wrócił do pracy akademickiej. Został profesorem nadzwyczajnym na Uniwersytecie Południowej Kalifornii (USC). Uczelnia okazała się słaba, Los Angeles było miastem trudnym do mieszkania i poruszania się z powodu korków ulicznych. Pewnego dnia Ulam poważnie zachorował, zaczął mieć problemy z mówieniem. Przeprowadzono operację, otwierając czaszkę. Znaleziono ostry stan zapalny, który leczono nowymi wówczas antybiotykami, podawanymi bezpośrednio do wnętrza czaszki. Uczony po pewnym czasie doszedł do siebie, jednak z obawą myślał, czy po tym wszystkim jego umysł wróci do dawnej sprawności. Przekonał się o tym, kiedy odwiedził go Paul Erdös. Zagrali w szachy i Ulam wygrał. Zaczął podejrzewać, że może przyjaciel pozwolił mu wygrać dla podtrzymania go na duchu. Zagrali więc jeszcze raz. Uspokoił się dopiero, kiedy wygrał po raz drugi, a Erdös wyraźnie się tym zirytował.

Nie pozostał na USC długo, tym bardziej że po chorobie wpadł w długi. Otrzymał propozycję pracy w Los Alamos dla armii amerykańskiej. Wprawdzie sławni i wielcy po zakończeniu Projektu Manhattan rozjechali się po różnych ośrodkach, ale laboratorium w Los Alamos zostało i nieoczekiwanie dawało Ulamowi możliwość ciekawej i względnie niezależnej pracy. Problemy, nad którymi tam pracowano, były konkretne, co zdaniem Ulama bardzo się liczyło. Sądził on bowiem, że naprawdę ważne problemy wywodzą się z praktyki, a nie filozoficznych rozważań. Mógł dobierać sobie współpracowników, co było szczególnie ważne wobec jego metody pracy. Polegała ona na tym, że Ulam szkicował możliwości rozwiązania danego zagadnienia, a współpracownicy starali się te pomysły zrealizować. Niewykluczone, że przebyta choroba odebrała Ulamowi czysto techniczną sprawność dokonywania obliczeń czy prowadzenia jakiegoś długiego dowodu. Starał się tego po sobie nie pokazywać. Pozostała mu jednak wyobraźnia i umiejętność dostrzegania bez dowodu, czy twierdzenie jest prawdziwe, czy nie, i w jaki sposób można dążyć do wytyczonego celu. Toteż pracował przede wszystkim nad wytyczaniem kierunków i formułowaniem problemów – co w sumie jest może ważniejsze niż szczegółowe rozwiązania. Przypominał swoim stylem pracy pracującego po przeciwnej stronie Atlantyku Jakowa Zeldowicza.

Dzięki pracy dla armii Ulam należał do pionierów stosowania komputerów. Układając pewien trudny pasjans w okresie rekonwalescencji, zdał sobie sprawę, że bardzo trudno byłoby obliczyć, jakie jest prawdopodobieństwo ułożenia tego pasjansa, łatwo natomiast można by go było modelować za pomocą komputera, który mógłby przeprowadzić wiele prób, dzięki czemu można by empirycznie stwierdzić, jakie jest szukane prawdopodobieństwo. Rozwinięciem tej idei opracowanym we współpracy z von Neumannem i Nickiem Metropolisem są metody Monte Carlo (nazwa zaczerpnięta ze skojarzenia z wujem Ulama, który pożyczał od krewnych pieniądze i następnie przepuszczał je w Monte Carlo). Zamiast np. rozwiązywać równanie różniczkowe, opisujące dyfuzję neutronów z pewnego stanu początkowego, możemy prześledzić losy wielu neutronów i zobaczyć, jakie są charakterystyczne cechy ich rozkładu. Dla pięćdziesięciu cząstek startujących z punktu x=0 tory w błądzeniu przypadkowym mogą być np. takie jak na wykresie.

Po zebraniu pewnej statystyki można znaleźć kształt rozkładu końcowego. Im więcej wykonamy losowań, tym dokładniej będziemy znali rozkład cząstek po danym czasie.

Rozkład uzyskany w tym przypadku jest łatwy do obliczenia analitycznego (jest rozkładem normalnym). Wystarczy jednak nieco zmodyfikować zagadnienie: dodać dwa wymiary, różne kształty i materiały, a problem dyfuzji stanie się bardzo trudny do rozwiązania metodami analitycznymi, choć symulacja komputerowa nadal będzie stosunkowo prosta. Pionierzy tej metody musieli zaczynać kompletnie od zera, rozwiązując np. zagadnienie, jak komputer, który prowadzi obliczenia arytmetyczne na liczbach – a więc otrzymując zawsze ściśle określony i jednoznaczny wynik, może generować liczby losowe. Jak sprawić, aby liczby te podlegały określonemu prawu statystycznemu? Jak sprawdzać uzyskane wyniki itd itp. Metoda Monte Carlo używana jest dziś w wielu dziedzinach od fizyki do finansów i stała się zespołem wyspecjalizowanych praktyk.

Stanisław Ulam odegrał istotną rolę w projekcie bomby wodorowej. Była to idée fixe Tellera: zbudować bombę opartą na procesie syntezy lekkich pierwiastków w cięższe. W przyrodzie procesy takie odbywają się we wnętrzu gwiazd, gdzie panują ogromne temperatury i materia jest bardzo gęsta. Warunki tak ekstremalne potrzebne są do tego, by dodatnio naładowane jądra mogły zbliżyć się do siebie, pokonując odpychanie elektrostatyczne. Dopiero bowiem w odległościach rzędu 10^{-15} m możliwe jest przegrupowanie nukleonów, wskutek czego wyzwala się energia.

Synteza helu z dwóch izotopów wodoru: deuteru i trytu; bomby wykorzystują głównie deuter (rys. Wikipedia)

Warunki takie można by wytworzyć za pomocą wstępnego wybuchu zwykłej bomby atomowej. Edward Teller (jeszcze jeden żydowski emigrant z Węgier) pracował nad pomysłem „superbomby” już w trakcie Projektu Manhattan. Nie zrezygnował z niego także i później. W roku 1950 prezydent Harry Truman podjął decyzję o pracach nad superbombą. Okazało się jednak szybko, że początkowy pomysł Tellera nie nadaje się do realizacji. Udowodnił to Stanisław Ulam ze współpracownikami, potwierdziły zaś obliczenia Ulama i Enrico Fermiego. Także obliczenia komputerowe von Neumanna dawały ten sam wynik. Sytuacja stała się trudna dla Tellera, którego oskarżano, że nakłonił władze polityczne do decyzji, nie mając w ręku żadnej rozsądnej teorii działania superbomby. Koszt przedsięwzięcia był ogromny, rywalizacja z Rosją zawzięta, a więc i stawka projektu bardzo wysoka. Impas przełamał Stanisław Ulam, który zaproponował implozyjny mechanizm działania superbomby. Razem z Tellerem napisali raport, który stał się podstawą amerykańskiego projektu. Bomba została zbudowana, lecz stosunki miedzy Tellerem a Ulamem gwałtownie się oziębiły. Teller nie potrafił prawdopodobnie wybaczyć Ulamowi dwukrotnej porażki prestiżowej. Ulam natomiast uważał, że zainteresowani i tak wiedzą, ile kto jest wart.

Raport Tellera i Ulama został po latach odtajniony, lecz większość z kilkunastu jego stron jest kompletnie pusta. Armia amerykańska najwyraźniej uznała, że wciąż jest za wcześnie na publiczne informowanie o technologii bomb wodorowych. Może to być zresztą także przykład nadmiernej ostrożności wojskowych w kwestiach tajemnic, militarne znaczenie bomb wodorowych nie jest bowiem aż tak wielkie, jak sądzono na początku. Dalsze prace szły raczej nad zmniejszaniem siły rażenia, bo co po wygranej wojnie, skoro zwycięzcy zostaną w niej zabici powiedzmy dziesięć razy, a pokonani – dwadzieścia. Angielszczyzna ma na to zgrabne słówko: overkill (*).

Gian-Carlo Rota charakteryzuje Ulama następująco:

Dopiero po kilku latach zdałem sobie sprawę z tego, co jest prawdziwą profesją Stana Ulama. Wielu z nas, pracujących w Laboratorium i mających z nim styczność, wiedziało, jak bardzo nie lubi on zostawać sam, że wzywa nas o zaskakujących porach, by wybawić go od samotności hotelowego pokoju albo czterech ścian swego gabinetu, kiedy już skończył codzienną rundę rozmów międzymiastowych.

Pewnego dnia zebrałem się na odwagę i zapytałem, czemu stale potrzebuje towarzystwa; odpowiedź, jakiej udzielił była wielce znamienna. „Kiedy jestem sam – zwierzył się – zmuszony jestem przemyśleć różne rzeczy i widzę ich tak wiele, że wolę nie myśleć”. Ujrzałem go wtedy w prawdziwym świetle: ten człowiek, mający na koncie największą liczbę trafnych przypuszczeń w matematyce, który potrafi pokonać inżynierów na ich własnym polu, który w jednej chwili ocenia zdarzenia i ludzi, należy do niemal już doszczętnie wymarłej profesji proroków.

Z mężami Starego Testamentu i wyrocznią delficką dźwigał on ciężkie brzemię natychmiastowego widzenia. I jak wszyscy zawodowi prorocy cierpiał na coś, co Sigmund Freud nazwałby „kompleksem Proteusza”. Wielka szkoda, że wśród pacjentów Freuda nie było żadnych proroków.

W dawnych czasach ciemne orzeczenia Sybilli interpretowane były przez wyszkolonych specjalistów, tak zwanych hermeneutów, których zadaniem było przełożenie kryptycznych fraz na greckie zdania. W przypadku Ulama laboratorium w Los Alamos wynajmowało konsultantów, których zadaniem było wyrażenie jego kryptycznych komunikatów w popsutym żargonie współczesnej matematyki.

Stanisław Ulam zmarł niespodziewanie w wieku 75 lat na atak serca. Jak pisze Françoise Ulam:

mawiał, że „najlepszym rodzajem śmierci jest nagły atak serca lub zastrzelenie przez zazdrosnego męża”. Miał szczęście umrzeć w ten pierwszy sposób, choć myślę, że chyba wolałby ten drugi.

(*) Ulam komentował w roku 1965: „Mam wrażenie, iż to interesujące pojęcie, jakim jest overkill, przez lewicę atakowane jest z powodu marnotrawstwa – jako nieekonomiczne, podczas gdy skrajna prawica popiera je z przyczyn psychologicznych: gdyż daje im poczucie męskości, której brak odczuwają.”

Toczyła się wówczas debata, czy Stany Zjednoczone powinny zgodzić się na zakaz prób jądrowych. Ulam i Teller stali na odmiennych stanowiskach, ilustruje to rysunek Herblocka: „Mądry ojciec zna swoje własne dziecko”.

Stanisław Ulam (1/2)

Wyraz jego twarzy jest zazwyczaj ironiczny i kpiący. W istocie porusza go bardzo wszystko, co jest komiczne. Być może posiada pewien dar rozpoznawania i natychmiastowego wychwytywania śmieszności, nic więc dziwnego, że maluje się to na jego twarzy.
Jego wypowiedzi są bardzo nierówne, czasem poważne, czasem wesołe, ale nigdy nudne. Stara się bawić i rozweselać ludzi, których lubi. Nic, z wyjątkiem nauk ścisłych, nie wydaje mi się aż tak pewne czy oczywiste, by nie dopuszczał możliwości istnienia różnych opinii: sądzi, że na niemal każdy temat można powiedzieć niemal wszystko.
Posiada pewien talent matematyczny i zręczność, które pozwoliły mu zdobyć rozgłos w młodym wieku. Pracując w samotności aż do ukończenia dwudziestu pięciu lat, raczej późno stał się człowiekiem bardziej światowym. Jednak nigdy nie bywa nieuprzejmy, gdyż nie jest szorstki ani surowy. Jeżeli czasem kogoś obrazi, to przez nieuwagę lub niewiedzę.
Jego mowa nie jest gładka ani pełna wdzięku. Kiedy mówi coś miłego, to dlatego, że tak myśli. Cechuje go szczerość i prawdomówność, czasem nieco zbyt wielka, ale nigdy brutalna.
Niecierpliwy i choleryczny, czasami bywa gwałtowny. Bardzo bierze sobie do serca wszystko, co go rani, ale uraza zazwyczaj mija, kiedy da ujście swoim uczuciom. Łatwo na niego wpływać i nim kierować, pod warunkiem, że nie zdaje sobie z tego sprawy.
Niektórzy sądzą, że jest złośliwy, ponieważ bezlitośnie naśmiewa się z pretensjonalnych głupców. W rzeczywistości ma wrażliwe usposobienie, co sprawia, że jego nastrój często się zmienia. Może być jednocześnie wesoły i smutny.
Pan U. zachowuje się zgodnie z następującą zasadą: mówi mnóstwo głupich rzeczy, rzadko je zapisuje i nigdy żadnej z nich nie robi. (przeł. A. Górnicka, przekład nieco poprawiony za oryginałem d’Alemberta)

Autocharakterystykę tę przedstawił (oczywiście po francusku) Stanisław Ulam swojej przyszłej żonie Françoise, dopiero na końcu dodając, że napisał ją Jean Le Rond d’Alembert, jeden ze sławnych fizyków matematycznych XVIII stulecia i autor większości artykułów na temat nauk ścisłych w Wielkiej Encyklopedii Francuskiej.

Czy jest to tylko zabawny zbieg okoliczności, czy też obu uczonych łączy jakieś głębsze powinowactwo? Z pewnością obaj starali się przez całe życie uparcie zachować wolność, d′Alembert przytacza określenie jednego ze swych przyjaciół, że stał się „niewolnikiem swej wolności” – określenie to dobrze pasuje także do Ulama. Wbrew pozorom zachowanie takiej suwerenności poczynań jest w dzisiejszej nauce równie trudne co w XVIII wieku. Stanisław Ulam starał się pracować tak, żeby sprawiało mu to przyjemność, nie lubił presji. Cenił pomysłowość, szybkość rozumowań, nie był z tych, którzy latami rozwijają jakąś jedną metodę czy teorię, choć oczywiście miał swoje ulubione tematy czy sposoby podejścia. W najlepszym sensie tego słowa (pochodzącego od łacińskiego „kochać”) był raczej amatorem niż profesjonalnym uczonym akademickim – co w XX wieku było znacznie rzadsze niż w XVIII.
Już Galileusz pisał przy okazji pewnej uczonej polemiki:

Jeśliby roztrząsanie trudnych problemów było tym samym co przenoszenie ciężarów, czynność, przy której wiele koni przenosi więcej worków ziarna niż jeden koń, zgodziłbym się z tym, że wiele dysput wartych jest więcej niż jedna; ale dysputowanie (discorrere) przypomina bieganie (correre), a nie dźwiganie, toteż jeden koń berberyjski pobiegnie dalej niż sto koni fryzyjskich. (przeł. A. Wasilewska)

W osiemnastowiecznym Paryżu grzechem było mówić głupstwa, a jeszcze większym mówić głupstwa z wysiłkiem. Coś z tej atmosfery przetrwało może w środkowoeuropejskich kawiarniach, w których na początku XX wieku tak chętnie spotykali się artyści i uczeni. Ulam starał się trzymać rzeczy istotnych. Nie słuchał np. dłużej niż dziesięć minut wykładów zaproszonych uczonych, ponieważ jeśli ktoś w ciągu dziesięciu minut nie powiedział nic ciekawego, to zapewne nie będzie miał nic do powiedzenia i potem.

Cechą, która zdecydowanie różni d’Alemberta i Ulama jest stosunek do priorytetu własnych odkryć. Pierwszy zaciekle walczył o pierwszeństwo, drugi natomiast zupełnie się nie wdawał w spory tego rodzaju, uważając je za uwłaczające godności. Paradoksalnie w obu przypadkach – d’Alemberta i Ulama – przyczyną mogła być duma zraniona postępowaniem ludzi, których niezbyt się ceni.

Stanisław Ulam początkowo nie zamierzał zostać matematykiem. W rodzinnym Lwowie uczęszczał do gimnazjum klasycznego. Program nauczania takich szkół, podobny w większości Europy: daleki od problemów świata współczesnego, z naciskiem na historię i naukę martwych języków. Te abstrakcyjne zajęcia kształtować miały przyszłą elitę: urzędników, lekarzy, prawników, uczonych. Były czymś w rodzaju wieloletniej próby i budowały wspólną kulturę absolwentów. Wiemy, że Albert Einstein nie zniósł bezdusznej dyscypliny panującej w gimnazjum monachijskim i rzucił szkołę dwa lata przed maturą. Utalentowanemu językowo Ulamowi nauka przychodziła z łatwością, maturę zdał znakomicie, a greka i łacina towarzyszyły mu przez resztę życia, stanowiąc rodzaj kodu, jakim mógł się porozumiewać z kolegami, którzy przeszli podobną edukację. Uważał zresztą gramatykę łacińską za dobre wprowadzenie do myślenia logicznego.

Jako uczeń interesował się astronomią i fizyką. Ojciec, prawnik, dumny był, że jego nastoletni syn „rozumie” teorię względności, która w latach dwudziestych ubiegłego wieku stała się sensacją daleko wykraczającą poza kręgi naukowe. Młody Ulam zafascynowany też był niektórymi zagadnieniami matematycznymi, np. czy istnieją nieparzyste liczby doskonałe (liczby doskonałe są sumą swoich dzielników właściwych, jak 6=1+2+3. Rozwiązanie nie jest znane do dziś). Nie chciał zostać prawnikiem, w ówczesnej Polsce Żydzi niełatwo zostawali profesorami, więc i kariera naukowa wydawała się utrudniona. Postanowił zapisać się na miejscową politechnikę, z jakichś powodów był to Wydział Ogólny, a nie Elektryczny, który dawał konkretny zawód. Ponieważ młody człowiek nieco nudził się na wykładach dla pierwszego roku, zaczął chodzić na wykłady Kazimierza Kuratowskiego z teorii mnogości. Młody profesor chętnie rozmawiał ze swym studentem, Ulam odprowadzał go do domu i gawędzili o matematyce. Kuratowski, widząc inteligencję swego studenta, podsunął mu do rozwiązania pewne zagadnienie z teorii mnogości. Ulamowi udało się rozwiązać problem i praca została opublikowana w „Fundamenta Mathematicae”, polskim piśmie poświęconym głównie teorii mnogości i będącym czymś w rodzaju organu polskiej szkoły matematycznej. Dopiero jednak po rozwiązaniu drugiego problemu zasugerowanego przez Kuratowskiego Ulam zdecydował się zostać matematykiem, stało się to przed końcem jego pierwszego roku studiów.

Wkrótce poznał też innych matematyków lwowskich i wiele czasu spędzał w ich pokojach na dyskusjach. Później rozmowy te przenosiły się często do kawiarni. Jedna z takich sesji w kawiarni „Szkockiej” ze Stanisławem Mazurem i Stefanem Banachem trwała, jak wspomina Ulam, siedemnaście godzin z przerwami na posiłki. Z rozmów tych pochodził materiał do jego prac, jak też znaczna część jego wiedzy matematycznej. Ulam nigdy nie należał do uczonych, którzy pilnie śledzą postępy w wybranych dziedzinach i wiedzą na ten temat wszystko. Lubił rozpoczynać od zera, nawet gdy przy okazji odkrywał po raz drugi pojęcia czy fakty znane już w literaturze.

Nieformalny sposób uprawiania nauki bardzo odpowiadał towarzyskiemu Ulamowi, który z trudem naginał się do formalnych wymagań i zdawania egzaminów. W 1932 roku jako student został zaproszony do wygłoszenia komunikatu na Kongresie Matematycznym w Zurychu, gdzie spotkał wielu sławnych uczonych, potem jesienią w ciągu kilku tygodni napisał pracę magisterską, w roku następnym doktorat. Miał wtedy dwadzieścia cztery lata i coraz mniejsze szanse na karierę w Polsce. W sąsiednich Niemczech do władzy doszedł Adolf Hitler, bardzo wielu uczonych żydowskiego pochodzenia, w tym matematyków, musiało opuścić Niemcy. Odbywając w 1934 roku podróż po ośrodkach matematycznych Europy, pochłonięty matematyką Stanisław Ulam ledwie zdawał sobie jednak sprawę z tego, co się dzieje w świecie polityki. W roku następnym poznał Johna von Neumanna, który choć tylko kilka lat od niego starszy, był już sławny. Von Neumann, syn budapeszteńskiego bankiera żydowskiego pochodzenia, nie miał złudzeń co do sytuacji w Europie, toteż wyemigrował do Stanów Zjednoczonych, stary kontynent odwiedzając tylko z okazji jakichś konferencji czy spotkań. Obaj uczeni zaprzyjaźnili się. Poza matematyką łączyło ich sporo: dawne Austro-Węgry, kultura żydowska, klasyczne wykształcenie, pewna kosmopolityczna ogłada i dobre wychowanie. Von Neumann cenił ogromną pewność siebie Ulama, a także jego trudny do przewidzenia tok myślenia. Coś podobnego stwierdził też kiedyś na temat Ulama Stefan Banach: że formułuje on problemy w sposób „dziwny” i proponuje też „dziwne” rozwiązania, które często są skuteczne.

Von Neumann sprawił, że zaproszono Stanisława Ulama do Instytutu Badań Zaawansowanych w Princeton, gdzie tworzono coś w rodzaju ziemskiego raju dla uczonych, zaczynając od matematyków i fizyków teoretycznych. Jedną z pierwszych gwiazd tego Instytutu stał się Albert Einstein. Najmłodszym profesorem był tam von Neumann. Ulam należał do grupy młodych badaczy zapraszanych, by mieli okazję popracować wśród uznanych kolegów. Semestr w Princeton zaowocował trzyletnim stypendium na uniwersytecie Harvarda w Society of Fellows, organizacji finansującej dobrze zapowiadających się młodych uczonych.

Erwin Schrödinger: trzeci początek mechaniki kwantowej (1926)

Równanie Schrödingera zasługuje na swoją sławę: dzięki niemu znamy nie tylko budowę atomów, ale i cząsteczek chemicznych czy ciał skondensowanych. Wynikają z niego najprzeróżniejsze własności materii, która nas otacza, a także materii we wszechświecie. Jest więc równaniem niezwykle istotnym tak dla fundamentów fizyki, jak i dla zastosowań.

Autor najsłynniejszego równania dwudziestowiecznej fizyki aż do roku 1926 nie należał do ścisłej czołówki fizyków teoretycznych. Zaledwie osiem lat młodszy od Einsteina, dopiero od 1921 roku zajmował katedrę na uniwersytecie w Zurychu. Studiował w Wiedniu, zbyt późno by zetknąć się osobiście z Ludwigiem Boltzmannem czy Ernstem Machem, choć wpływ obu tych uczonych wciąż dawał się tam odczuć. Fizyki teoretycznej uczył się u Friedricha Hasenöhrla, bliskiego przyjaciela Mariana Smoluchowskiego. Do tej pory niewiele zajmował się teorią kwantową, ponieważ opierała się ona wciąż na bardzo grząskich podstawach, korzystając po trosze z fizyki klasycznej, a po trosze z postulatów kwantowania, wyraźnie z nią sprzecznych. Zwrócił jednak uwagę na pracę Louisa de Broglie na temat fal materii. Postulowała ona, że zarówno fotony, jak i inne cząstki mikroświata mają dualną naturę: zachowują się czasem jak cząstki, a czasem jak fale. Obowiązywał przy tym jeden uniwersalny przelicznik własności cząstkowych: energii E i pędu p na wielkości falowe: częstość (kołową) \omega i liczbę falową k\equiv\frac{2\pi}{\lambda} (\lambda jest długością fali). Współczynnikiem proporcjonalności w obu przypadakch miała być stała Plancka \hbar:

E=\hbar\omega,\,p=\hbar k.

Felix Bloch, wówczas początkujący fizyk, tak wspomina wspólne kolokwia (dziś powiedzielibyśmy raczej seminaria) fizyków z uniwersytetu w Zurychu i z ETH, gdzie najważniejszą postacią był Peter Debye.

Pewnego razu pod koniec kolokwium Debye powiedział coś w tym rodzaju: „Schrödinger nie zajmujesz się teraz żadnym ważnym tematem. Może opowiedziałbyś nam któregoś dnia o tym doktoracie de Broglie’a, który, zdaje się, przyciągnął sporo uwagi”. Więc na jednym z następnych kolokwiów Schrödinger przedstawił cudownie przejrzysty wykład o tym, jak de Broglie wiąże fale z cząstkami i w jaki sposób zdołał on uzyskać reguły kwantyzacji Bohra i Sommerfelda (…) Kiedy skończył, Debye stwierdził od niechcenia, że taki sposób ujęcia jest raczej dziecinny. Jako student Sommerfelda nauczył się, że właściwy sposób podejścia do fal wiedzie przez równanie falowe. Brzmiało to dość trywialnie i na pozór nie zrobiło głębszego wrażenia, ale Schrödinger najwyraźniej wrócił później do tego pomysłu. Zaledwie kilka tygodni później dał następne kolokwium, zaczynając od słów: „Kolega Debye zasugerował, że należy mieć równanie falowe, toteż je znalazłem”. [„Physics Today”, t. 29 (1976), nr 12, s. 23-24]

Najwyraźniej w pierwszej chwili obaj nie zdawali sobie sprawy z wagi tych badań. Erwin Schrödinger dzięki pracom z końca roku 1925 i roku 1926 stał się błyskawicznie jednym z najgłośniejszych fizyków świata. Seria jego artykułów natychmiast zyskała uznanie. Chwalili je Albert Einstein i Arnold Sommerfeld, który wraz ze swymi uczniami rozwijał od lat fizykę kwantową. Napisał do niego sędziwy Hendrik Lorentz, który uważnie śledził nowości i miał parę istotnych uwag. Surowy i poważny Max Planck, profesor najbardziej prestiżowej katedry w Niemczech (co wtedy znaczyło: najbardziej prestiżowej na świecie) – na uniwersytecie w Berlinie, pisał entuzjastycznie do Schrödingera:

Czytam pański artykuł tak, jak ciekawe dziecko, słuchające w napięciu rozwiązania zagadki, nad którą się długo głowiło, i cieszę się bardzo wszystkimi pięknościami, jakie tam dostrzegam, choć muszę go jeszcze dokładniej przestudiować, by wszystko z niego pojąć.

Kiedy w grudniu 1925 roku Schrödinger znalazł swe równanie, był to trzeci początek mechaniki kwantowej albo – jak wolał o tym mówić autor odkrycia – mechaniki falowej. Na pierwszy rzut oka nie miało to nic wspólnego z teorią Heisenberga, Borna, Jordana i Diraca. U Schrödingera nie było żadnych skoków kwantowych, żadnych wielkości macierzowych, nieprzemiennych iloczynów. Język był całkowicie klasyczny – była to matematyka drgań, dobrze już wówczas opracowana. W roku 1924 wyszła dwutomowa monografia Methoden der mathematischen Physik („Metody fizyki matematycznej”) zredagowana przez Richarda Couranta i innych matematyków z Getyngi na podstawie wykładów Davida Hilberta. Zawierała ona wiele materiału, który miał się okazać potrzebny fizykom za kilka lat. Jak na ironię metody Hilberta zastosowali pierwsi nie fizycy z grupy Maksa Borna, pracujący przecież głównie pod bokiem Hilberta w Getyndze, ale Erwin Schrödinger, outsider i naukowy samotnik. Fizycy z Getyngi zlekceważyli nawet wyraźną sugestię Hilberta w jednej z rozmów, że powinni poszukać równania różniczkowego, które opisuje skwantowane wartości energii. Nie próbowali iść tym tropem, przekonani, że ich mechanika kwantowa jest czymś całkowicie nowym i nie może się zawierać w książce sprzed paru lat. Źle przyjęli też pracę Schrödingera, która wydawała się recydywą fizyki klasycznej, odwrotem od kwantowej rewolucji spod sztandaru Heisenberga.

Fizycy klasyczni znali wiele przypadków drgań układów rozciągłych, czyli fal stojących. Są one np. podstawą wytwarzania dźwięku w instrumentach muzycznych takich, jak organy, flet, trąbka czy skrzypce. Wiadomo, że zamocowana na końcach struna drgać może tylko z określonymi ściśle częstościami: podstawową oraz jej wielokrotnościami. Rozważano różne bardziej skomplikowane możliwości, pisaliśmy tu o rówieśniku Einsteina, fizyku z Getyngi, Waltherze Ritzu. Idea Schrödingera polegała na tym, by wartości energii w atomie potraktować analogicznie do częstości dźwięku w pudle rezonansowym, stosując równanie falowe. Ma ono w przypadku trójwymiarowym postać:

\dfrac{\partial^2\psi}{\partial x^2}+\dfrac{\partial^2\psi}{\partial y^2}+\dfrac{\partial^2\psi}{\partial z^2}-\dfrac{1}{v^2}\dfrac{\partial^2 \psi}{\partial t^2}\equiv \Delta\psi-\dfrac{1}{v^2}\dfrac{\partial^2 \psi}{\partial t^2}=0,

gdzie v jest prędkością fal. Jeśli przyjmiemy, że nasze fale są okresowe i mają częstość \omega, możemy rozwiązania zapisać jako

\psi(x,y,z, t)=\psi(x,y,z)e^{\pm i\omega t}.

Drugą pochodna po czasie jest ta sama funkcja wykładnicza pomnożona przez stałą. Wstawiając to do równania falowego, otrzymujemy tzw. równanie Helmholtza (który pod koniec XIX wieku był profesorem w Berlinie):

\Delta \psi+k^2 \psi=0.

W równaniu tym skorzystaliśmy z tego, że \dfrac{\omega}{v}=k. Droga Schrödingera do odkrycia była dość zawikłana. Związki de Broglie’a są relatywistyczne, naturalne wydawało się więc zapisanie równania relatywistycznego. Jednak kiedy spróbujemy je rozwiązać w najprostszym przypadku atomu wodoru, okazuje się, że dopuszczalne energie nie zgadzają się z tym, co wcześniej, w starej teorii kwantów obliczył Sommerfeld i co zgadzało się z doświadczeniem (szczegóły można znaleźć u L. Schiffa, Mechanika kwantowa, s. 409 i n.). Dwa lata później sytuacja się wyjaśniła: potrzebne tu jest równanie Diraca. Dwa lata w tamtej chwili rozwoju fizyki to było więcej niż epoka, Schrödinger znajdował się dopiero u początków tej drogi i nie mógł wiedzieć, co stanie się dalej. Rozsądnie zdecydował się więc na przybliżenie nierelatywistyczne, robiąc niejako krok wstecz w porównaniu do de Broglie’a. Nie pójdziemy tu jego drogą, a właściwie kilkoma różnymi drogami, jakimi próbował uzasadnić swe równanie. Wybierzemy podejście najprostsze zaproponowane pół roku później przez Maksa Borna – musimy jednak pamiętać, że nie jest to wyprowadzenie. Nie można bowiem wyprowadzić praw mechaniki kwantowej z praw klasycznych. Dla cząstki o masie m i całkowitej energii E możemy napisać równanie zachowania energii:

E=\dfrac{\hbar^2 k^2}{2m}+V(x,y,z),

gdzie V jest energią potencjalną (pierwszy składnik to zwykła energia kinetyczna). Jeśli wyznaczymy k^2 z ostatniego równania i wstawimy do równania Helmholtza, otrzymamy tzw. równanie Schrödingera bez czasu:

-\dfrac{\hbar^2}{2m}\Delta\psi+V\psi=E\psi.

Chcąc np. opisać ruch elektronu wokół nieruchomego jądra atomowego o ładunku Ze, należy wstawić do równania Schrödingera energię potencjalną postaci

V(r)=-\dfrac{Ze^2}{4\pi \epsilon_0 r},

czyli zwykłą energię potencjalną przyciągania elektrostatycznego dwóch ładunków Ze oraz -e w odległości r. Szukamy takich funkcji \psi(x,y,z), które daleko od jądra zanikają. Okazuje się, że rozwiązania takie są możliwe tylko dla dyskretnych wartości energii równych

E_n=-\dfrac{me^4}{2(4\pi\epsilon_0)^2 \hbar^2}\dfrac{1}{n^2}, \mbox{ gdzie } n=1,2, 3, \ldots.

 Jest to wynik uzyskany w roku 1913 przez Bohra z założeń, które od początku wydawały się aktem rozpaczy, a nie solidną nauką. Równanie Schrödingera miało więc sens, choć nadal brakowało pewnych elementów do kompletnej teorii. Jednym z najważniejszych było znaczenie samej funkcji \psi. Kiedy w piszczałce organowej czy w rurce fletu wytwarzany jest dźwięk, wiemy, co drga – jest to powietrze, które ściśnięte się rozpręża, a rozprężone wraca do początkowej gęstości. Co drga w atomie wodoru? Jakie jest znaczenie funkcji \psi? Co gorsza, okazało się, że powinna ona mieć wartości zespolone, z pewnością nie było to żadne proste drganie klasyczne. Geniusz Schrödingera ujawnił się i w tym, że nie próbował odpowiedzieć na wszystkie pytania naraz i pozwolił swoim ideom rozwijać się w czasie. Publikacje uczonego z pierwszego półrocza 1926 roku wystarczyły na Nagrodę Nobla i objęcie w roku 1927 katedry w Berlinie po odchodzącym na emeryturę Maksie Plancku.

Erwin Schrödinger, człowiek wszechstronnie wykształcony, o szerokich zainteresowaniach, całkowicie zaprzecza ascetycznej wizji uczonego, który nie ma czasu na nic oprócz nauki. Wydaje się wręcz, że jego pomysłowość przy stworzeniu słynnego równania szła w parze z gorączką miłosną. Praca ta powstała w uzdrowisku Arosa, gdzie wybrał się w towarzystwie do dziś nie znanej flamy. Jego małżeństwo należało do nowoczesnych i partnerzy pozostawiali sobie bardzo wielką swobodę. Były przecież lata dwudzieste: kobiety odsłoniły nogi, tańczono charlestona, wszyscy chcieli zapomnieć o koszmarze niedawnej wielkiej wojny.

 

 

 

 

 

Oscylator kwantowy: Paul Dirac i inni (1929-1930)

Mechanika kwantowa wprowadziła rewolucyjnie nowe pojęcie stanu układu fizycznego. Klasycznie stan układu znamy, gdy dane są jego położenie i pęd w pewnej chwili. Na tej podstawie możemy obliczyć przyszłe położenia i pędy (albo i przeszłe – mechanika jest symetryczna wobec zmiany strzałki czasu). Np. znając dziesiejsze położenie i pęd planety, możemy obliczyć, gdzie znajdzie się ona za sto lat albo gdzie była, powiedzmy, w czasach Keplera. Stan układu to punkt w przestrzeni polożeń q i pędów p. Ewolucja w czasie to ruch tego punktu w owej przestrzeni fazowej.

Mechanika kwantowa zastępuje klasyczną na poziomie mikroświata. Zupełnie jednak zmienia się pojęcie stanu układu. Stanem jest teraz nie punkt, lecz wektor, a właściwie cały promień, to znaczy wektor pomnożony przez dowoloną liczbę. Przestrzeń stanów (wektorów) umożliwia dodawanie dwóch stanów. Operacja taka nie miałaby sensu w mechanice klasycznej: bo niby jak mamy dodać do siebie położenie Marsa i położenie Jowisza? Co taka suma miałaby oznaczać? W mechanice kwantowej obowiązuje zasada superpozycji, czyli dodawania stanów.

Wikipedia: Double-slit experiment

Kiedy np. przepuszczamy elektron przez przesłonę z dwiema szczelinami, jego stan kwantowy będzie sumą stanu elektronu, który przeszedł przez szczelinę nr 1 oraz stanu elektronu, który przeszedł przez szczelinę nr 2. Stosując zapis wprowadzony przez Paula Diraca w 1939 roku, możemy to zapisać jako

|\varphi\rangle=| \varphi_1\rangle+| \varphi_2\rangle.

Fizycznie znaczy to, że nasz elektron trochę przeszedł przez szczelinę nr 1, a trochę przez szczelinę nr 2. Jego stan jest superpozycją dwóch stanów. Gdybyśmy chcieli wyznaczyć prawdopodobieństwo, że w jakimś punkcie ekranu x zarejestrujemy nasz elektron, należałoby obliczyć iloczyn skalarny z wektorem przedstawiającym elektron w x:

\langle x | \varphi \rangle=\langle x| \varphi_1\rangle+ \langle x| \varphi_2\rangle.

Zapis Diraca wziął się z rozłożenia nawiasu kątowego na dwie części: nazywa się je wektorem bra i ket (od angielskiego: bracket). Z pomnożenia skalarnego dwóch wektorów otrzymujemy liczbę (prędzej czy później będziemy potrzebowali liczb, jeśli teoria ma coś przewidywać ilościowo). Powyższy zapis Diraca można też zastąpić bardziej konwencjonalnym sumowaniem funkcji:

\varphi(x)=\varphi_1(x)+\varphi_2(x).

Wartość funkcji falowej w danym punkcie x można traktować jako składową wektora \varphi. Zapis Diraca \langle a|b\rangle pozwala nam patrzeć na funkcję jako iloczyn skalarny dwóch wektorów, jeszcze wygodniej jest często operować samymi wektorami stanu: nie precyzujemy wówczas, co chcielibyśmy mierzyć (może np. zamiast położenia, wolelibyśmy pędy – pierwsza forma zapisu  tego nie przesądza.

Mamy zatem abstrakcyjne wektory stanu i iloczyn skalarny. Wartości tego iloczynu skalarnego są na ogół zespolone, inaczej mówiąc, funkcje falowe są zespolone (*). Nie mogą one mieć bezpośredniego sensu fizycznego. Sens taki mają natomiast kwadraty ich modułów: |\varphi(x)|^2 daje nam prawdopodobieństwo zarejestrowania elektronu w punkcie x (dokładniej: gęstość prawdopodobieństwa, bo współrzędna przyjmuje dowolne wartości rzeczywiste). Tam gdzie prawdopodobieństwo jest duże, elektrony będą częściej trafiały, gdy zbierze się dostateczna statystyka, będziemy mogli zaobserwować, że „trafienia” układają się w prążki interferencyjne. Wynik jest taki, jakby dwie fale nakładały się na siebie.

Obrazki powyżej pochodzą z rzeczywistego doświadczenia Akira Tonomury, Proc. Natl. Acad. Sci. U.S.A. 102 (2005) 14952-14959. Liczba elektronów wzrasta od 10 do 140 000, widzimy, jak uwidaczniają się prążki interferencyjne. W doświadczeniu tym elektrony przepuszczane były pojedynczo, wiemy więc, że każdy elektron interferuje niejako sam z sobą, nie jest to skutek jakichś oddziaływań między nimi. Ze względów technicznych doświadczenie to przeprowadzone było stosunkowo niedawno, ale że wynik musi być właśnie taki, zdawali sobie sprawę już pierwsi badacze mechaniki kwantowej: Heisenberg, Born, Jordan, Dirac. W 1927 r. Lester Germer i Clinton Davisson oraz niezależnie George Paget Thomson zaobserwowali dyfrakcję elektronów, za co otrzymali Nagrodę Nobla (G.P. Thomson był synem J.J. Thomsona, który odkrył elektron, mówiono, że ojciec dostał Nagrodę Nobla za odkrycie, iż elektron jest cząstką, a syn – za odkrycie, że elektron jest falą). Oczywiście, elektron (podobnie jak np. foton) jest cząstką, do opisu której musimy stosować mechanikę kwantową.

Tak więc choć dodawanie stanów wydaje się abstrakcyjne, to w istocie jest obserwowane w eksperymentach. Skoro stany są wektorami i można je dodawać oraz mnożyć przez liczbę, to naturalnym rodzajem przekształceń takiej przestrzeni są operatory liniowe, czyli odwzorowania przypisujące każdemu wektorowi |\varphi \rangle jakiś inny wektor: A |\varphi \rangle, przy czym

A(\lambda_1 | \varphi_1\rangle+\lambda_2 |\varphi_2\rangle)=\lambda_1 A |\varphi_1\rangle+\lambda_2 A |\varphi_2\rangle,

gdzie \lambda_1,\lambda_2 są dowolnymi liczbami. Operatory takie w mechanice kwantowej zastępują wielkości fizyczne, które można mierzyć: mamy więc operatory pędu, położenia, energii itd. W jaki sposób formalizm ten pozwala otrzymywać w pewnych sytuacjach skwantowane wartości np. energii? Operator wielkości A działając na pewne odpowiednio wybrane wektory daje bardzo prosty wynik: mnoży wektor wyjściowy przez liczbę. Np.

A |\varphi_a\rangle=a|\varphi_a\rangle,

co zwykle zapisuje się krócej:

A|a\rangle =a|a\rangle.

Litera a oznacza wartość wielkości fizycznej, a więc powinna to być liczba rzeczywista, a przynależny jej stan |a\rangle jest wektorem. Mówi się, że jest to wektor własny, a wartość nazywamy wartością własną. Z doświadczalnego punktu widzenia, gdy układ jest w stanie własnym, to wynikiem pomiaru owej wielkości jest na pewno a. Przestrzeń stanów jest nieskończenie wymiarowa i może zawierać wiele różnych wektorów odpowiadających różnym wartościom własnym. Może się np. okazać, że tylko pewien dyskretny zbiór wartości jest dopuszczalny – i wtedy właśnie wielkość fizyczna się kwantuje.

Pokażemy, jak formalizm ten działa w przypadku oscylatora harmonicznego. Jest to najprostszy niecałkiem trywialny układ, mający zresztą liczne zastosowania: wszystko, co gdzieś drga, można w pierwszym przybliżeniu opisać jako oscylator harmoniczny albo ich zbiór – mogą to być drgania kryształów, atomów w cząsteczkach chemicznych, a nawet fale elektromagnetyczne, które matematycznie są podobne do oscylatorów.

W jednowymiarowym przypadku, gdy masa cząstki oraz częstość oscylatora są jednostkowe, energia ma postać:

E=\frac{1}{2}(p^2+x^2),

jest to więc suma kwadratów pędu i współrzędnej (kwadratowy potencjał odpowiada sile proporcjonalnej do wychylenia z położenia równowagi, jak w przypadku masy na sprężynie). W mechanice kwantowej zastępujemy tę funkcję operatorem Hamiltona (hamiltonianem), który ma postać taką samą, jak klasyczna:

H=\frac{1}{2}(p^2+x^2),

teraz jednak po prawej stronie mamy operatory pędu i położenia. Wiemy o nich od czasów Borna i Jordana oraz Diraca, że są nieprzemienne i spełniają regułę komutacji:

xp-px=i\hbar.

Okazuje się, że wystarczy to do znalezienia wartości energii oscylatora (dla uproszczenia przyjmiemy jednostki \hbar=1). Metoda, którą zastosujemy, przypisywana jest zwykle Paulowi Diracowi, choć w druku pojawiła się po raz pierwszy w książce Maksa Borna i Pascuala Jordana z roku 1930.

Hamiltonian jest sumą kwadratów, możemy więc spróbować rozłożyć go na czynniki. Wprowadzamy dwa nowe operatory:

a=\frac{1}{\sqrt{2}}(x+ip), \; a^{\dag}=\frac{1}{\sqrt{2}}(x-ip).

Gdyby x, p były liczbami rzeczywistymi, iloczyn obu naszych operatorów byłby równy hamiltonianowi. Musimy jednak uwzględnić nieprzemienność mnożenia operatorów:

a^{\dag}a=\frac{1}{2}(x^2+p^2+ixp-ipx)=H-\frac{1}{2}.

W podobny sposób możemy obliczyć iloczyn wzięty w odwrotnej kolejności:

aa^{\dag}=\frac{1}{2}(x^2+p^2-ixp+ipx)=H+\frac{1}{2}.

Odejmując ostatnie dwie równości stronami, otrzymamy

a^{\dag}a-aa^{\dag}=1.

Zbadajmy teraz wartości własne operatora N=a^{\dag}a – muszą one być o \frac{1}{2} mniejsze niż wartości własne operatora H. Jeśli |\lambda\rangle jest wektorem własnym N o wartości \lambda, to mamy

Na|\lambda \rangle=(a^{\dag}a)a|\lambda\rangle=(aa^{\dag}-1)a|\lambda\rangle=(\lambda-1)a|\lambda\rangle.

Oznacza to, że wektor a|\lambda\rangle też jest wektorem własnym N o wartości o 1 mniejszej. Działając kolejny raz operatorem a na tak uzyskany wektor, otrzymamy wektor o wartości własnej mniejszej o 2 itd. Procedura ta musi się jednak zakończyć po skończonej liczbie kroków, ponieważ operator N, tak jak i H, jest ograniczony od dołu. Hamiltonian jest sumą kwadratów i nie może mieć ujemnych wartości własnych, energia każdego układu ograniczona jest od dołu, gdyby tak nie było świat by się zapadł w stany o ujemnej energii. Znaczy to, że istnieje taki wektor |0\rangle, że

a  |0\rangle=0.

Po prawej stronie mamy wektor zerowy, czyli brak jakiegokolwiek stanu. Oczywiście, N |0\rangle=0, czyli wektorowi temu odpowiada zerowa wartość własna. Możemy teraz do tego wektora zastosować operator a^{\dag}, otrzymamy

Na^{\dag}|0\rangle=a^{\dag}aa^{\dag}|0\rangle=a^{\dag}(a^{\dag}a+1)|0\rangle=a^{\dag}|0\rangle,

czyli wektor a^{\dag}|0\rangle ma wartość własną 1. Powtarzając ten zabieg stosowania operatora a^{\dag} wykreujemy stany o wartościach własnych równych kolejnym liczbom naturalnym. Z tego powodu operator a^{\dag} nazywa się operatorem kreacji, a a – operatorem anihilacji. Generują one stany o większej bądź mniejszej wartości N. Zatem wartości własne naszego hamiltonianu równe są

E_n=n+\frac{1}{2}, \mbox{ gdzie  } n=0,1, 2,\ldots.

W zwykłych jednostkach energie wyrażają się przez częstość oscylatora \omega=\sqrt{\frac{k}{m}}:

E_n=\hbar\omega(n+\frac{1}{2}).

Wynik ten znany był od lat, po raz pierwszy jednak powstał w latach 1925-1926 spójny formalizm pozwalający otrzymać ten i wiele innych rezultatów.

Na obrazku widzimy rezultat zastosowania formalizmu: niebieska linia to kształt potencjału (parabola x^2), linie poziome oznaczają dozwolone wartości energii. Nawet najmniejsza energia musi być dodatnia: oznacza to, że kwantowy oscylator nigdy nie może spoczywać. Gdybyśmy zrobili kwantowe wahadło, musiałoby ono zawsze drgać. Z tego powodu nawet w temperaturze zera bezwględnego atomy w kryształach czy cząsteczkach chemicznych drgają – są to tzw. drgania zerowe.

Wynik dla oscylatora ma konsekwencje fizyczne: już w 1900 r. Max Planck zauważył, że energie te powinny przybierać skwantowane wartości, jeśli chcemy prawidłowo opisać promieniowanie ceieplne. Kilka lat później Albert Einstein wyjaśnił eksperymentalne wyniki dotyczące diamentu właśnie za pomocą tego kwantowania.

Prosty formalizm operatorów kreacji i anihilacji odegrał niezmiernie ważną rolę w rozwoju mechaniki kwantowej, pozwalając zbudować kwantową teorię pola. O jej początkach innym razem.

(*) Iloczyn skalarny dwóch wektorów przypisuje parze wektorów liczbę zespoloną i spełnia następujące aksjomaty:

\langle a| b\rangle=\langle b|a\rangle^{\star}.

\langle a| \lambda b+c\rangle=\langle a| b\rangle+\lambda\langle a| c\rangle.

Iloczyn wektora z samym sobą jest liczbą rzeczywistą nieujemną – kwadratem jego długości, zwanym też normą:

||{a}||^2:=\langle a|a\rangle.

 

 

Elementy – Euklides (ok. 300 p.npe.)

Myślimy często o starożytnej Grecji jako o cywilizacji, która dała nam filozofię, teatr, poezję, historię, sztukę, logikę, demokrację. Mniej dostrzegane są początki nauk ścisłych, które, wbrew wszelkiemu prawdopodobieństwu, osiągnęły u Greków niezwykle wysoki poziom. Dwa najważniejsze dzieła, Elementy i Almagestpowstały w Aleksandrii, pierwsze na początku świetności miasta, drugie już pod jej koniec. Oddzielone od siebie ponad czterema wiekami, skondensowały w sobie to, co najlepsze w starożytnym dorobku. A bez greckiej geometrii i astronomii nie do pomyślenia byłaby późniejsza nauka islamska, a także praca Mikołaja Kopernika i jego następców prowadząca do rewolucji naukowej XVII wieku.

Tekst Elementów, podzielony na trzynaście ksiąg, obejmuje w sposób systematyczny najważniejsze osiągnięcia matematyki greckiej przed Archimedesem. Napisane około roku 300 p.n.e. dzieło było przez wieki kopiowane zarówno w greckim oryginale, jak i w przekładach na hebrajski, arabski i łacinę, a od 1482 roku zaczęło ukazywać się drukiem w niezliczonych wydaniach książkowych, które liczbą ustępują tylko wydaniom Biblii. Aż do początku XIX wieku znano tekst Euklidesa jedynie w redakcji Teona z Aleksandrii, uczonego z IV w.n.e., ojca Hypatii. W 1808 r. François Peyrard, pierwszy bibliotekarz École Polytechnique w Paryżu, odkrył, iż rękopis Elementów zrabowany z Watykanu przez Napoleona (Vaticanus graecus 190, zwany też P) jest wcześniejszą wersją dzieła. Stała się ona później podstawą definitywnego wydania opracowanego przez duńskiego filologa Johana Ludviga Heiberga.

[Vaticanus graecus 190]

Dzieło Euklidesa nie było pierwszym noszącym ten tytuł, szybko stało się jednak klasyczne, czego pośrednim dowodem jest fakt, że nie zachowały się niemal żadne wcześniejsze teksty matematyczne – w czasach gdy kopiowanie książek było kosztowne i pracochłonne, następowała swoista selekcja naturalna rękopisów, w której te bardziej przydatne wypierały mniej użyteczne. Elementy są najwcześniejszym zachowanym greckim traktatem poświęconym matematyce, ponieważ stanowią one podręcznik, z którego można nauczyć się podstaw matematyki. Stosowane były w tej funkcji nie tylko w starożytności, ale i w czasach późniejszych aż po dziewiętnasty wiek.

Zadziwiająco mało wiemy o autorze tekstu, nawet jego istnienie podawano w wątpliwość, argumentując, że dzieło jest niejednorodne i różne jego księgi wykazują rozmaity stopień dojrzałości. Na ogół sądzi się jednak, że Euklides działał i prawdopodobnie także urodził się w Aleksandrii, mieście niedługo wcześniej założonym przez Aleksandra Wielkiego i przez długie wieki stanowiącym ośrodek nauki i kultury greckiej. Według Proklosa, neoplatończyka z V w.n.e., Euklides żył za panowania Ptolemeusza I i był młodszy niż krąg uczniów Platona, a starszy od Archimedesa i Eratostenesa. Miał być platonikiem i z tego powodu dzieło jego kulminowało konstrukcją i omówieniem pięciu brył platońskich, znanych z Timajosa. Euklidesa nie uważano nigdy za oryginalnego twórcę, sądzono, że zebrał on i usystematyzował osiągniecia poprzedników, w szczególności Eudoksosa i Teajteta. Elementy nie są jednak prostą kompilacją znanego już materiału, lecz próbą zbudowania dedukcyjnego systemu wiedzy matematycznej. Możliwe, że tak jak i w późniejszej historii matematyki, po okresach szybkich postępów następowały okresy systematyzacji i porządkowania wiedzy i Elementy są świadectwem takiego dążenia. Choć odkrycia późniejszych matematyków, takich jak Archimedes, Apoloniusz i Pappus, znacznie wykroczyły poza problematykę Elementów, dzieło to pozostało najszerzej używanym podręcznikiem w historii. Jego znaczenie nie ogranicza się do matematyki: dedukcyjny system wiedzy stał się ideałem wielu późniejszych filozofów i uczonych. W naukach ścisłych aż do dziś uważa się możliwość ustrukturyzowania wykładu na wzór greckiej geometrii za ważny sprawdzian dojrzałości danej dyscypliny. Wprowadzając postulaty, z których następnie wyprowadzamy twierdzenia, osiągamy pojęciową jasność i większą przejrzystość konstrukcji myślowych, musimy bowiem uświadomić sobie jasno przyjęte założenia.

Pamiętać też należy, iż grecka geometria nie była traktowana jako abstrakcyjna gra logiczna, lecz jako teoria wywodząca się z obserwacji dotyczących ciał w przestrzeni, stanowiła więc i nadal stanowi (wraz z nieeklidesowymi rozszerzeniami) podstawę fizyki. Można więc traktować ją jako pierwszą matematyczną teorię fizyczną. Kiedy niedługo później Archimedes w podobny sposób ujmował zasady równowagi ciał, rozszerzał niejako geometrię, tworząc zarazem pierwszą fizykę matematyczną.

Poniżej skoncentrujemy się na przedstawieniu metody postępowania Euklidesa, ograniczając się do tego, co było znane i czytane najszerzej i nie ograniczało się tylko do samej matematyki. Aksjomatyczna konstrukcja wiedzy jest osiągnięciem greckim nie mniejszym niż demokratyczne rządy albo rzeźba. Dzięki Euklidesowi nigdy już nie stracono z oczu, przynajmniej w kręgu śródziemnomorskim, owej metody uzyskiwania zdań niezbitych i pewnych. Jeśli prawdą jest, że (jak ujął to Alfred North Whitehead) filozofia europejska stanowi ciąg przypisów do Platona, to z niemniejszą dozą słuszności powiedzieć można, że nauki ścisłe – fizyka w nie mniejszym stopniu niż matematyka – stanowią rozbudowany komentarz do Elementów Euklidesa.

Każda z ksiąg (albo grup ksiąg) poprzedzona jest definicjami. Księga pierwsza zaczyna się od wymienienia pięciu postulatów geometrii oraz pięciu ogólniejszych prawidłowości odnoszących się do tego, co Euklides nazywa wielkościami – może tu chodzić (jak czytelnik dowiaduje się przy okazji kolejnych twierdzeń) o długość odcinka, wielkość kąta, pole powierzchni czy objętość pewnych brył. Następnie z owych dziesięciu założeń wyprowadzane są kolejne twierdzenia oraz konstrukcje. Księgi I-IV oraz VI, XI-XIII poświęcone są geometrii, sięga V zawiera wykład teorii proporcji Eudoksosa (odgrywały one w matematyce greckiej rolę dzisiejszych liczb rzeczywistych), księgi VII-IX dotyczą arytmetyki, w księdze X dyskutowane są rozmaite rodzaje liczb niewymiernych, zawsze jednak traktowanych jako proporcje długości pewnych odcinków. Ostatnia księga XIII kończy się twierdzeniem, że istnieje dokładnie pięć brył platońskich (sześcian oraz foremne: czworościan, ośmiościan, dwunastościan i dwudziestościan).

Podejście Euklidesa niewątpliwie wiele zawdzięcza istniejącej już tradycji matematycznej, a także platońskiemu rozróżnieniu między przedmiotami postrzeganymi przez zmysły a bytami idealnymi: korzystając z rysunków, traktuje je tylko jako pomoc w wyobrażeniu sobie, jak mają się do siebie idealne figury geometryczne. Koncepcję uporządkowania wiedzy, zaczynając od założeń, których prawdziwość przyjmuje się bez dowodu, znaleźć można u Arystotelesa, nie wiadomo jednak, czy występuje tu jakaś bezpośrednia zależność, czy tylko wspólna tradycja filozoficzna. Geometria stała się pierwszą wyspecjalizowaną dziedziną wiedzy, uprawianą nie ze względów praktycznych, lecz dla niej samej. Wysokie mniemanie o pedagogicznych wartościach geometrii żywił Platon, sądząc, że kieruje ona uwagę ku temu, co wieczne i niezmienne. Stobajos przytacza następującą anegdotę:

Ktoś zaczął się uczyć u Euklidesa i kiedy poznał pierwsze twierdzenie, spytał:
– Co mi przyjdzie z tego, żem się tego nauczył?

Na to Euklides zawołał niewolnika i powiedział:

– Daj mu trzy obole, jeśli musi mieć zysk z tego, czego się uczy.

Omówimy bliżej główne linie rozumowania księgi I Elementów. Tekst poprzedzają 23 definicje, np. „Punkt jest tym, co nie ma żadnych części”, „Linia zaś jest długością bez szerokości”, „Równoległe są proste, które będąc na tej samej płaszczyźnie rozciągają się bez kresu w obie strony, ale w żadnej części się nie przetną” (przeł. M. Roszkowski). Linia prosta u Euklidesa jest zawsze skończona, tzn. jest odcinkiem wedle dzisiejszej terminologii. Dzisiejsi matematycy nie definiują wszystkich pojęć danej teorii, część z nich muszą bowiem stanowić pojęcia pierwotne, które przyjmuje się bez definicji, a ich sens ujawnia się dopiero, gdy badamy, w jaki sposób pojęcia występują one w aksjomatach i twierdzeniach.

Pięć postulatów głosi kolejno, że

1. Z każdego punktu do każdego innego można poprowadzić prostą (odcinek).
2. Odcinek można (obustronnie) przedłużać.
3. Z dowolnego środka można zakreślić okrąg przechodzący przez dany punkt.
4. Wszystkie kąty proste są wzajemnie równe.
5. Jeśli prosta przecina dwie inne proste, tworząca dwa kąty wewnętrzne mniejsze (w sumie) od dwóch kątów prostych, to można owe dwie proste przedłużyć tak, aby się przecięły.

Kąt prosty zdefiniowany jest tak, jak to widać na rysunku: gdy oba kąty utworzone przez półprostą o początku leżącym na danej prostej są równe, to kąty są kątami prostymi. Postulat 4 głosi, że dowolne kąty proste są równe, co znaczy tyle, że są przystające – mogą być na siebie nałożone tak, aby ich wierzchołki oraz ramiona się pokrywały (Euklides nie mówi tego wprost).

Pięć aksjomatów ogólnych stwierdza (w redakcji M. Kordosa):
1. Dwie wielkości równe trzeciej są równe.
2. Dodając do równych równe, dostajemy równe.
3. Odejmując od równych równe, dostajemy równe.
4. Wielkości dające się zamienić są równe.
5. Część jest mniejsza od całości.

Aksjomaty te stosowane są do porównania długości, kątów, figur, jak np. trójkąty. Mniejszy oznacza np. w przypadku odcinków, że po ich nałożeniu zostaje jeszcze jakaś niepokryta część większego (całości). Euklides nie posługuje się żadnymi miarami, porównuje tylko wielkości między sobą. Dlatego np. trójkąty są równe, gdy są przystające (można je na siebie nałożyć), ale także, gdy mają np. wspólną podstawę oraz jednakowe wysokości – dziś powiedzielibyśmy, że ich pola powierzchni są równe. Euklides nie myślał o długości jako liczbie, ani o polu prostokąta jako iloczynie długości boków, porównywał co najwyżej między sobą dwie wielkości.

Cały wykład podzielony jest na zagadnienia, które mogą być albo rozwiązaniem problemu konstrukcyjnego, albo twierdzeniem. W księdze I znajduje się 48 zagadnień, twierdzenie I,47 to twierdzenie dziś nazywane tw. Pitagorasa, I,48 to twierdzenie do niego odwrotne. Przyjrzyjmy się postępowaniu Euklidesa. Stosujemy dla przejrzystości nieco uwspółcześnioną terminologię, sformułowania nasze nie są wprawdzie dosłownym przekładem oryginału, ale też i nie odbiegają od niego zbyt daleko.

I,1 Mając dany odcinek AB, skonstruować na nim trójkąt równoboczny.

Konstrukcja sprowadza się do zakreślenia dwóch okręgów (Post. 3), które wyznaczą punkty przecięcia (co jednak nie wynika z aksjomatów Euklidesa, choć jest prawdą). Mając punkt przecięcia C, budujemy dwa odcinki AB oraz BC (Post. 1). Odcinki te są równe, ponieważ równe są odcinkowi AB (Aksj. 1). Trójkąt jest więc równoboczny. Warto zwrócić uwagę na eliminowanie kroków „oczywistych” i zastępowanie ich odwołaniami do postulatów i aksjomatów – w tym leży matematyczna siła Euklidesa, choć w oczach mniej matematycznie nastawionego czytelnika wywołuje to wrażenie (może nadmiernej) pedanterii.

I,2 Mając dany odcinek BC oraz punkt A nie leżący na nim, skonstruować odcinek AE=BC.

Łączymy w tym celu punkty AB (Post. 1) i budujemy trójkąt równoboczny za pomocą I,1. Promieniem BC zakreślamy okrąg o środku B (Post. 3). Przedłużamy następnie odcinek BD (Post. 2) do przecięcia z tym okręgiem H. Następnie promieniem HD zakreślamy okrąg o środku D. Przedłużenie AD (Post. 2) przetnie się z tym okręgiem w punkcie E. Odcinek AE (Post. 1) jest szukanym odcinkiem równym BC. Z aksjomatów ogólnych łatwo wnioskujemy, że odcinki te są równe, tzn. równe są ich długości (promień większego okręgu na rysunku to suma AB i boku trójkąta, odejmując potem bok trójkąta, otrzymujemy naszą tezę).
Warto zauważyć, że konstrukcje Euklidesa wykonywane są za pomocą linijki bez żadnej skali oraz cyrkla, który także nie pozwala przenosić odległości, lecz tylko poprwadzić okrąg z danego środka przez dany punkt (po przeniesieniu cyrkiel „nie pamięta” swego rozwarcia). Dzięki I,2 możemy uwolnić się od tego ograniczenia i odtwarzać odległość dwóch punktów w innym miejscu.

I,4 Dwa trójkąty, których dwa boki oraz zawarty między nimi kąt są równe, są przystające (równe).

Jest to cecha przystawania trójkątów bok-kąt-bok (bkb). Euklides dowodzi tego twierdzenia, nakładając na siebie oba trójkąty. Nie jest to postępowanie oczywiste, jeśli nie uważamy naszych figur za sztywne obiekty, które można przemieszczać bez zmiany kształtu i długości. David Hilbert przyjął w XIX w. to twierdzenie za jeden z aksjomatów w swoim wykładzie geometrii euklidesowej.

I,5 W trójkącie równoramiennym ABC, w którym AB=BC, kąty wewnętrzne przy podstawie są równe.

Przedłużamy ramiona trójkąta o jednakowe odcinki BF=CG. Trójkąty ABG i ACF są przystające na mocy poprzedniego twierdzenia, zatem także kąty ABG oraz ACF są równe. Trójkąty BFC i CGB są przystające na mocy tego samego twierdzenia (kąty BFC i BGC są równe, gdyż oba trójkąty pierwszej pary są przystające). Kąty ABC i BCA można przedstawić jako różnicę odpowiednio równych kątów (np. \sphericalangle ABC=\sphericalangle ABG-\sphericalangle CBG), muszą zatem być równe.
Twierdzenie to zyskało w średniowieczu nazwę Pons asinorum („ośli most”), nie wiadomo, czy z powodu kształtu towarzyszącego mu rysunku, czy też dlatego, że w tym miejscu ujawniał się już podział na tych, którzy rozumieją geometrię i na tych, którzy jej nie rozumieją. Pappus przedstawił prostszy dowód, w którym I,4 stosujemy do trójkątów BAC i CAB: ich boki są parami równe, a kąt przy wierzchołku jest tym samym kątem BAC, zatem oba trójkąty są przystające i kąty przy podstawie są równe. Euklides mógł mieć opory przeciwko takiemu potraktowaniu jednego trójkąta jako dwóch.

I,6 Jeśli kąty przy podstawie trójkąta są równe, to trójkąt jest równoramienny.

Euklides dowodzi tego twierdzenia przez sprowadzenie do niedorzeczności (reductio ad absurdum). Zakładamy, że teza twierdzenia jest fałszywa, a następnie staramy się wykazać, że wynika stąd zaprzeczenie założeń twierdzenia. Jeśli AB\neq AC, to któryś z odcinków jest większy, tzn. ma większą długość. Załóżmy, że AB>AC. Możemy wówczas na odcinku AB odłożyć odcinek AD=AC. Kąt DCB jest zatem mniejszy od kąta ACB. Jednocześnie trójkąt DBC jest równoboczny, a więc kąty DCB i DBC są równe na mocy poprzedniego twierdzenia. Kąt DBC jest tym samym, co kąt ABC, ergo ABC jest mniejszy od ACB wbrew założeniu.

I,9 Skonstruować dwusieczną danego kąta.

Na ramionach kąta odkładamy równe odcinki AD i AE. Następnie na odcinku AD konstruujemy trójkąt równoboczny. Jego trzeci wierzchołek wraz z wierzchołkiem kąta wyznaczają szukaną dwusieczną, co można łatwo udowodnić: kąty ADE i AED są równe jako kąty przy podstawie trójkąta równoramiennego. W takim razie także kąty ADF i AEF są równe i oba trójkąty ADF i AEF są przystające. Wobec tego kąty DAF i FAE są równe c.n.d.

I,11 Skonstruować prostopadłą do danej prostej w punkcie D.

Wyznaczamy na prostej dwa punkty A i B w równych odległościach od D: AD=DB. Następnie na odcinku AB konstruujemy trójkąt równoboczny. Jego trzeci wierzchołek C wraz z punktem D wyznaczają szukaną prostopadłą. Aby to udowodnić, zauważamy, że trójkąty ADC i BDC są przystające, a zatem kąty CDA i CDB są równe – spełniona jest więc definicja kąta prostego i oba te kąt są równe kątowi prostemu. Tym samym DC jest prostopadła do prostej AB.

I,20 (Nierówność trójkąta) Dwa boki trójkąta razem są dłuższe od trzeciego boku.

Niech będzie dany trójkąt CAB, chcemy dowieść, że odcinki AC wraz z CB są większe od AB. W tym celu na przedłużeniu AC odkładamy odcinek CD=CB. Kąt ABD jest większy od kąta CBD. Ten ostatni równy jest kątowi CDB, czyli ADB. W trójkącie ABD naprzeciwko większego kąta leży większy bok (I, 19; nie przytaczamy dowodu), a zatem AD=AC+CB>AB (stosując współczesny zapis).
Z twierdzenia tego wynika, że długość łamanej łączącej dwa punkty jest zawsze większa niż długość odcinka łączącego te punkty. W konsekwencji, jeśli połączymy oba punkty jakąś krzywą gładką, ale taką że zarówno samą krzywą, jak i jej długość można dowolnie przybliżać za pomocą łamanych, to długość łuku krzywej nie może być mniejsza niż długość odcinka łączącego dane punkty. Inaczej mówiąc, odcinek jest krzywą o najmniejszej długości (przy ustalonych obu końcach). Euklides nie dowodzi takiego twierdzenia, ale było ono znane greckim geometrom.
Dopiero blisko połowy księgi I staje się potrzebny Postulat 5.

I,29 Jeśli prosta EF przecina parę prostych równoległych AB i CD, to kąty naprzemianległe wewnętrzne są równe.

Wykażemy, że kąt AGF równy jest kątowi EHD. Załóżmy, że oba te kąty nie są równe. Niech np. AGF będzie większy od EHD. Ponieważ kąty AGF i BGF dopełniają się do dwóch kątów prostych (I,14; nie przytaczamy dowodu), więc suma kątów BGF i EHD jest mniejsza od dwóch kątów prostych. Z Post. 5 wynika, że proste AB i CD (po ewentualnym przedłużeniu) przetną się, nie są zatem – wbrew założeniu – prostymi równoległymi.
Postulat 5 sformułowany został tak, aby wygodnie się nim było posługiwać do wykazania, że dwie proste nie są równoległe. Nie wydawał się on tak oczywisty jak pozostałe i wzbudzał zawsze rozmaite wątpliwości. Jest on równoważny innemu postulatowi sformułowanemu przez Playfaira: Przez punkt nie leżący na danej prostej można przeprowadzić dokładnie jedną prostą równoległą do danej. Postulat 5 jest także równoważny twierdzeniu o sumie kątów wewnętrznych trójkąta.

I,32 Suma kątów wewnętrznych trójkąta równa jest dwóm kątom prostym.

Wystarczy zauważyć równość zaznaczonych kątów na rysunku (linia przerywana jest równoległa do boku trójkąta).

I,47 (Tw. Pitagorasa) W trójkącie prostokątnym suma kwadratów zbudowanych na przyprostokątnych jest równa kwadratowi zbudowanemu na przeciwprostokątnej.

Zwróćmy uwagę na sformułowanie: należy najpierw skonstruować kwadraty, o których mowa w twierdzeniu, a następnie wykazać, że suma (pól) dwóch mniejszych kwadratów jest równa polu kwadratu największego. Wysokość trójkąta opuszczona z kąta prostego po przedłużeniu dzieli kwadrat na dwa prostokąty. Euklides wykazuje, że dla trójkąta ABΓ oba pola zaznaczone na zielono oraz oba pola zaznaczone na niebiesko są równe.

Dowód Euklidesa korzysta z konstrukcji I,46 kwadratu na danym odcinku oraz linii równoległej do BΔ i ΓE przechodzącej przez dany punkt A (I,31). Wykazuje następnie, że AH jest przedłużeniem AΓ oraz AΘ jest przedłużeniem AB (I,14). Trójkąty ABΔ oraz ZBΓ są przystające na mocy twierdzenia I,4 (bkb). Prostokąt BΛ o podstawie BΔ ma tę samą wysokość co trójkąt ABΔ o tej samej podstawie. Na mocy I,41 prostokąt jest dwa razy większy od trójkąta (to wynik równoważny wzorowi na pole trójkąta, gdy określimy pole prostokąta). Kwadrat BH jest z tego samego powodu dwa razy większy od trójkąta ZBΓ o podstawie ZB. W analogiczny sposób pokazać można, że oba pola zaznaczone na niebiesko są równe, co kończy dowód.

W księdze VI Euklides przytacza inny dowód tw. Pitagorasa, oparty na podobieństwie mniejszych trójkątów na rysunku i trójkąta wyjściowego. Ten drugi dowód znany był prawdopodobnie wcześniej, dowód I,47, pochodzący zapewne od samego Euklidesa, jest bardziej zadowalający matematycznie, gdyż używa mniejszej liczby założeń: w księdze I daleko jeszcze jesteśmy od tak subtelnych konstrukcji jak figury podobne.
Ostatnie twierdzenie tej księgi I,48 jest odwrotne do tw. Pitagorasa: Jeśli spełniony jest warunek pól dla kwadratów zbudowanych na bokach trójkąta, to trójkąt ów jest prostokątny.

Elementy są podręcznikiem i były nim już w chwili powstania. Ścisłość rozumowań Euklidesa stała się wzorem dla przyszłych matematyków. Wybitny matematyk XX wieku André Weil pisał: „ [Elementy] Euklidesa to pierwszy zachowany tekst matematyczny, w którym pojęcie dowodu utożsamione zostało z łańcuchem wnioskowań pozbawionym luk; nie bez powodu ten sposób widzenia przedmiotu zachował swą aktualność do dziś”.

Nie sposób oczywiście przedstawić nawet pobieżnie wpływu książki czytanej w ciągu dwudziestu kilku wieków przez tysiące ludzi: wybitnych matematyków, jak i myślicieli czy po prostu uważnych czytelników mniej lub bardziej oddalonych od nauk ścisłych.

Greckie manuskrypty Elementów przechowywane były w Bizancjum. Od nich pochodziły przekłady arabskie, które z kolei dały początek rozpowszechnianiu się tekstu zarówno na Wschód (języki hebrajski, syryjski, perski), jak i na Zachód (łacina). W europejskim średniowieczu przekładano Euklidesa z arabskiego na łacinę wielokrotnie w wieku dwunastym i później. Już sama międzynarodowa lista tłumaczy daje pojęcie o zainteresowaniu Elementami: Adelard z Bath, Hermann z Karyntii, Gerard z Cremony, Robert z Chester, Campanus z Novary. Przekład tego ostatniego stał się podstawą pierwszego drukowanego wydania Elementów w Wenecji w roku 1482. W XVI wieku udało się też dotrzeć do tekstu greckiego (w wersji Teona). Od tamtej pory ukazały się niezliczone wydania oraz przekłady na języki narodowe (brak nadal kompletnego przekładu polskiego, choć już w 1808 Józef Czech, dyrektor Liceum Krzemienieckiego, przełożył osiem ksiąg, opierając się na angielskiej wersji Roberta Simonsa).

Twierdzenie Pitagorasa w weneckim wydaniu z 1482 r. (numeracja twierdzenia lekko w nim szwankowała)

Geometria oraz arytmetyka miały w średniowieczu mocną pozycję jako sztuki wyzwolone wchodzące w skład quadrivium („czterodroże”) wraz z astronomią i muzyką (która obejmowała głównie teoretyczną naukę o proporcjach dźwięków w różnych skalach). Także i później podstawy geometrii stanowiły nieodzowny element wykształcenia, Elementów długo jeszcze używano jako podręcznika. Bertrand Russell, logik i filozof, wspomina: „W wieku jedenastu lat zacząłem Euklidesa z moim bratem w roli tutora. Było to w moim życiu wielkie wydarzenie, równie olśniewające co pierwsza miłość. Wcześniej nie wyobrażałem sobie nawet, że istnieje na świecie coś tak zachwycającego. Kiedy przeszedłem Zagadnienie 5 (Pons asinorum), brat powiedział mi, że powszechnie uchodzi ono za trudne, ja jednak nie napotkałem w nim żadnych trudności. To wtedy po raz pierwszy zaświtało w mej głowie, że może obdarzony zostałem jakąś inteligencją”. Kilka lat młodszy Albert Einstein nie uczył się wprawdzie z Elementów, lecz z podręcznika będącego ich zmodernizowaną wersją; także dla niego odkrycie geometrii było wielkim przeżyciem, wspominał potem podręcznik jako „świętą książeczkę”, co w jego ustach – uduchowionego niedowiarka i spinozisty – miało swoją wymowę. Einstein sądził wręcz, że głęboki wstrząs intelektualny, jaki wówczas przeżył, stanowi niejako rodzaj probierza, czy ktoś się do nauki nadaje, czy nie. Zanim jeszcze podręcznik trafił w jego ręce, udało mu się znaleźć dowód twierdzenia Pitagorasa oparty na podobieństwie trójkątów (VI,31).

Metoda geometryczna kusiła też filozofów. Thomas Hobbes, mając już czterdzieści lat, natknął się w bibliotece znajomego gentlemana na egzemplarz Elementów, które otwarte były na stronie zawierającej twierdzenie Pitagorasa. Przeczytawszy jego treść, wykrzyknął: na Boga, to niemożliwe! Potem jednak cofając się stopniowo do twierdzeń, na których oparty był dowód, zrozumiał, że rozumowanie Euklidesa jest bez zarzutu. René Descartes sam był wybitnym matematykiem i z geometrią zapoznał się wcześnie w jezuickim kolegium w La Flèche. Właśnie na goemetrii wzorował się w swym podejściu do filozofii, która miała być nowym początkiem ludzkiej wiedzy. „Owe długie łańcuchy uzasadnień, zupełnie proste i łatwe, którymi zazwyczaj posługują się geometrzy, by dotrzeć do swych najtrudniejszych dowodzeń, dały mi sposobność do wyobrażenia sobie, że wszystkie rzeczy dostępne poznaniu ludzkiemu wynikają w taki sam sposób wzajemnie ze siebie, a także, że nie mogą istnieć tak odległe, do których byśmy wreszcie nie dotarli, i tak ukryte, których byśmy nie wykryli, bylebyśmy tylko nie przyjmowali za prawdziwą żadnej rzeczy, która by prawdziwą nie była, i zachowywali zawsze należyty porządek w wyprowadzaniu jednych z drugich” (przeł. W. Wojciechowska, Rozprawa o metodzie, PWN 1981, s. 23). Zdaniem Immanuela Kanta przedmioty, które bada matematyka: przestrzeń i czas nie pochodzą z doświadczenia, ale mają swe źródło w poznającym przedmiocie. Geometria stała się w ten sposób nauką o jedynie możliwej przestrzeni.

Tymczasem matematycy nabierali coraz więcej wątpliwości. Karl Friedrich Gauss już w roku 1813 rozmyślał nad geometrią nieuklidesową, lecz oportunistycznie nie zdecydował się na publikację swych wyników. Także Ferdinand Karl Schweikart, profesor prawa, rozwijał podobne idee w zaciszu gabinetu. Dopiero János Bolyai i Nikołaj Iwanowicz Łobaczewski, niezależnie od siebie zaryzykowali publikację prac sprzecznych z dotychczasową tradycją, nie były one przyjęte dobrze. Obaj zajmowali się geometrią hiperboliczną, w której istnieje nieskończenie wiele prostych równoległych do danej prostej. Postulat 5 Euklidesa jest bowiem niezależny od pozostałych i równie dobrze można zbudować konsekwentną geometrię, wychodząc z jego zaprzeczenia. Pod koniec XIX wieku David Hilbert podał ścisłe sformułowanie geometrii euklidesowej. Znalazło się w nim dwadzieścia aksjomatów, trzy pojęcia pierwotne (punkt, linia prosta, płaszczyzna) oraz cztery relacje pierwotne (leżenia pomiedzy, zawierania oraz przystawania odcinków oraz kątów). Różnica w podejściu między dawną geometrią a jej nowoczesnym, abstrakcyjnym sformułowaniem podkreślona została przez Hilberta następująco: „Powinno się w każdej chwili móc wstawić w miejsce punktów, linii i płaszczyzn – stoły, krzesła i kufle do piwa” (oczywiście pod warunkiem, że obiekty te spełniają aksjomaty geometrii).

Dlaczego grawitacja wiąże się z krzywizną czasoprzestrzeni?

  • Przeniesienie równoległe

Wyobraźmy sobie najpierw powierzchnię zanurzoną w przestrzeni euklidesowej. Załóżmy, że określiliśmy na niej pewne współrzędne x=(x^1, \ldots, x^n) . Położenie punktu powierzchni możemy więc zapisać jako \vec{r}=\vec{r}(x^i) . Pochodne tego wektora po współrzędnych, utworzą zbiór wektorów stycznych do naszej powierzchni:

\vec{e}_j=\dfrac{\partial \vec{r}}{\partial x^j}.

Dowolny wektor styczny do powierzchni w danym punkcie można przedstawić jako kombinację liniową \vec{e}_j:

\vec{v}=v^j \vec{e}_j,

gdzie sumujemy po powtarzającej się parze wskaźników: górnym i dolnym. Jest to tzw. konwencja Einsteina, uczony mówił żartobliwie, że stanowi ona jego największe odkrycie matematyczne. W geometrii ważną rolę odgrywa równoległość: wiemy, co znaczy, że dwa wektory w przestrzeni euklidesowej są równoległe. Można koncepcję równoległości przenieść na nieskończenie bliskie wektory na zakrzywionej powierzchni. W przestrzeni euklidesowej nasz wektor \vec{v} ma pozostać stały, co oznacza, że

\delta\vec{v}=0=\delta v^j \vec{e}_j+v_j \delta \vec{e}_j.

W drugim wyrazie uwzględniliśmy, że nasza baza względem przestrzeni euklidesowej może się obracać. Zmiana każdego z wektorów bazy powinna być równa:

\delta\vec{e}_j=\dfrac{\partial \vec{r}}{\partial x^j \partial x^i }\delta x^i\stackrel{.}{=}{\Gamma}^k_{ij}\delta x^i \vec{e}_k.

Ostatnia równość \stackrel{.}{=} to w istocie rzut wektora z lewej strony na płaszczyznę styczną, pomijamy więc tę część wektora, która „wystaje” z powierzchni. Podstawiając to do warunku równoległości, otrzymujemy

\delta v^k=-\Gamma_{ij}^k v^i \delta x^j. \mbox{ (*)}

Oznacza to, że współrzędne wektora równoległego nieco się zmienią i zmianę tę opisują współczynniki \Gamma , zwane uczenie koneksją afiniczną. Znając funkcje koneksji, możemy dokonać przesunięcia równoległego wektora. Jeśli rozpatrzymy pewną krzywą x^j=x^j(\tau) (gdzie \tau jest czasem własnym), pochodne współrzędnych utworzą wektor prędkości styczny do toru:

v^k=\dfrac{d x^k}{d\tau}.

Najprostszym fizycznie ruchem będzie przesunięcie równoległe tego wektora wzdłuż krzywej (linii świata):

\delta \left(\dfrac{d x^k}{d\tau}\right)=-\Gamma_{ij}^k v^i \delta x^k,

skąd otrzymujemy równanie geodezyjnej:

\dfrac{{d\,}^2 x^k}{d\tau^2}+\Gamma_{ij}^k \,\dfrac{d x^i}{d\tau}\,\dfrac{d x^j}{d\tau}=0. \mbox{ (**)}

Jest to warunek na przeniesienie równoległe wektora prędkości wzdłuż krzywej, a więc coś najbliższego ruchowi jednostajnemu i prostoliniowemu z I zasady dynamiki.

Możemy teraz zapomnieć o przestrzeni euklidesowej i rozpatrywać przestrzeń, w której określone są współczynniki koneksji. Mamy wówczas krzywe geodezyjne – coś najbardziej zbliżonego do linii prostej. W teorii względności krzywe geodezyjne opisują ruch cząstki pod działaniem pola grawitacyjnego. Jak widać współczynniki koneksji komplikują równania ruchu i można je uważać za składowe pola grawitacyjnego, czy dokładniej grawitacyjno–bezwładnościowego. Kiedy współczynniki koneksji znikają, wracamy do ruchu prostoliniowego i szczególnej teorii względności (tzn. nie ma pola grawitacyjnego).

Równania geodezyjnej mogą więc nieść informację o polu grawitacyjnym. Zgodnie z zasadą równoważności nic tu nie zależy od masy poruszającej się cząstki. Okazuje się, że można za pomocą koneksji opisać grawitację także w mechanice klasycznej (zrobił to É. Cartan, już znając teorię Einsteina). Automatycznie opisujemy też siły bezwładności. Z punktu widzenia fizyka wcale nie jest dziwne, że w równaniu geodezyjnej mamy aż dwie prędkości: powinniśmy bowiem w tym formalizmie otrzymać zarówno siły Coriolisa liniowe w prędkości, jak i siły odśrodkowe, kwadratowe w prędkości. Z punktu widzenia zasady równoważności nie możemy lokalnie rozstrzygnąć, czy w naszym przypadku mamy do czynienia z polem grawitacyjnym, czy siłami bezwładności.

  • Krzywizna

Koneksja pozwala nam przenosić wektory równolegle wzdłuż krzywej. Wynik takiego przesuniecia może więc zależeć od kształtu krzywej. Aby zobaczyć, jak to działa, rozpatrzmy przesunięcie równoległe wektora v^i po infinitezymalnym zamkniętym równoległoboku geodezyjnych: po drodze x, x+\delta a, x+\delta a+\delta b, x+\delta b, x. Łączna zmiana wektora dana jest wyrażeniem:

\delta v^i=-\Gamma_{kj}^i(x) v^k(x) \delta a^j-\Gamma_{kj}^i(x+\delta a) v^k(x+\delta a) \delta b^j\\ \\ +\Gamma_{kj}^i(x+\delta b) v^k(x+\delta b) \delta a^j+\Gamma_{kj}^i(x) v^k(x) \delta b^j.

Można to wszystko zapisać w postaci:

\delta v^i=R^i_{kjl} v^k \delta b^j \delta a^l, \mbox{(***)}

gdzie R^i_{kjl} nazywa się tensorem krzywizny Riemanna i wyraża wzorem:

R^i_{kjl}=\Gamma^i_{lk,j}-\Gamma^i_{jk,l}+\Gamma^i_{jm}\Gamma^m_{kl}-\Gamma^i_{lm}\Gamma^m_{kl}.

W ostatnim wyrażeniu przecinki przed indeksem oznaczają różniczkowanie po odpowiedniej współrzędnej: A_{,i}\equiv\frac{\partial}{\partial x^i}. Przestrzeń jest zakrzywiona wtedy i tylko wtedy, gdy tensor krzywizny jest różny od zera. (Wektory i tensory transformują się w odpowiedni sposób przy zmianie układu współrzędnych, tak że znikanie w jednym układzie oznacza znikanie we wszystkich.) Koneksja jest zatem nietrywialna, gdy tensor krzywizny znika. Równanie (***) można zilustrować poglądowo: zmiana wektora proporcjonalna jest tu do pola powierzchni równoległoboku. Ponieważ każdą powierzchnię możemy rozbić na takie równoległoboki, więc łączna zmiana wektora w przesunięciu równoległym po zamkniętej pętli powinna być związana z krzywizną oraz polem powierzchni pętli. W przypadku sfery krzywizna jest stała i kąt obrotu wektora jest proporcjonalny do pola powierzchni pętli. W teorii względności pojawienie się krzywizny oznacza, że mamy nietrywialne pole grawitacyjne.

Tensor krzywizny ma wiele symetrii, które sprawiają, że ma nieco mniej niezależnych składowych, niż to wygląda na pierwszy rzut oka. W przypadku dwuwymiarowej powierzchni ma tylko jedną składową, w czterowymiarowej – dwadzieścia.

Klasycznym zastosowaniem przeniesienia równoległego jest wahadło Foucaulta.

  • Równanie dewiacji geodezyjnej

Brzmi to okropnie, nieco bardziej logiczne jest określenie: dewiacja linii geodezyjnych. Chodzi o to, co dzieje się wzdłuż pobliskich linii geodezyjnych. Możemy sobie wyobrazić dwie cząstki pyłu, które znajdują się nieskończenie blisko siebie w chwili początkowej. Obserwujemy, jak bedzie się zachowywać z czasem ich odległość mierzona różnicami współrzędnych. Zakladamy, że rozsądnie zaczynamy liczyć czas, tak żeby ułatwić porównanie dwóch ruchów.

Równanie dewiacji ma następującą postać:

\dfrac{D^2 \eta^i}{D\tau^2}=R^i_{jkl}\,\dfrac{dx^j}{d\tau}\,\dfrac{dx^k}{d\tau}\,\eta^l.

Różniczkowanie po lewej stronie oznacza pochodną po czasie własnym obliczoną jednak z uwzględnieniem przeniesienia równoległego. Nie możemy bowiem porównywać w przestrzeni zakrzywionej wektorów w dwóch różnych punktach przestrzeni, najpierw należy przenieść jeden z nich do punktu zaczepienia drugiego. Różnicę wektora wzdłuż krzywej wynikającą z jego zmiany: \frac{d\eta^i}{d\tau}d\tau należy poprawić, odejmując zmianę wynikającą z przesunięcia (*), łącznie otrzymamy

\dfrac{D\eta^i}{D\tau}=\dfrac{d\eta^i}{d\tau}+\Gamma^i_{jk}\,\dfrac{dx^j}{d\tau}\,\eta^k.

Jest to tzw. pochodna absolutna wzdłuż krzywej. Używając tego zapisu, możemy równanie geodezyjnej (**) zapisać w postaci

\dfrac{D}{D\tau}\dfrac{dx^i}{d\tau}=0.

Pochodna absolutna znika, gdy współrzędne wektora zmieniają się jedynie za sprawą przesunięcia równoległego, czyli w sensie fizycznym można powiedzieć, że się nasz wektor nie zmienia – przenosi się jedynie równolegle wzdłuż krzywej.

  • Równania pola Einsteina

Warto zauważyć, że do tej pory nie mówiliśmy nic o metryce naszej przestrzeni. W szczególnej teorii względności mamy naturalną miarę odległości dwóch zdarzeń w czasoprzestrzeni:

ds^2=dt^2-dx^2-dy^2-dz^2.

(Przyjmujemy c=1.) W zakrzywionej czasoprzestrzeni ogólnej teorii względności możemy zawsze wprowadzić taki układ współrzędnych, w którym interwał ds^2 przyjmie powyższą postać w danym punkcie. Nie można natomiast zwykle zrobić tego globalnie. Interwał czasoprzestrzenny ogólnie biorąc określa tensor metryczny g_{\mu\nu}. Podaje on przepis na obliczenie interwału za pomocą danych współrzędnych (gdy zmienimy współrzędne, postać metryki też się odpowiednio zmieni):

ds^2=g_{\mu\nu}dx^{\mu}dx^{\nu}.

Tutaj wskaźniki \mu,\nu=0,1,2,3. Mamy tu 10 niezależnych wartości (symetryczna macierz 4×4). Z matematycznego punktu widzenia koneksja i metryka to dwie różne struktury. Można je uzgodnić i tak jest w ogólnej teorii względności. Koneksja oraz tensor krzywizny wyrażają się przez metrykę. Lokalnie, w danym punkcie, nie tylko metryka może przybrać wartości znane ze szczególnej teorii względności, ale także współczynniki koneksji mogą znikać. Nie ma natomiast takiej transformacji współrzędnych, która sprowadza tensor Riemanna do zera, jeśli był niezerowy w innym układzie współrzędnych. Tensor Riemanna zawiera pierwsze i drugie pochodne metryki. Geodezyjne możemy też zdefiniować jako krzywe najkrótszej/najdłuższej długości, i są to wówczas te same geodezyjne co zdefiniowane wyżej.

Z fizycznego punktu widzenia metryka przypomina potencjał, a współczynniki koneksji – siły. Jaką postać moze mieć równanie pola w teorii Einsteina? Źródłem pola grawitacyjnego są masy, a u Einsteina także pędy i energie. Dla zbioru cząstek opisu dostarcza symetryczny tensor energii pędu: T_{\mu\nu}. Potrzebujemy więc jakiegoś tensora krzywizny o dwóch wskaźnikach. Taką wielkością jest tensor Ricciego zdefiniowany jako

R_{\mu\nu}=R^{\lambda}_{\mu\lambda\nu},

(sumowanie po wskaźnku \lambda). Można więc oczekiwać równania typu

R_{\mu\nu}=\kappa T_{\mu\nu}.

I jest to prawie dobre równanie, należy tylko zmodyfikować w nim lekko lewą stronę. Rzecz w tym, że tensor energii pędu powinien być zachowany, a lewa strona, tensor Ricciego nie spełnia tego warunku. Należy zastąpić go więc tensorem Einsteina:

G_{\mu\nu}=R_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R=\kappa T_{\mu\nu},

gdzie R to skalar Ricciego: R=g^{\mu\nu}R_{\mu\nu} (g^{\mu\nu} jest macierzą odwrotną do g_{\mu\nu}. Jest to subtelność techniczna, na którą natrafił Einstein w listopadzie 1915 roku: 11 listopada proponuje pierwszą wersję, a 25 listopada tę niższą, już prawidłową. Ostatnie równanie można też przepisać w równoważnej postaci:

R_{\mu\nu}=\kappa (T_{\mu\nu}-\frac{1}{2}g_{\mu\nu}T^{\lambda}_{\lambda}).

W dalszym ciągu przyda nam się składowa 00 tego równania, w najprostszej sytuacji spoczywającej materii tylko składowa 00 tensora energii pędu jest różna od zera i równa jest gęstości materii \varrho. Otrzymamy wówczas

R_{00}=\kappa (T_{00}-\frac{1}{2}T_{00})=\frac{1}{2}\kappa T_{00}=\frac{1}{2}\kappa \varrho.

Aby znaleźć stałą \kappa, należy skorzystać z równań dla grawitacji Newtonowskiej, która powinna być przypadkiem granicznym.

W tym celu wyobraźmy sobie równanie dewiacji zastosowane do dwóch swobodnie spadających cząstek. Zakładamy, że w chwili początkowej \tau=0 obie spoczywają względem siebie. Wybieramy układ współrzędnych związany z cząstką centralną (względem której obliczana jest dewiacja). W takim układzie odniesienia czas własny i czas t są tym samym. Dla wskaźników przestrzennych i=1,2,3 równanie dewiacji sprowadza się do

\dfrac{d^2\eta^i}{dt^2}=R^{i}_{00l}\eta^l=-R^i_{0l0}\eta^l.

Skorzystaliśmy z faktu, że nasza cząstka centralna spoczywa: \frac{dx^\mu}{dt}=(1,0,0,0). W drugiej równości zmieniliśmy znak wraz z przestawieniem pary ostatnich wskaźników w tensorze Riemanna. Wynik ten obowiązuje dla trzech przyspieszeń wzdłuż trzech osi kartezjańskich. Załóżmy, że mamy kulę pyłu o promieniu r, początkowo nieruchomą, której środek obraliśmy za początek wektora \eta. Objętość kuli to

V=\dfrac{4\pi}{3}r_x r_y r_z,

gdzie zaznaczyliśmy, że wzdłuż trzech osi kartezjańskich promienie mogą się zmieniać niezależnie (przekształcając kulę w elipsoidę). Obliczając drugą pochodną objętości w chwili t=0 (pamiętamy, że pierwsze pochodne znikają), otrzymujemy:

\dfrac{\ddot{V}}{V}=\dfrac{\ddot{r}_x}{r_x}+\dfrac{\ddot{r}_y}{r_y}+\dfrac{\ddot{r}_z}{r_z}=-R_{00}.

W ostatniej równości, skorzystaliśmy z faktu, że R^0_{000}=0 – można więc sumowanie po wskaźnikach przestrzennych rozszerzyć o wskaźnik czasowy. Możemy tę samą wielkość obliczyć z Newtonowskiego prawa ciążenia. Przyspieszenie grawitacyjne na powierzchni kuli pyłu o masie M równe jest

g=\dfrac{GM}{r^2},

Wobec tego druga pochodna objętości spełnia równanie

\dfrac{\ddot{V}}{V}=-3\dfrac{g}{r}=-4\pi G \varrho.

gdzie \varrho to gęstość naszej kuli (&). Zatem szukana stała równa jest \kappa=8\pi G. Równanie Einsteina powinno mieć zatem postać.

G_{\mu\nu}=8\pi G T_{\mu\nu}.

Podsumowując, w roku 1915 Albert Einstein (podobnie zresztą jak najlepsi ówcześni matematycy) nie rozumiał dokładnie roli tensora Ricciego i nie widział, że równania pola są praktycznie wyznaczone przez kilka dość prostych warunków matematycznych. Oczywiście, nie są to jedyne możliwe matematycznie równania, ale jak pokazują przykłady późniejszych teorii grawitacji (a było ich przez sto lat sporo), równania Einsteina są najprostsze i jak dotąd potwierdzane są przez obserwacje. Kiedy później uczony zrozumiał, że w gruncie rzeczy można by dojść do teorii grawitacji drogą matematyczną, zaczął wyżej cenić osiągnięcia czystej matematyki. Stało się to poniekąd źródłem jego późniejszych niepowodzeń przy konstrukcji jednolitej teorii pola: z braku danych fizycznych szukał bowiem drogi matematycznej. Skonczyło się na dość jałowych próbach, które nie wzbogaciły zbytnio ani matematyki, ani fizyki.

(&) Nie jest to całkiem ścisłe rozumowanie, ponieważ milcząco założyliśmy, że nie ma innej materii niż kula pyłowa. Naprawdę należałoby obliczyć strumień pola grawitacyjnego przez powierzchnię kuli (on już zależy wyłącznie od tego, co znajduje się wewnątrz kuli), a potem skorzystać z tw. Gaussa-Ostrogradskiego i obliczyć dywergencję pola grawitacyjnego w punkcie centralnym. Tę wartość można porównać z tym, co wynika z równania dewiacji geodezyjnej. Oczywiście wynik jest taki sam.

Nie rozwijałem tu kwestii, czym są tensory. W największym skrócie są to obiekty niezależne od wyboru współrzędnych, podobnie jak trójwymiarowe wektory (które są szczególnym jednowskaźnikowym typem tensora). W teorii Einsteina dopuszczamy praktycznie wszelkie gładkie transformacje współrzędnych (ogólna kowariantność). Równania prawidłowo zapisane w ten sosób automatycznie słuszne będą w każdym układzie współrzędnych. Einstein wrócił do tensorów już w trakcie swej „rewolucji listopadowej” – kiedy co tydzień publikował nową pracę na temat teorii grawitacji, przy okazji modyfikując albo zmieniając poprzednie. Ten dziwny tryb publikowania wiązał się z tym, że w Getyndze David Hilbert, jeden z czołowych matematyków świata, także pracował nad podobną teorią. Einsteinowi groziło, że po siedmiu latach pracy zostanie prześcignięty, by tak rzec na ostatnich metrach przed finiszem. Nigdy później (ani wcześniej) nie publikował tak gorączkowo. Starał się też zazwyczaj wykazywać bardziej olimpijski spokój, co oczywiście było znacznie łatwiejsze, kiedy się było autorem epokowej teorii.

Gdyby ktoś chciał szczegółowo przejść obliczenia tensora krzywizny i równania dewiacji, może znaleźć je np. tutaj, na stronie Alana Heavensa s. 22-24.

Interpretacja tensora Ricciego za pomocą objętości kul opisana jest np. w pracy Johna C. Baeza i Emory’ego F. Bunna.