Oscylator kwantowy: Paul Dirac i inni (1929-1930)

Mechanika kwantowa wprowadziła rewolucyjnie nowe pojęcie stanu układu fizycznego. Klasycznie stan układu znamy, gdy dane są jego położenie i pęd w pewnej chwili. Na tej podstawie możemy obliczyć przyszłe położenia i pędy (albo i przeszłe – mechanika jest symetryczna wobec zmiany strzałki czasu). Np. znając dziesiejsze położenie i pęd planety, możemy obliczyć, gdzie znajdzie się ona za sto lat albo gdzie była, powiedzmy, w czasach Keplera. Stan układu to punkt w przestrzeni polożeń q i pędów p. Ewolucja w czasie to ruch tego punktu w owej przestrzeni fazowej.

Mechanika kwantowa zastępuje klasyczną na poziomie mikroświata. Zupełnie jednak zmienia się pojęcie stanu układu. Stanem jest teraz nie punkt, lecz wektor, a właściwie cały promień, to znaczy wektor pomnożony przez dowoloną liczbę. Przestrzeń stanów (wektorów) umożliwia dodawanie dwóch stanów. Operacja taka nie miałaby sensu w mechanice klasycznej: bo niby jak mamy dodać do siebie położenie Marsa i położenie Jowisza? Co taka suma miałaby oznaczać? W mechanice kwantowej obowiązuje zasada superpozycji, czyli dodawania stanów.

Wikipedia: Double-slit experiment

Kiedy np. przepuszczamy elektron przez przesłonę z dwiema szczelinami, jego stan kwantowy będzie sumą stanu elektronu, który przeszedł przez szczelinę nr 1 oraz stanu elektronu, który przeszedł przez szczelinę nr 2. Stosując zapis wprowadzony przez Paula Diraca w 1939 roku, możemy to zapisać jako

|\varphi\rangle=| \varphi_1\rangle+| \varphi_2\rangle.

Fizycznie znaczy to, że nasz elektron trochę przeszedł przez szczelinę nr 1, a trochę przez szczelinę nr 2. Jego stan jest superpozycją dwóch stanów. Gdybyśmy chcieli wyznaczyć prawdopodobieństwo, że w jakimś punkcie ekranu x zarejestrujemy nasz elektron, należałoby obliczyć iloczyn skalarny z wektorem przedstawiającym elektron w x:

\langle x | \varphi \rangle=\langle x| \varphi_1\rangle+ \langle x| \varphi_2\rangle.

Zapis Diraca wziął się z rozłożenia nawiasu kątowego na dwie części: nazywa się je wektorem bra i ket (od angielskiego: bracket). Z pomnożenia skalarnego dwóch wektorów otrzymujemy liczbę (prędzej czy później będziemy potrzebowali liczb, jeśli teoria ma coś przewidywać ilościowo). Powyższy zapis Diraca można też zastąpić bardziej konwencjonalnym sumowaniem funkcji:

\varphi(x)=\varphi_1(x)+\varphi_2(x).

Wartość funkcji falowej w danym punkcie x można traktować jako składową wektora \varphi. Zapis Diraca \langle a|b\rangle pozwala nam patrzeć na funkcję jako iloczyn skalarny dwóch wektorów, jeszcze wygodniej jest często operować samymi wektorami stanu: nie precyzujemy wówczas, co chcielibyśmy mierzyć (może np. zamiast położenia, wolelibyśmy pędy – pierwsza forma zapisu  tego nie przesądza.

Mamy zatem abstrakcyjne wektory stanu i iloczyn skalarny. Wartości tego iloczynu skalarnego są na ogół zespolone, inaczej mówiąc, funkcje falowe są zespolone (*). Nie mogą one mieć bezpośredniego sensu fizycznego. Sens taki mają natomiast kwadraty ich modułów: |\varphi(x)|^2 daje nam prawdopodobieństwo zarejestrowania elektronu w punkcie x (dokładniej: gęstość prawdopodobieństwa, bo współrzędna przyjmuje dowolne wartości rzeczywiste). Tam gdzie prawdopodobieństwo jest duże, elektrony będą częściej trafiały, gdy zbierze się dostateczna statystyka, będziemy mogli zaobserwować, że „trafienia” układają się w prążki interferencyjne. Wynik jest taki, jakby dwie fale nakładały się na siebie.

Obrazki powyżej pochodzą z rzeczywistego doświadczenia Akira Tonomury, Proc. Natl. Acad. Sci. U.S.A. 102 (2005) 14952-14959. Liczba elektronów wzrasta od 10 do 140 000, widzimy, jak uwidaczniają się prążki interferencyjne. W doświadczeniu tym elektrony przepuszczane były pojedynczo, wiemy więc, że każdy elektron interferuje niejako sam z sobą, nie jest to skutek jakichś oddziaływań między nimi. Ze względów technicznych doświadczenie to przeprowadzone było stosunkowo niedawno, ale że wynik musi być właśnie taki, zdawali sobie sprawę już pierwsi badacze mechaniki kwantowej: Heisenberg, Born, Jordan, Dirac. W 1927 r. Lester Germer i Clinton Davisson oraz niezależnie George Paget Thomson zaobserwowali dyfrakcję elektronów, za co otrzymali Nagrodę Nobla (G.P. Thomson był synem J.J. Thomsona, który odkrył elektron, mówiono, że ojciec dostał Nagrodę Nobla za odkrycie, iż elektron jest cząstką, a syn – za odkrycie, że elektron jest falą). Oczywiście, elektron (podobnie jak np. foton) jest cząstką, do opisu której musimy stosować mechanikę kwantową.

Tak więc choć dodawanie stanów wydaje się abstrakcyjne, to w istocie jest obserwowane w eksperymentach. Skoro stany są wektorami i można je dodawać oraz mnożyć przez liczbę, to naturalnym rodzajem przekształceń takiej przestrzeni są operatory liniowe, czyli odwzorowania przypisujące każdemu wektorowi |\varphi \rangle jakiś inny wektor: A |\varphi \rangle, przy czym

A(\lambda_1 | \varphi_1\rangle+\lambda_2 |\varphi_2\rangle)=\lambda_1 A |\varphi_1\rangle+\lambda_2 A |\varphi_2\rangle,

gdzie \lambda_1,\lambda_2 są dowolnymi liczbami. Operatory takie w mechanice kwantowej zastępują wielkości fizyczne, które można mierzyć: mamy więc operatory pędu, położenia, energii itd. W jaki sposób formalizm ten pozwala otrzymywać w pewnych sytuacjach skwantowane wartości np. energii? Operator wielkości A działając na pewne odpowiednio wybrane wektory daje bardzo prosty wynik: mnoży wektor wyjściowy przez liczbę. Np.

A |\varphi_a\rangle=a|\varphi_a\rangle,

co zwykle zapisuje się krócej:

A|a\rangle =a|a\rangle.

Litera a oznacza wartość wielkości fizycznej, a więc powinna to być liczba rzeczywista, a przynależny jej stan |a\rangle jest wektorem. Mówi się, że jest to wektor własny, a wartość nazywamy wartością własną. Z doświadczalnego punktu widzenia, gdy układ jest w stanie własnym, to wynikiem pomiaru owej wielkości jest na pewno a. Przestrzeń stanów jest nieskończenie wymiarowa i może zawierać wiele różnych wektorów odpowiadających różnym wartościom własnym. Może się np. okazać, że tylko pewien dyskretny zbiór wartości jest dopuszczalny – i wtedy właśnie wielkość fizyczna się kwantuje.

Pokażemy, jak formalizm ten działa w przypadku oscylatora harmonicznego. Jest to najprostszy niecałkiem trywialny układ, mający zresztą liczne zastosowania: wszystko, co gdzieś drga, można w pierwszym przybliżeniu opisać jako oscylator harmoniczny albo ich zbiór – mogą to być drgania kryształów, atomów w cząsteczkach chemicznych, a nawet fale elektromagnetyczne, które matematycznie są podobne do oscylatorów.

W jednowymiarowym przypadku, gdy masa cząstki oraz częstość oscylatora są jednostkowe, energia ma postać:

E=\frac{1}{2}(p^2+x^2),

jest to więc suma kwadratów pędu i współrzędnej (kwadratowy potencjał odpowiada sile proporcjonalnej do wychylenia z położenia równowagi, jak w przypadku masy na sprężynie). W mechanice kwantowej zastępujemy tę funkcję operatorem Hamiltona (hamiltonianem), który ma postać taką samą, jak klasyczna:

H=\frac{1}{2}(p^2+x^2),

teraz jednak po prawej stronie mamy operatory pędu i położenia. Wiemy o nich od czasów Borna i Jordana oraz Diraca, że są nieprzemienne i spełniają regułę komutacji:

xp-px=i\hbar.

Okazuje się, że wystarczy to do znalezienia wartości energii oscylatora (dla uproszczenia przyjmiemy jednostki \hbar=1). Metoda, którą zastosujemy, przypisywana jest zwykle Paulowi Diracowi, choć w druku pojawiła się po raz pierwszy w książce Maksa Borna i Pascuala Jordana z roku 1930.

Hamiltonian jest sumą kwadratów, możemy więc spróbować rozłożyć go na czynniki. Wprowadzamy dwa nowe operatory:

a=\frac{1}{\sqrt{2}}(x+ip), \; a^{\dag}=\frac{1}{\sqrt{2}}(x-ip).

Gdyby x, p były liczbami rzeczywistymi, iloczyn obu naszych operatorów byłby równy hamiltonianowi. Musimy jednak uwzględnić nieprzemienność mnożenia operatorów:

a^{\dag}a=\frac{1}{2}(x^2+p^2+ixp-ipx)=H-\frac{1}{2}.

W podobny sposób możemy obliczyć iloczyn wzięty w odwrotnej kolejności:

aa^{\dag}=\frac{1}{2}(x^2+p^2-ixp+ipx)=H+\frac{1}{2}.

Odejmując ostatnie dwie równości stronami, otrzymamy

a^{\dag}a-aa^{\dag}=1.

Zbadajmy teraz wartości własne operatora N=a^{\dag}a – muszą one być o \frac{1}{2} mniejsze niż wartości własne operatora H. Jeśli |\lambda\rangle jest wektorem własnym N o wartości \lambda, to mamy

Na|\lambda \rangle=(a^{\dag}a)a|\lambda\rangle=(aa^{\dag}-1)a|\lambda\rangle=(\lambda-1)a|\lambda\rangle.

Oznacza to, że wektor a|\lambda\rangle też jest wektorem własnym N o wartości o 1 mniejszej. Działając kolejny raz operatorem a na tak uzyskany wektor, otrzymamy wektor o wartości własnej mniejszej o 2 itd. Procedura ta musi się jednak zakończyć po skończonej liczbie kroków, ponieważ operator N, tak jak i H, jest ograniczony od dołu. Hamiltonian jest sumą kwadratów i nie może mieć ujemnych wartości własnych, energia każdego układu ograniczona jest od dołu, gdyby tak nie było świat by się zapadł w stany o ujemnej energii. Znaczy to, że istnieje taki wektor |0\rangle, że

a  |0\rangle=0.

Po prawej stronie mamy wektor zerowy, czyli brak jakiegokolwiek stanu. Oczywiście, N |0\rangle=0, czyli wektorowi temu odpowiada zerowa wartość własna. Możemy teraz do tego wektora zastosować operator a^{\dag}, otrzymamy

Na^{\dag}|0\rangle=a^{\dag}aa^{\dag}|0\rangle=a^{\dag}(a^{\dag}a+1)|0\rangle=a^{\dag}|0\rangle,

czyli wektor a^{\dag}|0\rangle ma wartość własną 1. Powtarzając ten zabieg stosowania operatora a^{\dag} wykreujemy stany o wartościach własnych równych kolejnym liczbom naturalnym. Z tego powodu operator a^{\dag} nazywa się operatorem kreacji, a a – operatorem anihilacji. Generują one stany o większej bądź mniejszej wartości N. Zatem wartości własne naszego hamiltonianu równe są

E_n=n+\frac{1}{2}, \mbox{ gdzie  } n=0,1, 2,\ldots.

W zwykłych jednostkach energie wyrażają się przez częstość oscylatora \omega=\sqrt{\frac{k}{m}}:

E_n=\hbar\omega(n+\frac{1}{2}).

Wynik ten znany był od lat, po raz pierwszy jednak powstał w latach 1925-1926 spójny formalizm pozwalający otrzymać ten i wiele innych rezultatów.

Na obrazku widzimy rezultat zastosowania formalizmu: niebieska linia to kształt potencjału (parabola x^2), linie poziome oznaczają dozwolone wartości energii. Nawet najmniejsza energia musi być dodatnia: oznacza to, że kwantowy oscylator nigdy nie może spoczywać. Gdybyśmy zrobili kwantowe wahadło, musiałoby ono zawsze drgać. Z tego powodu nawet w temperaturze zera bezwględnego atomy w kryształach czy cząsteczkach chemicznych drgają – są to tzw. drgania zerowe.

Wynik dla oscylatora ma konsekwencje fizyczne: już w 1900 r. Max Planck zauważył, że energie te powinny przybierać skwantowane wartości, jeśli chcemy prawidłowo opisać promieniowanie ceieplne. Kilka lat później Albert Einstein wyjaśnił eksperymentalne wyniki dotyczące diamentu właśnie za pomocą tego kwantowania.

Prosty formalizm operatorów kreacji i anihilacji odegrał niezmiernie ważną rolę w rozwoju mechaniki kwantowej, pozwalając zbudować kwantową teorię pola. O jej początkach innym razem.

(*) Iloczyn skalarny dwóch wektorów przypisuje parze wektorów liczbę zespoloną i spełnia następujące aksjomaty:

\langle a| b\rangle=\langle b|a\rangle^{\star}.

\langle a| \lambda b+c\rangle=\langle a| b\rangle+\lambda\langle a| c\rangle.

Iloczyn wektora z samym sobą jest liczbą rzeczywistą nieujemną – kwadratem jego długości, zwanym też normą:

||{a}||^2:=\langle a|a\rangle.

 

 

Reklamy

Paul Dirac – drugi początek mechaniki kwantowej (1925)

Latem 1925 roku Werner Heisenberg wystąpił w Cambridge z odczytem w Klubie Kapicy. Było to nieformalne stowarzyszenie powołane do życia przez pełnego temperamentu rosyjskiego fizyka Piotra Kapicę, coś w rodzaju klubu naukowego doktorantów i studentów. Chwila była ważna: Heisenberg zaczął właśnie budować pierwsze zręby nowej mechaniki kwantowej. Sam jeszcze nie był pewny, co z tego wyjdzie, nikt pewnie nie przypuszczał, że chodzi o największe odkrycie XX wieku (obok teorii względności). W swoim wystąpieniu Heisenberg omówił swoją pracę na temat efektu Zeemana, a pod koniec wspomniał o nowych rewolucyjnych pomysłach.

Jednym ze słuchaczy był Paul Dirac. Wydawałoby się zatem, że wtedy właśnie dowiedział się, i to wprost od samego autora o koncepcji mechaniki kwantowej. Jeśli A mówił na temat X, a B tego słuchał, to zapewne B zapoznał się w ten sposób z X. Nie zawsze to prawda, podobnie jak z obecności na wykładzie niekoniecznie wynika, że student się czegoś dowiedział. W tym przypadku mamy świadectwo samego Diraca. Twierdził on, że zupełnie zapomniał o tej części wystąpienia Heisenberga i nawet był przekonany, że niemiecki uczony nic nie wpomniał o swej ostatniej pracy. Nie ma powodu nie wierzyć Diracowi, który był prawdomówny do bólu. Pracę Heisenberga otrzymał we wrześniu 1925 roku w postaci korekty drukarskiej. Heisenberg wysłał ją do Ralpha Fowlera, ten zaś napisał na odbitce: „Co o tym myślisz?” i przesłał ją swemu doktorantowi Diracowi do Bristolu. Nie był to przypadek, Fowler poznał się na zdolnościach swego milczącego i niezbyt towarzyskiego studenta. Jednak i we wrześniu Dirac nie zrozumiał od razu znaczenia pracy Heisenberga. Stało się tak dopiero po kilku tygodniach. Zaczął wówczas rozmyślać nad tym zagadnieniem i zaproponował własną wersję podejścia do problemu. Werner Heisenberg należał do wąskiej grupy uczonych zajmujących się zagadnieniem budowy atomu, orientował się nie tylko w opublikowanych osiągnięciach, ale brał udział w dyskusjach, wiedział, kto nad czym pracuje – słowem, korzystał w pełni z przynależności do czołówki ówczesnych fizyków. Dirac pracował sam, korzystając jedynie z tego, że Ralph Fowler był dobrze poinformowany w aktualnej sytuacji fizyki kwantowej na kontynencie. Zadziwiające, że potrafił w takich warunkach bardzo wiele osiągnąć w tej i w następnych pracach. Zresztą i później pracował sam, prawdopodobnie inaczej nie potrafił. Niektórzy twierdzą, że Paul Dirac był największym fizykiem XX wieku. Jego prace nigdy wszakże nie były popularne, nie mogły stać się nagłówkami w gazetach, był uczonym budzącym respekt wśród znających się na rzeczy, nie mógł też podobać się dziennikarzom – potrzebującym paru chwytliwych słów i nie mającym czasu, by zgłębić jakąkolwiek sprawę (*).

W pracy Heisenberga Dirac zwrócił przede wszystkim na fakt, że wielkości fizyczne, takie jak pęd czy współrzędna mogą nie być zwykłymi funkcjami czasu, lecz wielkościami, których mnożenie jest nieprzemienne: xy\neq yx. Fizycy wcześniej nie posługiwali się podobnymi pojęciami. Dirac miał naturalną łatwość operowania abstrakcyjnymi pojęciami, nie zaprzątał też sobie zbytnio głowy kwestią interpretacji formalizmu. Zaczął się zastanawiać nad sensem nieprzemienności, czym jest wyrażenie xy-yx? (Obecnie nazywa się ono komutatorem i oznaczane jest [x,y].)
Pewnej październikowej niedzieli, podczas cotygodniowej pieszej wycieczki, Dirac przypomniał sobie, że widział już wyrażenie podobne do komutatora w podręcznikach mechaniki klasycznej. Komutatory przypominały tzw. nawiasy Poissona. Nie był jednak pewien, czy dobrze pamięta. W żadnej z książek, które miał u siebie w pokoju, nie było definicji nawiasów Poissona. Ponieważ w niedzielę biblioteka była zamknięta, nie mógł od razu sprawdzić, czy skojarzenie jest prawidłowe. Wspominał później:

„Noc przeszła mi w męczącym oczekiwaniu, wciąż nie wiedziałem, czy mój pomysł ma jakąkolwiek wartość, ale stopniowo moje przekonanie rosło. Rankiem wybrałem się do biblioteki od razu po jej otwarciu i kiedy znalazłem w Mechanice analitycznej [E.T.] Whittakera definicję nawiasu Poissona, stwierdziłem, że jest dokładnie to, czego mi potrzeba. Był on całkowicie analogiczny do komutatora.

Nawiasy Poissona są zaawansowanym sposobem zapisu równań mechaniki w formalizmie Hamiltona. Stan układu określony jest przez podanie położenia q oraz pędu p (w razie potrzeby wprowadzamy większą liczbę współrzędnych i odpowiadających im pędów). Dynamikę układu, czyli jego ewolucję w czasie, określa funkcja zwana hamiltonianem H. W najprostszym przypadku cząstki o masie m w polu zewnętrznym V(q) hamiltonian jest po prostu sumą energii kinetycznej i potencjalnej:

H(q,p)=\dfrac{p^2}{2m}+V(q).

Znając hamiltonian, możemy napisać równania na pochodne czasowe położenia oraz pędu:

\dot{q}=-\dfrac{\partial H}{\partial q}, \: \dot{p}=\dfrac{\partial H}{\partial p}.

Łatwo zobaczyć, że w najprostszym przypadku równania te są równoważne II zasadzie dynamiki Newtona. Ich zaletą jest ogólność: możemy w rozmaity sposób definiować nowe współrzędne i pędy tak, by postać równań Hamiltona została zachowana. Hamiltonian będzie się przy tym zmieniać, w szczególnie prostych przypadkach może on się nawet redukować do jakiejś bardzo prostej funkcji, np. liniowej w pędzie i w ogóle nie zawierającej współrzędnych. Wtedy rozwiązanie układu równań jest trywialne (oczywiście, nie zawsze łatwo odgadnąć postać takich współrzędnych, które niejako wykonają pracę za nas).

Jeśli f(q,p), g(q,p) są dowolnymi funkcjami położeń i pędów, to ich nawias Poissona ma postać:

\left\{f,g\right\}=\dfrac{\partial f}{\partial q}\dfrac{\partial g}{\partial p}-\dfrac{\partial f}{\partial p}\dfrac{\partial g}{\partial q}.

Łatwo sprawdzić, że nawiasy Poissona są antysymetryczne (zmieniają znak przy przestawieniu funkcji), liniowe, spełniają dla dowolnych trzech funkcji f,g,h warunek Leibniza:

\left\{fg,h\right\}=f\left\{g,h\right\}+\left\{f,h\right\}g.

oraz tożsamość Jacobiego:

\left\{f,\left\{g,h\right\}\right\}+\left\{g,\left\{h,f\right\}\right\}+\left\{h,\left\{f,g\right\}\right\}.

Łatwo sprawdzić, że komutator dwóch wielkości będzie także spełniał powyższe warunki, jeśli tylko mnożenie jest łączne oraz rozdzielne względem dodawania. Analogię tę zauważył Dirac. A więc komutator w mechanice kwantowej odgrywałby rolę analogiczną do nawiasów Poissona.

Definicja Poissona nie była przypadkowa, pochodną każdej funkcji f położenia i pędu po czasie możemy zapisać jako

\dot{f}=\left\{f,H\right\}.

W szczególności, wstawiając f=q oraz f=p, dostaniemy równania ruchu w postaci Hamiltona. Najbardziej podstawowe nawiasy Poissona mają postać:

\left\{ q,q\right\}=\left\{ p,p\right\}=0, \; \left\{q,p\right\}=1.

Znając te podstawowe nawiasy oraz zakładając wyliczone wyżej własności ogólne nawiasów, można łatwo znaleźć nawiasy dla wielomianów zmiennych q,p, a stąd w zasadzie dla każdej rozsądnej funkcji tych zmiennych.

Praca Diraca była czymś więcej niż tylko trafnym zgadywaniem. Obliczył on, że w granicy dużych liczb kwantowych komutator powinien przechodzić w nawias Poissona pomnożony przez stałą:

[f,g] \approx i\hbar \left\{f,g\right\}.

Przyjmując więc odpowiednie wartości komutatorów, mamy pewność, że formalizm kwantowy redukuje się do klasycznej mechaniki. Dirac otrzymał w ten sposób reguły komutacyjne, które stanowią podstawę nowej teorii. W tym samym czasie w Getyndze Born i Jordan otrzymali je także, o czym jednak Dirac nie wiedział. Odpowiedniość nie jest do końca automatyczna, ponieważ gdy zmienne q,p nie komutują, ich kolejność ma znaczenie i temu samemu wyrażeniu klasycznemu odpowiadają rozmaite wyrażenia kwantowe.

Był to debiut Diraca w dziedzinie mechaniki kwantowej. To ta praca wprawiła w osłupienie Maxa Borna: nikomu nieznany student zrobił to samo, co najznakomitsi uczeni z Getyngi i wykazał przy tym samodzielność i dojrzałość. Dopiero w czerwcu następnego roku miał zrobić doktorat.

(*) Ostatnim przykładem takiej dziennikarskiej hucpy jest doniesienie o udowodnieniu hipotezy Riemanna przez sir Michaela Atiyaha. Pisałem o hipotezie Riemanna, jest to największy otwarty problem matematyki. Atiyah był genialnym matematykiem, który zdobył w swoim czasie wszelkie możliwe nagrody, ale obecnie ma 90 lat i od paru lat zasypuje świat niepotwierdzonymi rewelacjami. W dodatku hipoteza Riemanna miałaby być udowodniona wraz z rozważaniami na temat stałej struktury subtelnej – problem w tym, że stała ta bynajmniej nie jest stałą i nic sensownego na jej temat chyba się nie da powiedzieć. Niegdyś Arthur Eddington twierdził, że zna fundamentalne powody, dla których stała ta równa jest dokładnie 1/137. Jednak w rzeczywistości nie jest ona dokładnie równa tej wartości, więc całe to wyjaśnienie nie ma sensu. Obawiam się, że podobnie jest z dowodem Atiyah. Dziennikarze obwieszczają teraz wiadomość o dowodzie, potem będą mieli drugą okazję, aby to sprostować. Jest skrajnie nieprawdopodobne, aby hipotezę Riemanna udowodnić w paru linijkach – jak twierdzi Atiyah. To tak nie działa.

 

 

Werner Heisenberg: pierwsza praca z mechaniki kwantowej (1925)

Dwudziestotrzyletni Heisenberg już od kilku lat był aktywnym uczonym zajmującym się fizyką teoretyczną atomu. Dwa lata wcześniej, po trzech latach studiów, zrobił doktorat w Monachium u Arnolda Sommerfelda, który pierwszy zwrócił uwagę na jego talent. Sommerfeld, aktywny uczestnik w rozwoju nowej dziedziny, miał dar przyciągania zdolnych studentów: czterech jego doktorantów otrzymało Nagrody Nobla, a wielu studentów i stażystów przewijających się przez jego instytut zyskało międzynarodową sławę. W latach dwudziestych Monachium traciło pomału pozycję na rzecz Getyngi, gdzie teoretykom przewodził Max Born. Mechanika kwantowa powstała w Getyndze, a także w Kopenhadze, dokąd Niels Bohr stale zapraszał młodych naukowców z całego świata. Heisenberg zdążył już spędzić długi staż u Bohra, wiosną roku 1925 pracowali tam intensywnie wraz ze starszym o półtora roku Wolfgangiem Paulim, który już wtedy stał się dla Heisenberga punktem odniesienia. Pauli zaczął pracę naukową zaraz po maturze publikacją na temat ogólnej teorii względności. Doktorat u Sommerfelda zrobił także po trzech latach studiów – w najkrótszym prawnie dopuszczalnym terminie. Napisał też w tym czasie długi, ponaddwustustronicowy artykuł przeglądowy na temat teorii względności, w którym omówiona została krytycznie cała literatura przedmiotu. Niezwykle utalentowany, Pauli znany był też z bezwzględnego atakowania prac, które uważał za bezwartościowe. W późniejszych latach słynne było jego powiedzenie o jakiejś słabej pracy: „to nawet nie jest błędne”.

Heisenberg w 1924 roku, podczas wykładu habilitacyjnego w Getyndze.

Chłopięco wyglądający Heisenberg zaangażowany był w ruch skautingowy, spędzał sporo czasu na wycieczkach z młodymi ludźmi. Panowała tam beztroska atmosfera braterstwa i wspólnego przeżywania przygód. Była to jednak organizacja stawiająca sobie cele paramilitarne. Werner Heisenberg wraz z kolegami odwiedzali np. regiony zamieszkane przez Niemców, a pozostające poza granicami Rzeszy, jak np. Górny Tyrol, Finlandia, gdzie było trochę niemieckich emigrantów, a także niektóre tereny Węgier i Polski. W przypadku Heisenberga chodziło chyba raczej o młodzieńczą przygodę, a także odskocznię od intensywnej pracy naukowej. Nie był zwolennikiem skrajnej prawicy, starał się być apolityczny, choć można o nim chyba powiedzieć, że był nacjonalistą. Podczas II wojny światowej nie widział nic niewłaściwego w wizytach w okupowanej Kopenhadze czy Krakowie. Zamiłowanie Heisenberga do spędzania czasu  wyłącznie w męskim towarzystwie wydało się potem podejrzane, gdy jego biografii zaczęło przyglądać się SS. Nie doszukali się jednak niczego nieobyczajnego, do tej pory zresztą uczony miał już żonę i powiększającą się gromadkę dzieci.

Niels Bohr stał się dla młodego Wernera nie tylko mentorem, ale także wzorem i duchowym ojcem. Z prawdziwym ojcem Augustem Heisenbergiem, profesorem bizantynistyki w Monachium, Werner miał stosunki dość napięte. Jak się zdaje, ojciec nie wierzył w jego talent, a może w ogóle w fizykę teoretyczną, która wciąż uchodziła za coś mniej solidnego niż prowadzenie eksperymentów. Werner jako nastolatek chciał zostać pianistą, fizykę wybrał dość późno. August źle reagował na złe wieści o synu, kiedy np. dowiedział się, że Werner ledwo zdał egzamin doktorski. Egzaminatorów było dwóch: teoretyk Sommerfeld oraz eksperymentator Willy Wien. Ten drugi szybko wykrył braki w wiedzy młodego człowieka, który nie potrafił obliczyć zdolności rozdzielczej mikroskopu ani powiedzieć, jak działa ogniwo elektryczne (cztery lata później mikroskop pojawi się w pracy Heisenberga na temat zasady nieoznaczoności). Wien dopiero po dyskusji z Sommerfeldem zgodził się przepuścić Heisenberga, ale jego ocena końcowa była słaba: cum laude (można było otrzymać doktorat summa cum laude, magno cum laude, cum laude i bez żadnego dodatkowego określenia). Wien w senacie uniwersytetu spotykał się z profesorem Heisenbergiem i nie omieszkał się poskarżyć. Werner potrzebował pomocy finansowej, ponieważ nie od razu uzyskał płatną posadę. Ojciec napisał do Borna, pytając o perspektywy naukowe syna. Prosił też Jamesa Francka, eksperymentatora z Getyngi, przyszłego noblistę, aby umożliwił Wernerowi pracę w swoim laboratorium. Franck się zgodził, ale niewiele z tego wyszło i Werner wrócił do pracy teoretyka. Bohr, skracający dystans, biorący udział we wspólnych wycieczkach z młodymi ludźmi, a także zapraszający ich do domu, stał się Heisenbergowi bardzo bliski zarówno pod względem naukowym, jak i prywatnym.

Co ciekawe, najważniejszą swą pracę naukową Heisenberg napisał z dala od Bohra i Pauliego, nie zwierzając się także Maksowi Bornowi. Jak się zdaje, Bohr przy całej swej życzliwości wywierał silną presję na otoczenie, co nie zawsze służyło młodszym, mniej asertywnym uczonym. W kwietniu 1925 roku Heisenberg dostał silnego ataku kataru siennego i wyjechał na wyspę Helgoland, gdzie nie było roślin i w związku z tym pyłku w powietrzu. Tam zdał sobie sprawę, że jedna z ostatnich prac Bohra jest błędna (chodziło w niej o podważenie zasady zachowania energii, tzw. praca BKS). Odbyło się to w scenerii godnej obrazów Caspara Friedricha, Werner spędził noc duchowych zmagań na skalistym wybrzeżu, czekając na wschód słońca. Udało mu się znaleźć nową metodę postępowania, zastosował ją do prostych przypadków. Nie był jednak pewny, czy jest na dobrym tropie. Po powrocie z Helgolandu wręczył gotową pracę Bornowi, pytając o opinię. Do ojca pisał w tym czasie: „Moja własna praca nie idzie w tej chwili najlepiej. Nie uzyskuję zbyt wielu rezultatów i nie wiem, czy w tym semestrze wyjdzie z tego następny artykuł”.

Max Born zadecydował, że pracę trzeba opublikować, mimo że nie rozumiał jej do końca. Pisał w lipcu 1925 roku do Alberta Einsteina: „Moi młodzi ludzie: [Werner] Heisenberg, [Pascual] Jordan, [Friedrich] Hund są znakomici. Muszę się czasem poważnie wysilić, aby nadążyć za ich rozważaniami. Wprost bajecznie opanowali tak zwaną zoologię termów. Najnowsza praca Heisenberga, która się niebawem ukaże, wygląda bardzo mistycznie, ale jest prawdziwa i głęboka”. Heisenberg po jej napisaniu wyjechał do Cambridge, a później do Kopenhagi. W tym czasie Born wraz z Jordanem starali się zrozumieć, co właściwie Heisenberg zaproponował. Okazało się, że jest to decydujący krok w oderwaniu się od tzw. starej teorii kwantów, czyli fizyki klasycznej z kwantowymi dodatkami, jak model atomu Bohra – gdzie orbity elektronów są obliczane klasycznie, tak jak orbity planet, a do tego dokłada się warunek kwantowania, mówiący, jakie orbity są dozwolone. Problemem tego modelu i jego późniejszych coraz bardziej wyrafinowanych matematycznie ulepszeń była wewnętrzna sprzeczność: w fizyce klasycznej niemożliwe są stabilne orbity elektronów. Cały obraz atomu jako kłębowiska orbit elektronowych jest fałszywy. Stawało się to coraz bardziej widoczne przed rokiem 1925.

Heisenberg postanowił z konieczności zrobić cnotę: Nie powinniśmy w ogóle wyobrażać sobie żadnych orbit, nikt nie zaobserwował elektronu na orbicie i nie ma sensu mówić tutaj o ruchu w sposób klasyczny. Należy ograniczyć się do wielkości, które są możliwe do zaobserwowania w doświadczeniach, porzucając spekulacje na temat ruchu elektronu w atomie. Trzeba zmienić fizykę na poziomie kinematyki: nie można opisywać ruchu elektronu tak, jak ruchu kamienia czy innego obiektu makroskopowego. Powoływał się przy tym na podejście Einsteina, który zwracał w teorii względności uwagę, że aby np. mówić o równoczesności, należy podać metodę eksperymentalnego rozstrzygnięcia, czy dane zdarzenia są równoczesne. Metodologia tego rodzaju niekoniecznie sprawdza się w budowaniu teorii fizycznych, ale Heisenbergowi w tamtym momencie pomogła.

Podstawową informacją na temat atomów były linie widmowe. Atom promieniuje fale elektromagnetyczne o pewnych określonych częstościach. Najprostszym układem, który wysyła taką falę, jest drgający elektron. Aby mieć układ drgający należy wyobrazić sobie, że na elektron działa siła zależna od wychylenia, tak jakby nasz elektron był na sprężynie. Jednowymiarowy układ tego rodzaju jest najprostszym oscylatorem (masa na sprężynie, innym przykładem jest wahadło). Do opisania fal emitowanych przez oscylatory atomowe w przypadku klasycznym możemy zastosować analizę Fouriera. Współrzędna naszego oscylatora (o częstości kołowej \omega) jest funkcją okresową, można ją więc przedstawić jako sumę sinusów i cosinusów:

{\displaystyle x(t)=\sum_{n=0}^{\infty}(A_n\cos n\omega t+B_n \sin\omega t)}.

Dwa ciągi liczb rzeczywistych A_n, B_n określają jednoznacznie funkcję. Możemy także zapisać tę sumę krócej w postaci zespolonej:

{\displaystyle x(t)=\sum_{n=-\infty}^{+\infty}x(n) e^{i\omega n t}, \mbox{ (*)}}

gdzie korzystamy ze wzoru Eulera: e^{iz}=\cos z+i\sin z. Z punktu widzenia fizyki ważna jest nie tylko częstość, ale także amplituda drgań. Wypromieniowywana przez oscylator moc jest proporcjonalna do kwadratu amplitudy, czyli sumy |x(n)|^2.

Heisenberg uznał, że zamiast budować model atomu, w którym elektron jakoś się porusza, należy skupić się na wielkościach możliwych do zaobserwowania, czyli częstościach i kwadratach amplitudy.

Przeanalizował następnie, w jaki sposób buduje się kwadrat x(t). Zgodnie z naszym rozwinięciem w szereg Fouriera kwadrat funkcji będzie równy

x^2(t)=\sum_{n}\sum_{m}x(n)x(m)e^{i\omega(n+m)t}.

Wyrażenie to ma postać rozwinięcia Fouriera, jeśli wprowadzimy nową nazwę indeksu p=n+m, to nasz kwadrat można zapisać następująco:

x^2=\sum_{p} e^{i\omega pt}\left(\sum_{n}x(n)x(p-n)\right).

Wyrażenie w nawiasie mówi nam, jak otrzymać rozwinięcie fourierowskie kwadratu funkcji:

x^2(p)=\sum_{n}x(n)x(p-n).

Inaczej mówiąc, aby otrzymać wyraz o częstości \omega p, musimy wysumować wszystkie iloczyny x(n), w których suma częstości jest równa \omega p.

Następnie, i to był najważniejszy pomysł pracy, zastanowił się Heisenberg nad tym, co powinno zastąpić rozwinięcie fourierowskie w sytuacji kwantowej. Pojawia się wtedy oczywiście wiele różnych częstości, nie można przyjąć, że są one wielokrotnością jednej tylko częstości \omega. Co więcej, częstości zależą teraz od dwóch wskaźników:

\omega_{mn}=\dfrac{E_{m}-E_{n}}{\hbar}, \mbox{  (**)}

jest to warunek Bohra, będący w istocie zasadą zachowania energii (\hbar jest stałą Plancka podzieloną przez 2\pi). Można więc uznać, że teraz potrzebujemy także amplitud zależnych od dwóch wskaźników. Współrzędna x naszego oscylatora powinna być jakoś reprezentowana przez zbiór owych amplitud:

x \rightarrow \left\{ x_{mn}e^{i\omega_{mn} t} \right\} .

Nie powinniśmy teraz liczyć na to, że x(t) jest sumą takich wyrazów, raczej mówimy o pewnym zbiorze, który reprezentuje współrzędną w mechanice kwantowej, Heisenberg był tu nieprecyzyjny, bo prawdopodobnie nie potrafił lepiej tego wyrazić.

Czym będzie w takim razie kwadrat współrzędnej albo – co ciekawsze – iloczyn dwóch współrzędnych x oraz y? Mówimy o tym samym układzie, którego zestaw energii, a więc i częstości, jest ustalony. Jeśli także y dane będzie podobnym zestawem co x powyżej, to iloczynowi powinien odpowiadać zbiór

xy \rightarrow \left\{ (xy)_{mp}e^{i\omega_{mp}t} \right\},

gdzie

\boxed{(xy)_{mp}=\sum_{n} x_{mn}y_{np}.}

Zauważmy, że definicja ta daje prawidłowy czynnik wykładniczy:

e^{i\omega_{mp}t}=e^{i\omega_{mn}t}e^{i\omega_{np}t},

gdyż korzystając z (**), otrzymujemy:

\omega_{mp}=\omega_{mn}+\omega_{np}.

Definicja z ramki okazała się najważniejszym wynikiem tej przełomowej pracy Heisenberga. Zauważył on natychmiast, że przy takiej definicji xy\neq yx, czyli mnożenie dwóch wielkości będzie na ogół nieprzemienne.

Potrzebował jeszcze warunku kwantowania, uzyskał go w dość skomplikowanej postaci. Następnie zastosował wynaleziony formalizm do przypadku oscylatora anharmonicznego, tzn. gdy siła oprócz składnika proporcjonalnego do wychylenia zawiera także poprawkę kwadratową w wychyleniu. Nie będziemy powtarzać jego rachunków, pokażemy tylko, co stało się w następnym miesiącu.

Otóż w czasie gdy Heisenberg wojażował, Born wraz z Jordanem (młodszym o rok od Heisenberga, a więc mającym dwadzieścia dwa lata!) przyjrzeli się jego pracy z bardziej matematycznego punktu widzenia. Max Born skojarzył po kilku dniach, że widział już kiedyś takie mnożenie jak w ramce. Było to jeszcze na studiach we Wrocławiu, a chodziło o mnożenie macierzy. Wielkości Heisenberga były po prostu macierzami. Zauważyli też obaj, że ów skomplikowany warunek Heisenberga można macierzowo zapisać jako

\boxed{xp-px=i\hbar \mathbf{I},}

gdzie x,p były macierzami położenia i pędu, a \mathbf{I} macierzą jednostkową. Wielkości kwantowomechaniczne były więc macierzami i to takimi, które nie komutują. Od komutowania dzieli je niewiele, bo tylko stała Plancka – znaczy to, że w wielu sytuacjach różnica ta będzie nie do wykrycia, gdyż stała Plancka jest mała w zwykłych jednostkach (ujmując to inaczej, to nasze, dostosowane do ludzkiego ciała, jednostki są ogromne w skali atomowej, bo my sami składamy się z ogromnej liczby atomów).

Trudno dziś uwierzyć, że Max Born, matematyk z wykształcenia, dawny asystent Hermanna Minkowskiego, musiał wygrzebywać z zakamarków pamięci definicję mnożenia macierzy. Algebra liniowa przez ostatnie sto lat stała się dziedziną bardzo podstawową i uczy się jej powszechnie, nie tylko ze względu na mechanikę kwantową, ale także różne bardziej przyziemne zastosowania, np. w statystyce.

Najprostszym zastosowaniem mechaniki macierzowej jest oscylator harmoniczny. Jego energia ma postać:

H=\dfrac{1}{2}m\dot{x}^2+\dfrac{1}{2}m\omega^2 x^2,

(gdzie m to masa oscylatora), a równanie ruchu (odpowiednik równania Newtona):

\ddot{x}+\omega^2 x=0.

Wyrażenia mają tę samą postać co w mechanice klasycznej (kropki oznaczają pochodną po czasie), ale wszystkie wielkości x,\dot{x},\ddot{x} są teraz macierzami. Nietrudno znaleźć postać macierzy x_{mn}. Można wybrać ją jako macierz symetryczną: x_{mn}=x_{nm} i jedyne nieznikające wyrazy równe są

x_{n,n-1}=x_{n-1,n}=\sqrt{\dfrac{n\hbar}{2m\omega}}.

Macierz energii (zwana hamiltonianem) staje się diagonalna, tzn. nie znikają jedynie wyrazy z jednakowymi wskaźnikami:

H_{nn}=\hbar\omega\left(n+\dfrac{1}{2}\right), \mbox{ gdzie }\, n=0,1,2,\ldots.

Nasze macierze są nieskończone, gdyż oscylator ma nieskończenie wiele stanów wzbudzonych. Całe obliczenie znaleźć można w klasycznej książce L.D. Landaua i E.M. Lifszyca, Mechanika kwantowa.

Mechanikę kwantową rozwijali ludzie młodzi pod kierunkiem starszych oraz Erwin Schrödinger. Isnieje dość zabawne zdjęcie z uroczystości noblowskich w roku 1933, gdy twórcy mechaniki kwantowej odbierali swoje nagrody. Mamy tam Diraca i Heisenberga z matkami oraz Schrödingera z żoną. Ten ostatni, już po czterdziestce, mógł być niemalże ojcem młodszych laureatów.

Warto dodać może parę słów o Pacualu Jordanie. Był potomkiem hiszpańskiego oficera wojsk napoleońskich i zawziętym nacjonalistą, a także nazistą. W roku 1933 Born z racji żydowskiego pochodzenia był już na emigracji, Getynga wyglądała zupełnie inaczej. Jordan, który brał od początku udział w powstaniu mechaniki kwantowej, współtworzył także równolegle do Paula Diraca kwantową teorię pola, czyli relatywistyczną mechanikę kwantową. Gdyby nie nazistowskie sympatie, z pewnością zostałby laureatem Nagrody Nobla. Z czysto naukowego punktu widzenia należała mu się ona, choć trudno nie podzielać wątpliwości szwedzkiego komitetu, że przyznanie nagrody w takich okolicznościach byłoby złym sygnałem dla świata.

 

 

P.A.M. Dirac i jego równanie (1927-1928)

Paul Dirac znany był z powściągliwej małomówności i z tego, że nie wdaje się w grzecznościowe pogaduszki. Richard Feynman opowiadał, że kiedy spotkał po raz pierwszy Paula Diraca na jakiejś konferencji, to po długiej chwili milczenia starszy uczony rzekł: „Mam równanie. Czy pan także?”

Rozmaite wypowiedzi Diraca cytowane są często jako żarty, gdyż brzmią z pozoru absurdalnie. Paul Adrien Maurice Dirac sprawiał wrażenie postaci beckettowskiej: chudy, z długimi kończynami i wielkimi stopami, nie okazujący emocji, porozumiewający się pełnymi zdaniami (ponieważ nie wolno zacząć zdania, jeśli się nie wie, jak je zakończyć), myślący w kategoriach logicznych i matematycznych, a nie emocjonalnych czy etycznych. Jego przyjaciel Charles Galton Darwin, fizyk, wnuk twórcy teorii ewolucji, dopiero po kilku latach znajomości z Dirakiem odważył się zapytać, co właściwie znaczą inicjały P.A.M. przed jego nazwiskiem. Po przeczytaniu Zbrodni i kary Dostojewskiego Dirac miał tylko jedną uwagę, i to raczej techniczną niż etyczną czy psychologiczną: otóż w książce słońce wschodzi dwukrotnie tego samego dnia.

Anegdota z równaniem mówi sporo o obu rozmówcach. Dirac cenił konkrety, lubił np. słuchać wielogodzinnych monologów Nielsa Bohra, ale wątpił, czy coś z nich wyniósł, ponieważ prawie wcale nie było w nich równań. Toteż cenił sobie niewątpliwie fakt, iż odkrył jedno z fundamentalnych równań przyrody, które stosuje się do wszystkich cząstek o spinie ½: a więc elektronów, protonów, nieodkrytych jeszcze wtedy neutronów oraz kwarków, z których nukleony się składają. Feynman pozostawił po sobie wprawdzie całki Feynmana, diagramy Feynmana i wiele innych osiągnięć, nie odkrył jednak nigdy żadnego fundamentalnego prawa przyrody i jak się zdaje jego ambicja cierpiała z tego powodu.

Jesienią 1927 roku Paul Dirac, młodzieniec zaledwie dwudziestopięcioletni, zaproszony został na Kongres Solvaya do Brukseli. Była to konferencja bardzo elitarna, gromadząca obecne i przyszłe znakomitości naukowe. Na pamiątkowym zdjęciu siedzi w samym środku za Einsteinem, wiemy, że bardzo był dumny z tej fotografii i posłał ją na swój macierzysty uniwersytet w Bristolu. Niewykluczone, że specjalnie usiadł za Einsteinem, jego teorię względności podziwiał bowiem od lat i poznał, zanim jeszcze zajął się fizyką atomową – jak to wtedy mówiono, czyli fizyką mikroświata. Najważniejsze postacie na tym zdjęciu to Niels Bohr i Max Born, przywódcy i patroni całego ruchu kwantowej odnowy w fizyce. W Kopenhadze i Getyndze tworzyły się zasady nowej mechaniki. Zaczęła ją praca Wernera Heisenberga z 1925 roku. Niedługo później dołączyli Born i Pascual Jordan.

Od jesieni 1925 roku mechanikę kwantową współtworzył też Paul Dirac. Był studentem Ralpha Fowlera w Cambridge. Fowler rozpoznał jego niebywały talent: młody inżynier elektryk i absolwent studiów drugiego stopnia z matematyki na uniwersytecie w Bristolu dostał stypendium do Cambridge i błyskawicznie uzupełnił braki z fizyki, nie tylko najnowszej, nie znał np. dotąd równań Maxwella. Fowler miał znakomite kontakty i chyba one przydały się Diracowi najbardziej. Młody uczony otrzymał od niego jeszcze przed drukiem korekty artykułu Heisenberga i zrozumiał ich znaczenie. Kiedy niedługo później opublikował swoją pierwszą pracę na temat mechaniki kwantowej, Max Born zdumiony był, że pojawił się ktoś spoza wąskiej grupy znanych mu ludzi pracujących w tej dziedzinie i w dodatku jego osiągnięcia są porównywalne do tego, co udało się stworzyć w Getyndze i Kopenhadze. Dirac, równieśnik Jordana, miał dwadzieścia trzy lata, pół roku mniej niż Heisenberg i dwa lata mniej niż Wolfgang Pauli. Pracował nad doktoratem. Dzięki Fowlerowi jego prace szybko się ukazywały w „Proceedings of the Royal Society”, a czas bardzo się wtedy liczył. Dirac zaczął korespondować z Hiesenbergiem, który od razu poczuł ogromny respekt do brytyjskiego kolegi. Po doktoracie wyjechał do Kopenhagi i Getyngi. Poznał wielu fizyków, ale nie zmienił swej metody pracy: przez sześć dni w tygodniu intensywne myślenie od rana do obiadu, w niedziele piesze wycieczki. Nie współpracował też z nikim, przez całe życie pracował sam, uważając, że tak jest najlepiej, bo ważne idee są zawsze dziełem konkretnego człowieka, nie zespołu.

Tak więc po dwóch latach swej naukowej kariery Dirac znalazł się w elitarnym gronie na Konferencji Solvaya. Przeszła ona do historii za sprawą dyskusji Bohra z Einsteinem, który nie potrafił się pogodzić z probabilistycznym charakterem nowej mechaniki – można w niej obliczać i przewidywać jedynie prawdopodobieństwa zdarzeń. To w trakcie jednej z takich dyskusji padły słynne słowa: „Bóg nie gra w kości”. W mechanice kwantowej zrezygnować trzeba także z pełnej wiedzy o zjawiskach w mikroświecie: im dokładniej zmierzymy położenie elektronu, tym mniej będziemy wiedzieli na temat jego pędu. Dirac zupełnie nie interesował się sporami filozoficznymi na temat podstaw mechaniki kwantowej. Dla niego była to piękna teoria, do której zbudowania się przyczynił, fascynowała go matematyczna elegancja całego obrazu, napisał zresztą niedługo później słynną książkę The Principles of Quantum Mechanics, przedstawiającą całą tę konstrukcję w niezrównany klarowny, choć też niezwykle zwięzły sposób.

Jesienią 1927 roku Paul Dirac pragnął odkryć swoje równanie. Chodziło o rozwiązanie zagadnienia elektronu w sposób zgodny z teorią względności Einsteina. Z problemem tym pierwszy zetknął się w roku 1925 Erwin Schrödinger, drugi outsider fizyki kwantowej, pracujący w Zurychu. Wiadomo było, że cząstki takie jak elektron związane są z pewnymi wielkościami falowymi. Schrödinger przyjął, że stan elektronu opisywany jest pewną funkcją położenia i czasu \psi(\vec{r},t). Funkcja ta spełniać musi równanie o postaci

i\hbar \dfrac{\partial\psi}{\partial t}=H\psi \mbox{ (*)},

gdzie H jest pewnym operatorem działającym na funkcję. Najłatwiej wyjaśnić to na przykładach. Operatorem takim jest np. mnożenie \psi przez którąś ze współrzędnych, np. x. Wynikiem działania tego operatora jest nowa funkcja równa x\psi. Innym operatorem jest różniczkowanie, np. po zmiennej x. Wynikiem działania tego operatora jest wówczas \frac{\partial \psi}{\partial x}. Innym przykładem operatora jest pochodna po czasie z lewej strony równania Schrödingera. Za każdym razem tworzymy z wyjściowej funkcji \psi jakąś nową funkcję. Operator H zwany hamiltonianem (albo operatorem Hamiltona) jest kwantową wersją wyrażenia na energię cząstki. Jeśli np. energia cząstki o masie m składa się z energii kinetycznej i potencjalnej V(\vec{x}), to możemy ją zapisać w postaci

E=\dfrac{{\vec{p}\,}^2}{2m}+V(\vec{x}).

Kwantowy operator Hamiltona będzie wówczas równy

H=-\dfrac{\hbar^2}{2m}\left(\dfrac{\partial^2}{\partial x^2}+\dfrac{\partial^2}{\partial y^2}+\dfrac{\partial^2}{\partial z^2}\right)+V(\vec{r})\equiv -\dfrac{\hbar^2}{2m}\Delta+V(\vec{r}).

Operator V(\vec{r}) jest po prostu operatorem mnożenia, energię kinetyczną konstruujemy z pędu za pomocą podstawienia

p_x\rightarrow -i\hbar\dfrac{\partial}{\partial x}

i analogicznie dla pozostałych współrzędnych. Równanie Schrödingera (*) jest podstawowym prawem mechaniki kwantowej. Rozwiązując je, dowiadujemy się, w jaki spośob zmienia się funkcja falowa, a więc stan naszego elektronu. Najprostszym możliwym rozwiązaniem tego równania w przypadku cząstki swobodnej (tzn. gdy V=0) jest funkcja opisującą falę:

\psi=A \exp{\frac{i}{\hbar}(\vec{p}\,\vec{r}-Et)}, \mbox{ (**)}

gdzie p_x, p_y, p_x oraz E są parametrami liczbowymi. Łatwo sprawdzić, że różniczkowanie tej funkcji sprowadza się do mnożenia przez odpowiedni czynnik i ostatecznie równanie Schrödingera da nam warunek:

E=\dfrac{\vec{p}\,^2}{2m},

jak powinno być dla cząstki swobodnej i parametry są składowymi pędu oraz energią cząstki. Zbudowaliśmy stan o określonej energii i jednocześnie określonym pędzie. Jasne jest, że przyjmujemy tu energię kinetyczną w postaci newtonowskiej, a więc nierelatywistycznej.

Erwin Schrödinger początkowo poszukiwał równania relatywistycznego dla swojej funkcji \psi i nawet takie równanie znalazł. Ma ono następującą postać w przypadku swobodnym:

\dfrac{1}{c^2}\dfrac{\partial^2 \psi}{\partial {t}^2}-\Delta \psi+\left(\dfrac{mc}{\hbar}\right)^2 \psi=0.

Podstawiając do niego funkcję (**), otrzymamy równanie

E^2-p^2c^2=m^2c^4,

a więc prawidłowy związek energii i pędu dla cząstki o masie m w teorii względności. Oczywiście równanie dla cząstki swobodnej niewiele znaczy, interesujące są przypadki, gdy mamy pewien potencjał V(\vec{r}), np. gdy elektron porusza się w polu elektrostatycznym nieruchomego protonu. Jest to prawie atom wodoru (prawie – ponieważ w prawdziwym atomie wodoru proton, choć znacznie masywniejszy, może też się poruszać). Nietrudno równanie Kleina-Gordona rozszerzyć tak, aby zawierało zewnętrzne pole elektromagnetyczne. Wiadomo było jednak, że elektron ma spin, co sprawia, że jego stany są podwojone i np. w polu magnetycznym ta różnica się ujawnia jako rozszczepienie linii widmowych (efekt Zeemana). Czemu więc Schrödinger nie opublikował tego równania, które dziś nazywa się równaniem Kleina-Gordona? Schrödinger uznał, że trzeba ograniczyć się na początek do równania nierelatywistycznego i opublikował równanie (*) zastosowane m.in. do atomu wodoru. Nie jest jasne, czy chodziło mu o brak spinu, czy może dostrzegł inne trudności z rozwiązaniami równania Kleina-Gordona.

Z punktu widzenia Diraca równanie Kleina-Gordona nie było rozwiązaniem problemu elektronu. Owszem, relatywistyczny związek między energią i pędem cząstki był spełniony, ale równanie zawierało drugą pochodną czasową, a nie pierwszą jak równanie Schrödingera. Zdaniem Diraca równanie podstawowe powinno być pierwszego rzędu w czasie, tak aby wartości funkcji falowej w danej chwili determinowały jej wartości w przyszłości (w przypadku równania drugiego rzędu należy znać jeszcze wartości pochodnych czasowych). Jak pogodzić to z relatywistyczną postacią energii? Hamiltonian powinien mieć postać:

H=\sqrt{-c^2\hbar^2 \Delta+m^2c^4},

Oczywiście, wyciąganie pierwiastka kwadratowego z laplasjanu nie jest operacją standardową. Inżyniersko nastawiony do matematyki Paul Dirac, nieodrodny spadkobierca Olivera Heaviside’a, nie zamierzał się poddawać z tak trywialnego powodu. Równanie dla cząstki swobodnej powinno być pierwszego rzędu w czasie, w teorii względności znaczy to, że powinno być także pierwszego rzędu w pochodnych przestrzennych – poniważ przestrzeń i czas są symetryczne u Einsteina. Należy więc szukać równania postaci

i\hbar \gamma^{\mu}\dfrac{\partial \psi}{\partial x^{\mu}}=mc\psi, \mbox{ (***)}

gdzie sumujemy po wskaźnikach czasoprzestrzennych \mu=0,1,2,3 oraz x^0=ct. Żądamy, aby \gamma^{\mu} nie zależały od czasu ani współrzędnych przestrzennych, a także aby dwukrotne zastosowanie operatora po lewej stronie dało nam m^2, jak w równaniu Kleina-Gordona – wtedy relatywistyczny związek energii i pędu będzie spełniony. Łatwo zauważyć, że stanie się tak, jeśli

\gamma^{\mu}\gamma^{\nu}+\gamma^{\nu}\gamma^{\mu}=2g^{\mu\nu}=2\cdot diag(1,-1-1-1),

gdzie g^{\mu\nu} jest metryką czasoprzestrzeni Minkowskiego. Jakimi obiektami muszą być owe cztery \gamma^{\mu}? Mają one antykomutować ze sobą, czyli ich iloczyn zmienia znak przy przestawieniu, a kwadraty mają być równe \pm 1. Dirac odkrył, że \gamma^{\mu} muszą być macierzami 4×4, a więc funkcja \psi musi zawierać cztery składowe:

\psi=\begin{pmatrix} \psi_1\\ \psi_2 \\ \psi_3 \\ \psi_4 \end{pmatrix}.

Inaczej mówiąc, równanie (***) jest układem czterech równań liniowych o stałych współczynnikach. Zaraz po Nowym Roku 1928 Ralph Fowler przekazał pracę do druku i miesiąc później się ukazała. Po miesiącu Dirac uzupełnił ją o drugą część. Mógł być teraz pewien: miał swoje równanie.

Dirac zaczął sprawdzać konsekwencje odkrytego równania. Okazało się, że zawiera ono informację o stanach spinowych elektronu. Co więcej, spinowy moment pędu okazywał się równy \hbar/2, a moment magnetyczny równy dokładnie magnetonowi Bohra. Znaczyło to, że w tym przypadku stosunek momentu magnetycznego do momentu pędu jest dwukrotnie większy niż dla orbitalnego momentu pędu, co potwierdzały eksperymenty (Nb. w roku 1915 Albert Einstein i Wander de Haas, zięć Hendrika Lorentza, przegapili okazję do pierwszorzędnego odkrycia doświadczalnego, zmierzyli bowiem ten stosunek i wyszedł im taki, jak oczekiwali, ale dwa razy mniejszy niż w rzeczywistości). Równanie elektronu Diraca w polu kulombowskim odtwarzało znane wyniki dla energii uzyskane wcześniej przez Arnolda Sommerfelda za pomocą relatywistycznej wersji modelu Bohra (model Bohra-Sommerfelda).

Co z czterema składowymi funkcji falowej? Potrzebne były dwie składowe do opisania spinu, ale cztery? Równanie Diraca zawiera rozwiązania zarówno dla energii dodatniej +\sqrt{p^2c^2+m^2c^4}, jak i -\sqrt{p^2c^2+m^2c^4}. Paul Dirac zauważył też, że rozwiązania te stwarzają realny problem: energia elektronu nie jest bowiem ograniczona z dołu, a to w przypadku układu kwantowego znaczy, że prędzej czy później powinien on przejść do stanu o niższej energii. W mechanice kwantowej panuje skrajny liberalizm: wszystko, co nie jest zabronione, jest dozwolone i się kiedyś zdarzy. Jedynym wyjściem wydawało się znaleźć jakiś zakaz, który musiałby być naruszany podczas takiego przejścia. Dwa lata później Dirac zaproponował, że stany o ujemnej energii są zajęte, więc ponieważ elektrony podlegają zakazowi Pauliego, zwykle nie ma takich przejść. Możliwe jest wzbudzenie elektronu z ujemną energią do stanu z energią dodatnią, pozostawi on dziurę, która będzie się zachowywać jak cząstka o takiej samej masie, lecz dodatnia. Otrzymujemy w ten sposób parę elektron i antyelektron. W 1932 roku cząstka taka została odkryta i nazwana pozytonem. Nic więc dziwnego, że już w roku następnym P.A.M. Dirac otrzymał Nagrodę Nobla (po połowie ze Schrödingerem). Inne wyjaśnienie dla rozwiązań o energii ujemnej podał później Richard Feynman: u niego pozytony są elektronami, które poruszają się wstecz w czasie, zamiast energii zmienia się znak czasu. Współczesna kwantowa teoria pola nie potrzebuje takich obrazów, wprowadza się w niej przestrzeń stanów bogatszą niż w mechanice kwantowej, gdyż pojawia się możliwość procesów kreacji oraz anihliacji par. Równanie Diraca obowiązuje nadal, lecz zamiast funkcji falowej mamy operator pola, obiekt jeszcze nieco bardziej abstrakcyjny.

Znakomitą biografię Diraca napisał Graham Farmelo, została ona jednak całkiem popsuta w polskim przekładzie, który językowo jest poniżej wszelkiej krytyki. Szkoda, bo pewnie nieprędko pojawi się drugie wydanie.

Elementy – Euklides (ok. 300 p.npe.)

Myślimy często o starożytnej Grecji jako o cywilizacji, która dała nam filozofię, teatr, poezję, historię, sztukę, logikę, demokrację. Mniej dostrzegane są początki nauk ścisłych, które, wbrew wszelkiemu prawdopodobieństwu, osiągnęły u Greków niezwykle wysoki poziom. Dwa najważniejsze dzieła, Elementy i Almagestpowstały w Aleksandrii, pierwsze na początku świetności miasta, drugie już pod jej koniec. Oddzielone od siebie ponad czterema wiekami, skondensowały w sobie to, co najlepsze w starożytnym dorobku. A bez greckiej geometrii i astronomii nie do pomyślenia byłaby późniejsza nauka islamska, a także praca Mikołaja Kopernika i jego następców prowadząca do rewolucji naukowej XVII wieku.

Tekst Elementów, podzielony na trzynaście ksiąg, obejmuje w sposób systematyczny najważniejsze osiągnięcia matematyki greckiej przed Archimedesem. Napisane około roku 300 p.n.e. dzieło było przez wieki kopiowane zarówno w greckim oryginale, jak i w przekładach na hebrajski, arabski i łacinę, a od 1482 roku zaczęło ukazywać się drukiem w niezliczonych wydaniach książkowych, które liczbą ustępują tylko wydaniom Biblii. Aż do początku XIX wieku znano tekst Euklidesa jedynie w redakcji Teona z Aleksandrii, uczonego z IV w.n.e., ojca Hypatii. W 1808 r. François Peyrard, pierwszy bibliotekarz École Polytechnique w Paryżu, odkrył, iż rękopis Elementów zrabowany z Watykanu przez Napoleona (Vaticanus graecus 190, zwany też P) jest wcześniejszą wersją dzieła. Stała się ona później podstawą definitywnego wydania opracowanego przez duńskiego filologa Johana Ludviga Heiberga.

[Vaticanus graecus 190]

Dzieło Euklidesa nie było pierwszym noszącym ten tytuł, szybko stało się jednak klasyczne, czego pośrednim dowodem jest fakt, że nie zachowały się niemal żadne wcześniejsze teksty matematyczne – w czasach gdy kopiowanie książek było kosztowne i pracochłonne, następowała swoista selekcja naturalna rękopisów, w której te bardziej przydatne wypierały mniej użyteczne. Elementy są najwcześniejszym zachowanym greckim traktatem poświęconym matematyce, ponieważ stanowią one podręcznik, z którego można nauczyć się podstaw matematyki. Stosowane były w tej funkcji nie tylko w starożytności, ale i w czasach późniejszych aż po dziewiętnasty wiek.

Zadziwiająco mało wiemy o autorze tekstu, nawet jego istnienie podawano w wątpliwość, argumentując, że dzieło jest niejednorodne i różne jego księgi wykazują rozmaity stopień dojrzałości. Na ogół sądzi się jednak, że Euklides działał i prawdopodobnie także urodził się w Aleksandrii, mieście niedługo wcześniej założonym przez Aleksandra Wielkiego i przez długie wieki stanowiącym ośrodek nauki i kultury greckiej. Według Proklosa, neoplatończyka z V w.n.e., Euklides żył za panowania Ptolemeusza I i był młodszy niż krąg uczniów Platona, a starszy od Archimedesa i Eratostenesa. Miał być platonikiem i z tego powodu dzieło jego kulminowało konstrukcją i omówieniem pięciu brył platońskich, znanych z Timajosa. Euklidesa nie uważano nigdy za oryginalnego twórcę, sądzono, że zebrał on i usystematyzował osiągniecia poprzedników, w szczególności Eudoksosa i Teajteta. Elementy nie są jednak prostą kompilacją znanego już materiału, lecz próbą zbudowania dedukcyjnego systemu wiedzy matematycznej. Możliwe, że tak jak i w późniejszej historii matematyki, po okresach szybkich postępów następowały okresy systematyzacji i porządkowania wiedzy i Elementy są świadectwem takiego dążenia. Choć odkrycia późniejszych matematyków, takich jak Archimedes, Apoloniusz i Pappus, znacznie wykroczyły poza problematykę Elementów, dzieło to pozostało najszerzej używanym podręcznikiem w historii. Jego znaczenie nie ogranicza się do matematyki: dedukcyjny system wiedzy stał się ideałem wielu późniejszych filozofów i uczonych. W naukach ścisłych aż do dziś uważa się możliwość ustrukturyzowania wykładu na wzór greckiej geometrii za ważny sprawdzian dojrzałości danej dyscypliny. Wprowadzając postulaty, z których następnie wyprowadzamy twierdzenia, osiągamy pojęciową jasność i większą przejrzystość konstrukcji myślowych, musimy bowiem uświadomić sobie jasno przyjęte założenia.

Pamiętać też należy, iż grecka geometria nie była traktowana jako abstrakcyjna gra logiczna, lecz jako teoria wywodząca się z obserwacji dotyczących ciał w przestrzeni, stanowiła więc i nadal stanowi (wraz z nieeklidesowymi rozszerzeniami) podstawę fizyki. Można więc traktować ją jako pierwszą matematyczną teorię fizyczną. Kiedy niedługo później Archimedes w podobny sposób ujmował zasady równowagi ciał, rozszerzał niejako geometrię, tworząc zarazem pierwszą fizykę matematyczną.

Poniżej skoncentrujemy się na przedstawieniu metody postępowania Euklidesa, ograniczając się do tego, co było znane i czytane najszerzej i nie ograniczało się tylko do samej matematyki. Aksjomatyczna konstrukcja wiedzy jest osiągnięciem greckim nie mniejszym niż demokratyczne rządy albo rzeźba. Dzięki Euklidesowi nigdy już nie stracono z oczu, przynajmniej w kręgu śródziemnomorskim, owej metody uzyskiwania zdań niezbitych i pewnych. Jeśli prawdą jest, że (jak ujął to Alfred North Whitehead) filozofia europejska stanowi ciąg przypisów do Platona, to z niemniejszą dozą słuszności powiedzieć można, że nauki ścisłe – fizyka w nie mniejszym stopniu niż matematyka – stanowią rozbudowany komentarz do Elementów Euklidesa.

Każda z ksiąg (albo grup ksiąg) poprzedzona jest definicjami. Księga pierwsza zaczyna się od wymienienia pięciu postulatów geometrii oraz pięciu ogólniejszych prawidłowości odnoszących się do tego, co Euklides nazywa wielkościami – może tu chodzić (jak czytelnik dowiaduje się przy okazji kolejnych twierdzeń) o długość odcinka, wielkość kąta, pole powierzchni czy objętość pewnych brył. Następnie z owych dziesięciu założeń wyprowadzane są kolejne twierdzenia oraz konstrukcje. Księgi I-IV oraz VI, XI-XIII poświęcone są geometrii, sięga V zawiera wykład teorii proporcji Eudoksosa (odgrywały one w matematyce greckiej rolę dzisiejszych liczb rzeczywistych), księgi VII-IX dotyczą arytmetyki, w księdze X dyskutowane są rozmaite rodzaje liczb niewymiernych, zawsze jednak traktowanych jako proporcje długości pewnych odcinków. Ostatnia księga XIII kończy się twierdzeniem, że istnieje dokładnie pięć brył platońskich (sześcian oraz foremne: czworościan, ośmiościan, dwunastościan i dwudziestościan).

Podejście Euklidesa niewątpliwie wiele zawdzięcza istniejącej już tradycji matematycznej, a także platońskiemu rozróżnieniu między przedmiotami postrzeganymi przez zmysły a bytami idealnymi: korzystając z rysunków, traktuje je tylko jako pomoc w wyobrażeniu sobie, jak mają się do siebie idealne figury geometryczne. Koncepcję uporządkowania wiedzy, zaczynając od założeń, których prawdziwość przyjmuje się bez dowodu, znaleźć można u Arystotelesa, nie wiadomo jednak, czy występuje tu jakaś bezpośrednia zależność, czy tylko wspólna tradycja filozoficzna. Geometria stała się pierwszą wyspecjalizowaną dziedziną wiedzy, uprawianą nie ze względów praktycznych, lecz dla niej samej. Wysokie mniemanie o pedagogicznych wartościach geometrii żywił Platon, sądząc, że kieruje ona uwagę ku temu, co wieczne i niezmienne. Stobajos przytacza następującą anegdotę:

Ktoś zaczął się uczyć u Euklidesa i kiedy poznał pierwsze twierdzenie, spytał:
– Co mi przyjdzie z tego, żem się tego nauczył?

Na to Euklides zawołał niewolnika i powiedział:

– Daj mu trzy obole, jeśli musi mieć zysk z tego, czego się uczy.

Omówimy bliżej główne linie rozumowania księgi I Elementów. Tekst poprzedzają 23 definicje, np. „Punkt jest tym, co nie ma żadnych części”, „Linia zaś jest długością bez szerokości”, „Równoległe są proste, które będąc na tej samej płaszczyźnie rozciągają się bez kresu w obie strony, ale w żadnej części się nie przetną” (przeł. M. Roszkowski). Linia prosta u Euklidesa jest zawsze skończona, tzn. jest odcinkiem wedle dzisiejszej terminologii. Dzisiejsi matematycy nie definiują wszystkich pojęć danej teorii, część z nich muszą bowiem stanowić pojęcia pierwotne, które przyjmuje się bez definicji, a ich sens ujawnia się dopiero, gdy badamy, w jaki sposób pojęcia występują one w aksjomatach i twierdzeniach.

Pięć postulatów głosi kolejno, że

1. Z każdego punktu do każdego innego można poprowadzić prostą (odcinek).
2. Odcinek można (obustronnie) przedłużać.
3. Z dowolnego środka można zakreślić okrąg przechodzący przez dany punkt.
4. Wszystkie kąty proste są wzajemnie równe.
5. Jeśli prosta przecina dwie inne proste, tworząca dwa kąty wewnętrzne mniejsze (w sumie) od dwóch kątów prostych, to można owe dwie proste przedłużyć tak, aby się przecięły.

Kąt prosty zdefiniowany jest tak, jak to widać na rysunku: gdy oba kąty utworzone przez półprostą o początku leżącym na danej prostej są równe, to kąty są kątami prostymi. Postulat 4 głosi, że dowolne kąty proste są równe, co znaczy tyle, że są przystające – mogą być na siebie nałożone tak, aby ich wierzchołki oraz ramiona się pokrywały (Euklides nie mówi tego wprost).

Pięć aksjomatów ogólnych stwierdza (w redakcji M. Kordosa):
1. Dwie wielkości równe trzeciej są równe.
2. Dodając do równych równe, dostajemy równe.
3. Odejmując od równych równe, dostajemy równe.
4. Wielkości dające się zamienić są równe.
5. Część jest mniejsza od całości.

Aksjomaty te stosowane są do porównania długości, kątów, figur, jak np. trójkąty. Mniejszy oznacza np. w przypadku odcinków, że po ich nałożeniu zostaje jeszcze jakaś niepokryta część większego (całości). Euklides nie posługuje się żadnymi miarami, porównuje tylko wielkości między sobą. Dlatego np. trójkąty są równe, gdy są przystające (można je na siebie nałożyć), ale także, gdy mają np. wspólną podstawę oraz jednakowe wysokości – dziś powiedzielibyśmy, że ich pola powierzchni są równe. Euklides nie myślał o długości jako liczbie, ani o polu prostokąta jako iloczynie długości boków, porównywał co najwyżej między sobą dwie wielkości.

Cały wykład podzielony jest na zagadnienia, które mogą być albo rozwiązaniem problemu konstrukcyjnego, albo twierdzeniem. W księdze I znajduje się 48 zagadnień, twierdzenie I,47 to twierdzenie dziś nazywane tw. Pitagorasa, I,48 to twierdzenie do niego odwrotne. Przyjrzyjmy się postępowaniu Euklidesa. Stosujemy dla przejrzystości nieco uwspółcześnioną terminologię, sformułowania nasze nie są wprawdzie dosłownym przekładem oryginału, ale też i nie odbiegają od niego zbyt daleko.

I,1 Mając dany odcinek AB, skonstruować na nim trójkąt równoboczny.

Konstrukcja sprowadza się do zakreślenia dwóch okręgów (Post. 3), które wyznaczą punkty przecięcia (co jednak nie wynika z aksjomatów Euklidesa, choć jest prawdą). Mając punkt przecięcia C, budujemy dwa odcinki AB oraz BC (Post. 1). Odcinki te są równe, ponieważ równe są odcinkowi AB (Aksj. 1). Trójkąt jest więc równoboczny. Warto zwrócić uwagę na eliminowanie kroków „oczywistych” i zastępowanie ich odwołaniami do postulatów i aksjomatów – w tym leży matematyczna siła Euklidesa, choć w oczach mniej matematycznie nastawionego czytelnika wywołuje to wrażenie (może nadmiernej) pedanterii.

I,2 Mając dany odcinek BC oraz punkt A nie leżący na nim, skonstruować odcinek AE=BC.

Łączymy w tym celu punkty AB (Post. 1) i budujemy trójkąt równoboczny za pomocą I,1. Promieniem BC zakreślamy okrąg o środku B (Post. 3). Przedłużamy następnie odcinek BD (Post. 2) do przecięcia z tym okręgiem H. Następnie promieniem HD zakreślamy okrąg o środku D. Przedłużenie AD (Post. 2) przetnie się z tym okręgiem w punkcie E. Odcinek AE (Post. 1) jest szukanym odcinkiem równym BC. Z aksjomatów ogólnych łatwo wnioskujemy, że odcinki te są równe, tzn. równe są ich długości (promień większego okręgu na rysunku to suma AB i boku trójkąta, odejmując potem bok trójkąta, otrzymujemy naszą tezę).
Warto zauważyć, że konstrukcje Euklidesa wykonywane są za pomocą linijki bez żadnej skali oraz cyrkla, który także nie pozwala przenosić odległości, lecz tylko poprwadzić okrąg z danego środka przez dany punkt (po przeniesieniu cyrkiel „nie pamięta” swego rozwarcia). Dzięki I,2 możemy uwolnić się od tego ograniczenia i odtwarzać odległość dwóch punktów w innym miejscu.

I,4 Dwa trójkąty, których dwa boki oraz zawarty między nimi kąt są równe, są przystające (równe).

Jest to cecha przystawania trójkątów bok-kąt-bok (bkb). Euklides dowodzi tego twierdzenia, nakładając na siebie oba trójkąty. Nie jest to postępowanie oczywiste, jeśli nie uważamy naszych figur za sztywne obiekty, które można przemieszczać bez zmiany kształtu i długości. David Hilbert przyjął w XIX w. to twierdzenie za jeden z aksjomatów w swoim wykładzie geometrii euklidesowej.

I,5 W trójkącie równoramiennym ABC, w którym AB=BC, kąty wewnętrzne przy podstawie są równe.

Przedłużamy ramiona trójkąta o jednakowe odcinki BF=CG. Trójkąty ABG i ACF są przystające na mocy poprzedniego twierdzenia, zatem także kąty ABG oraz ACF są równe. Trójkąty BFC i CGB są przystające na mocy tego samego twierdzenia (kąty BFC i BGC są równe, gdyż oba trójkąty pierwszej pary są przystające). Kąty ABC i BCA można przedstawić jako różnicę odpowiednio równych kątów (np. \sphericalangle ABC=\sphericalangle ABG-\sphericalangle CBG), muszą zatem być równe.
Twierdzenie to zyskało w średniowieczu nazwę Pons asinorum („ośli most”), nie wiadomo, czy z powodu kształtu towarzyszącego mu rysunku, czy też dlatego, że w tym miejscu ujawniał się już podział na tych, którzy rozumieją geometrię i na tych, którzy jej nie rozumieją. Pappus przedstawił prostszy dowód, w którym I,4 stosujemy do trójkątów BAC i CAB: ich boki są parami równe, a kąt przy wierzchołku jest tym samym kątem BAC, zatem oba trójkąty są przystające i kąty przy podstawie są równe. Euklides mógł mieć opory przeciwko takiemu potraktowaniu jednego trójkąta jako dwóch.

I,6 Jeśli kąty przy podstawie trójkąta są równe, to trójkąt jest równoramienny.

Euklides dowodzi tego twierdzenia przez sprowadzenie do niedorzeczności (reductio ad absurdum). Zakładamy, że teza twierdzenia jest fałszywa, a następnie staramy się wykazać, że wynika stąd zaprzeczenie założeń twierdzenia. Jeśli AB\neq AC, to któryś z odcinków jest większy, tzn. ma większą długość. Załóżmy, że AB>AC. Możemy wówczas na odcinku AB odłożyć odcinek AD=AC. Kąt DCB jest zatem mniejszy od kąta ACB. Jednocześnie trójkąt DBC jest równoboczny, a więc kąty DCB i DBC są równe na mocy poprzedniego twierdzenia. Kąt DBC jest tym samym, co kąt ABC, ergo ABC jest mniejszy od ACB wbrew założeniu.

I,9 Skonstruować dwusieczną danego kąta.

Na ramionach kąta odkładamy równe odcinki AD i AE. Następnie na odcinku AD konstruujemy trójkąt równoboczny. Jego trzeci wierzchołek wraz z wierzchołkiem kąta wyznaczają szukaną dwusieczną, co można łatwo udowodnić: kąty ADE i AED są równe jako kąty przy podstawie trójkąta równoramiennego. W takim razie także kąty ADF i AEF są równe i oba trójkąty ADF i AEF są przystające. Wobec tego kąty DAF i FAE są równe c.n.d.

I,11 Skonstruować prostopadłą do danej prostej w punkcie D.

Wyznaczamy na prostej dwa punkty A i B w równych odległościach od D: AD=DB. Następnie na odcinku AB konstruujemy trójkąt równoboczny. Jego trzeci wierzchołek C wraz z punktem D wyznaczają szukaną prostopadłą. Aby to udowodnić, zauważamy, że trójkąty ADC i BDC są przystające, a zatem kąty CDA i CDB są równe – spełniona jest więc definicja kąta prostego i oba te kąt są równe kątowi prostemu. Tym samym DC jest prostopadła do prostej AB.

I,20 (Nierówność trójkąta) Dwa boki trójkąta razem są dłuższe od trzeciego boku.

Niech będzie dany trójkąt CAB, chcemy dowieść, że odcinki AC wraz z CB są większe od AB. W tym celu na przedłużeniu AC odkładamy odcinek CD=CB. Kąt ABD jest większy od kąta CBD. Ten ostatni równy jest kątowi CDB, czyli ADB. W trójkącie ABD naprzeciwko większego kąta leży większy bok (I, 19; nie przytaczamy dowodu), a zatem AD=AC+CB>AB (stosując współczesny zapis).
Z twierdzenia tego wynika, że długość łamanej łączącej dwa punkty jest zawsze większa niż długość odcinka łączącego te punkty. W konsekwencji, jeśli połączymy oba punkty jakąś krzywą gładką, ale taką że zarówno samą krzywą, jak i jej długość można dowolnie przybliżać za pomocą łamanych, to długość łuku krzywej nie może być mniejsza niż długość odcinka łączącego dane punkty. Inaczej mówiąc, odcinek jest krzywą o najmniejszej długości (przy ustalonych obu końcach). Euklides nie dowodzi takiego twierdzenia, ale było ono znane greckim geometrom.
Dopiero blisko połowy księgi I staje się potrzebny Postulat 5.

I,29 Jeśli prosta EF przecina parę prostych równoległych AB i CD, to kąty naprzemianległe wewnętrzne są równe.

Wykażemy, że kąt AGF równy jest kątowi EHD. Załóżmy, że oba te kąty nie są równe. Niech np. AGF będzie większy od EHD. Ponieważ kąty AGF i BGF dopełniają się do dwóch kątów prostych (I,14; nie przytaczamy dowodu), więc suma kątów BGF i EHD jest mniejsza od dwóch kątów prostych. Z Post. 5 wynika, że proste AB i CD (po ewentualnym przedłużeniu) przetną się, nie są zatem – wbrew założeniu – prostymi równoległymi.
Postulat 5 sformułowany został tak, aby wygodnie się nim było posługiwać do wykazania, że dwie proste nie są równoległe. Nie wydawał się on tak oczywisty jak pozostałe i wzbudzał zawsze rozmaite wątpliwości. Jest on równoważny innemu postulatowi sformułowanemu przez Playfaira: Przez punkt nie leżący na danej prostej można przeprowadzić dokładnie jedną prostą równoległą do danej. Postulat 5 jest także równoważny twierdzeniu o sumie kątów wewnętrznych trójkąta.

I,32 Suma kątów wewnętrznych trójkąta równa jest dwóm kątom prostym.

Wystarczy zauważyć równość zaznaczonych kątów na rysunku (linia przerywana jest równoległa do boku trójkąta).

I,47 (Tw. Pitagorasa) W trójkącie prostokątnym suma kwadratów zbudowanych na przyprostokątnych jest równa kwadratowi zbudowanemu na przeciwprostokątnej.

Zwróćmy uwagę na sformułowanie: należy najpierw skonstruować kwadraty, o których mowa w twierdzeniu, a następnie wykazać, że suma (pól) dwóch mniejszych kwadratów jest równa polu kwadratu największego. Wysokość trójkąta opuszczona z kąta prostego po przedłużeniu dzieli kwadrat na dwa prostokąty. Euklides wykazuje, że dla trójkąta ABΓ oba pola zaznaczone na zielono oraz oba pola zaznaczone na niebiesko są równe.

Dowód Euklidesa korzysta z konstrukcji I,46 kwadratu na danym odcinku oraz linii równoległej do BΔ i ΓE przechodzącej przez dany punkt A (I,31). Wykazuje następnie, że AH jest przedłużeniem AΓ oraz AΘ jest przedłużeniem AB (I,14). Trójkąty ABΔ oraz ZBΓ są przystające na mocy twierdzenia I,4 (bkb). Prostokąt BΛ o podstawie BΔ ma tę samą wysokość co trójkąt ABΔ o tej samej podstawie. Na mocy I,41 prostokąt jest dwa razy większy od trójkąta (to wynik równoważny wzorowi na pole trójkąta, gdy określimy pole prostokąta). Kwadrat BH jest z tego samego powodu dwa razy większy od trójkąta ZBΓ o podstawie ZB. W analogiczny sposób pokazać można, że oba pola zaznaczone na niebiesko są równe, co kończy dowód.

W księdze VI Euklides przytacza inny dowód tw. Pitagorasa, oparty na podobieństwie mniejszych trójkątów na rysunku i trójkąta wyjściowego. Ten drugi dowód znany był prawdopodobnie wcześniej, dowód I,47, pochodzący zapewne od samego Euklidesa, jest bardziej zadowalający matematycznie, gdyż używa mniejszej liczby założeń: w księdze I daleko jeszcze jesteśmy od tak subtelnych konstrukcji jak figury podobne.
Ostatnie twierdzenie tej księgi I,48 jest odwrotne do tw. Pitagorasa: Jeśli spełniony jest warunek pól dla kwadratów zbudowanych na bokach trójkąta, to trójkąt ów jest prostokątny.

Elementy są podręcznikiem i były nim już w chwili powstania. Ścisłość rozumowań Euklidesa stała się wzorem dla przyszłych matematyków. Wybitny matematyk XX wieku André Weil pisał: „ [Elementy] Euklidesa to pierwszy zachowany tekst matematyczny, w którym pojęcie dowodu utożsamione zostało z łańcuchem wnioskowań pozbawionym luk; nie bez powodu ten sposób widzenia przedmiotu zachował swą aktualność do dziś”.

Nie sposób oczywiście przedstawić nawet pobieżnie wpływu książki czytanej w ciągu dwudziestu kilku wieków przez tysiące ludzi: wybitnych matematyków, jak i myślicieli czy po prostu uważnych czytelników mniej lub bardziej oddalonych od nauk ścisłych.

Greckie manuskrypty Elementów przechowywane były w Bizancjum. Od nich pochodziły przekłady arabskie, które z kolei dały początek rozpowszechnianiu się tekstu zarówno na Wschód (języki hebrajski, syryjski, perski), jak i na Zachód (łacina). W europejskim średniowieczu przekładano Euklidesa z arabskiego na łacinę wielokrotnie w wieku dwunastym i później. Już sama międzynarodowa lista tłumaczy daje pojęcie o zainteresowaniu Elementami: Adelard z Bath, Hermann z Karyntii, Gerard z Cremony, Robert z Chester, Campanus z Novary. Przekład tego ostatniego stał się podstawą pierwszego drukowanego wydania Elementów w Wenecji w roku 1482. W XVI wieku udało się też dotrzeć do tekstu greckiego (w wersji Teona). Od tamtej pory ukazały się niezliczone wydania oraz przekłady na języki narodowe (brak nadal kompletnego przekładu polskiego, choć już w 1808 Józef Czech, dyrektor Liceum Krzemienieckiego, przełożył osiem ksiąg, opierając się na angielskiej wersji Roberta Simonsa).

Twierdzenie Pitagorasa w weneckim wydaniu z 1482 r. (numeracja twierdzenia lekko w nim szwankowała)

Geometria oraz arytmetyka miały w średniowieczu mocną pozycję jako sztuki wyzwolone wchodzące w skład quadrivium („czterodroże”) wraz z astronomią i muzyką (która obejmowała głównie teoretyczną naukę o proporcjach dźwięków w różnych skalach). Także i później podstawy geometrii stanowiły nieodzowny element wykształcenia, Elementów długo jeszcze używano jako podręcznika. Bertrand Russell, logik i filozof, wspomina: „W wieku jedenastu lat zacząłem Euklidesa z moim bratem w roli tutora. Było to w moim życiu wielkie wydarzenie, równie olśniewające co pierwsza miłość. Wcześniej nie wyobrażałem sobie nawet, że istnieje na świecie coś tak zachwycającego. Kiedy przeszedłem Zagadnienie 5 (Pons asinorum), brat powiedział mi, że powszechnie uchodzi ono za trudne, ja jednak nie napotkałem w nim żadnych trudności. To wtedy po raz pierwszy zaświtało w mej głowie, że może obdarzony zostałem jakąś inteligencją”. Kilka lat młodszy Albert Einstein nie uczył się wprawdzie z Elementów, lecz z podręcznika będącego ich zmodernizowaną wersją; także dla niego odkrycie geometrii było wielkim przeżyciem, wspominał potem podręcznik jako „świętą książeczkę”, co w jego ustach – uduchowionego niedowiarka i spinozisty – miało swoją wymowę. Einstein sądził wręcz, że głęboki wstrząs intelektualny, jaki wówczas przeżył, stanowi niejako rodzaj probierza, czy ktoś się do nauki nadaje, czy nie. Zanim jeszcze podręcznik trafił w jego ręce, udało mu się znaleźć dowód twierdzenia Pitagorasa oparty na podobieństwie trójkątów (VI,31).

Metoda geometryczna kusiła też filozofów. Thomas Hobbes, mając już czterdzieści lat, natknął się w bibliotece znajomego gentlemana na egzemplarz Elementów, które otwarte były na stronie zawierającej twierdzenie Pitagorasa. Przeczytawszy jego treść, wykrzyknął: na Boga, to niemożliwe! Potem jednak cofając się stopniowo do twierdzeń, na których oparty był dowód, zrozumiał, że rozumowanie Euklidesa jest bez zarzutu. René Descartes sam był wybitnym matematykiem i z geometrią zapoznał się wcześnie w jezuickim kolegium w La Flèche. Właśnie na goemetrii wzorował się w swym podejściu do filozofii, która miała być nowym początkiem ludzkiej wiedzy. „Owe długie łańcuchy uzasadnień, zupełnie proste i łatwe, którymi zazwyczaj posługują się geometrzy, by dotrzeć do swych najtrudniejszych dowodzeń, dały mi sposobność do wyobrażenia sobie, że wszystkie rzeczy dostępne poznaniu ludzkiemu wynikają w taki sam sposób wzajemnie ze siebie, a także, że nie mogą istnieć tak odległe, do których byśmy wreszcie nie dotarli, i tak ukryte, których byśmy nie wykryli, bylebyśmy tylko nie przyjmowali za prawdziwą żadnej rzeczy, która by prawdziwą nie była, i zachowywali zawsze należyty porządek w wyprowadzaniu jednych z drugich” (przeł. W. Wojciechowska, Rozprawa o metodzie, PWN 1981, s. 23). Zdaniem Immanuela Kanta przedmioty, które bada matematyka: przestrzeń i czas nie pochodzą z doświadczenia, ale mają swe źródło w poznającym przedmiocie. Geometria stała się w ten sposób nauką o jedynie możliwej przestrzeni.

Tymczasem matematycy nabierali coraz więcej wątpliwości. Karl Friedrich Gauss już w roku 1813 rozmyślał nad geometrią nieuklidesową, lecz oportunistycznie nie zdecydował się na publikację swych wyników. Także Ferdinand Karl Schweikart, profesor prawa, rozwijał podobne idee w zaciszu gabinetu. Dopiero János Bolyai i Nikołaj Iwanowicz Łobaczewski, niezależnie od siebie zaryzykowali publikację prac sprzecznych z dotychczasową tradycją, nie były one przyjęte dobrze. Obaj zajmowali się geometrią hiperboliczną, w której istnieje nieskończenie wiele prostych równoległych do danej prostej. Postulat 5 Euklidesa jest bowiem niezależny od pozostałych i równie dobrze można zbudować konsekwentną geometrię, wychodząc z jego zaprzeczenia. Pod koniec XIX wieku David Hilbert podał ścisłe sformułowanie geometrii euklidesowej. Znalazło się w nim dwadzieścia aksjomatów, trzy pojęcia pierwotne (punkt, linia prosta, płaszczyzna) oraz cztery relacje pierwotne (leżenia pomiedzy, zawierania oraz przystawania odcinków oraz kątów). Różnica w podejściu między dawną geometrią a jej nowoczesnym, abstrakcyjnym sformułowaniem podkreślona została przez Hilberta następująco: „Powinno się w każdej chwili móc wstawić w miejsce punktów, linii i płaszczyzn – stoły, krzesła i kufle do piwa” (oczywiście pod warunkiem, że obiekty te spełniają aksjomaty geometrii).

Dlaczego grawitacja wiąże się z krzywizną czasoprzestrzeni?

  • Przeniesienie równoległe

Wyobraźmy sobie najpierw powierzchnię zanurzoną w przestrzeni euklidesowej. Załóżmy, że określiliśmy na niej pewne współrzędne x=(x^1, \ldots, x^n) . Położenie punktu powierzchni możemy więc zapisać jako \vec{r}=\vec{r}(x^i) . Pochodne tego wektora po współrzędnych, utworzą zbiór wektorów stycznych do naszej powierzchni:

\vec{e}_j=\dfrac{\partial \vec{r}}{\partial x^j}.

Dowolny wektor styczny do powierzchni w danym punkcie można przedstawić jako kombinację liniową \vec{e}_j:

\vec{v}=v^j \vec{e}_j,

gdzie sumujemy po powtarzającej się parze wskaźników: górnym i dolnym. Jest to tzw. konwencja Einsteina, uczony mówił żartobliwie, że stanowi ona jego największe odkrycie matematyczne. W geometrii ważną rolę odgrywa równoległość: wiemy, co znaczy, że dwa wektory w przestrzeni euklidesowej są równoległe. Można koncepcję równoległości przenieść na nieskończenie bliskie wektory na zakrzywionej powierzchni. W przestrzeni euklidesowej nasz wektor \vec{v} ma pozostać stały, co oznacza, że

\delta\vec{v}=0=\delta v^j \vec{e}_j+v_j \delta \vec{e}_j.

W drugim wyrazie uwzględniliśmy, że nasza baza względem przestrzeni euklidesowej może się obracać. Zmiana każdego z wektorów bazy powinna być równa:

\delta\vec{e}_j=\dfrac{\partial \vec{r}}{\partial x^j \partial x^i }\delta x^i\stackrel{.}{=}{\Gamma}^k_{ij}\delta x^i \vec{e}_k.

Ostatnia równość \stackrel{.}{=} to w istocie rzut wektora z lewej strony na płaszczyznę styczną, pomijamy więc tę część wektora, która „wystaje” z powierzchni. Podstawiając to do warunku równoległości, otrzymujemy

\delta v^k=-\Gamma_{ij}^k v^i \delta x^j. \mbox{ (*)}

Oznacza to, że współrzędne wektora równoległego nieco się zmienią i zmianę tę opisują współczynniki \Gamma , zwane uczenie koneksją afiniczną. Znając funkcje koneksji, możemy dokonać przesunięcia równoległego wektora. Jeśli rozpatrzymy pewną krzywą x^j=x^j(\tau) (gdzie \tau jest czasem własnym), pochodne współrzędnych utworzą wektor prędkości styczny do toru:

v^k=\dfrac{d x^k}{d\tau}.

Najprostszym fizycznie ruchem będzie przesunięcie równoległe tego wektora wzdłuż krzywej (linii świata):

\delta \left(\dfrac{d x^k}{d\tau}\right)=-\Gamma_{ij}^k v^i \delta x^k,

skąd otrzymujemy równanie geodezyjnej:

\dfrac{{d\,}^2 x^k}{d\tau^2}+\Gamma_{ij}^k \,\dfrac{d x^i}{d\tau}\,\dfrac{d x^j}{d\tau}=0. \mbox{ (**)}

Jest to warunek na przeniesienie równoległe wektora prędkości wzdłuż krzywej, a więc coś najbliższego ruchowi jednostajnemu i prostoliniowemu z I zasady dynamiki.

Możemy teraz zapomnieć o przestrzeni euklidesowej i rozpatrywać przestrzeń, w której określone są współczynniki koneksji. Mamy wówczas krzywe geodezyjne – coś najbardziej zbliżonego do linii prostej. W teorii względności krzywe geodezyjne opisują ruch cząstki pod działaniem pola grawitacyjnego. Jak widać współczynniki koneksji komplikują równania ruchu i można je uważać za składowe pola grawitacyjnego, czy dokładniej grawitacyjno–bezwładnościowego. Kiedy współczynniki koneksji znikają, wracamy do ruchu prostoliniowego i szczególnej teorii względności (tzn. nie ma pola grawitacyjnego).

Równania geodezyjnej mogą więc nieść informację o polu grawitacyjnym. Zgodnie z zasadą równoważności nic tu nie zależy od masy poruszającej się cząstki. Okazuje się, że można za pomocą koneksji opisać grawitację także w mechanice klasycznej (zrobił to É. Cartan, już znając teorię Einsteina). Automatycznie opisujemy też siły bezwładności. Z punktu widzenia fizyka wcale nie jest dziwne, że w równaniu geodezyjnej mamy aż dwie prędkości: powinniśmy bowiem w tym formalizmie otrzymać zarówno siły Coriolisa liniowe w prędkości, jak i siły odśrodkowe, kwadratowe w prędkości. Z punktu widzenia zasady równoważności nie możemy lokalnie rozstrzygnąć, czy w naszym przypadku mamy do czynienia z polem grawitacyjnym, czy siłami bezwładności.

  • Krzywizna

Koneksja pozwala nam przenosić wektory równolegle wzdłuż krzywej. Wynik takiego przesuniecia może więc zależeć od kształtu krzywej. Aby zobaczyć, jak to działa, rozpatrzmy przesunięcie równoległe wektora v^i po infinitezymalnym zamkniętym równoległoboku geodezyjnych: po drodze x, x+\delta a, x+\delta a+\delta b, x+\delta b, x. Łączna zmiana wektora dana jest wyrażeniem:

\delta v^i=-\Gamma_{kj}^i(x) v^k(x) \delta a^j-\Gamma_{kj}^i(x+\delta a) v^k(x+\delta a) \delta b^j\\ \\ +\Gamma_{kj}^i(x+\delta b) v^k(x+\delta b) \delta a^j+\Gamma_{kj}^i(x) v^k(x) \delta b^j.

Można to wszystko zapisać w postaci:

\delta v^i=R^i_{kjl} v^k \delta b^j \delta a^l, \mbox{(***)}

gdzie R^i_{kjl} nazywa się tensorem krzywizny Riemanna i wyraża wzorem:

R^i_{kjl}=\Gamma^i_{lk,j}-\Gamma^i_{jk,l}+\Gamma^i_{jm}\Gamma^m_{kl}-\Gamma^i_{lm}\Gamma^m_{kl}.

W ostatnim wyrażeniu przecinki przed indeksem oznaczają różniczkowanie po odpowiedniej współrzędnej: A_{,i}\equiv\frac{\partial}{\partial x^i}. Przestrzeń jest zakrzywiona wtedy i tylko wtedy, gdy tensor krzywizny jest różny od zera. (Wektory i tensory transformują się w odpowiedni sposób przy zmianie układu współrzędnych, tak że znikanie w jednym układzie oznacza znikanie we wszystkich.) Koneksja jest zatem nietrywialna, gdy tensor krzywizny znika. Równanie (***) można zilustrować poglądowo: zmiana wektora proporcjonalna jest tu do pola powierzchni równoległoboku. Ponieważ każdą powierzchnię możemy rozbić na takie równoległoboki, więc łączna zmiana wektora w przesunięciu równoległym po zamkniętej pętli powinna być związana z krzywizną oraz polem powierzchni pętli. W przypadku sfery krzywizna jest stała i kąt obrotu wektora jest proporcjonalny do pola powierzchni pętli. W teorii względności pojawienie się krzywizny oznacza, że mamy nietrywialne pole grawitacyjne.

Tensor krzywizny ma wiele symetrii, które sprawiają, że ma nieco mniej niezależnych składowych, niż to wygląda na pierwszy rzut oka. W przypadku dwuwymiarowej powierzchni ma tylko jedną składową, w czterowymiarowej – dwadzieścia.

Klasycznym zastosowaniem przeniesienia równoległego jest wahadło Foucaulta.

  • Równanie dewiacji geodezyjnej

Brzmi to okropnie, nieco bardziej logiczne jest określenie: dewiacja linii geodezyjnych. Chodzi o to, co dzieje się wzdłuż pobliskich linii geodezyjnych. Możemy sobie wyobrazić dwie cząstki pyłu, które znajdują się nieskończenie blisko siebie w chwili początkowej. Obserwujemy, jak bedzie się zachowywać z czasem ich odległość mierzona różnicami współrzędnych. Zakladamy, że rozsądnie zaczynamy liczyć czas, tak żeby ułatwić porównanie dwóch ruchów.

Równanie dewiacji ma następującą postać:

\dfrac{D^2 \eta^i}{D\tau^2}=R^i_{jkl}\,\dfrac{dx^j}{d\tau}\,\dfrac{dx^k}{d\tau}\,\eta^l.

Różniczkowanie po lewej stronie oznacza pochodną po czasie własnym obliczoną jednak z uwzględnieniem przeniesienia równoległego. Nie możemy bowiem porównywać w przestrzeni zakrzywionej wektorów w dwóch różnych punktach przestrzeni, najpierw należy przenieść jeden z nich do punktu zaczepienia drugiego. Różnicę wektora wzdłuż krzywej wynikającą z jego zmiany: \frac{d\eta^i}{d\tau}d\tau należy poprawić, odejmując zmianę wynikającą z przesunięcia (*), łącznie otrzymamy

\dfrac{D\eta^i}{D\tau}=\dfrac{d\eta^i}{d\tau}+\Gamma^i_{jk}\,\dfrac{dx^j}{d\tau}\,\eta^k.

Jest to tzw. pochodna absolutna wzdłuż krzywej. Używając tego zapisu, możemy równanie geodezyjnej (**) zapisać w postaci

\dfrac{D}{D\tau}\dfrac{dx^i}{d\tau}=0.

Pochodna absolutna znika, gdy współrzędne wektora zmieniają się jedynie za sprawą przesunięcia równoległego, czyli w sensie fizycznym można powiedzieć, że się nasz wektor nie zmienia – przenosi się jedynie równolegle wzdłuż krzywej.

  • Równania pola Einsteina

Warto zauważyć, że do tej pory nie mówiliśmy nic o metryce naszej przestrzeni. W szczególnej teorii względności mamy naturalną miarę odległości dwóch zdarzeń w czasoprzestrzeni:

ds^2=dt^2-dx^2-dy^2-dz^2.

(Przyjmujemy c=1.) W zakrzywionej czasoprzestrzeni ogólnej teorii względności możemy zawsze wprowadzić taki układ współrzędnych, w którym interwał ds^2 przyjmie powyższą postać w danym punkcie. Nie można natomiast zwykle zrobić tego globalnie. Interwał czasoprzestrzenny ogólnie biorąc określa tensor metryczny g_{\mu\nu}. Podaje on przepis na obliczenie interwału za pomocą danych współrzędnych (gdy zmienimy współrzędne, postać metryki też się odpowiednio zmieni):

ds^2=g_{\mu\nu}dx^{\mu}dx^{\nu}.

Tutaj wskaźniki \mu,\nu=0,1,2,3. Mamy tu 10 niezależnych wartości (symetryczna macierz 4×4). Z matematycznego punktu widzenia koneksja i metryka to dwie różne struktury. Można je uzgodnić i tak jest w ogólnej teorii względności. Koneksja oraz tensor krzywizny wyrażają się przez metrykę. Lokalnie, w danym punkcie, nie tylko metryka może przybrać wartości znane ze szczególnej teorii względności, ale także współczynniki koneksji mogą znikać. Nie ma natomiast takiej transformacji współrzędnych, która sprowadza tensor Riemanna do zera, jeśli był niezerowy w innym układzie współrzędnych. Tensor Riemanna zawiera pierwsze i drugie pochodne metryki. Geodezyjne możemy też zdefiniować jako krzywe najkrótszej/najdłuższej długości, i są to wówczas te same geodezyjne co zdefiniowane wyżej.

Z fizycznego punktu widzenia metryka przypomina potencjał, a współczynniki koneksji – siły. Jaką postać moze mieć równanie pola w teorii Einsteina? Źródłem pola grawitacyjnego są masy, a u Einsteina także pędy i energie. Dla zbioru cząstek opisu dostarcza symetryczny tensor energii pędu: T_{\mu\nu}. Potrzebujemy więc jakiegoś tensora krzywizny o dwóch wskaźnikach. Taką wielkością jest tensor Ricciego zdefiniowany jako

R_{\mu\nu}=R^{\lambda}_{\mu\lambda\nu},

(sumowanie po wskaźnku \lambda). Można więc oczekiwać równania typu

R_{\mu\nu}=\kappa T_{\mu\nu}.

I jest to prawie dobre równanie, należy tylko zmodyfikować w nim lekko lewą stronę. Rzecz w tym, że tensor energii pędu powinien być zachowany, a lewa strona, tensor Ricciego nie spełnia tego warunku. Należy zastąpić go więc tensorem Einsteina:

G_{\mu\nu}=R_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R=\kappa T_{\mu\nu},

gdzie R to skalar Ricciego: R=g^{\mu\nu}R_{\mu\nu} (g^{\mu\nu} jest macierzą odwrotną do g_{\mu\nu}. Jest to subtelność techniczna, na którą natrafił Einstein w listopadzie 1915 roku: 11 listopada proponuje pierwszą wersję, a 25 listopada tę niższą, już prawidłową. Ostatnie równanie można też przepisać w równoważnej postaci:

R_{\mu\nu}=\kappa (T_{\mu\nu}-\frac{1}{2}g_{\mu\nu}T^{\lambda}_{\lambda}).

W dalszym ciągu przyda nam się składowa 00 tego równania, w najprostszej sytuacji spoczywającej materii tylko składowa 00 tensora energii pędu jest różna od zera i równa jest gęstości materii \varrho. Otrzymamy wówczas

R_{00}=\kappa (T_{00}-\frac{1}{2}T_{00})=\frac{1}{2}\kappa T_{00}=\frac{1}{2}\kappa \varrho.

Aby znaleźć stałą \kappa, należy skorzystać z równań dla grawitacji Newtonowskiej, która powinna być przypadkiem granicznym.

W tym celu wyobraźmy sobie równanie dewiacji zastosowane do dwóch swobodnie spadających cząstek. Zakładamy, że w chwili początkowej \tau=0 obie spoczywają względem siebie. Wybieramy układ współrzędnych związany z cząstką centralną (względem której obliczana jest dewiacja). W takim układzie odniesienia czas własny i czas t są tym samym. Dla wskaźników przestrzennych i=1,2,3 równanie dewiacji sprowadza się do

\dfrac{d^2\eta^i}{dt^2}=R^{i}_{00l}\eta^l=-R^i_{0l0}\eta^l.

Skorzystaliśmy z faktu, że nasza cząstka centralna spoczywa: \frac{dx^\mu}{dt}=(1,0,0,0). W drugiej równości zmieniliśmy znak wraz z przestawieniem pary ostatnich wskaźników w tensorze Riemanna. Wynik ten obowiązuje dla trzech przyspieszeń wzdłuż trzech osi kartezjańskich. Załóżmy, że mamy kulę pyłu o promieniu r, początkowo nieruchomą, której środek obraliśmy za początek wektora \eta. Objętość kuli to

V=\dfrac{4\pi}{3}r_x r_y r_z,

gdzie zaznaczyliśmy, że wzdłuż trzech osi kartezjańskich promienie mogą się zmieniać niezależnie (przekształcając kulę w elipsoidę). Obliczając drugą pochodną objętości w chwili t=0 (pamiętamy, że pierwsze pochodne znikają), otrzymujemy:

\dfrac{\ddot{V}}{V}=\dfrac{\ddot{r}_x}{r_x}+\dfrac{\ddot{r}_y}{r_y}+\dfrac{\ddot{r}_z}{r_z}=-R_{00}.

W ostatniej równości, skorzystaliśmy z faktu, że R^0_{000}=0 – można więc sumowanie po wskaźnikach przestrzennych rozszerzyć o wskaźnik czasowy. Możemy tę samą wielkość obliczyć z Newtonowskiego prawa ciążenia. Przyspieszenie grawitacyjne na powierzchni kuli pyłu o masie M równe jest

g=\dfrac{GM}{r^2},

Wobec tego druga pochodna objętości spełnia równanie

\dfrac{\ddot{V}}{V}=-3\dfrac{g}{r}=-4\pi G \varrho.

gdzie \varrho to gęstość naszej kuli (&). Zatem szukana stała równa jest \kappa=8\pi G. Równanie Einsteina powinno mieć zatem postać.

G_{\mu\nu}=8\pi G T_{\mu\nu}.

Podsumowując, w roku 1915 Albert Einstein (podobnie zresztą jak najlepsi ówcześni matematycy) nie rozumiał dokładnie roli tensora Ricciego i nie widział, że równania pola są praktycznie wyznaczone przez kilka dość prostych warunków matematycznych. Oczywiście, nie są to jedyne możliwe matematycznie równania, ale jak pokazują przykłady późniejszych teorii grawitacji (a było ich przez sto lat sporo), równania Einsteina są najprostsze i jak dotąd potwierdzane są przez obserwacje. Kiedy później uczony zrozumiał, że w gruncie rzeczy można by dojść do teorii grawitacji drogą matematyczną, zaczął wyżej cenić osiągnięcia czystej matematyki. Stało się to poniekąd źródłem jego późniejszych niepowodzeń przy konstrukcji jednolitej teorii pola: z braku danych fizycznych szukał bowiem drogi matematycznej. Skonczyło się na dość jałowych próbach, które nie wzbogaciły zbytnio ani matematyki, ani fizyki.

(&) Nie jest to całkiem ścisłe rozumowanie, ponieważ milcząco założyliśmy, że nie ma innej materii niż kula pyłowa. Naprawdę należałoby obliczyć strumień pola grawitacyjnego przez powierzchnię kuli (on już zależy wyłącznie od tego, co znajduje się wewnątrz kuli), a potem skorzystać z tw. Gaussa-Ostrogradskiego i obliczyć dywergencję pola grawitacyjnego w punkcie centralnym. Tę wartość można porównać z tym, co wynika z równania dewiacji geodezyjnej. Oczywiście wynik jest taki sam.

Nie rozwijałem tu kwestii, czym są tensory. W największym skrócie są to obiekty niezależne od wyboru współrzędnych, podobnie jak trójwymiarowe wektory (które są szczególnym jednowskaźnikowym typem tensora). W teorii Einsteina dopuszczamy praktycznie wszelkie gładkie transformacje współrzędnych (ogólna kowariantność). Równania prawidłowo zapisane w ten sosób automatycznie słuszne będą w każdym układzie współrzędnych. Einstein wrócił do tensorów już w trakcie swej „rewolucji listopadowej” – kiedy co tydzień publikował nową pracę na temat teorii grawitacji, przy okazji modyfikując albo zmieniając poprzednie. Ten dziwny tryb publikowania wiązał się z tym, że w Getyndze David Hilbert, jeden z czołowych matematyków świata, także pracował nad podobną teorią. Einsteinowi groziło, że po siedmiu latach pracy zostanie prześcignięty, by tak rzec na ostatnich metrach przed finiszem. Nigdy później (ani wcześniej) nie publikował tak gorączkowo. Starał się też zazwyczaj wykazywać bardziej olimpijski spokój, co oczywiście było znacznie łatwiejsze, kiedy się było autorem epokowej teorii.

Gdyby ktoś chciał szczegółowo przejść obliczenia tensora krzywizny i równania dewiacji, może znaleźć je np. tutaj, na stronie Alana Heavensa s. 22-24.

Interpretacja tensora Ricciego za pomocą objętości kul opisana jest np. w pracy Johna C. Baeza i Emory’ego F. Bunna.

Michele Angelo Besso, przyjaciel Einsteina

Historia zna wiele przypadków, kiedy tylko pesymiści mieli rację, a radosna większość beztrosko podążała ku zgubie. W roku 1936 większość Niemców zadowolona była z kanclerza Hitlera, który podniósł kraj z kolan i zlikwidował bezrobocie. Prawie nikt oprócz przeciwników reżimu nie myślał o nieuniknionym smutnym końcu tego państwa. Einstein, obserwując sytuację w Europie, pisał z Ameryki do Bessa:

Sprawy ludzkie w naszych czasach mniej niż kiedykolwiek napawają radością, by nie wspomnieć o tych głupcach z Niemiec. Teraz okazuje się w końcu, jak proroczym umysłem był prof. Winteler, który tak wcześnie rozpoznał całą powagę tego zagrożenia [Fölsing, s. 55].

Znali się z Bessem wówczas niemal czterdzieści lat i choć nie mieli się już nigdy spotkać osobiście, pisali do siebie regularnie. Albert Einstein miał dar zaprzyjaźniania się z ludźmi, i to na całe życie. Jedna z najdłuższych znajomości wiązała go z Michele Angelo Besso, starszym o sześć lat inżynierem budowy maszyn po Politechnice w Zurychu (późniejszej ETH). Poznali się na wieczorku muzycznym w salonie państwa Hüni, właścicieli sklepu muzycznego w Zurychu, obaj bowiem grali na skrzypcach. Czytając o ludziach z końca XIX wieku, ma się wrażenie, że niemal wszyscy muzykowali, a w każdym razie bywali na różnych domowych wydarzeniach muzycznych. Łączyło to ludzi w różnym wieku, różnych zawodów i upodobań. Osiemnastoletni Einstein kończył już zapewne pierwszy rok studiów na kierunku nauczycielskim tej samej uczelni. Można sądzić, że zbliżyło ich także i to, że uczyli się u tych samych profesorów fizyki: Heinricha Webera i Johanna Perneta i matematyki: Adolfa Hurwitza i Karla Geisera. Besso uzyskiwał zresztą lepsze stopnie niż Einstein, który chodził swoimi drogami, szybko przestał cenić wiedzę przekazywaną na uczelni i niezbyt się przykładał, zwłaszcza do matematyki. Besso zawdzięczał też Einsteinowi i owym wieczorkom muzycznym znajomość ze swą przyszłą żoną Anne Winteler.

Rodzina Wintelerów stała się wspólnym ogniwem łączącym ich życie. Einstein trafił do domu Josta i Pauline Winteler w Aarau w roku 1895 po oblanych egzaminach na Politechnikę. W tamtejszej szkole kantonalnej uzupełniać miał wiedzę z potrzebnych przedmiotów, mieszkając na stancji u Wintelerów. Jost Winteler, językoznawca, autor nowatorskiej dysertacji na temat jednego ze szwajcarskich dialektów, filolog, ornitolog i poeta, należał do grona nauczycielskiego szkoły. Jego żona Pauline szybko stała się dla Alberta kimś bliskim, niemalże drugą matką. Wintelerowie mieli też siódemkę dzieci, od najstarszej Anne, przez Josta Fridolina, Rosę, Marie, Mathiasa, Josta juniora do Paula. Swój pierwszy romans przeżył Albert z Marie Winteler. Odsunął się jednak od niej, kiedy podczas studiów poznał Milevę Marić, swą późniejszą żonę. Marie mocno to przeżyła i związki Alberta z Wintelerami przejściowo osłabły. Po kilku latach Marie wyszła za mąż za dyrektora fabryki zegarków. Wiadomo, że w późniejszych latach ich romans odżył w sekrecie. Kilka lat po Albercie również jego siostra, Maja, mieszkała przez czas nauki u Wintelerów i wyszła potem za mąż za najmłodszego ich syna Paula.

Rodzina Wintelerów: od lewej Marie, Maja Einstein, Paul, Anna, rodzice: Jost i Pauline, Rosa

Jost Winteler kultywował staroświecki liberalizm, ideały republikańskie, kształcił swoje dzieci (także córki), niechętnie myślał o niemieckim szowinizmie, który znał jeszcze swe swych studiów w Jenie i który docierał aż do Szwajcarii. Einstein zawdzięczał Jostowi wiele swych poglądów na świat polityki i historii. Podobne liberalne poglądy żywił Alfred Stern, profesor historii, u którego Albert bywał jako student na obiadach. Besso uczęszczał na jeden z jego wykładów. Szwajcarskie środowisko młodego Einsteina nie przywiązywało wagi do narodowości. Einstein dopiero w Berlinie wiele lat później poczuł się Żydem.

Jeszcze innym elementem łączącym Bessa i Alberta oraz Maję Einsteinów były Włochy. Besso, urodzony pod Zurychem, pochodził z rodziny wywodzącej się z Triestu. Mówił równie swobodnie po włosku i po niemiecku, znał też francuski i angielski. Rodzice Einsteinów mieszkali wówczas we Włoszech, więc Albert kursował między Pawią a Zurychem. Choć uczony nie znał dobrze włoskiego, lubił ten język i w korespondencji z Tulio Levi-Civitą podczas pierwszej wojny światowej, nalegał, by matematyk pisał do niego w swoim języku (odpowiadał mu jednak po niemiecku). Besso także w pewnych okresach życia mieszkał we Włoszech. We Florencji spędzili wiele lat Maja Einstein (doktor filologii romańskiej) z Paulem: ona usiłowała prowadzić pensjonat, on malował obrazy.

Namiętnością Bessa była wiedza. Przez całe życie, aż do późnej starości, pochłaniał książki, uczęszczał na wykłady, robił notatki, należał do towarzystw naukowych. Zajmował się przy tym dziedzinami tak różnymi, jak filozofia, neurofizjologia, polityka, psychologia, prawo przemysłowe, literatura angielska, różne dziedziny fizyki i matematyki. I nie były to zainteresowania powierzchowne: Besso chodził na wykłady takich uczonych, jak Einstein czy Hermann Weyl i był ich aktywnym uczestnikiem, zadającym pytania i starającym się zrozumieć różne kwestie. Przez kilka lat Albert i Michele pracowali razem w Urzędzie Patentowym w Bernie. To Einstein ściągnął tam przyjaciela, często razem wracali do domu, dyskutując nad zagadnieniami fizyki. Besso jest jedyną osobą, którą Einstein wymienia z wdzięcznością w swoim epokowym artykule na temat teorii względności.

Przyjaciele współpracowali też w czerwcu 1913 roku, gdy Besso (mieszkający wtedy w Gorycji) odwiedził Einsteina w Zurychu. Uczony ukończył wtedy ważną pracę wspólnie z Marcelem Grossmannem, w której podał równania pola grawitacyjnego. Była to tzw. teoria Entwurf (co znaczy tyle co zarys). Einstein przekonał wówczas sam siebie, iż jest to prawidłowa teoria. Nie była ona szczególnie elegancka, ale w końcu nikt nie powiedział, że równania fizyki muszą koniecznie być eleganckie. Mają prawidłowo opisywać zjawiska, i to wszystko. Kłopot w tym, że nie było zbyt wielu zjawisk możliwych wtedy do wykrycia. Inaczej mówiąc, stara teoria Newtona nawet po przeszło dwóch wiekach trzymała się dobrze. Czemu więc w ogóle ulepszać coś, co okazało się dobre? Einstein był fizykiem dobrze „słyszącym” pojęcia i wychwytującym świetnie wszelki fałsz i brak harmonii. To go zaprowadziło do szczególnej teorii względności. Ale szczególna teoria względności była niekompatybilna z grawitacją. Potrzebna była teoria traktująca grawitację jako pole, analogiczne do pola elektrycznego i magnetycznego. Do tego punktu Einstein nie był sam – wielu innych próbowało w tych latach zbudować teorię grawitacji jako pola. Einstein miał jednak inny punkt wyjścia: grawitacja, podobnie jak bezwładność, mierzona jest masą. Właściwie są to dwa różne pojęcia masy: można osobno mierzyć masę grawitacyjną i osobno bezwładną. Okazuje się, że są one równe. Z punktu widzenia teorii był to swoisty „cud”, arbitralne założenie, dodane, by opisać rzeczywistość. Toteż Einstein pracował nad teorią, w której bezwładność i grawitacja będą wymienne, a to zaprowadziło go do przestrzeni zakrzywionych i szukania pomocy u Marcela Grossmanna, matematyka i przyjaciela ze studiów.

Istniał niewielki efekt, którego astronomom nie udawało się wyjaśnić: orbita Merkurego, w pierwszym przybliżeniu eliptyczna, obraca się powoli. Większość tego obrotu (równego 570’’) wyjaśnić można przyciąganiem innych planet, pozostawała jednak niewielka różnica 41 sekund kątowych na stulecie. Zauważył to jeszcze w połowie XIX wieku Urbain Le Verrier i po półwieczu analiz różnica ta nadal się utrzymywała i nikt nie miał dobrego pomysłu na jej wyjaśnienie. Chwytano się pomysłów rozpaczliwych, np., że wykładnik w prawie grawitacji różni się troszeczkę od dwóch albo że są jakieś niewidoczne obłoki materii blisko Słońca, które wpływają na ruch Merkurego. Mając teorię Entwurf Einstein chciał sprawdzić, czy uda się za jej pomocą wyjaśnić obrót peryhelium Merkurego. Zachował się rękopis (Einstein Papers, t. 4, doc. 14), w którym obaj przyjaciele obliczali ową wielkość obrotu peryhelium. Jest on świadectwem, że w osobie Bessa Einstein miał nie tylko interlokutora, ale i do pewnego stopnia kolegę. Niewykluczone też, że uczony chciał wciągnąć w ten sposób Bessa do pracy naukowej i zachęcić do przeprowadzenia dalszych rozważań, które można by opublikować. Wielkość efektu, którą uzyskali równa była 1821’’, czyli około pół stopnia na stulecie. Musieli jednak później zdać sobie sprawę z błędu w rachunkach: wstawili do obliczeń przez pomyłkę sto razy za dużą masę Słońca. Efekt ów był naprawdę równy 18’’ na stulecie. Czyli nadal źle, ale w końcu nie było żadnej pewności, czy w ogóle owe 41’’ uda się wyjaśnić za pomocą innej teorii grawitacji. Astronomowie mogli się gdzieś po drodze pomylić albo nie wziąć pod uwagę jakichś istotnych faktów. Inne teorie grawitacji z tego okresu nie radziły sobie lepiej. Besso wrócił wkrótce do Włoch, zabierając ze sobą obliczenia. W następnym roku obliczenia podobne do Einsteina i Bessa opublikował Johannes Droste, holenderski nauczyciel matematyki, który później napisał doktorat poświęcony ogólnej teorii względności. Besso nigdy nie zrobił doktoratu, może czuł, że aktywna praca naukowa nie jest dla niego. W tamtych czasach nie było zresztą łatwo o płatną posadę naukową i często nawet wybitni uczeni musieli przez wiele lat zarabiać w inny sposób. Jak się zdaje, Besso nie był w dostatecznym stopniu skoncentrowany na jednym, interesowało go wiele rzeczy, a przy tym brakowało mu uporu, aby zmagać się z jednym zagadnieniem przez długi czas. Ludzie tacy jak Besso nie osiągają zaszczytnych stanowisk, choć może to dzięki nim świat wydaje się nieco lepszy. Einstein lubił idealistów, nawet dziwaków, niezwykle wysoko cenił też zawsze inteligencję Bessa, a przecież z biegiem lat poznał najwybitniejsze umysły epoki. Kiedy już obaj byli starzy, napisał przyjacielowi: „Nadal wierzę, że gdybyś był w większym stopniu monomaniakiem, mógłbyś osiągnąć coś naukowo wartościowego. Motyl nie jest kretem, ale żaden motyl nie pownien tego żałować” [6 I 1948].

Ostatecznie teoria Entwurf okazała się fałszywa, co Einstein zauważył dopiero we wrześniu 1915 roku. Jednak obliczenia przeprowadzone w roku 1913 wraz Michele Besso okazały się niezwykle pomocne, gdy w listopadzie sformułował nowe równania pola i powtórzył rachunki dla peryhelium Merkurego – tym razem dały one prawidłowy rezultat. Było to, jak Einstein później twierdził, jego najsilniejsze przeżycie naukowe: teoria zbudowana tak, by uzyskać większą przejrzystość pojęć, w oderwaniu od bezpośrednich danych eksperymentalnych, dała oto prawidłowy rezultat dla efektu znanego i niewyjaśnionego od dawna. A więc składając ze sobą starannie i uważnie idee oderwane, można wyjrzeć z platońskiej jaskini i lepiej zrozumieć ruch planet.

Później Besso, który znał także Milevę, służył często jako pośrednik w jej trudnych kontaktach z Einsteinem, czy nawet jako swego rodzaju zastępczy ojciec dla jego synów. Po I wojnie światowej zamieszkał znowu w Szwajcarii znajdował się więc znacznie bliżej dawnej rodziny Einsteina. Uczony żywił dużo szacunku dla moralnej postawy Bessa, ale chwilami trudno im się było porozumieć, zwłaszcza podczas bolesnego i wieloletniego konfliktu Alberta z Milevą zakończonego rozwodem. Ona walczyła zażarcie o pieniądze i pełne decydowanie o życiu synów. Jak się zdaje, w obu kwestiach osiągnęłaby to samo, nie stawiając spraw na ostrzu noża. Einstein chciał być dobrym ojcem i nie był też skąpy. Zapewne to urażona duma i zawiedziona miłość Milevy stały się główną przeszkodą w negocjacjach.

Besso, namawiany wielokrotnie do napisania biografii przyjaciela, miał na tyle dużo taktu, aby tego nie robić, choć postać Einsteina gwarantowała finansowy sukces przedsięwzięcia. Po dojściu Hitlera do władzy Einstein wyjechał na stałe do Stanów Zjednoczonych i nawet po wojnie nie odwiedził Europy, szczególnie unikając kontaktów z Niemcami. Besso mieszkał w Bernie, potem w Genewie. Na początku roku 1955 Einstein dowiedział się o śmierci przyjaciela. Odpisał wtedy jego synowi (któremu kiedyś zbudował pierwszego latawca), podkreślając harmonię życia zmarłego, jego udane życie rodzinne, którego sam nie osiągnął, a także jego niezawodny zmysł moralny.

Teraz znowu, raz jeszcze, wyprzedził mnie, żegnając ten dziwny świat. To nie ma żadnego znaczenia. Dla nas, wierzących fizyków, podział na przeszłość, teraźniejszość i przyszłość jest jedynie iluzją, nawet jeśli mocno zakorzenioną [A. Einstein do Vero i Bice Besso, 15 III 1955].

Rękopis Einsteina-Bessa znajduje się w Einstein Papers, t. 4.