Erwin Schrödinger: trzeci początek mechaniki kwantowej (1926)

Równanie Schrödingera zasługuje na swoją sławę: dzięki niemu znamy nie tylko budowę atomów, ale i cząsteczek chemicznych czy ciał skondensowanych. Wynikają z niego najprzeróżniejsze własności materii, która nas otacza, a także materii we wszechświecie. Jest więc równaniem niezwykle istotnym tak dla fundamentów fizyki, jak i dla zastosowań.

Autor najsłynniejszego równania dwudziestowiecznej fizyki aż do roku 1926 nie należał do ścisłej czołówki fizyków teoretycznych. Zaledwie osiem lat młodszy od Einsteina, dopiero od 1921 roku zajmował katedrę na uniwersytecie w Zurychu. Studiował w Wiedniu, zbyt późno by zetknąć się osobiście z Ludwigiem Boltzmannem czy Ernstem Machem, choć wpływ obu tych uczonych wciąż dawał się tam odczuć. Fizyki teoretycznej uczył się u Friedricha Hasenöhrla, bliskiego przyjaciela Mariana Smoluchowskiego. Do tej pory niewiele zajmował się teorią kwantową, ponieważ opierała się ona wciąż na bardzo grząskich podstawach, korzystając po trosze z fizyki klasycznej, a po trosze z postulatów kwantowania, wyraźnie z nią sprzecznych. Zwrócił jednak uwagę na pracę Louisa de Broglie na temat fal materii. Postulowała ona, że zarówno fotony, jak i inne cząstki mikroświata mają dualną naturę: zachowują się czasem jak cząstki, a czasem jak fale. Obowiązywał przy tym jeden uniwersalny przelicznik własności cząstkowych: energii E i pędu p na wielkości falowe: częstość (kołową) \omega i liczbę falową k\equiv\frac{2\pi}{\lambda} (\lambda jest długością fali). Współczynnikiem proporcjonalności w obu przypadakch miała być stała Plancka \hbar:

E=\hbar\omega,\,p=\hbar k.

Felix Bloch, wówczas początkujący fizyk, tak wspomina wspólne kolokwia (dziś powiedzielibyśmy raczej seminaria) fizyków z uniwersytetu w Zurychu i z ETH, gdzie najważniejszą postacią był Peter Debye.

Pewnego razu pod koniec kolokwium Debye powiedział coś w tym rodzaju: „Schrödinger nie zajmujesz się teraz żadnym ważnym tematem. Może opowiedziałbyś nam któregoś dnia o tym doktoracie de Broglie’a, który, zdaje się, przyciągnął sporo uwagi”. Więc na jednym z następnych kolokwiów Schrödinger przedstawił cudownie przejrzysty wykład o tym, jak de Broglie wiąże fale z cząstkami i w jaki sposób zdołał on uzyskać reguły kwantyzacji Bohra i Sommerfelda (…) Kiedy skończył, Debye stwierdził od niechcenia, że taki sposób ujęcia jest raczej dziecinny. Jako student Sommerfelda nauczył się, że właściwy sposób podejścia do fal wiedzie przez równanie falowe. Brzmiało to dość trywialnie i na pozór nie zrobiło głębszego wrażenia, ale Schrödinger najwyraźniej wrócił później do tego pomysłu. Zaledwie kilka tygodni później dał następne kolokwium, zaczynając od słów: „Kolega Debye zasugerował, że należy mieć równanie falowe, toteż je znalazłem”. [„Physics Today”, t. 29 (1976), nr 12, s. 23-24]

Najwyraźniej w pierwszej chwili obaj nie zdawali sobie sprawy z wagi tych badań. Erwin Schrödinger dzięki pracom z końca roku 1925 i roku 1926 stał się błyskawicznie jednym z najgłośniejszych fizyków świata. Seria jego artykułów natychmiast zyskała uznanie. Chwalili je Albert Einstein i Arnold Sommerfeld, który wraz ze swymi uczniami rozwijał od lat fizykę kwantową. Napisał do niego sędziwy Hendrik Lorentz, który uważnie śledził nowości i miał parę istotnych uwag. Surowy i poważny Max Planck, profesor najbardziej prestiżowej katedry w Niemczech (co wtedy znaczyło: najbardziej prestiżowej na świecie) – na uniwersytecie w Berlinie, pisał entuzjastycznie do Schrödingera:

Czytam pański artykuł tak, jak ciekawe dziecko, słuchające w napięciu rozwiązania zagadki, nad którą się długo głowiło, i cieszę się bardzo wszystkimi pięknościami, jakie tam dostrzegam, choć muszę go jeszcze dokładniej przestudiować, by wszystko z niego pojąć.

Kiedy w grudniu 1925 roku Schrödinger znalazł swe równanie, był to trzeci początek mechaniki kwantowej albo – jak wolał o tym mówić autor odkrycia – mechaniki falowej. Na pierwszy rzut oka nie miało to nic wspólnego z teorią Heisenberga, Borna, Jordana i Diraca. U Schrödingera nie było żadnych skoków kwantowych, żadnych wielkości macierzowych, nieprzemiennych iloczynów. Język był całkowicie klasyczny – była to matematyka drgań, dobrze już wówczas opracowana. W roku 1924 wyszła dwutomowa monografia Methoden der mathematischen Physik („Metody fizyki matematycznej”) zredagowana przez Richarda Couranta i innych matematyków z Getyngi na podstawie wykładów Davida Hilberta. Zawierała ona wiele materiału, który miał się okazać potrzebny fizykom za kilka lat. Jak na ironię metody Hilberta zastosowali pierwsi nie fizycy z grupy Maksa Borna, pracujący przecież głównie pod bokiem Hilberta w Getyndze, ale Erwin Schrödinger, outsider i naukowy samotnik. Fizycy z Getyngi zlekceważyli nawet wyraźną sugestię Hilberta w jednej z rozmów, że powinni poszukać równania różniczkowego, które opisuje skwantowane wartości energii. Nie próbowali iść tym tropem, przekonani, że ich mechanika kwantowa jest czymś całkowicie nowym i nie może się zawierać w książce sprzed paru lat. Źle przyjęli też pracę Schrödingera, która wydawała się recydywą fizyki klasycznej, odwrotem od kwantowej rewolucji spod sztandaru Heisenberga.

Fizycy klasyczni znali wiele przypadków drgań układów rozciągłych, czyli fal stojących. Są one np. podstawą wytwarzania dźwięku w instrumentach muzycznych takich, jak organy, flet, trąbka czy skrzypce. Wiadomo, że zamocowana na końcach struna drgać może tylko z określonymi ściśle częstościami: podstawową oraz jej wielokrotnościami. Rozważano różne bardziej skomplikowane możliwości, pisaliśmy tu o rówieśniku Einsteina, fizyku z Getyngi, Waltherze Ritzu. Idea Schrödingera polegała na tym, by wartości energii w atomie potraktować analogicznie do częstości dźwięku w pudle rezonansowym, stosując równanie falowe. Ma ono w przypadku trójwymiarowym postać:

\dfrac{\partial^2\psi}{\partial x^2}+\dfrac{\partial^2\psi}{\partial y^2}+\dfrac{\partial^2\psi}{\partial z^2}-\dfrac{1}{v^2}\dfrac{\partial^2 \psi}{\partial t^2}\equiv \Delta\psi-\dfrac{1}{v^2}\dfrac{\partial^2 \psi}{\partial t^2}=0,

gdzie v jest prędkością fal. Jeśli przyjmiemy, że nasze fale są okresowe i mają częstość \omega, możemy rozwiązania zapisać jako

\psi(x,y,z, t)=\psi(x,y,z)e^{\pm i\omega t}.

Drugą pochodna po czasie jest ta sama funkcja wykładnicza pomnożona przez stałą. Wstawiając to do równania falowego, otrzymujemy tzw. równanie Helmholtza (który pod koniec XIX wieku był profesorem w Berlinie):

\Delta \psi+k^2 \psi=0.

W równaniu tym skorzystaliśmy z tego, że \dfrac{\omega}{v}=k. Droga Schrödingera do odkrycia była dość zawikłana. Związki de Broglie’a są relatywistyczne, naturalne wydawało się więc zapisanie równania relatywistycznego. Jednak kiedy spróbujemy je rozwiązać w najprostszym przypadku atomu wodoru, okazuje się, że dopuszczalne energie nie zgadzają się z tym, co wcześniej, w starej teorii kwantów obliczył Sommerfeld i co zgadzało się z doświadczeniem (szczegóły można znaleźć u L. Schiffa, Mechanika kwantowa, s. 409 i n.). Dwa lata później sytuacja się wyjaśniła: potrzebne tu jest równanie Diraca. Dwa lata w tamtej chwili rozwoju fizyki to było więcej niż epoka, Schrödinger znajdował się dopiero u początków tej drogi i nie mógł wiedzieć, co stanie się dalej. Rozsądnie zdecydował się więc na przybliżenie nierelatywistyczne, robiąc niejako krok wstecz w porównaniu do de Broglie’a. Nie pójdziemy tu jego drogą, a właściwie kilkoma różnymi drogami, jakimi próbował uzasadnić swe równanie. Wybierzemy podejście najprostsze zaproponowane pół roku później przez Maksa Borna – musimy jednak pamiętać, że nie jest to wyprowadzenie. Nie można bowiem wyprowadzić praw mechaniki kwantowej z praw klasycznych. Dla cząstki o masie m i całkowitej energii E możemy napisać równanie zachowania energii:

E=\dfrac{\hbar^2 k^2}{2m}+V(x,y,z),

gdzie V jest energią potencjalną (pierwszy składnik to zwykła energia kinetyczna). Jeśli wyznaczymy k^2 z ostatniego równania i wstawimy do równania Helmholtza, otrzymamy tzw. równanie Schrödingera bez czasu:

-\dfrac{\hbar^2}{2m}\Delta\psi+V\psi=E\psi.

Chcąc np. opisać ruch elektronu wokół nieruchomego jądra atomowego o ładunku Ze, należy wstawić do równania Schrödingera energię potencjalną postaci

V(r)=-\dfrac{Ze^2}{4\pi \epsilon_0 r},

czyli zwykłą energię potencjalną przyciągania elektrostatycznego dwóch ładunków Ze oraz -e w odległości r. Szukamy takich funkcji \psi(x,y,z), które daleko od jądra zanikają. Okazuje się, że rozwiązania takie są możliwe tylko dla dyskretnych wartości energii równych

E_n=-\dfrac{me^4}{2(4\pi\epsilon_0)^2 \hbar^2}\dfrac{1}{n^2}, \mbox{ gdzie } n=1,2, 3, \ldots.

 Jest to wynik uzyskany w roku 1913 przez Bohra z założeń, które od początku wydawały się aktem rozpaczy, a nie solidną nauką. Równanie Schrödingera miało więc sens, choć nadal brakowało pewnych elementów do kompletnej teorii. Jednym z najważniejszych było znaczenie samej funkcji \psi. Kiedy w piszczałce organowej czy w rurce fletu wytwarzany jest dźwięk, wiemy, co drga – jest to powietrze, które ściśnięte się rozpręża, a rozprężone wraca do początkowej gęstości. Co drga w atomie wodoru? Jakie jest znaczenie funkcji \psi? Co gorsza, okazało się, że powinna ona mieć wartości zespolone, z pewnością nie było to żadne proste drganie klasyczne. Geniusz Schrödingera ujawnił się i w tym, że nie próbował odpowiedzieć na wszystkie pytania naraz i pozwolił swoim ideom rozwijać się w czasie. Publikacje uczonego z pierwszego półrocza 1926 roku wystarczyły na Nagrodę Nobla i objęcie w roku 1927 katedry w Berlinie po odchodzącym na emeryturę Maksie Plancku.

Erwin Schrödinger, człowiek wszechstronnie wykształcony, o szerokich zainteresowaniach, całkowicie zaprzecza ascetycznej wizji uczonego, który nie ma czasu na nic oprócz nauki. Wydaje się wręcz, że jego pomysłowość przy stworzeniu słynnego równania szła w parze z gorączką miłosną. Praca ta powstała w uzdrowisku Arosa, gdzie wybrał się w towarzystwie do dziś nie znanej flamy. Jego małżeństwo należało do nowoczesnych i partnerzy pozostawiali sobie bardzo wielką swobodę. Były przecież lata dwudzieste: kobiety odsłoniły nogi, tańczono charlestona, wszyscy chcieli zapomnieć o koszmarze niedawnej wielkiej wojny.

 

 

 

 

 

Reklamy

Oscylator kwantowy: Paul Dirac i inni (1929-1930)

Mechanika kwantowa wprowadziła rewolucyjnie nowe pojęcie stanu układu fizycznego. Klasycznie stan układu znamy, gdy dane są jego położenie i pęd w pewnej chwili. Na tej podstawie możemy obliczyć przyszłe położenia i pędy (albo i przeszłe – mechanika jest symetryczna wobec zmiany strzałki czasu). Np. znając dziesiejsze położenie i pęd planety, możemy obliczyć, gdzie znajdzie się ona za sto lat albo gdzie była, powiedzmy, w czasach Keplera. Stan układu to punkt w przestrzeni polożeń q i pędów p. Ewolucja w czasie to ruch tego punktu w owej przestrzeni fazowej.

Mechanika kwantowa zastępuje klasyczną na poziomie mikroświata. Zupełnie jednak zmienia się pojęcie stanu układu. Stanem jest teraz nie punkt, lecz wektor, a właściwie cały promień, to znaczy wektor pomnożony przez dowoloną liczbę. Przestrzeń stanów (wektorów) umożliwia dodawanie dwóch stanów. Operacja taka nie miałaby sensu w mechanice klasycznej: bo niby jak mamy dodać do siebie położenie Marsa i położenie Jowisza? Co taka suma miałaby oznaczać? W mechanice kwantowej obowiązuje zasada superpozycji, czyli dodawania stanów.

Wikipedia: Double-slit experiment

Kiedy np. przepuszczamy elektron przez przesłonę z dwiema szczelinami, jego stan kwantowy będzie sumą stanu elektronu, który przeszedł przez szczelinę nr 1 oraz stanu elektronu, który przeszedł przez szczelinę nr 2. Stosując zapis wprowadzony przez Paula Diraca w 1939 roku, możemy to zapisać jako

|\varphi\rangle=| \varphi_1\rangle+| \varphi_2\rangle.

Fizycznie znaczy to, że nasz elektron trochę przeszedł przez szczelinę nr 1, a trochę przez szczelinę nr 2. Jego stan jest superpozycją dwóch stanów. Gdybyśmy chcieli wyznaczyć prawdopodobieństwo, że w jakimś punkcie ekranu x zarejestrujemy nasz elektron, należałoby obliczyć iloczyn skalarny z wektorem przedstawiającym elektron w x:

\langle x | \varphi \rangle=\langle x| \varphi_1\rangle+ \langle x| \varphi_2\rangle.

Zapis Diraca wziął się z rozłożenia nawiasu kątowego na dwie części: nazywa się je wektorem bra i ket (od angielskiego: bracket). Z pomnożenia skalarnego dwóch wektorów otrzymujemy liczbę (prędzej czy później będziemy potrzebowali liczb, jeśli teoria ma coś przewidywać ilościowo). Powyższy zapis Diraca można też zastąpić bardziej konwencjonalnym sumowaniem funkcji:

\varphi(x)=\varphi_1(x)+\varphi_2(x).

Wartość funkcji falowej w danym punkcie x można traktować jako składową wektora \varphi. Zapis Diraca \langle a|b\rangle pozwala nam patrzeć na funkcję jako iloczyn skalarny dwóch wektorów, jeszcze wygodniej jest często operować samymi wektorami stanu: nie precyzujemy wówczas, co chcielibyśmy mierzyć (może np. zamiast położenia, wolelibyśmy pędy – pierwsza forma zapisu  tego nie przesądza.

Mamy zatem abstrakcyjne wektory stanu i iloczyn skalarny. Wartości tego iloczynu skalarnego są na ogół zespolone, inaczej mówiąc, funkcje falowe są zespolone (*). Nie mogą one mieć bezpośredniego sensu fizycznego. Sens taki mają natomiast kwadraty ich modułów: |\varphi(x)|^2 daje nam prawdopodobieństwo zarejestrowania elektronu w punkcie x (dokładniej: gęstość prawdopodobieństwa, bo współrzędna przyjmuje dowolne wartości rzeczywiste). Tam gdzie prawdopodobieństwo jest duże, elektrony będą częściej trafiały, gdy zbierze się dostateczna statystyka, będziemy mogli zaobserwować, że „trafienia” układają się w prążki interferencyjne. Wynik jest taki, jakby dwie fale nakładały się na siebie.

Obrazki powyżej pochodzą z rzeczywistego doświadczenia Akira Tonomury, Proc. Natl. Acad. Sci. U.S.A. 102 (2005) 14952-14959. Liczba elektronów wzrasta od 10 do 140 000, widzimy, jak uwidaczniają się prążki interferencyjne. W doświadczeniu tym elektrony przepuszczane były pojedynczo, wiemy więc, że każdy elektron interferuje niejako sam z sobą, nie jest to skutek jakichś oddziaływań między nimi. Ze względów technicznych doświadczenie to przeprowadzone było stosunkowo niedawno, ale że wynik musi być właśnie taki, zdawali sobie sprawę już pierwsi badacze mechaniki kwantowej: Heisenberg, Born, Jordan, Dirac. W 1927 r. Lester Germer i Clinton Davisson oraz niezależnie George Paget Thomson zaobserwowali dyfrakcję elektronów, za co otrzymali Nagrodę Nobla (G.P. Thomson był synem J.J. Thomsona, który odkrył elektron, mówiono, że ojciec dostał Nagrodę Nobla za odkrycie, iż elektron jest cząstką, a syn – za odkrycie, że elektron jest falą). Oczywiście, elektron (podobnie jak np. foton) jest cząstką, do opisu której musimy stosować mechanikę kwantową.

Tak więc choć dodawanie stanów wydaje się abstrakcyjne, to w istocie jest obserwowane w eksperymentach. Skoro stany są wektorami i można je dodawać oraz mnożyć przez liczbę, to naturalnym rodzajem przekształceń takiej przestrzeni są operatory liniowe, czyli odwzorowania przypisujące każdemu wektorowi |\varphi \rangle jakiś inny wektor: A |\varphi \rangle, przy czym

A(\lambda_1 | \varphi_1\rangle+\lambda_2 |\varphi_2\rangle)=\lambda_1 A |\varphi_1\rangle+\lambda_2 A |\varphi_2\rangle,

gdzie \lambda_1,\lambda_2 są dowolnymi liczbami. Operatory takie w mechanice kwantowej zastępują wielkości fizyczne, które można mierzyć: mamy więc operatory pędu, położenia, energii itd. W jaki sposób formalizm ten pozwala otrzymywać w pewnych sytuacjach skwantowane wartości np. energii? Operator wielkości A działając na pewne odpowiednio wybrane wektory daje bardzo prosty wynik: mnoży wektor wyjściowy przez liczbę. Np.

A |\varphi_a\rangle=a|\varphi_a\rangle,

co zwykle zapisuje się krócej:

A|a\rangle =a|a\rangle.

Litera a oznacza wartość wielkości fizycznej, a więc powinna to być liczba rzeczywista, a przynależny jej stan |a\rangle jest wektorem. Mówi się, że jest to wektor własny, a wartość nazywamy wartością własną. Z doświadczalnego punktu widzenia, gdy układ jest w stanie własnym, to wynikiem pomiaru owej wielkości jest na pewno a. Przestrzeń stanów jest nieskończenie wymiarowa i może zawierać wiele różnych wektorów odpowiadających różnym wartościom własnym. Może się np. okazać, że tylko pewien dyskretny zbiór wartości jest dopuszczalny – i wtedy właśnie wielkość fizyczna się kwantuje.

Pokażemy, jak formalizm ten działa w przypadku oscylatora harmonicznego. Jest to najprostszy niecałkiem trywialny układ, mający zresztą liczne zastosowania: wszystko, co gdzieś drga, można w pierwszym przybliżeniu opisać jako oscylator harmoniczny albo ich zbiór – mogą to być drgania kryształów, atomów w cząsteczkach chemicznych, a nawet fale elektromagnetyczne, które matematycznie są podobne do oscylatorów.

W jednowymiarowym przypadku, gdy masa cząstki oraz częstość oscylatora są jednostkowe, energia ma postać:

E=\frac{1}{2}(p^2+x^2),

jest to więc suma kwadratów pędu i współrzędnej (kwadratowy potencjał odpowiada sile proporcjonalnej do wychylenia z położenia równowagi, jak w przypadku masy na sprężynie). W mechanice kwantowej zastępujemy tę funkcję operatorem Hamiltona (hamiltonianem), który ma postać taką samą, jak klasyczna:

H=\frac{1}{2}(p^2+x^2),

teraz jednak po prawej stronie mamy operatory pędu i położenia. Wiemy o nich od czasów Borna i Jordana oraz Diraca, że są nieprzemienne i spełniają regułę komutacji:

xp-px=i\hbar.

Okazuje się, że wystarczy to do znalezienia wartości energii oscylatora (dla uproszczenia przyjmiemy jednostki \hbar=1). Metoda, którą zastosujemy, przypisywana jest zwykle Paulowi Diracowi, choć w druku pojawiła się po raz pierwszy w książce Maksa Borna i Pascuala Jordana z roku 1930.

Hamiltonian jest sumą kwadratów, możemy więc spróbować rozłożyć go na czynniki. Wprowadzamy dwa nowe operatory:

a=\frac{1}{\sqrt{2}}(x+ip), \; a^{\dag}=\frac{1}{\sqrt{2}}(x-ip).

Gdyby x, p były liczbami rzeczywistymi, iloczyn obu naszych operatorów byłby równy hamiltonianowi. Musimy jednak uwzględnić nieprzemienność mnożenia operatorów:

a^{\dag}a=\frac{1}{2}(x^2+p^2+ixp-ipx)=H-\frac{1}{2}.

W podobny sposób możemy obliczyć iloczyn wzięty w odwrotnej kolejności:

aa^{\dag}=\frac{1}{2}(x^2+p^2-ixp+ipx)=H+\frac{1}{2}.

Odejmując ostatnie dwie równości stronami, otrzymamy

a^{\dag}a-aa^{\dag}=1.

Zbadajmy teraz wartości własne operatora N=a^{\dag}a – muszą one być o \frac{1}{2} mniejsze niż wartości własne operatora H. Jeśli |\lambda\rangle jest wektorem własnym N o wartości \lambda, to mamy

Na|\lambda \rangle=(a^{\dag}a)a|\lambda\rangle=(aa^{\dag}-1)a|\lambda\rangle=(\lambda-1)a|\lambda\rangle.

Oznacza to, że wektor a|\lambda\rangle też jest wektorem własnym N o wartości o 1 mniejszej. Działając kolejny raz operatorem a na tak uzyskany wektor, otrzymamy wektor o wartości własnej mniejszej o 2 itd. Procedura ta musi się jednak zakończyć po skończonej liczbie kroków, ponieważ operator N, tak jak i H, jest ograniczony od dołu. Hamiltonian jest sumą kwadratów i nie może mieć ujemnych wartości własnych, energia każdego układu ograniczona jest od dołu, gdyby tak nie było świat by się zapadł w stany o ujemnej energii. Znaczy to, że istnieje taki wektor |0\rangle, że

a  |0\rangle=0.

Po prawej stronie mamy wektor zerowy, czyli brak jakiegokolwiek stanu. Oczywiście, N |0\rangle=0, czyli wektorowi temu odpowiada zerowa wartość własna. Możemy teraz do tego wektora zastosować operator a^{\dag}, otrzymamy

Na^{\dag}|0\rangle=a^{\dag}aa^{\dag}|0\rangle=a^{\dag}(a^{\dag}a+1)|0\rangle=a^{\dag}|0\rangle,

czyli wektor a^{\dag}|0\rangle ma wartość własną 1. Powtarzając ten zabieg stosowania operatora a^{\dag} wykreujemy stany o wartościach własnych równych kolejnym liczbom naturalnym. Z tego powodu operator a^{\dag} nazywa się operatorem kreacji, a a – operatorem anihilacji. Generują one stany o większej bądź mniejszej wartości N. Zatem wartości własne naszego hamiltonianu równe są

E_n=n+\frac{1}{2}, \mbox{ gdzie  } n=0,1, 2,\ldots.

W zwykłych jednostkach energie wyrażają się przez częstość oscylatora \omega=\sqrt{\frac{k}{m}}:

E_n=\hbar\omega(n+\frac{1}{2}).

Wynik ten znany był od lat, po raz pierwszy jednak powstał w latach 1925-1926 spójny formalizm pozwalający otrzymać ten i wiele innych rezultatów.

Na obrazku widzimy rezultat zastosowania formalizmu: niebieska linia to kształt potencjału (parabola x^2), linie poziome oznaczają dozwolone wartości energii. Nawet najmniejsza energia musi być dodatnia: oznacza to, że kwantowy oscylator nigdy nie może spoczywać. Gdybyśmy zrobili kwantowe wahadło, musiałoby ono zawsze drgać. Z tego powodu nawet w temperaturze zera bezwględnego atomy w kryształach czy cząsteczkach chemicznych drgają – są to tzw. drgania zerowe.

Wynik dla oscylatora ma konsekwencje fizyczne: już w 1900 r. Max Planck zauważył, że energie te powinny przybierać skwantowane wartości, jeśli chcemy prawidłowo opisać promieniowanie ceieplne. Kilka lat później Albert Einstein wyjaśnił eksperymentalne wyniki dotyczące diamentu właśnie za pomocą tego kwantowania.

Prosty formalizm operatorów kreacji i anihilacji odegrał niezmiernie ważną rolę w rozwoju mechaniki kwantowej, pozwalając zbudować kwantową teorię pola. O jej początkach innym razem.

(*) Iloczyn skalarny dwóch wektorów przypisuje parze wektorów liczbę zespoloną i spełnia następujące aksjomaty:

\langle a| b\rangle=\langle b|a\rangle^{\star}.

\langle a| \lambda b+c\rangle=\langle a| b\rangle+\lambda\langle a| c\rangle.

Iloczyn wektora z samym sobą jest liczbą rzeczywistą nieujemną – kwadratem jego długości, zwanym też normą:

||{a}||^2:=\langle a|a\rangle.

 

 

Paul Dirac – drugi początek mechaniki kwantowej (1925)

Latem 1925 roku Werner Heisenberg wystąpił w Cambridge z odczytem w Klubie Kapicy. Było to nieformalne stowarzyszenie powołane do życia przez pełnego temperamentu rosyjskiego fizyka Piotra Kapicę, coś w rodzaju klubu naukowego doktorantów i studentów. Chwila była ważna: Heisenberg zaczął właśnie budować pierwsze zręby nowej mechaniki kwantowej. Sam jeszcze nie był pewny, co z tego wyjdzie, nikt pewnie nie przypuszczał, że chodzi o największe odkrycie XX wieku (obok teorii względności). W swoim wystąpieniu Heisenberg omówił swoją pracę na temat efektu Zeemana, a pod koniec wspomniał o nowych rewolucyjnych pomysłach.

Jednym ze słuchaczy był Paul Dirac. Wydawałoby się zatem, że wtedy właśnie dowiedział się, i to wprost od samego autora o koncepcji mechaniki kwantowej. Jeśli A mówił na temat X, a B tego słuchał, to zapewne B zapoznał się w ten sposób z X. Nie zawsze to prawda, podobnie jak z obecności na wykładzie niekoniecznie wynika, że student się czegoś dowiedział. W tym przypadku mamy świadectwo samego Diraca. Twierdził on, że zupełnie zapomniał o tej części wystąpienia Heisenberga i nawet był przekonany, że niemiecki uczony nic nie wpomniał o swej ostatniej pracy. Nie ma powodu nie wierzyć Diracowi, który był prawdomówny do bólu. Pracę Heisenberga otrzymał we wrześniu 1925 roku w postaci korekty drukarskiej. Heisenberg wysłał ją do Ralpha Fowlera, ten zaś napisał na odbitce: „Co o tym myślisz?” i przesłał ją swemu doktorantowi Diracowi do Bristolu. Nie był to przypadek, Fowler poznał się na zdolnościach swego milczącego i niezbyt towarzyskiego studenta. Jednak i we wrześniu Dirac nie zrozumiał od razu znaczenia pracy Heisenberga. Stało się tak dopiero po kilku tygodniach. Zaczął wówczas rozmyślać nad tym zagadnieniem i zaproponował własną wersję podejścia do problemu. Werner Heisenberg należał do wąskiej grupy uczonych zajmujących się zagadnieniem budowy atomu, orientował się nie tylko w opublikowanych osiągnięciach, ale brał udział w dyskusjach, wiedział, kto nad czym pracuje – słowem, korzystał w pełni z przynależności do czołówki ówczesnych fizyków. Dirac pracował sam, korzystając jedynie z tego, że Ralph Fowler był dobrze poinformowany w aktualnej sytuacji fizyki kwantowej na kontynencie. Zadziwiające, że potrafił w takich warunkach bardzo wiele osiągnąć w tej i w następnych pracach. Zresztą i później pracował sam, prawdopodobnie inaczej nie potrafił. Niektórzy twierdzą, że Paul Dirac był największym fizykiem XX wieku. Jego prace nigdy wszakże nie były popularne, nie mogły stać się nagłówkami w gazetach, był uczonym budzącym respekt wśród znających się na rzeczy, nie mógł też podobać się dziennikarzom – potrzebującym paru chwytliwych słów i nie mającym czasu, by zgłębić jakąkolwiek sprawę (*).

W pracy Heisenberga Dirac zwrócił przede wszystkim na fakt, że wielkości fizyczne, takie jak pęd czy współrzędna mogą nie być zwykłymi funkcjami czasu, lecz wielkościami, których mnożenie jest nieprzemienne: xy\neq yx. Fizycy wcześniej nie posługiwali się podobnymi pojęciami. Dirac miał naturalną łatwość operowania abstrakcyjnymi pojęciami, nie zaprzątał też sobie zbytnio głowy kwestią interpretacji formalizmu. Zaczął się zastanawiać nad sensem nieprzemienności, czym jest wyrażenie xy-yx? (Obecnie nazywa się ono komutatorem i oznaczane jest [x,y].)
Pewnej październikowej niedzieli, podczas cotygodniowej pieszej wycieczki, Dirac przypomniał sobie, że widział już wyrażenie podobne do komutatora w podręcznikach mechaniki klasycznej. Komutatory przypominały tzw. nawiasy Poissona. Nie był jednak pewien, czy dobrze pamięta. W żadnej z książek, które miał u siebie w pokoju, nie było definicji nawiasów Poissona. Ponieważ w niedzielę biblioteka była zamknięta, nie mógł od razu sprawdzić, czy skojarzenie jest prawidłowe. Wspominał później:

„Noc przeszła mi w męczącym oczekiwaniu, wciąż nie wiedziałem, czy mój pomysł ma jakąkolwiek wartość, ale stopniowo moje przekonanie rosło. Rankiem wybrałem się do biblioteki od razu po jej otwarciu i kiedy znalazłem w Mechanice analitycznej [E.T.] Whittakera definicję nawiasu Poissona, stwierdziłem, że jest dokładnie to, czego mi potrzeba. Był on całkowicie analogiczny do komutatora.

Nawiasy Poissona są zaawansowanym sposobem zapisu równań mechaniki w formalizmie Hamiltona. Stan układu określony jest przez podanie położenia q oraz pędu p (w razie potrzeby wprowadzamy większą liczbę współrzędnych i odpowiadających im pędów). Dynamikę układu, czyli jego ewolucję w czasie, określa funkcja zwana hamiltonianem H. W najprostszym przypadku cząstki o masie m w polu zewnętrznym V(q) hamiltonian jest po prostu sumą energii kinetycznej i potencjalnej:

H(q,p)=\dfrac{p^2}{2m}+V(q).

Znając hamiltonian, możemy napisać równania na pochodne czasowe położenia oraz pędu:

\dot{q}=-\dfrac{\partial H}{\partial q}, \: \dot{p}=\dfrac{\partial H}{\partial p}.

Łatwo zobaczyć, że w najprostszym przypadku równania te są równoważne II zasadzie dynamiki Newtona. Ich zaletą jest ogólność: możemy w rozmaity sposób definiować nowe współrzędne i pędy tak, by postać równań Hamiltona została zachowana. Hamiltonian będzie się przy tym zmieniać, w szczególnie prostych przypadkach może on się nawet redukować do jakiejś bardzo prostej funkcji, np. liniowej w pędzie i w ogóle nie zawierającej współrzędnych. Wtedy rozwiązanie układu równań jest trywialne (oczywiście, nie zawsze łatwo odgadnąć postać takich współrzędnych, które niejako wykonają pracę za nas).

Jeśli f(q,p), g(q,p) są dowolnymi funkcjami położeń i pędów, to ich nawias Poissona ma postać:

\left\{f,g\right\}=\dfrac{\partial f}{\partial q}\dfrac{\partial g}{\partial p}-\dfrac{\partial f}{\partial p}\dfrac{\partial g}{\partial q}.

Łatwo sprawdzić, że nawiasy Poissona są antysymetryczne (zmieniają znak przy przestawieniu funkcji), liniowe, spełniają dla dowolnych trzech funkcji f,g,h warunek Leibniza:

\left\{fg,h\right\}=f\left\{g,h\right\}+\left\{f,h\right\}g.

oraz tożsamość Jacobiego:

\left\{f,\left\{g,h\right\}\right\}+\left\{g,\left\{h,f\right\}\right\}+\left\{h,\left\{f,g\right\}\right\}.

Łatwo sprawdzić, że komutator dwóch wielkości będzie także spełniał powyższe warunki, jeśli tylko mnożenie jest łączne oraz rozdzielne względem dodawania. Analogię tę zauważył Dirac. A więc komutator w mechanice kwantowej odgrywałby rolę analogiczną do nawiasów Poissona.

Definicja Poissona nie była przypadkowa, pochodną każdej funkcji f położenia i pędu po czasie możemy zapisać jako

\dot{f}=\left\{f,H\right\}.

W szczególności, wstawiając f=q oraz f=p, dostaniemy równania ruchu w postaci Hamiltona. Najbardziej podstawowe nawiasy Poissona mają postać:

\left\{ q,q\right\}=\left\{ p,p\right\}=0, \; \left\{q,p\right\}=1.

Znając te podstawowe nawiasy oraz zakładając wyliczone wyżej własności ogólne nawiasów, można łatwo znaleźć nawiasy dla wielomianów zmiennych q,p, a stąd w zasadzie dla każdej rozsądnej funkcji tych zmiennych.

Praca Diraca była czymś więcej niż tylko trafnym zgadywaniem. Obliczył on, że w granicy dużych liczb kwantowych komutator powinien przechodzić w nawias Poissona pomnożony przez stałą:

[f,g] \approx i\hbar \left\{f,g\right\}.

Przyjmując więc odpowiednie wartości komutatorów, mamy pewność, że formalizm kwantowy redukuje się do klasycznej mechaniki. Dirac otrzymał w ten sposób reguły komutacyjne, które stanowią podstawę nowej teorii. W tym samym czasie w Getyndze Born i Jordan otrzymali je także, o czym jednak Dirac nie wiedział. Odpowiedniość nie jest do końca automatyczna, ponieważ gdy zmienne q,p nie komutują, ich kolejność ma znaczenie i temu samemu wyrażeniu klasycznemu odpowiadają rozmaite wyrażenia kwantowe.

Był to debiut Diraca w dziedzinie mechaniki kwantowej. To ta praca wprawiła w osłupienie Maxa Borna: nikomu nieznany student zrobił to samo, co najznakomitsi uczeni z Getyngi i wykazał przy tym samodzielność i dojrzałość. Dopiero w czerwcu następnego roku miał zrobić doktorat.

(*) Ostatnim przykładem takiej dziennikarskiej hucpy jest doniesienie o udowodnieniu hipotezy Riemanna przez sir Michaela Atiyaha. Pisałem o hipotezie Riemanna, jest to największy otwarty problem matematyki. Atiyah był genialnym matematykiem, który zdobył w swoim czasie wszelkie możliwe nagrody, ale obecnie ma 90 lat i od paru lat zasypuje świat niepotwierdzonymi rewelacjami. W dodatku hipoteza Riemanna miałaby być udowodniona wraz z rozważaniami na temat stałej struktury subtelnej – problem w tym, że stała ta bynajmniej nie jest stałą i nic sensownego na jej temat chyba się nie da powiedzieć. Niegdyś Arthur Eddington twierdził, że zna fundamentalne powody, dla których stała ta równa jest dokładnie 1/137. Jednak w rzeczywistości nie jest ona dokładnie równa tej wartości, więc całe to wyjaśnienie nie ma sensu. Obawiam się, że podobnie jest z dowodem Atiyah. Dziennikarze obwieszczają teraz wiadomość o dowodzie, potem będą mieli drugą okazję, aby to sprostować. Jest skrajnie nieprawdopodobne, aby hipotezę Riemanna udowodnić w paru linijkach – jak twierdzi Atiyah. To tak nie działa.

 

 

Werner Heisenberg: pierwsza praca z mechaniki kwantowej (1925)

Dwudziestotrzyletni Heisenberg już od kilku lat był aktywnym uczonym zajmującym się fizyką teoretyczną atomu. Dwa lata wcześniej, po trzech latach studiów, zrobił doktorat w Monachium u Arnolda Sommerfelda, który pierwszy zwrócił uwagę na jego talent. Sommerfeld, aktywny uczestnik w rozwoju nowej dziedziny, miał dar przyciągania zdolnych studentów: czterech jego doktorantów otrzymało Nagrody Nobla, a wielu studentów i stażystów przewijających się przez jego instytut zyskało międzynarodową sławę. W latach dwudziestych Monachium traciło pomału pozycję na rzecz Getyngi, gdzie teoretykom przewodził Max Born. Mechanika kwantowa powstała w Getyndze, a także w Kopenhadze, dokąd Niels Bohr stale zapraszał młodych naukowców z całego świata. Heisenberg zdążył już spędzić długi staż u Bohra, wiosną roku 1925 pracowali tam intensywnie wraz ze starszym o półtora roku Wolfgangiem Paulim, który już wtedy stał się dla Heisenberga punktem odniesienia. Pauli zaczął pracę naukową zaraz po maturze publikacją na temat ogólnej teorii względności. Doktorat u Sommerfelda zrobił także po trzech latach studiów – w najkrótszym prawnie dopuszczalnym terminie. Napisał też w tym czasie długi, ponaddwustustronicowy artykuł przeglądowy na temat teorii względności, w którym omówiona została krytycznie cała literatura przedmiotu. Niezwykle utalentowany, Pauli znany był też z bezwzględnego atakowania prac, które uważał za bezwartościowe. W późniejszych latach słynne było jego powiedzenie o jakiejś słabej pracy: „to nawet nie jest błędne”.

Heisenberg w 1924 roku, podczas wykładu habilitacyjnego w Getyndze.

Chłopięco wyglądający Heisenberg zaangażowany był w ruch skautingowy, spędzał sporo czasu na wycieczkach z młodymi ludźmi. Panowała tam beztroska atmosfera braterstwa i wspólnego przeżywania przygód. Była to jednak organizacja stawiająca sobie cele paramilitarne. Werner Heisenberg wraz z kolegami odwiedzali np. regiony zamieszkane przez Niemców, a pozostające poza granicami Rzeszy, jak np. Górny Tyrol, Finlandia, gdzie było trochę niemieckich emigrantów, a także niektóre tereny Węgier i Polski. W przypadku Heisenberga chodziło chyba raczej o młodzieńczą przygodę, a także odskocznię od intensywnej pracy naukowej. Nie był zwolennikiem skrajnej prawicy, starał się być apolityczny, choć można o nim chyba powiedzieć, że był nacjonalistą. Podczas II wojny światowej nie widział nic niewłaściwego w wizytach w okupowanej Kopenhadze czy Krakowie. Zamiłowanie Heisenberga do spędzania czasu  wyłącznie w męskim towarzystwie wydało się potem podejrzane, gdy jego biografii zaczęło przyglądać się SS. Nie doszukali się jednak niczego nieobyczajnego, do tej pory zresztą uczony miał już żonę i powiększającą się gromadkę dzieci.

Niels Bohr stał się dla młodego Wernera nie tylko mentorem, ale także wzorem i duchowym ojcem. Z prawdziwym ojcem Augustem Heisenbergiem, profesorem bizantynistyki w Monachium, Werner miał stosunki dość napięte. Jak się zdaje, ojciec nie wierzył w jego talent, a może w ogóle w fizykę teoretyczną, która wciąż uchodziła za coś mniej solidnego niż prowadzenie eksperymentów. Werner jako nastolatek chciał zostać pianistą, fizykę wybrał dość późno. August źle reagował na złe wieści o synu, kiedy np. dowiedział się, że Werner ledwo zdał egzamin doktorski. Egzaminatorów było dwóch: teoretyk Sommerfeld oraz eksperymentator Willy Wien. Ten drugi szybko wykrył braki w wiedzy młodego człowieka, który nie potrafił obliczyć zdolności rozdzielczej mikroskopu ani powiedzieć, jak działa ogniwo elektryczne (cztery lata później mikroskop pojawi się w pracy Heisenberga na temat zasady nieoznaczoności). Wien dopiero po dyskusji z Sommerfeldem zgodził się przepuścić Heisenberga, ale jego ocena końcowa była słaba: cum laude (można było otrzymać doktorat summa cum laude, magno cum laude, cum laude i bez żadnego dodatkowego określenia). Wien w senacie uniwersytetu spotykał się z profesorem Heisenbergiem i nie omieszkał się poskarżyć. Werner potrzebował pomocy finansowej, ponieważ nie od razu uzyskał płatną posadę. Ojciec napisał do Borna, pytając o perspektywy naukowe syna. Prosił też Jamesa Francka, eksperymentatora z Getyngi, przyszłego noblistę, aby umożliwił Wernerowi pracę w swoim laboratorium. Franck się zgodził, ale niewiele z tego wyszło i Werner wrócił do pracy teoretyka. Bohr, skracający dystans, biorący udział we wspólnych wycieczkach z młodymi ludźmi, a także zapraszający ich do domu, stał się Heisenbergowi bardzo bliski zarówno pod względem naukowym, jak i prywatnym.

Co ciekawe, najważniejszą swą pracę naukową Heisenberg napisał z dala od Bohra i Pauliego, nie zwierzając się także Maksowi Bornowi. Jak się zdaje, Bohr przy całej swej życzliwości wywierał silną presję na otoczenie, co nie zawsze służyło młodszym, mniej asertywnym uczonym. W kwietniu 1925 roku Heisenberg dostał silnego ataku kataru siennego i wyjechał na wyspę Helgoland, gdzie nie było roślin i w związku z tym pyłku w powietrzu. Tam zdał sobie sprawę, że jedna z ostatnich prac Bohra jest błędna (chodziło w niej o podważenie zasady zachowania energii, tzw. praca BKS). Odbyło się to w scenerii godnej obrazów Caspara Friedricha, Werner spędził noc duchowych zmagań na skalistym wybrzeżu, czekając na wschód słońca. Udało mu się znaleźć nową metodę postępowania, zastosował ją do prostych przypadków. Nie był jednak pewny, czy jest na dobrym tropie. Po powrocie z Helgolandu wręczył gotową pracę Bornowi, pytając o opinię. Do ojca pisał w tym czasie: „Moja własna praca nie idzie w tej chwili najlepiej. Nie uzyskuję zbyt wielu rezultatów i nie wiem, czy w tym semestrze wyjdzie z tego następny artykuł”.

Max Born zadecydował, że pracę trzeba opublikować, mimo że nie rozumiał jej do końca. Pisał w lipcu 1925 roku do Alberta Einsteina: „Moi młodzi ludzie: [Werner] Heisenberg, [Pascual] Jordan, [Friedrich] Hund są znakomici. Muszę się czasem poważnie wysilić, aby nadążyć za ich rozważaniami. Wprost bajecznie opanowali tak zwaną zoologię termów. Najnowsza praca Heisenberga, która się niebawem ukaże, wygląda bardzo mistycznie, ale jest prawdziwa i głęboka”. Heisenberg po jej napisaniu wyjechał do Cambridge, a później do Kopenhagi. W tym czasie Born wraz z Jordanem starali się zrozumieć, co właściwie Heisenberg zaproponował. Okazało się, że jest to decydujący krok w oderwaniu się od tzw. starej teorii kwantów, czyli fizyki klasycznej z kwantowymi dodatkami, jak model atomu Bohra – gdzie orbity elektronów są obliczane klasycznie, tak jak orbity planet, a do tego dokłada się warunek kwantowania, mówiący, jakie orbity są dozwolone. Problemem tego modelu i jego późniejszych coraz bardziej wyrafinowanych matematycznie ulepszeń była wewnętrzna sprzeczność: w fizyce klasycznej niemożliwe są stabilne orbity elektronów. Cały obraz atomu jako kłębowiska orbit elektronowych jest fałszywy. Stawało się to coraz bardziej widoczne przed rokiem 1925.

Heisenberg postanowił z konieczności zrobić cnotę: Nie powinniśmy w ogóle wyobrażać sobie żadnych orbit, nikt nie zaobserwował elektronu na orbicie i nie ma sensu mówić tutaj o ruchu w sposób klasyczny. Należy ograniczyć się do wielkości, które są możliwe do zaobserwowania w doświadczeniach, porzucając spekulacje na temat ruchu elektronu w atomie. Trzeba zmienić fizykę na poziomie kinematyki: nie można opisywać ruchu elektronu tak, jak ruchu kamienia czy innego obiektu makroskopowego. Powoływał się przy tym na podejście Einsteina, który zwracał w teorii względności uwagę, że aby np. mówić o równoczesności, należy podać metodę eksperymentalnego rozstrzygnięcia, czy dane zdarzenia są równoczesne. Metodologia tego rodzaju niekoniecznie sprawdza się w budowaniu teorii fizycznych, ale Heisenbergowi w tamtym momencie pomogła.

Podstawową informacją na temat atomów były linie widmowe. Atom promieniuje fale elektromagnetyczne o pewnych określonych częstościach. Najprostszym układem, który wysyła taką falę, jest drgający elektron. Aby mieć układ drgający należy wyobrazić sobie, że na elektron działa siła zależna od wychylenia, tak jakby nasz elektron był na sprężynie. Jednowymiarowy układ tego rodzaju jest najprostszym oscylatorem (masa na sprężynie, innym przykładem jest wahadło). Do opisania fal emitowanych przez oscylatory atomowe w przypadku klasycznym możemy zastosować analizę Fouriera. Współrzędna naszego oscylatora (o częstości kołowej \omega) jest funkcją okresową, można ją więc przedstawić jako sumę sinusów i cosinusów:

{\displaystyle x(t)=\sum_{n=0}^{\infty}(A_n\cos n\omega t+B_n \sin\omega t)}.

Dwa ciągi liczb rzeczywistych A_n, B_n określają jednoznacznie funkcję. Możemy także zapisać tę sumę krócej w postaci zespolonej:

{\displaystyle x(t)=\sum_{n=-\infty}^{+\infty}x(n) e^{i\omega n t}, \mbox{ (*)}}

gdzie korzystamy ze wzoru Eulera: e^{iz}=\cos z+i\sin z. Z punktu widzenia fizyki ważna jest nie tylko częstość, ale także amplituda drgań. Wypromieniowywana przez oscylator moc jest proporcjonalna do kwadratu amplitudy, czyli sumy |x(n)|^2.

Heisenberg uznał, że zamiast budować model atomu, w którym elektron jakoś się porusza, należy skupić się na wielkościach możliwych do zaobserwowania, czyli częstościach i kwadratach amplitudy.

Przeanalizował następnie, w jaki sposób buduje się kwadrat x(t). Zgodnie z naszym rozwinięciem w szereg Fouriera kwadrat funkcji będzie równy

x^2(t)=\sum_{n}\sum_{m}x(n)x(m)e^{i\omega(n+m)t}.

Wyrażenie to ma postać rozwinięcia Fouriera, jeśli wprowadzimy nową nazwę indeksu p=n+m, to nasz kwadrat można zapisać następująco:

x^2=\sum_{p} e^{i\omega pt}\left(\sum_{n}x(n)x(p-n)\right).

Wyrażenie w nawiasie mówi nam, jak otrzymać rozwinięcie fourierowskie kwadratu funkcji:

x^2(p)=\sum_{n}x(n)x(p-n).

Inaczej mówiąc, aby otrzymać wyraz o częstości \omega p, musimy wysumować wszystkie iloczyny x(n), w których suma częstości jest równa \omega p.

Następnie, i to był najważniejszy pomysł pracy, zastanowił się Heisenberg nad tym, co powinno zastąpić rozwinięcie fourierowskie w sytuacji kwantowej. Pojawia się wtedy oczywiście wiele różnych częstości, nie można przyjąć, że są one wielokrotnością jednej tylko częstości \omega. Co więcej, częstości zależą teraz od dwóch wskaźników:

\omega_{mn}=\dfrac{E_{m}-E_{n}}{\hbar}, \mbox{  (**)}

jest to warunek Bohra, będący w istocie zasadą zachowania energii (\hbar jest stałą Plancka podzieloną przez 2\pi). Można więc uznać, że teraz potrzebujemy także amplitud zależnych od dwóch wskaźników. Współrzędna x naszego oscylatora powinna być jakoś reprezentowana przez zbiór owych amplitud:

x \rightarrow \left\{ x_{mn}e^{i\omega_{mn} t} \right\} .

Nie powinniśmy teraz liczyć na to, że x(t) jest sumą takich wyrazów, raczej mówimy o pewnym zbiorze, który reprezentuje współrzędną w mechanice kwantowej, Heisenberg był tu nieprecyzyjny, bo prawdopodobnie nie potrafił lepiej tego wyrazić.

Czym będzie w takim razie kwadrat współrzędnej albo – co ciekawsze – iloczyn dwóch współrzędnych x oraz y? Mówimy o tym samym układzie, którego zestaw energii, a więc i częstości, jest ustalony. Jeśli także y dane będzie podobnym zestawem co x powyżej, to iloczynowi powinien odpowiadać zbiór

xy \rightarrow \left\{ (xy)_{mp}e^{i\omega_{mp}t} \right\},

gdzie

\boxed{(xy)_{mp}=\sum_{n} x_{mn}y_{np}.}

Zauważmy, że definicja ta daje prawidłowy czynnik wykładniczy:

e^{i\omega_{mp}t}=e^{i\omega_{mn}t}e^{i\omega_{np}t},

gdyż korzystając z (**), otrzymujemy:

\omega_{mp}=\omega_{mn}+\omega_{np}.

Definicja z ramki okazała się najważniejszym wynikiem tej przełomowej pracy Heisenberga. Zauważył on natychmiast, że przy takiej definicji xy\neq yx, czyli mnożenie dwóch wielkości będzie na ogół nieprzemienne.

Potrzebował jeszcze warunku kwantowania, uzyskał go w dość skomplikowanej postaci. Następnie zastosował wynaleziony formalizm do przypadku oscylatora anharmonicznego, tzn. gdy siła oprócz składnika proporcjonalnego do wychylenia zawiera także poprawkę kwadratową w wychyleniu. Nie będziemy powtarzać jego rachunków, pokażemy tylko, co stało się w następnym miesiącu.

Otóż w czasie gdy Heisenberg wojażował, Born wraz z Jordanem (młodszym o rok od Heisenberga, a więc mającym dwadzieścia dwa lata!) przyjrzeli się jego pracy z bardziej matematycznego punktu widzenia. Max Born skojarzył po kilku dniach, że widział już kiedyś takie mnożenie jak w ramce. Było to jeszcze na studiach we Wrocławiu, a chodziło o mnożenie macierzy. Wielkości Heisenberga były po prostu macierzami. Zauważyli też obaj, że ów skomplikowany warunek Heisenberga można macierzowo zapisać jako

\boxed{xp-px=i\hbar \mathbf{I},}

gdzie x,p były macierzami położenia i pędu, a \mathbf{I} macierzą jednostkową. Wielkości kwantowomechaniczne były więc macierzami i to takimi, które nie komutują. Od komutowania dzieli je niewiele, bo tylko stała Plancka – znaczy to, że w wielu sytuacjach różnica ta będzie nie do wykrycia, gdyż stała Plancka jest mała w zwykłych jednostkach (ujmując to inaczej, to nasze, dostosowane do ludzkiego ciała, jednostki są ogromne w skali atomowej, bo my sami składamy się z ogromnej liczby atomów).

Trudno dziś uwierzyć, że Max Born, matematyk z wykształcenia, dawny asystent Hermanna Minkowskiego, musiał wygrzebywać z zakamarków pamięci definicję mnożenia macierzy. Algebra liniowa przez ostatnie sto lat stała się dziedziną bardzo podstawową i uczy się jej powszechnie, nie tylko ze względu na mechanikę kwantową, ale także różne bardziej przyziemne zastosowania, np. w statystyce.

Najprostszym zastosowaniem mechaniki macierzowej jest oscylator harmoniczny. Jego energia ma postać:

H=\dfrac{1}{2}m\dot{x}^2+\dfrac{1}{2}m\omega^2 x^2,

(gdzie m to masa oscylatora), a równanie ruchu (odpowiednik równania Newtona):

\ddot{x}+\omega^2 x=0.

Wyrażenia mają tę samą postać co w mechanice klasycznej (kropki oznaczają pochodną po czasie), ale wszystkie wielkości x,\dot{x},\ddot{x} są teraz macierzami. Nietrudno znaleźć postać macierzy x_{mn}. Można wybrać ją jako macierz symetryczną: x_{mn}=x_{nm} i jedyne nieznikające wyrazy równe są

x_{n,n-1}=x_{n-1,n}=\sqrt{\dfrac{n\hbar}{2m\omega}}.

Macierz energii (zwana hamiltonianem) staje się diagonalna, tzn. nie znikają jedynie wyrazy z jednakowymi wskaźnikami:

H_{nn}=\hbar\omega\left(n+\dfrac{1}{2}\right), \mbox{ gdzie }\, n=0,1,2,\ldots.

Nasze macierze są nieskończone, gdyż oscylator ma nieskończenie wiele stanów wzbudzonych. Całe obliczenie znaleźć można w klasycznej książce L.D. Landaua i E.M. Lifszyca, Mechanika kwantowa.

Mechanikę kwantową rozwijali ludzie młodzi pod kierunkiem starszych oraz Erwin Schrödinger. Isnieje dość zabawne zdjęcie z uroczystości noblowskich w roku 1933, gdy twórcy mechaniki kwantowej odbierali swoje nagrody. Mamy tam Diraca i Heisenberga z matkami oraz Schrödingera z żoną. Ten ostatni, już po czterdziestce, mógł być niemalże ojcem młodszych laureatów.

Warto dodać może parę słów o Pacualu Jordanie. Był potomkiem hiszpańskiego oficera wojsk napoleońskich i zawziętym nacjonalistą, a także nazistą. W roku 1933 Born z racji żydowskiego pochodzenia był już na emigracji, Getynga wyglądała zupełnie inaczej. Jordan, który brał od początku udział w powstaniu mechaniki kwantowej, współtworzył także równolegle do Paula Diraca kwantową teorię pola, czyli relatywistyczną mechanikę kwantową. Gdyby nie nazistowskie sympatie, z pewnością zostałby laureatem Nagrody Nobla. Z czysto naukowego punktu widzenia należała mu się ona, choć trudno nie podzielać wątpliwości szwedzkiego komitetu, że przyznanie nagrody w takich okolicznościach byłoby złym sygnałem dla świata.

 

 

P.A.M. Dirac i jego równanie (1927-1928)

Paul Dirac znany był z powściągliwej małomówności i z tego, że nie wdaje się w grzecznościowe pogaduszki. Richard Feynman opowiadał, że kiedy spotkał po raz pierwszy Paula Diraca na jakiejś konferencji, to po długiej chwili milczenia starszy uczony rzekł: „Mam równanie. Czy pan także?”

Rozmaite wypowiedzi Diraca cytowane są często jako żarty, gdyż brzmią z pozoru absurdalnie. Paul Adrien Maurice Dirac sprawiał wrażenie postaci beckettowskiej: chudy, z długimi kończynami i wielkimi stopami, nie okazujący emocji, porozumiewający się pełnymi zdaniami (ponieważ nie wolno zacząć zdania, jeśli się nie wie, jak je zakończyć), myślący w kategoriach logicznych i matematycznych, a nie emocjonalnych czy etycznych. Jego przyjaciel Charles Galton Darwin, fizyk, wnuk twórcy teorii ewolucji, dopiero po kilku latach znajomości z Dirakiem odważył się zapytać, co właściwie znaczą inicjały P.A.M. przed jego nazwiskiem. Po przeczytaniu Zbrodni i kary Dostojewskiego Dirac miał tylko jedną uwagę, i to raczej techniczną niż etyczną czy psychologiczną: otóż w książce słońce wschodzi dwukrotnie tego samego dnia.

Anegdota z równaniem mówi sporo o obu rozmówcach. Dirac cenił konkrety, lubił np. słuchać wielogodzinnych monologów Nielsa Bohra, ale wątpił, czy coś z nich wyniósł, ponieważ prawie wcale nie było w nich równań. Toteż cenił sobie niewątpliwie fakt, iż odkrył jedno z fundamentalnych równań przyrody, które stosuje się do wszystkich cząstek o spinie ½: a więc elektronów, protonów, nieodkrytych jeszcze wtedy neutronów oraz kwarków, z których nukleony się składają. Feynman pozostawił po sobie wprawdzie całki Feynmana, diagramy Feynmana i wiele innych osiągnięć, nie odkrył jednak nigdy żadnego fundamentalnego prawa przyrody i jak się zdaje jego ambicja cierpiała z tego powodu.

Jesienią 1927 roku Paul Dirac, młodzieniec zaledwie dwudziestopięcioletni, zaproszony został na Kongres Solvaya do Brukseli. Była to konferencja bardzo elitarna, gromadząca obecne i przyszłe znakomitości naukowe. Na pamiątkowym zdjęciu siedzi w samym środku za Einsteinem, wiemy, że bardzo był dumny z tej fotografii i posłał ją na swój macierzysty uniwersytet w Bristolu. Niewykluczone, że specjalnie usiadł za Einsteinem, jego teorię względności podziwiał bowiem od lat i poznał, zanim jeszcze zajął się fizyką atomową – jak to wtedy mówiono, czyli fizyką mikroświata. Najważniejsze postacie na tym zdjęciu to Niels Bohr i Max Born, przywódcy i patroni całego ruchu kwantowej odnowy w fizyce. W Kopenhadze i Getyndze tworzyły się zasady nowej mechaniki. Zaczęła ją praca Wernera Heisenberga z 1925 roku. Niedługo później dołączyli Born i Pascual Jordan.

Od jesieni 1925 roku mechanikę kwantową współtworzył też Paul Dirac. Był studentem Ralpha Fowlera w Cambridge. Fowler rozpoznał jego niebywały talent: młody inżynier elektryk i absolwent studiów drugiego stopnia z matematyki na uniwersytecie w Bristolu dostał stypendium do Cambridge i błyskawicznie uzupełnił braki z fizyki, nie tylko najnowszej, nie znał np. dotąd równań Maxwella. Fowler miał znakomite kontakty i chyba one przydały się Diracowi najbardziej. Młody uczony otrzymał od niego jeszcze przed drukiem korekty artykułu Heisenberga i zrozumiał ich znaczenie. Kiedy niedługo później opublikował swoją pierwszą pracę na temat mechaniki kwantowej, Max Born zdumiony był, że pojawił się ktoś spoza wąskiej grupy znanych mu ludzi pracujących w tej dziedzinie i w dodatku jego osiągnięcia są porównywalne do tego, co udało się stworzyć w Getyndze i Kopenhadze. Dirac, równieśnik Jordana, miał dwadzieścia trzy lata, pół roku mniej niż Heisenberg i dwa lata mniej niż Wolfgang Pauli. Pracował nad doktoratem. Dzięki Fowlerowi jego prace szybko się ukazywały w „Proceedings of the Royal Society”, a czas bardzo się wtedy liczył. Dirac zaczął korespondować z Hiesenbergiem, który od razu poczuł ogromny respekt do brytyjskiego kolegi. Po doktoracie wyjechał do Kopenhagi i Getyngi. Poznał wielu fizyków, ale nie zmienił swej metody pracy: przez sześć dni w tygodniu intensywne myślenie od rana do obiadu, w niedziele piesze wycieczki. Nie współpracował też z nikim, przez całe życie pracował sam, uważając, że tak jest najlepiej, bo ważne idee są zawsze dziełem konkretnego człowieka, nie zespołu.

Tak więc po dwóch latach swej naukowej kariery Dirac znalazł się w elitarnym gronie na Konferencji Solvaya. Przeszła ona do historii za sprawą dyskusji Bohra z Einsteinem, który nie potrafił się pogodzić z probabilistycznym charakterem nowej mechaniki – można w niej obliczać i przewidywać jedynie prawdopodobieństwa zdarzeń. To w trakcie jednej z takich dyskusji padły słynne słowa: „Bóg nie gra w kości”. W mechanice kwantowej zrezygnować trzeba także z pełnej wiedzy o zjawiskach w mikroświecie: im dokładniej zmierzymy położenie elektronu, tym mniej będziemy wiedzieli na temat jego pędu. Dirac zupełnie nie interesował się sporami filozoficznymi na temat podstaw mechaniki kwantowej. Dla niego była to piękna teoria, do której zbudowania się przyczynił, fascynowała go matematyczna elegancja całego obrazu, napisał zresztą niedługo później słynną książkę The Principles of Quantum Mechanics, przedstawiającą całą tę konstrukcję w niezrównany klarowny, choć też niezwykle zwięzły sposób.

Jesienią 1927 roku Paul Dirac pragnął odkryć swoje równanie. Chodziło o rozwiązanie zagadnienia elektronu w sposób zgodny z teorią względności Einsteina. Z problemem tym pierwszy zetknął się w roku 1925 Erwin Schrödinger, drugi outsider fizyki kwantowej, pracujący w Zurychu. Wiadomo było, że cząstki takie jak elektron związane są z pewnymi wielkościami falowymi. Schrödinger przyjął, że stan elektronu opisywany jest pewną funkcją położenia i czasu \psi(\vec{r},t). Funkcja ta spełniać musi równanie o postaci

i\hbar \dfrac{\partial\psi}{\partial t}=H\psi \mbox{ (*)},

gdzie H jest pewnym operatorem działającym na funkcję. Najłatwiej wyjaśnić to na przykładach. Operatorem takim jest np. mnożenie \psi przez którąś ze współrzędnych, np. x. Wynikiem działania tego operatora jest nowa funkcja równa x\psi. Innym operatorem jest różniczkowanie, np. po zmiennej x. Wynikiem działania tego operatora jest wówczas \frac{\partial \psi}{\partial x}. Innym przykładem operatora jest pochodna po czasie z lewej strony równania Schrödingera. Za każdym razem tworzymy z wyjściowej funkcji \psi jakąś nową funkcję. Operator H zwany hamiltonianem (albo operatorem Hamiltona) jest kwantową wersją wyrażenia na energię cząstki. Jeśli np. energia cząstki o masie m składa się z energii kinetycznej i potencjalnej V(\vec{x}), to możemy ją zapisać w postaci

E=\dfrac{{\vec{p}\,}^2}{2m}+V(\vec{x}).

Kwantowy operator Hamiltona będzie wówczas równy

H=-\dfrac{\hbar^2}{2m}\left(\dfrac{\partial^2}{\partial x^2}+\dfrac{\partial^2}{\partial y^2}+\dfrac{\partial^2}{\partial z^2}\right)+V(\vec{r})\equiv -\dfrac{\hbar^2}{2m}\Delta+V(\vec{r}).

Operator V(\vec{r}) jest po prostu operatorem mnożenia, energię kinetyczną konstruujemy z pędu za pomocą podstawienia

p_x\rightarrow -i\hbar\dfrac{\partial}{\partial x}

i analogicznie dla pozostałych współrzędnych. Równanie Schrödingera (*) jest podstawowym prawem mechaniki kwantowej. Rozwiązując je, dowiadujemy się, w jaki spośob zmienia się funkcja falowa, a więc stan naszego elektronu. Najprostszym możliwym rozwiązaniem tego równania w przypadku cząstki swobodnej (tzn. gdy V=0) jest funkcja opisującą falę:

\psi=A \exp{\frac{i}{\hbar}(\vec{p}\,\vec{r}-Et)}, \mbox{ (**)}

gdzie p_x, p_y, p_x oraz E są parametrami liczbowymi. Łatwo sprawdzić, że różniczkowanie tej funkcji sprowadza się do mnożenia przez odpowiedni czynnik i ostatecznie równanie Schrödingera da nam warunek:

E=\dfrac{\vec{p}\,^2}{2m},

jak powinno być dla cząstki swobodnej i parametry są składowymi pędu oraz energią cząstki. Zbudowaliśmy stan o określonej energii i jednocześnie określonym pędzie. Jasne jest, że przyjmujemy tu energię kinetyczną w postaci newtonowskiej, a więc nierelatywistycznej.

Erwin Schrödinger początkowo poszukiwał równania relatywistycznego dla swojej funkcji \psi i nawet takie równanie znalazł. Ma ono następującą postać w przypadku swobodnym:

\dfrac{1}{c^2}\dfrac{\partial^2 \psi}{\partial {t}^2}-\Delta \psi+\left(\dfrac{mc}{\hbar}\right)^2 \psi=0.

Podstawiając do niego funkcję (**), otrzymamy równanie

E^2-p^2c^2=m^2c^4,

a więc prawidłowy związek energii i pędu dla cząstki o masie m w teorii względności. Oczywiście równanie dla cząstki swobodnej niewiele znaczy, interesujące są przypadki, gdy mamy pewien potencjał V(\vec{r}), np. gdy elektron porusza się w polu elektrostatycznym nieruchomego protonu. Jest to prawie atom wodoru (prawie – ponieważ w prawdziwym atomie wodoru proton, choć znacznie masywniejszy, może też się poruszać). Nietrudno równanie Kleina-Gordona rozszerzyć tak, aby zawierało zewnętrzne pole elektromagnetyczne. Wiadomo było jednak, że elektron ma spin, co sprawia, że jego stany są podwojone i np. w polu magnetycznym ta różnica się ujawnia jako rozszczepienie linii widmowych (efekt Zeemana). Czemu więc Schrödinger nie opublikował tego równania, które dziś nazywa się równaniem Kleina-Gordona? Schrödinger uznał, że trzeba ograniczyć się na początek do równania nierelatywistycznego i opublikował równanie (*) zastosowane m.in. do atomu wodoru. Nie jest jasne, czy chodziło mu o brak spinu, czy może dostrzegł inne trudności z rozwiązaniami równania Kleina-Gordona.

Z punktu widzenia Diraca równanie Kleina-Gordona nie było rozwiązaniem problemu elektronu. Owszem, relatywistyczny związek między energią i pędem cząstki był spełniony, ale równanie zawierało drugą pochodną czasową, a nie pierwszą jak równanie Schrödingera. Zdaniem Diraca równanie podstawowe powinno być pierwszego rzędu w czasie, tak aby wartości funkcji falowej w danej chwili determinowały jej wartości w przyszłości (w przypadku równania drugiego rzędu należy znać jeszcze wartości pochodnych czasowych). Jak pogodzić to z relatywistyczną postacią energii? Hamiltonian powinien mieć postać:

H=\sqrt{-c^2\hbar^2 \Delta+m^2c^4},

Oczywiście, wyciąganie pierwiastka kwadratowego z laplasjanu nie jest operacją standardową. Inżyniersko nastawiony do matematyki Paul Dirac, nieodrodny spadkobierca Olivera Heaviside’a, nie zamierzał się poddawać z tak trywialnego powodu. Równanie dla cząstki swobodnej powinno być pierwszego rzędu w czasie, w teorii względności znaczy to, że powinno być także pierwszego rzędu w pochodnych przestrzennych – poniważ przestrzeń i czas są symetryczne u Einsteina. Należy więc szukać równania postaci

i\hbar \gamma^{\mu}\dfrac{\partial \psi}{\partial x^{\mu}}=mc\psi, \mbox{ (***)}

gdzie sumujemy po wskaźnikach czasoprzestrzennych \mu=0,1,2,3 oraz x^0=ct. Żądamy, aby \gamma^{\mu} nie zależały od czasu ani współrzędnych przestrzennych, a także aby dwukrotne zastosowanie operatora po lewej stronie dało nam m^2, jak w równaniu Kleina-Gordona – wtedy relatywistyczny związek energii i pędu będzie spełniony. Łatwo zauważyć, że stanie się tak, jeśli

\gamma^{\mu}\gamma^{\nu}+\gamma^{\nu}\gamma^{\mu}=2g^{\mu\nu}=2\cdot diag(1,-1-1-1),

gdzie g^{\mu\nu} jest metryką czasoprzestrzeni Minkowskiego. Jakimi obiektami muszą być owe cztery \gamma^{\mu}? Mają one antykomutować ze sobą, czyli ich iloczyn zmienia znak przy przestawieniu, a kwadraty mają być równe \pm 1. Dirac odkrył, że \gamma^{\mu} muszą być macierzami 4×4, a więc funkcja \psi musi zawierać cztery składowe:

\psi=\begin{pmatrix} \psi_1\\ \psi_2 \\ \psi_3 \\ \psi_4 \end{pmatrix}.

Inaczej mówiąc, równanie (***) jest układem czterech równań liniowych o stałych współczynnikach. Zaraz po Nowym Roku 1928 Ralph Fowler przekazał pracę do druku i miesiąc później się ukazała. Po miesiącu Dirac uzupełnił ją o drugą część. Mógł być teraz pewien: miał swoje równanie.

Dirac zaczął sprawdzać konsekwencje odkrytego równania. Okazało się, że zawiera ono informację o stanach spinowych elektronu. Co więcej, spinowy moment pędu okazywał się równy \hbar/2, a moment magnetyczny równy dokładnie magnetonowi Bohra. Znaczyło to, że w tym przypadku stosunek momentu magnetycznego do momentu pędu jest dwukrotnie większy niż dla orbitalnego momentu pędu, co potwierdzały eksperymenty (Nb. w roku 1915 Albert Einstein i Wander de Haas, zięć Hendrika Lorentza, przegapili okazję do pierwszorzędnego odkrycia doświadczalnego, zmierzyli bowiem ten stosunek i wyszedł im taki, jak oczekiwali, ale dwa razy mniejszy niż w rzeczywistości). Równanie elektronu Diraca w polu kulombowskim odtwarzało znane wyniki dla energii uzyskane wcześniej przez Arnolda Sommerfelda za pomocą relatywistycznej wersji modelu Bohra (model Bohra-Sommerfelda).

Co z czterema składowymi funkcji falowej? Potrzebne były dwie składowe do opisania spinu, ale cztery? Równanie Diraca zawiera rozwiązania zarówno dla energii dodatniej +\sqrt{p^2c^2+m^2c^4}, jak i -\sqrt{p^2c^2+m^2c^4}. Paul Dirac zauważył też, że rozwiązania te stwarzają realny problem: energia elektronu nie jest bowiem ograniczona z dołu, a to w przypadku układu kwantowego znaczy, że prędzej czy później powinien on przejść do stanu o niższej energii. W mechanice kwantowej panuje skrajny liberalizm: wszystko, co nie jest zabronione, jest dozwolone i się kiedyś zdarzy. Jedynym wyjściem wydawało się znaleźć jakiś zakaz, który musiałby być naruszany podczas takiego przejścia. Dwa lata później Dirac zaproponował, że stany o ujemnej energii są zajęte, więc ponieważ elektrony podlegają zakazowi Pauliego, zwykle nie ma takich przejść. Możliwe jest wzbudzenie elektronu z ujemną energią do stanu z energią dodatnią, pozostawi on dziurę, która będzie się zachowywać jak cząstka o takiej samej masie, lecz dodatnia. Otrzymujemy w ten sposób parę elektron i antyelektron. W 1932 roku cząstka taka została odkryta i nazwana pozytonem. Nic więc dziwnego, że już w roku następnym P.A.M. Dirac otrzymał Nagrodę Nobla (po połowie ze Schrödingerem). Inne wyjaśnienie dla rozwiązań o energii ujemnej podał później Richard Feynman: u niego pozytony są elektronami, które poruszają się wstecz w czasie, zamiast energii zmienia się znak czasu. Współczesna kwantowa teoria pola nie potrzebuje takich obrazów, wprowadza się w niej przestrzeń stanów bogatszą niż w mechanice kwantowej, gdyż pojawia się możliwość procesów kreacji oraz anihliacji par. Równanie Diraca obowiązuje nadal, lecz zamiast funkcji falowej mamy operator pola, obiekt jeszcze nieco bardziej abstrakcyjny.

Znakomitą biografię Diraca napisał Graham Farmelo, została ona jednak całkiem popsuta w polskim przekładzie, który językowo jest poniżej wszelkiej krytyki. Szkoda, bo pewnie nieprędko pojawi się drugie wydanie.

Dlaczego grawitacja wiąże się z krzywizną czasoprzestrzeni?

  • Przeniesienie równoległe

Wyobraźmy sobie najpierw powierzchnię zanurzoną w przestrzeni euklidesowej. Załóżmy, że określiliśmy na niej pewne współrzędne x=(x^1, \ldots, x^n) . Położenie punktu powierzchni możemy więc zapisać jako \vec{r}=\vec{r}(x^i) . Pochodne tego wektora po współrzędnych, utworzą zbiór wektorów stycznych do naszej powierzchni:

\vec{e}_j=\dfrac{\partial \vec{r}}{\partial x^j}.

Dowolny wektor styczny do powierzchni w danym punkcie można przedstawić jako kombinację liniową \vec{e}_j:

\vec{v}=v^j \vec{e}_j,

gdzie sumujemy po powtarzającej się parze wskaźników: górnym i dolnym. Jest to tzw. konwencja Einsteina, uczony mówił żartobliwie, że stanowi ona jego największe odkrycie matematyczne. W geometrii ważną rolę odgrywa równoległość: wiemy, co znaczy, że dwa wektory w przestrzeni euklidesowej są równoległe. Można koncepcję równoległości przenieść na nieskończenie bliskie wektory na zakrzywionej powierzchni. W przestrzeni euklidesowej nasz wektor \vec{v} ma pozostać stały, co oznacza, że

\delta\vec{v}=0=\delta v^j \vec{e}_j+v_j \delta \vec{e}_j.

W drugim wyrazie uwzględniliśmy, że nasza baza względem przestrzeni euklidesowej może się obracać. Zmiana każdego z wektorów bazy powinna być równa:

\delta\vec{e}_j=\dfrac{\partial \vec{r}}{\partial x^j \partial x^i }\delta x^i\stackrel{.}{=}{\Gamma}^k_{ij}\delta x^i \vec{e}_k.

Ostatnia równość \stackrel{.}{=} to w istocie rzut wektora z lewej strony na płaszczyznę styczną, pomijamy więc tę część wektora, która „wystaje” z powierzchni. Podstawiając to do warunku równoległości, otrzymujemy

\delta v^k=-\Gamma_{ij}^k v^i \delta x^j. \mbox{ (*)}

Oznacza to, że współrzędne wektora równoległego nieco się zmienią i zmianę tę opisują współczynniki \Gamma , zwane uczenie koneksją afiniczną. Znając funkcje koneksji, możemy dokonać przesunięcia równoległego wektora. Jeśli rozpatrzymy pewną krzywą x^j=x^j(\tau) (gdzie \tau jest czasem własnym), pochodne współrzędnych utworzą wektor prędkości styczny do toru:

v^k=\dfrac{d x^k}{d\tau}.

Najprostszym fizycznie ruchem będzie przesunięcie równoległe tego wektora wzdłuż krzywej (linii świata):

\delta \left(\dfrac{d x^k}{d\tau}\right)=-\Gamma_{ij}^k v^i \delta x^k,

skąd otrzymujemy równanie geodezyjnej:

\dfrac{{d\,}^2 x^k}{d\tau^2}+\Gamma_{ij}^k \,\dfrac{d x^i}{d\tau}\,\dfrac{d x^j}{d\tau}=0. \mbox{ (**)}

Jest to warunek na przeniesienie równoległe wektora prędkości wzdłuż krzywej, a więc coś najbliższego ruchowi jednostajnemu i prostoliniowemu z I zasady dynamiki.

Możemy teraz zapomnieć o przestrzeni euklidesowej i rozpatrywać przestrzeń, w której określone są współczynniki koneksji. Mamy wówczas krzywe geodezyjne – coś najbardziej zbliżonego do linii prostej. W teorii względności krzywe geodezyjne opisują ruch cząstki pod działaniem pola grawitacyjnego. Jak widać współczynniki koneksji komplikują równania ruchu i można je uważać za składowe pola grawitacyjnego, czy dokładniej grawitacyjno–bezwładnościowego. Kiedy współczynniki koneksji znikają, wracamy do ruchu prostoliniowego i szczególnej teorii względności (tzn. nie ma pola grawitacyjnego).

Równania geodezyjnej mogą więc nieść informację o polu grawitacyjnym. Zgodnie z zasadą równoważności nic tu nie zależy od masy poruszającej się cząstki. Okazuje się, że można za pomocą koneksji opisać grawitację także w mechanice klasycznej (zrobił to É. Cartan, już znając teorię Einsteina). Automatycznie opisujemy też siły bezwładności. Z punktu widzenia fizyka wcale nie jest dziwne, że w równaniu geodezyjnej mamy aż dwie prędkości: powinniśmy bowiem w tym formalizmie otrzymać zarówno siły Coriolisa liniowe w prędkości, jak i siły odśrodkowe, kwadratowe w prędkości. Z punktu widzenia zasady równoważności nie możemy lokalnie rozstrzygnąć, czy w naszym przypadku mamy do czynienia z polem grawitacyjnym, czy siłami bezwładności.

  • Krzywizna

Koneksja pozwala nam przenosić wektory równolegle wzdłuż krzywej. Wynik takiego przesuniecia może więc zależeć od kształtu krzywej. Aby zobaczyć, jak to działa, rozpatrzmy przesunięcie równoległe wektora v^i po infinitezymalnym zamkniętym równoległoboku geodezyjnych: po drodze x, x+\delta a, x+\delta a+\delta b, x+\delta b, x. Łączna zmiana wektora dana jest wyrażeniem:

\delta v^i=-\Gamma_{kj}^i(x) v^k(x) \delta a^j-\Gamma_{kj}^i(x+\delta a) v^k(x+\delta a) \delta b^j\\ \\ +\Gamma_{kj}^i(x+\delta b) v^k(x+\delta b) \delta a^j+\Gamma_{kj}^i(x) v^k(x) \delta b^j.

Można to wszystko zapisać w postaci:

\delta v^i=R^i_{kjl} v^k \delta b^j \delta a^l, \mbox{(***)}

gdzie R^i_{kjl} nazywa się tensorem krzywizny Riemanna i wyraża wzorem:

R^i_{kjl}=\Gamma^i_{lk,j}-\Gamma^i_{jk,l}+\Gamma^i_{jm}\Gamma^m_{kl}-\Gamma^i_{lm}\Gamma^m_{kl}.

W ostatnim wyrażeniu przecinki przed indeksem oznaczają różniczkowanie po odpowiedniej współrzędnej: A_{,i}\equiv\frac{\partial}{\partial x^i}. Przestrzeń jest zakrzywiona wtedy i tylko wtedy, gdy tensor krzywizny jest różny od zera. (Wektory i tensory transformują się w odpowiedni sposób przy zmianie układu współrzędnych, tak że znikanie w jednym układzie oznacza znikanie we wszystkich.) Koneksja jest zatem nietrywialna, gdy tensor krzywizny znika. Równanie (***) można zilustrować poglądowo: zmiana wektora proporcjonalna jest tu do pola powierzchni równoległoboku. Ponieważ każdą powierzchnię możemy rozbić na takie równoległoboki, więc łączna zmiana wektora w przesunięciu równoległym po zamkniętej pętli powinna być związana z krzywizną oraz polem powierzchni pętli. W przypadku sfery krzywizna jest stała i kąt obrotu wektora jest proporcjonalny do pola powierzchni pętli. W teorii względności pojawienie się krzywizny oznacza, że mamy nietrywialne pole grawitacyjne.

Tensor krzywizny ma wiele symetrii, które sprawiają, że ma nieco mniej niezależnych składowych, niż to wygląda na pierwszy rzut oka. W przypadku dwuwymiarowej powierzchni ma tylko jedną składową, w czterowymiarowej – dwadzieścia.

Klasycznym zastosowaniem przeniesienia równoległego jest wahadło Foucaulta.

  • Równanie dewiacji geodezyjnej

Brzmi to okropnie, nieco bardziej logiczne jest określenie: dewiacja linii geodezyjnych. Chodzi o to, co dzieje się wzdłuż pobliskich linii geodezyjnych. Możemy sobie wyobrazić dwie cząstki pyłu, które znajdują się nieskończenie blisko siebie w chwili początkowej. Obserwujemy, jak bedzie się zachowywać z czasem ich odległość mierzona różnicami współrzędnych. Zakladamy, że rozsądnie zaczynamy liczyć czas, tak żeby ułatwić porównanie dwóch ruchów.

Równanie dewiacji ma następującą postać:

\dfrac{D^2 \eta^i}{D\tau^2}=R^i_{jkl}\,\dfrac{dx^j}{d\tau}\,\dfrac{dx^k}{d\tau}\,\eta^l.

Różniczkowanie po lewej stronie oznacza pochodną po czasie własnym obliczoną jednak z uwzględnieniem przeniesienia równoległego. Nie możemy bowiem porównywać w przestrzeni zakrzywionej wektorów w dwóch różnych punktach przestrzeni, najpierw należy przenieść jeden z nich do punktu zaczepienia drugiego. Różnicę wektora wzdłuż krzywej wynikającą z jego zmiany: \frac{d\eta^i}{d\tau}d\tau należy poprawić, odejmując zmianę wynikającą z przesunięcia (*), łącznie otrzymamy

\dfrac{D\eta^i}{D\tau}=\dfrac{d\eta^i}{d\tau}+\Gamma^i_{jk}\,\dfrac{dx^j}{d\tau}\,\eta^k.

Jest to tzw. pochodna absolutna wzdłuż krzywej. Używając tego zapisu, możemy równanie geodezyjnej (**) zapisać w postaci

\dfrac{D}{D\tau}\dfrac{dx^i}{d\tau}=0.

Pochodna absolutna znika, gdy współrzędne wektora zmieniają się jedynie za sprawą przesunięcia równoległego, czyli w sensie fizycznym można powiedzieć, że się nasz wektor nie zmienia – przenosi się jedynie równolegle wzdłuż krzywej.

  • Równania pola Einsteina

Warto zauważyć, że do tej pory nie mówiliśmy nic o metryce naszej przestrzeni. W szczególnej teorii względności mamy naturalną miarę odległości dwóch zdarzeń w czasoprzestrzeni:

ds^2=dt^2-dx^2-dy^2-dz^2.

(Przyjmujemy c=1.) W zakrzywionej czasoprzestrzeni ogólnej teorii względności możemy zawsze wprowadzić taki układ współrzędnych, w którym interwał ds^2 przyjmie powyższą postać w danym punkcie. Nie można natomiast zwykle zrobić tego globalnie. Interwał czasoprzestrzenny ogólnie biorąc określa tensor metryczny g_{\mu\nu}. Podaje on przepis na obliczenie interwału za pomocą danych współrzędnych (gdy zmienimy współrzędne, postać metryki też się odpowiednio zmieni):

ds^2=g_{\mu\nu}dx^{\mu}dx^{\nu}.

Tutaj wskaźniki \mu,\nu=0,1,2,3. Mamy tu 10 niezależnych wartości (symetryczna macierz 4×4). Z matematycznego punktu widzenia koneksja i metryka to dwie różne struktury. Można je uzgodnić i tak jest w ogólnej teorii względności. Koneksja oraz tensor krzywizny wyrażają się przez metrykę. Lokalnie, w danym punkcie, nie tylko metryka może przybrać wartości znane ze szczególnej teorii względności, ale także współczynniki koneksji mogą znikać. Nie ma natomiast takiej transformacji współrzędnych, która sprowadza tensor Riemanna do zera, jeśli był niezerowy w innym układzie współrzędnych. Tensor Riemanna zawiera pierwsze i drugie pochodne metryki. Geodezyjne możemy też zdefiniować jako krzywe najkrótszej/najdłuższej długości, i są to wówczas te same geodezyjne co zdefiniowane wyżej.

Z fizycznego punktu widzenia metryka przypomina potencjał, a współczynniki koneksji – siły. Jaką postać moze mieć równanie pola w teorii Einsteina? Źródłem pola grawitacyjnego są masy, a u Einsteina także pędy i energie. Dla zbioru cząstek opisu dostarcza symetryczny tensor energii pędu: T_{\mu\nu}. Potrzebujemy więc jakiegoś tensora krzywizny o dwóch wskaźnikach. Taką wielkością jest tensor Ricciego zdefiniowany jako

R_{\mu\nu}=R^{\lambda}_{\mu\lambda\nu},

(sumowanie po wskaźnku \lambda). Można więc oczekiwać równania typu

R_{\mu\nu}=\kappa T_{\mu\nu}.

I jest to prawie dobre równanie, należy tylko zmodyfikować w nim lekko lewą stronę. Rzecz w tym, że tensor energii pędu powinien być zachowany, a lewa strona, tensor Ricciego nie spełnia tego warunku. Należy zastąpić go więc tensorem Einsteina:

G_{\mu\nu}=R_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R=\kappa T_{\mu\nu},

gdzie R to skalar Ricciego: R=g^{\mu\nu}R_{\mu\nu} (g^{\mu\nu} jest macierzą odwrotną do g_{\mu\nu}. Jest to subtelność techniczna, na którą natrafił Einstein w listopadzie 1915 roku: 11 listopada proponuje pierwszą wersję, a 25 listopada tę niższą, już prawidłową. Ostatnie równanie można też przepisać w równoważnej postaci:

R_{\mu\nu}=\kappa (T_{\mu\nu}-\frac{1}{2}g_{\mu\nu}T^{\lambda}_{\lambda}).

W dalszym ciągu przyda nam się składowa 00 tego równania, w najprostszej sytuacji spoczywającej materii tylko składowa 00 tensora energii pędu jest różna od zera i równa jest gęstości materii \varrho. Otrzymamy wówczas

R_{00}=\kappa (T_{00}-\frac{1}{2}T_{00})=\frac{1}{2}\kappa T_{00}=\frac{1}{2}\kappa \varrho.

Aby znaleźć stałą \kappa, należy skorzystać z równań dla grawitacji Newtonowskiej, która powinna być przypadkiem granicznym.

W tym celu wyobraźmy sobie równanie dewiacji zastosowane do dwóch swobodnie spadających cząstek. Zakładamy, że w chwili początkowej \tau=0 obie spoczywają względem siebie. Wybieramy układ współrzędnych związany z cząstką centralną (względem której obliczana jest dewiacja). W takim układzie odniesienia czas własny i czas t są tym samym. Dla wskaźników przestrzennych i=1,2,3 równanie dewiacji sprowadza się do

\dfrac{d^2\eta^i}{dt^2}=R^{i}_{00l}\eta^l=-R^i_{0l0}\eta^l.

Skorzystaliśmy z faktu, że nasza cząstka centralna spoczywa: \frac{dx^\mu}{dt}=(1,0,0,0). W drugiej równości zmieniliśmy znak wraz z przestawieniem pary ostatnich wskaźników w tensorze Riemanna. Wynik ten obowiązuje dla trzech przyspieszeń wzdłuż trzech osi kartezjańskich. Załóżmy, że mamy kulę pyłu o promieniu r, początkowo nieruchomą, której środek obraliśmy za początek wektora \eta. Objętość kuli to

V=\dfrac{4\pi}{3}r_x r_y r_z,

gdzie zaznaczyliśmy, że wzdłuż trzech osi kartezjańskich promienie mogą się zmieniać niezależnie (przekształcając kulę w elipsoidę). Obliczając drugą pochodną objętości w chwili t=0 (pamiętamy, że pierwsze pochodne znikają), otrzymujemy:

\dfrac{\ddot{V}}{V}=\dfrac{\ddot{r}_x}{r_x}+\dfrac{\ddot{r}_y}{r_y}+\dfrac{\ddot{r}_z}{r_z}=-R_{00}.

W ostatniej równości, skorzystaliśmy z faktu, że R^0_{000}=0 – można więc sumowanie po wskaźnikach przestrzennych rozszerzyć o wskaźnik czasowy. Możemy tę samą wielkość obliczyć z Newtonowskiego prawa ciążenia. Przyspieszenie grawitacyjne na powierzchni kuli pyłu o masie M równe jest

g=\dfrac{GM}{r^2},

Wobec tego druga pochodna objętości spełnia równanie

\dfrac{\ddot{V}}{V}=-3\dfrac{g}{r}=-4\pi G \varrho.

gdzie \varrho to gęstość naszej kuli (&). Zatem szukana stała równa jest \kappa=8\pi G. Równanie Einsteina powinno mieć zatem postać.

G_{\mu\nu}=8\pi G T_{\mu\nu}.

Podsumowując, w roku 1915 Albert Einstein (podobnie zresztą jak najlepsi ówcześni matematycy) nie rozumiał dokładnie roli tensora Ricciego i nie widział, że równania pola są praktycznie wyznaczone przez kilka dość prostych warunków matematycznych. Oczywiście, nie są to jedyne możliwe matematycznie równania, ale jak pokazują przykłady późniejszych teorii grawitacji (a było ich przez sto lat sporo), równania Einsteina są najprostsze i jak dotąd potwierdzane są przez obserwacje. Kiedy później uczony zrozumiał, że w gruncie rzeczy można by dojść do teorii grawitacji drogą matematyczną, zaczął wyżej cenić osiągnięcia czystej matematyki. Stało się to poniekąd źródłem jego późniejszych niepowodzeń przy konstrukcji jednolitej teorii pola: z braku danych fizycznych szukał bowiem drogi matematycznej. Skonczyło się na dość jałowych próbach, które nie wzbogaciły zbytnio ani matematyki, ani fizyki.

(&) Nie jest to całkiem ścisłe rozumowanie, ponieważ milcząco założyliśmy, że nie ma innej materii niż kula pyłowa. Naprawdę należałoby obliczyć strumień pola grawitacyjnego przez powierzchnię kuli (on już zależy wyłącznie od tego, co znajduje się wewnątrz kuli), a potem skorzystać z tw. Gaussa-Ostrogradskiego i obliczyć dywergencję pola grawitacyjnego w punkcie centralnym. Tę wartość można porównać z tym, co wynika z równania dewiacji geodezyjnej. Oczywiście wynik jest taki sam.

Nie rozwijałem tu kwestii, czym są tensory. W największym skrócie są to obiekty niezależne od wyboru współrzędnych, podobnie jak trójwymiarowe wektory (które są szczególnym jednowskaźnikowym typem tensora). W teorii Einsteina dopuszczamy praktycznie wszelkie gładkie transformacje współrzędnych (ogólna kowariantność). Równania prawidłowo zapisane w ten sosób automatycznie słuszne będą w każdym układzie współrzędnych. Einstein wrócił do tensorów już w trakcie swej „rewolucji listopadowej” – kiedy co tydzień publikował nową pracę na temat teorii grawitacji, przy okazji modyfikując albo zmieniając poprzednie. Ten dziwny tryb publikowania wiązał się z tym, że w Getyndze David Hilbert, jeden z czołowych matematyków świata, także pracował nad podobną teorią. Einsteinowi groziło, że po siedmiu latach pracy zostanie prześcignięty, by tak rzec na ostatnich metrach przed finiszem. Nigdy później (ani wcześniej) nie publikował tak gorączkowo. Starał się też zazwyczaj wykazywać bardziej olimpijski spokój, co oczywiście było znacznie łatwiejsze, kiedy się było autorem epokowej teorii.

Gdyby ktoś chciał szczegółowo przejść obliczenia tensora krzywizny i równania dewiacji, może znaleźć je np. tutaj, na stronie Alana Heavensa s. 22-24.

Interpretacja tensora Ricciego za pomocą objętości kul opisana jest np. w pracy Johna C. Baeza i Emory’ego F. Bunna.

Michele Angelo Besso, przyjaciel Einsteina

Historia zna wiele przypadków, kiedy tylko pesymiści mieli rację, a radosna większość beztrosko podążała ku zgubie. W roku 1936 większość Niemców zadowolona była z kanclerza Hitlera, który podniósł kraj z kolan i zlikwidował bezrobocie. Prawie nikt oprócz przeciwników reżimu nie myślał o nieuniknionym smutnym końcu tego państwa. Einstein, obserwując sytuację w Europie, pisał z Ameryki do Bessa:

Sprawy ludzkie w naszych czasach mniej niż kiedykolwiek napawają radością, by nie wspomnieć o tych głupcach z Niemiec. Teraz okazuje się w końcu, jak proroczym umysłem był prof. Winteler, który tak wcześnie rozpoznał całą powagę tego zagrożenia [Fölsing, s. 55].

Znali się z Bessem wówczas niemal czterdzieści lat i choć nie mieli się już nigdy spotkać osobiście, pisali do siebie regularnie. Albert Einstein miał dar zaprzyjaźniania się z ludźmi, i to na całe życie. Jedna z najdłuższych znajomości wiązała go z Michele Angelo Besso, starszym o sześć lat inżynierem budowy maszyn po Politechnice w Zurychu (późniejszej ETH). Poznali się na wieczorku muzycznym w salonie państwa Hüni, właścicieli sklepu muzycznego w Zurychu, obaj bowiem grali na skrzypcach. Czytając o ludziach z końca XIX wieku, ma się wrażenie, że niemal wszyscy muzykowali, a w każdym razie bywali na różnych domowych wydarzeniach muzycznych. Łączyło to ludzi w różnym wieku, różnych zawodów i upodobań. Osiemnastoletni Einstein kończył już zapewne pierwszy rok studiów na kierunku nauczycielskim tej samej uczelni. Można sądzić, że zbliżyło ich także i to, że uczyli się u tych samych profesorów fizyki: Heinricha Webera i Johanna Perneta i matematyki: Adolfa Hurwitza i Karla Geisera. Besso uzyskiwał zresztą lepsze stopnie niż Einstein, który chodził swoimi drogami, szybko przestał cenić wiedzę przekazywaną na uczelni i niezbyt się przykładał, zwłaszcza do matematyki. Besso zawdzięczał też Einsteinowi i owym wieczorkom muzycznym znajomość ze swą przyszłą żoną Anne Winteler.

Rodzina Wintelerów stała się wspólnym ogniwem łączącym ich życie. Einstein trafił do domu Josta i Pauline Winteler w Aarau w roku 1895 po oblanych egzaminach na Politechnikę. W tamtejszej szkole kantonalnej uzupełniać miał wiedzę z potrzebnych przedmiotów, mieszkając na stancji u Wintelerów. Jost Winteler, językoznawca, autor nowatorskiej dysertacji na temat jednego ze szwajcarskich dialektów, filolog, ornitolog i poeta, należał do grona nauczycielskiego szkoły. Jego żona Pauline szybko stała się dla Alberta kimś bliskim, niemalże drugą matką. Wintelerowie mieli też siódemkę dzieci, od najstarszej Anne, przez Josta Fridolina, Rosę, Marie, Mathiasa, Josta juniora do Paula. Swój pierwszy romans przeżył Albert z Marie Winteler. Odsunął się jednak od niej, kiedy podczas studiów poznał Milevę Marić, swą późniejszą żonę. Marie mocno to przeżyła i związki Alberta z Wintelerami przejściowo osłabły. Po kilku latach Marie wyszła za mąż za dyrektora fabryki zegarków. Wiadomo, że w późniejszych latach ich romans odżył w sekrecie. Kilka lat po Albercie również jego siostra, Maja, mieszkała przez czas nauki u Wintelerów i wyszła potem za mąż za najmłodszego ich syna Paula.

Rodzina Wintelerów: od lewej Marie, Maja Einstein, Paul, Anna, rodzice: Jost i Pauline, Rosa

Jost Winteler kultywował staroświecki liberalizm, ideały republikańskie, kształcił swoje dzieci (także córki), niechętnie myślał o niemieckim szowinizmie, który znał jeszcze swe swych studiów w Jenie i który docierał aż do Szwajcarii. Einstein zawdzięczał Jostowi wiele swych poglądów na świat polityki i historii. Podobne liberalne poglądy żywił Alfred Stern, profesor historii, u którego Albert bywał jako student na obiadach. Besso uczęszczał na jeden z jego wykładów. Szwajcarskie środowisko młodego Einsteina nie przywiązywało wagi do narodowości. Einstein dopiero w Berlinie wiele lat później poczuł się Żydem.

Jeszcze innym elementem łączącym Bessa i Alberta oraz Maję Einsteinów były Włochy. Besso, urodzony pod Zurychem, pochodził z rodziny wywodzącej się z Triestu. Mówił równie swobodnie po włosku i po niemiecku, znał też francuski i angielski. Rodzice Einsteinów mieszkali wówczas we Włoszech, więc Albert kursował między Pawią a Zurychem. Choć uczony nie znał dobrze włoskiego, lubił ten język i w korespondencji z Tulio Levi-Civitą podczas pierwszej wojny światowej, nalegał, by matematyk pisał do niego w swoim języku (odpowiadał mu jednak po niemiecku). Besso także w pewnych okresach życia mieszkał we Włoszech. We Florencji spędzili wiele lat Maja Einstein (doktor filologii romańskiej) z Paulem: ona usiłowała prowadzić pensjonat, on malował obrazy.

Namiętnością Bessa była wiedza. Przez całe życie, aż do późnej starości, pochłaniał książki, uczęszczał na wykłady, robił notatki, należał do towarzystw naukowych. Zajmował się przy tym dziedzinami tak różnymi, jak filozofia, neurofizjologia, polityka, psychologia, prawo przemysłowe, literatura angielska, różne dziedziny fizyki i matematyki. I nie były to zainteresowania powierzchowne: Besso chodził na wykłady takich uczonych, jak Einstein czy Hermann Weyl i był ich aktywnym uczestnikiem, zadającym pytania i starającym się zrozumieć różne kwestie. Przez kilka lat Albert i Michele pracowali razem w Urzędzie Patentowym w Bernie. To Einstein ściągnął tam przyjaciela, często razem wracali do domu, dyskutując nad zagadnieniami fizyki. Besso jest jedyną osobą, którą Einstein wymienia z wdzięcznością w swoim epokowym artykule na temat teorii względności.

Przyjaciele współpracowali też w czerwcu 1913 roku, gdy Besso (mieszkający wtedy w Gorycji) odwiedził Einsteina w Zurychu. Uczony ukończył wtedy ważną pracę wspólnie z Marcelem Grossmannem, w której podał równania pola grawitacyjnego. Była to tzw. teoria Entwurf (co znaczy tyle co zarys). Einstein przekonał wówczas sam siebie, iż jest to prawidłowa teoria. Nie była ona szczególnie elegancka, ale w końcu nikt nie powiedział, że równania fizyki muszą koniecznie być eleganckie. Mają prawidłowo opisywać zjawiska, i to wszystko. Kłopot w tym, że nie było zbyt wielu zjawisk możliwych wtedy do wykrycia. Inaczej mówiąc, stara teoria Newtona nawet po przeszło dwóch wiekach trzymała się dobrze. Czemu więc w ogóle ulepszać coś, co okazało się dobre? Einstein był fizykiem dobrze „słyszącym” pojęcia i wychwytującym świetnie wszelki fałsz i brak harmonii. To go zaprowadziło do szczególnej teorii względności. Ale szczególna teoria względności była niekompatybilna z grawitacją. Potrzebna była teoria traktująca grawitację jako pole, analogiczne do pola elektrycznego i magnetycznego. Do tego punktu Einstein nie był sam – wielu innych próbowało w tych latach zbudować teorię grawitacji jako pola. Einstein miał jednak inny punkt wyjścia: grawitacja, podobnie jak bezwładność, mierzona jest masą. Właściwie są to dwa różne pojęcia masy: można osobno mierzyć masę grawitacyjną i osobno bezwładną. Okazuje się, że są one równe. Z punktu widzenia teorii był to swoisty „cud”, arbitralne założenie, dodane, by opisać rzeczywistość. Toteż Einstein pracował nad teorią, w której bezwładność i grawitacja będą wymienne, a to zaprowadziło go do przestrzeni zakrzywionych i szukania pomocy u Marcela Grossmanna, matematyka i przyjaciela ze studiów.

Istniał niewielki efekt, którego astronomom nie udawało się wyjaśnić: orbita Merkurego, w pierwszym przybliżeniu eliptyczna, obraca się powoli. Większość tego obrotu (równego 570’’) wyjaśnić można przyciąganiem innych planet, pozostawała jednak niewielka różnica 41 sekund kątowych na stulecie. Zauważył to jeszcze w połowie XIX wieku Urbain Le Verrier i po półwieczu analiz różnica ta nadal się utrzymywała i nikt nie miał dobrego pomysłu na jej wyjaśnienie. Chwytano się pomysłów rozpaczliwych, np., że wykładnik w prawie grawitacji różni się troszeczkę od dwóch albo że są jakieś niewidoczne obłoki materii blisko Słońca, które wpływają na ruch Merkurego. Mając teorię Entwurf Einstein chciał sprawdzić, czy uda się za jej pomocą wyjaśnić obrót peryhelium Merkurego. Zachował się rękopis (Einstein Papers, t. 4, doc. 14), w którym obaj przyjaciele obliczali ową wielkość obrotu peryhelium. Jest on świadectwem, że w osobie Bessa Einstein miał nie tylko interlokutora, ale i do pewnego stopnia kolegę. Niewykluczone też, że uczony chciał wciągnąć w ten sposób Bessa do pracy naukowej i zachęcić do przeprowadzenia dalszych rozważań, które można by opublikować. Wielkość efektu, którą uzyskali równa była 1821’’, czyli około pół stopnia na stulecie. Musieli jednak później zdać sobie sprawę z błędu w rachunkach: wstawili do obliczeń przez pomyłkę sto razy za dużą masę Słońca. Efekt ów był naprawdę równy 18’’ na stulecie. Czyli nadal źle, ale w końcu nie było żadnej pewności, czy w ogóle owe 41’’ uda się wyjaśnić za pomocą innej teorii grawitacji. Astronomowie mogli się gdzieś po drodze pomylić albo nie wziąć pod uwagę jakichś istotnych faktów. Inne teorie grawitacji z tego okresu nie radziły sobie lepiej. Besso wrócił wkrótce do Włoch, zabierając ze sobą obliczenia. W następnym roku obliczenia podobne do Einsteina i Bessa opublikował Johannes Droste, holenderski nauczyciel matematyki, który później napisał doktorat poświęcony ogólnej teorii względności. Besso nigdy nie zrobił doktoratu, może czuł, że aktywna praca naukowa nie jest dla niego. W tamtych czasach nie było zresztą łatwo o płatną posadę naukową i często nawet wybitni uczeni musieli przez wiele lat zarabiać w inny sposób. Jak się zdaje, Besso nie był w dostatecznym stopniu skoncentrowany na jednym, interesowało go wiele rzeczy, a przy tym brakowało mu uporu, aby zmagać się z jednym zagadnieniem przez długi czas. Ludzie tacy jak Besso nie osiągają zaszczytnych stanowisk, choć może to dzięki nim świat wydaje się nieco lepszy. Einstein lubił idealistów, nawet dziwaków, niezwykle wysoko cenił też zawsze inteligencję Bessa, a przecież z biegiem lat poznał najwybitniejsze umysły epoki. Kiedy już obaj byli starzy, napisał przyjacielowi: „Nadal wierzę, że gdybyś był w większym stopniu monomaniakiem, mógłbyś osiągnąć coś naukowo wartościowego. Motyl nie jest kretem, ale żaden motyl nie pownien tego żałować” [6 I 1948].

Ostatecznie teoria Entwurf okazała się fałszywa, co Einstein zauważył dopiero we wrześniu 1915 roku. Jednak obliczenia przeprowadzone w roku 1913 wraz Michele Besso okazały się niezwykle pomocne, gdy w listopadzie sformułował nowe równania pola i powtórzył rachunki dla peryhelium Merkurego – tym razem dały one prawidłowy rezultat. Było to, jak Einstein później twierdził, jego najsilniejsze przeżycie naukowe: teoria zbudowana tak, by uzyskać większą przejrzystość pojęć, w oderwaniu od bezpośrednich danych eksperymentalnych, dała oto prawidłowy rezultat dla efektu znanego i niewyjaśnionego od dawna. A więc składając ze sobą starannie i uważnie idee oderwane, można wyjrzeć z platońskiej jaskini i lepiej zrozumieć ruch planet.

Później Besso, który znał także Milevę, służył często jako pośrednik w jej trudnych kontaktach z Einsteinem, czy nawet jako swego rodzaju zastępczy ojciec dla jego synów. Po I wojnie światowej zamieszkał znowu w Szwajcarii znajdował się więc znacznie bliżej dawnej rodziny Einsteina. Uczony żywił dużo szacunku dla moralnej postawy Bessa, ale chwilami trudno im się było porozumieć, zwłaszcza podczas bolesnego i wieloletniego konfliktu Alberta z Milevą zakończonego rozwodem. Ona walczyła zażarcie o pieniądze i pełne decydowanie o życiu synów. Jak się zdaje, w obu kwestiach osiągnęłaby to samo, nie stawiając spraw na ostrzu noża. Einstein chciał być dobrym ojcem i nie był też skąpy. Zapewne to urażona duma i zawiedziona miłość Milevy stały się główną przeszkodą w negocjacjach.

Besso, namawiany wielokrotnie do napisania biografii przyjaciela, miał na tyle dużo taktu, aby tego nie robić, choć postać Einsteina gwarantowała finansowy sukces przedsięwzięcia. Po dojściu Hitlera do władzy Einstein wyjechał na stałe do Stanów Zjednoczonych i nawet po wojnie nie odwiedził Europy, szczególnie unikając kontaktów z Niemcami. Besso mieszkał w Bernie, potem w Genewie. Na początku roku 1955 Einstein dowiedział się o śmierci przyjaciela. Odpisał wtedy jego synowi (któremu kiedyś zbudował pierwszego latawca), podkreślając harmonię życia zmarłego, jego udane życie rodzinne, którego sam nie osiągnął, a także jego niezawodny zmysł moralny.

Teraz znowu, raz jeszcze, wyprzedził mnie, żegnając ten dziwny świat. To nie ma żadnego znaczenia. Dla nas, wierzących fizyków, podział na przeszłość, teraźniejszość i przyszłość jest jedynie iluzją, nawet jeśli mocno zakorzenioną [A. Einstein do Vero i Bice Besso, 15 III 1955].

Rękopis Einsteina-Bessa znajduje się w Einstein Papers, t. 4.