Galileo Galiei, Dialog o dwu najważniejszych układach świata, 1632 (1/2): Początek i końcowy medykament

Dialog stanowi opus magnum Galileusza. Dobiegający siedemdziesiątki uczony uznał, że nadszedł w końcu czas, by ogłosić swoje poglądy na wszechświat i zagadnienie ruchu. Druk książki zakończył się w lutym 1632 roku. Jej pełny tytuł brzmiał: Dialog Galileo Galilei z Akademii Lincei, matematyka nadzwyczajnego uniwersytetu w Pizie, pierwszego filozofa i matematyka najjaśniejszego Wielkiego Księcia Toskanii, gdzie podczas spotkań w ciągu czterech dni dyskutuje się na temat dwóch największych układów świata: ptolemeuszowego i kopernikowego, proponując w sposób nierozstrzygający argumenty zarówno za jedną, jak i za drugą stroną. Frontispis przedstawiał trzech uczonych: Arystotelesa, Ptolemeusza i Kopernika (ten ostatni miał rysy przypominające raczej Galileusza), dyskutujących na temat układu świata. Natomiast strona tytułowa zawierała aż pięć różnych pozwoleń: dwa rzymskie bez daty i trzy florenckie z września 1630 roku.

Władze przywiązywały szczególną wagę do początku dzieła i końcowego argumentu, pochodzącego od samego Urbana VIII i nazywanego la medicina del fine – końcowym medykamentem, bo miał podważyć wszystko, co zostało wcześniej powiedziane, i tym samym niejako „uleczyć” chroniczną chorobę naukowych dociekań. Przypomina to nieco praktykę stosowaną w zupełnie innych czasach: w socjalistycznej Czechosłowacji filozofowie, chcąc zapewnić sobie minimum swobody naukowej, dodawali do swych prac wstępy i posłowia naszpikowane cytatami z Marksa, Engelsa i Lenina – nazywano je balkonami. W środku można było wówczas przemycić jakieś myśli zupełnie innej proweniencji.

Wstęp „Do wyrozumiałego Czytelnika” to tekst ociekający obłudą tak wielką, że aż ociera się o szyderstwo.

W latach ubiegłych, celem uniknięcia niebezpiecznego wzburzenia wśród współczesnych, ogłoszony został w Rzymie zbawienny dekret, nakazujący uzasadnione przemilczanie poglądów pitagorejczyków dotyczących ruchu Ziemi. Nie zbrakło takich, którzy zuchwale utrzymywali, że dekret ten nie został jakoby powzięty po rozważnym zbadaniu samego zagadnienia, ale jedynie pod wpływem nieuzasadnionych namiętności. Słyszało się też wyrzekania, że zgoła niebiegli w naukach astronomicznych konsultorzy nie powinni byli nagłymi zakazami podcinać skrzydeł umysłów badawczych.

Poczucie obowiązku nie pozwoliło mi milczeć, gdy doszły do mnie tak zuchwałe wyrzekania. W pełnym zrozumieniu tego tak bardzo roztropnego postanowienia uznałem za właściwe wystąpić publicznie na arenie świata jako świadek najszczerszej prawdy. Byłem podówczas w Rzymie (…) i nie bez uprzedniego zasięgnięcia mojej opinii nastąpiło ogłoszenie tego dekretu. Dlatego też zamiarem moim jest wykazanie pracą niniejszą narodom obcym, że o sprawach tych we Włoszech, a zwłaszcza w Rzymie, równie wiele wiadomo jak to, co w najśmielszych wyobrażeniach osiągnął wysiłek badawczy zagranicy; że zebrane przeze mnie owoce własnych rozmyślań odnoszące się do układu Kopernika podane były uprzednio do wiadomości cenzury rzymskiej, że zatem ze środowiska Wiecznego Miasta promieniują nie tylko dogmaty dla zbawienia duszy, ale i zdobycze wiedzy ku radości dociekających umysłów.

Naszkicowany w ten sposób zamysł pokazania, że władza absolutna nie tylko decyduje, bo ma siłę, ale jeszcze decyduje słusznie, bo ma także rację, i to nawet w marginalnych z jej punktu widzenia sprawach – jak kopernikanizm – nie wygląda przekonująco. Zwłaszcza że „radości dociekającego umysłu” bywały w Rzymie określane raczej jako zuchwalstwo i nowinkarstwo. Uroczysta obrona kwalifikacji astronomicznych konsultorów zwracała tylko niepotrzebnie uwagę na kulisy procesu decyzyjnego, które lepiej było trzymać w ukryciu: kiedy król jest nagi, głośny podziw dla jego szat wygląda dość podejrzanie. Przykre wrażenie robi też uwaga o zasięganiu opinii Galileusza – wygląda to tak, jakby starał się przekonać nie tylko innych, ale i samego siebie, że dekret z roku 1616 nie był porażką. Zdecydowanie robił dobrą minę do bardzo złej gry. Pragnął pokazać, że i on, i Kościół byli cały czas po właściwej stronie, choć być może nie wszyscy zewnętrzni obserwatorzy to dobrze rozumieli. Prawdopodobnie Galileusz próbował twórczo zinterpretować przeszłość, aby umożliwić pewną zmianę polityki przy zachowaniu pozorów niezmienności. Wiadomo było, że Kościół nie cofnie oficjalnej decyzji, ale to wcale nie oznaczało, iż nie można było zmienić sposobu jej rozumienia. Campanella przytoczył kiedyś w liście do Galileusza następujący przykład: sobór nicejski II zadekretował, że wolno malować anioły, gdyż są one cielesne. I nikt tej decyzji nigdy nie odwołał, choć wszyscy scholastycy byli zdania, iż anioły nie są cielesne. W sprawie kopernikańskiej pierwszy krok został już uczyniony: Urban VIII inaczej kładł akcenty w interpretacji dekretu z roku 1616, a nawet dał do zrozumienia, że dekret był niepotrzebny. Może więc była szansa na w miarę swobodną dyskusję przy zachowaniu pozorów? Zanim wybuchła „sprawa Galileusza”, taka możliwość istniała. Ponieważ dalsze wydarzenia potoczyły się w sposób dramatyczny, ta próba wypracowania kompromisu wydaje się niepotrzebna i zostawia jakiś cień na intencjach Galileusza.

Jeśli chodzi o podejście do omawianego zagadnienia, Galileusz przedstawia je następująco: „W niniejszej rozprawie zająłem stanowisko Kopernika, traktując je jako czystą hipotezę matematyczną i starając się za pomocą wszelkich sztuczek wykazać, że jest ono lepsze nie w porównaniu z twierdzeniem o spoczynku Ziemi traktowanym w sposób absolutny, lecz od tego, jakiego bronią niektórzy, uważający się za perypatetyków, lecz będący nimi tylko z nazwy, zadowoleni, że mogą tkwić w bezruchu* i oddawać hołd złudzie, niezdolni do samodzielnego filozofowania, posługujący się jedynie utrzymanymi w pamięci a przy tym źle zrozumianymi pojęciami czterech elementów”. W tym proustowskim zdaniu Galileusz deklaruje, że celem jego ataku są tacy perypatetycy, którzy nie potrafią dobrze filozofować. Niskie mniemanie o współczesnych sobie perypatetykach uczony powtarzał wielokrotnie, głosząc, że sam Arystoteles, który był dobrym filozofem, szanującym fakty i obserwacje, nie mógłby zajmować takiego stanowiska jak rozmaici uczeni z bożej łaski, używający wielkiego imienia jako listka figowego dla własnej ignorancji. Oczywiście dyskusja tego rodzaju nie mogła być czysto „matematyczna”, musiała być „filozoficzna” – w ówczesnym sensie, obejmującym fizykę i filozofię. W każdym razie deklarowanym zamysłem autora było prowadzenie debaty w sposób przyjęty od średniowiecza na uniwersytetach. W debatach takich wolno było bronić różnych, nawet mocno nieortodoksyjnych, kwestii, traktowano to jako swego rodzaju ćwiczenie czy eksperymentowanie myślowe.

Mowa tu będzie o trzech głównych zagadnieniach. Najpierw postaram się dowieść, że wszelkie doświadczenia, jakie można przeprowadzić na Ziemi, są niewystarczające, aby udowodnić jej ruch, i że równie dobrze odnosić się mogą do Ziemi ruchomej, jak i do Ziemi nieruchomej. Mam nadzieję, że w tych rozważaniach pojawi się wiele spostrzeżeń nieznanych starożytności.

Najogólniej mówiąc chodzi tu o zasadę względności, a więc twierdzenie, iż zjawiska fizyczne przebiegają tak samo na ruchomej Ziemi, jak przebiegałyby na Ziemi nieruchomej. Wysuwano od starożytności wiele różnych argumentów mających wykazać, że ruch Ziemi pociągałby za sobą jakieś dziwaczne, a nawet katastrofalne skutki: ptaki i chmury zostawałyby w tyle, wciąż wiałby wschodni wiatr, budynki musiałyby się walić itd. Tymczasem Galileusz, analizując szczegółowo te argumenty, potrafił wykazać, że z punktu widzenia fizyka nie ma (prawie) różnicy między Ziemią ruchomą a nieruchomą.

Dalej badane będą zjawiska niebieskie, przemawiające na korzyść hipotezy Kopernika, jak gdyby ona koniecznie miała się ostać zwycięsko – z dodatkiem nowych rozważań, zmierzających raczej ku ułatwieniu zadań astronomii, aniżeli ku wykryciu konieczności w przyrodzie.

Z wiadomych przyczyn Galileusz stara się podkreślić, że nie pretenduje do żadnych absolutnych stwierdzeń w kwestii kopernikańskiej.

Na trzecim miejscu mówić będę o różnych pomysłowych fantazjach. Powiedziałem wiele lat temu, że na nieznane zjawisko przypływów morskich można by rzucić pewne światło, zakładając ruch Ziemi. Wypowiedź ta moja, przechodząc z ust do ust, znalazła miłosiernych ojców, którzy przyjęli ją jak swoją, przedstawiając jako płód własnego umysłu.

Galileusz ze ślepym uporem trzymał się swojej teorii pływów, nie reagując na żadne fakty obserwacyjne, to znaczy z łatwością dostosowując ją do nich – co przypominało najgorsze praktyki perypatetyków, tak przez niego ganione. Uczony wciąż tropił i znajdował u innych jakieś zapożyczenia ze swych prac; niektóre wypowiedzi tego rodzaju sprawiają dziś wrażenie paranoi, rażąc swą niewątpliwą przesadą. Teoria pływów miała być punktem kulminacyjnym Dialogu, choć w istocie jej główną zaletą było to, że dostarczyła pretekstu do napisania znakomitej książki.

Po oddaniu cenzurze tego, co konieczne, Galileusz przedstawił pięćset stron rozważań ściśle naukowych w formie dialogu trzech interlokutorów. Na samym końcu, po omówieniu pływów, znajduje się następująca wymiana zdań:

SIMPLICIO: O ile chodzi o rozważania, które miały tu miejsce, a w szczególności o te ostatnie, o przyczynach przypływu i odpływu morza, to naprawdę nie powiem, bym je w zupełności rozumiał (…) jednakowoż nie mogę ich uznać za odpowiadające prawdzie i ostateczne we wnioskach; co więcej, mam wciąż przed oczyma mego umysłu najbardziej niewzruszoną naukę, przekazaną mi przez wielkiego i wybitnego uczonego, przed którą należy zamilknąć. Wiem, że wy obaj na pytanie, czy Bóg swoją nieskończoną wszechmocą i mądrością mógł przyznać elementowi wody owe ruchy zmienne, które w nim dostrzegamy, i to innym sposobem aniżeli wprawiając w ruch zawierające je zbiorniki, odpowiedzielibyście, jestem tego pewien, że i mógłby, i umiałby tego dokonać wieloma sposobami, dla naszego umysłu nawet niewyobrażalnymi. Na mocy tego wysnuwam bezpośredni wniosek, że byłoby zbytnią śmiałością chcieć ograniczać i zacieśniać potęgę i mądrość boską do poziomu ludzkich urojeń.

SALVIATI: Jest to zaprawdę cudowna i anielska nauka: a w zupełnej z nią zgodzie znajduje się również inna, również boska, która zezwala wprawdzie na roztrząsanie budowy wszechświata, ale poucza również (być może po to, by działanie ludzkie nie stępiło się i nie skostniało w lenistwie), że jeszcze dalecy jesteśmy od poznania istoty dzieł Jego ręki. (…)

SAGREDO: Niech to będzie ostatnim słowem naszych czterodniowych rozważań. (…) A teraz będziemy mogli, naszym zwyczajem, popłynąć oczekującą nas gondolą i zażyć świeżości wieczornej godziny.

Jednym z zarzutów wobec Galileusza miało być to, że „włożył końcowy medykament w usta głupka”, tj. Simplicia, który zresztą przedstawiany jest raczej jako chodzący worek komunałów i człowiek może nie nadzwyczajnie przenikliwy, ale dość pogodnego usposobienia, pozbawiony zjadliwości realnych przeciwników uczonego. Rzeczywiście argument papieski nie wypada najlepiej w kontekście Dialogu, wydaje się jednak, że Galileusz nie miał świadomego zamiaru szydzenia z jego wartości. Starał się raczej, ustami Salviatiego, inaczej go ukierunkować: boska wszechmoc objawia się także w niewyczerpanym bogactwie przyrody – tu Galileusz jest całkowicie szczery i wyraża swoje głębokie przekonanie. Jeśli w jego poglądach pojawiał się gdzieś Bóg, to chyba najbardziej bezpośrednio tam, gdzie ujawniały się tajniki przemyślnego urządzenia świata. Był to raczej Wielki Architekt niż Absolutny Władca z wizji Urbana VIII. Można powiedzieć, że dwaj wybitni Toskańczycy spotkali się w kwestiach kończących Dialog i żaden nie chciał ustąpić z racji bliskich swemu sercu.

Sformułowania Galileusza mogły razić pobożne uszy, nie było to jednak zamiarem uczonego, a wynikało raczej z jego chwilami zaskakującej niewrażliwości czy nawet braku słuchu na sposób myślenia ludzi reprezentujących tradycyjny Kościół. Ich argumenty docierały do niego tylko na poziomie intelektualnym, nie rozumiał jednak postawy, jaka się za tym kryła; wydaje się, że i oni w zetknięciu z nim odczuwali jakąś obcość – nie mogło to skończyć się dobrze.

* Galileusz robi tu aluzję do nazwy szkoły filozoficznej: „perypatetycy” tzn. chodzący, więc nieruchomy perypatetyk to oksymoron.

Cytaty z polskiego przekładu Dialogu E. Ligockiego przy współudziale K. Giustiniani-Kępińskiej (PWN Warszawa 1953)

Reklamy

Dlaczego grawitacja wiąże się z krzywizną czasoprzestrzeni?

  • Przeniesienie równoległe

Wyobraźmy sobie najpierw powierzchnię zanurzoną w przestrzeni euklidesowej. Załóżmy, że określiliśmy na niej pewne współrzędne x=(x^1, \ldots, x^n) . Położenie punktu powierzchni możemy więc zapisać jako \vec{r}=\vec{r}(x^i) . Pochodne tego wektora po współrzędnych, utworzą zbiór wektorów stycznych do naszej powierzchni:

\vec{e}_j=\dfrac{\partial \vec{r}}{\partial x^j}.

Dowolny wektor styczny do powierzchni w danym punkcie można przedstawić jako kombinację liniową \vec{e}_j:

\vec{v}=v^j \vec{e}_j,

gdzie sumujemy po powtarzającej się parze wskaźników: górnym i dolnym. Jest to tzw. konwencja Einsteina, uczony mówił żartobliwie, że stanowi ona jego największe odkrycie matematyczne. W geometrii ważną rolę odgrywa równoległość: wiemy, co znaczy, że dwa wektory w przestrzeni euklidesowej są równoległe. Można koncepcję równoległości przenieść na nieskończenie bliskie wektory na zakrzywionej powierzchni. W przestrzeni euklidesowej nasz wektor \vec{v} ma pozostać stały, co oznacza, że

\delta\vec{v}=0=\delta v^j \vec{e}_j+v_j \delta \vec{e}_j.

W drugim wyrazie uwzględniliśmy, że nasza baza względem przestrzeni euklidesowej może się obracać. Zmiana każdego z wektorów bazy powinna być równa:

\delta\vec{e}_j=\dfrac{\partial \vec{r}}{\partial x^j \partial x^i }\delta x^i\stackrel{.}{=}{\Gamma}^k_{ij}\delta x^i \vec{e}_k.

Ostatnia równość \stackrel{.}{=} to w istocie rzut wektora z lewej strony na płaszczyznę styczną, pomijamy więc tę część wektora, która „wystaje” z powierzchni. Podstawiając to do warunku równoległości, otrzymujemy

\delta v^k=-\Gamma_{ij}^k v^i \delta x^j. \mbox{ (*)}

Oznacza to, że współrzędne wektora równoległego nieco się zmienią i zmianę tę opisują współczynniki \Gamma , zwane uczenie koneksją afiniczną. Znając funkcje koneksji, możemy dokonać przesunięcia równoległego wektora. Jeśli rozpatrzymy pewną krzywą x^j=x^j(\tau) (gdzie \tau jest czasem własnym), pochodne współrzędnych utworzą wektor prędkości styczny do toru:

v^k=\dfrac{d x^k}{d\tau}.

Najprostszym fizycznie ruchem będzie przesunięcie równoległe tego wektora wzdłuż krzywej (linii świata):

\delta \left(\dfrac{d x^k}{d\tau}\right)=-\Gamma_{ij}^k v^i \delta x^k,

skąd otrzymujemy równanie geodezyjnej:

\dfrac{{d\,}^2 x^k}{d\tau^2}+\Gamma_{ij}^k \,\dfrac{d x^i}{d\tau}\,\dfrac{d x^j}{d\tau}=0. \mbox{ (**)}

Jest to warunek na przeniesienie równoległe wektora prędkości wzdłuż krzywej, a więc coś najbliższego ruchowi jednostajnemu i prostoliniowemu z I zasady dynamiki.

Możemy teraz zapomnieć o przestrzeni euklidesowej i rozpatrywać przestrzeń, w której określone są współczynniki koneksji. Mamy wówczas krzywe geodezyjne – coś najbardziej zbliżonego do linii prostej. W teorii względności krzywe geodezyjne opisują ruch cząstki pod działaniem pola grawitacyjnego. Jak widać współczynniki koneksji komplikują równania ruchu i można je uważać za składowe pola grawitacyjnego, czy dokładniej grawitacyjno–bezwładnościowego. Kiedy współczynniki koneksji znikają, wracamy do ruchu prostoliniowego i szczególnej teorii względności (tzn. nie ma pola grawitacyjnego).

Równania geodezyjnej mogą więc nieść informację o polu grawitacyjnym. Zgodnie z zasadą równoważności nic tu nie zależy od masy poruszającej się cząstki. Okazuje się, że można za pomocą koneksji opisać grawitację także w mechanice klasycznej (zrobił to É. Cartan, już znając teorię Einsteina). Automatycznie opisujemy też siły bezwładności. Z punktu widzenia fizyka wcale nie jest dziwne, że w równaniu geodezyjnej mamy aż dwie prędkości: powinniśmy bowiem w tym formalizmie otrzymać zarówno siły Coriolisa liniowe w prędkości, jak i siły odśrodkowe, kwadratowe w prędkości. Z punktu widzenia zasady równoważności nie możemy lokalnie rozstrzygnąć, czy w naszym przypadku mamy do czynienia z polem grawitacyjnym, czy siłami bezwładności.

  • Krzywizna

Koneksja pozwala nam przenosić wektory równolegle wzdłuż krzywej. Wynik takiego przesuniecia może więc zależeć od kształtu krzywej. Aby zobaczyć, jak to działa, rozpatrzmy przesunięcie równoległe wektora v^i po infinitezymalnym zamkniętym równoległoboku geodezyjnych: po drodze x, x+\delta a, x+\delta a+\delta b, x+\delta b, x. Łączna zmiana wektora dana jest wyrażeniem:

\delta v^i=-\Gamma_{kj}^i(x) v^k(x) \delta a^j-\Gamma_{kj}^i(x+\delta a) v^k(x+\delta a) \delta b^j\\ \\ +\Gamma_{kj}^i(x+\delta b) v^k(x+\delta b) \delta a^j+\Gamma_{kj}^i(x) v^k(x) \delta b^j.

Można to wszystko zapisać w postaci:

\delta v^i=R^i_{kjl} v^k \delta b^j \delta a^l, \mbox{(***)}

gdzie R^i_{kjl} nazywa się tensorem krzywizny Riemanna i wyraża wzorem:

R^i_{kjl}=\Gamma^i_{lk,j}-\Gamma^i_{jk,l}+\Gamma^i_{jm}\Gamma^m_{kl}-\Gamma^i_{lm}\Gamma^m_{kl}.

W ostatnim wyrażeniu przecinki przed indeksem oznaczają różniczkowanie po odpowiedniej współrzędnej: A_{,i}\equiv\frac{\partial}{\partial x^i}. Przestrzeń jest zakrzywiona wtedy i tylko wtedy, gdy tensor krzywizny jest różny od zera. (Wektory i tensory transformują się w odpowiedni sposób przy zmianie układu współrzędnych, tak że znikanie w jednym układzie oznacza znikanie we wszystkich.) Koneksja jest zatem nietrywialna, gdy tensor krzywizny znika. Równanie (***) można zilustrować poglądowo: zmiana wektora proporcjonalna jest tu do pola powierzchni równoległoboku. Ponieważ każdą powierzchnię możemy rozbić na takie równoległoboki, więc łączna zmiana wektora w przesunięciu równoległym po zamkniętej pętli powinna być związana z krzywizną oraz polem powierzchni pętli. W przypadku sfery krzywizna jest stała i kąt obrotu wektora jest proporcjonalny do pola powierzchni pętli. W teorii względności pojawienie się krzywizny oznacza, że mamy nietrywialne pole grawitacyjne.

Tensor krzywizny ma wiele symetrii, które sprawiają, że ma nieco mniej niezależnych składowych, niż to wygląda na pierwszy rzut oka. W przypadku dwuwymiarowej powierzchni ma tylko jedną składową, w czterowymiarowej – dwadzieścia.

Klasycznym zastosowaniem przeniesienia równoległego jest wahadło Foucaulta.

  • Równanie dewiacji geodezyjnej

Brzmi to okropnie, nieco bardziej logiczne jest określenie: dewiacja linii geodezyjnych. Chodzi o to, co dzieje się wzdłuż pobliskich linii geodezyjnych. Możemy sobie wyobrazić dwie cząstki pyłu, które znajdują się nieskończenie blisko siebie w chwili początkowej. Obserwujemy, jak bedzie się zachowywać z czasem ich odległość mierzona różnicami współrzędnych. Zakladamy, że rozsądnie zaczynamy liczyć czas, tak żeby ułatwić porównanie dwóch ruchów.

Równanie dewiacji ma następującą postać:

\dfrac{D^2 \eta^i}{D\tau^2}=R^i_{jkl}\,\dfrac{dx^j}{d\tau}\,\dfrac{dx^k}{d\tau}\,\eta^l.

Różniczkowanie po lewej stronie oznacza pochodną po czasie własnym obliczoną jednak z uwzględnieniem przeniesienia równoległego. Nie możemy bowiem porównywać w przestrzeni zakrzywionej wektorów w dwóch różnych punktach przestrzeni, najpierw należy przenieść jeden z nich do punktu zaczepienia drugiego. Różnicę wektora wzdłuż krzywej wynikającą z jego zmiany: \frac{d\eta^i}{d\tau}d\tau należy poprawić, odejmując zmianę wynikającą z przesunięcia (*), łącznie otrzymamy

\dfrac{D\eta^i}{D\tau}=\dfrac{d\eta^i}{d\tau}+\Gamma^i_{jk}\,\dfrac{dx^j}{d\tau}\,\eta^k.

Jest to tzw. pochodna absolutna wzdłuż krzywej. Używając tego zapisu, możemy równanie geodezyjnej (**) zapisać w postaci

\dfrac{D}{D\tau}\dfrac{dx^i}{d\tau}=0.

Pochodna absolutna znika, gdy współrzędne wektora zmieniają się jedynie za sprawą przesunięcia równoległego, czyli w sensie fizycznym można powiedzieć, że się nasz wektor nie zmienia – przenosi się jedynie równolegle wzdłuż krzywej.

  • Równania pola Einsteina

Warto zauważyć, że do tej pory nie mówiliśmy nic o metryce naszej przestrzeni. W szczególnej teorii względności mamy naturalną miarę odległości dwóch zdarzeń w czasoprzestrzeni:

ds^2=dt^2-dx^2-dy^2-dz^2.

(Przyjmujemy c=1.) W zakrzywionej czasoprzestrzeni ogólnej teorii względności możemy zawsze wprowadzić taki układ współrzędnych, w którym interwał ds^2 przyjmie powyższą postać w danym punkcie. Nie można natomiast zwykle zrobić tego globalnie. Interwał czasoprzestrzenny ogólnie biorąc określa tensor metryczny g_{\mu\nu}. Podaje on przepis na obliczenie interwału za pomocą danych współrzędnych (gdy zmienimy współrzędne, postać metryki też się odpowiednio zmieni):

ds^2=g_{\mu\nu}dx^{\mu}dx^{\nu}.

Tutaj wskaźniki \mu,\nu=0,1,2,3. Mamy tu 10 niezależnych wartości (symetryczna macierz 4×4). Z matematycznego punktu widzenia koneksja i metryka to dwie różne struktury. Można je uzgodnić i tak jest w ogólnej teorii względności. Koneksja oraz tensor krzywizny wyrażają się przez metrykę. Lokalnie, w danym punkcie, nie tylko metryka może przybrać wartości znane ze szczególnej teorii względności, ale także współczynniki koneksji mogą znikać. Nie ma natomiast takiej transformacji współrzędnych, która sprowadza tensor Riemanna do zera, jeśli był niezerowy w innym układzie współrzędnych. Tensor Riemanna zawiera pierwsze i drugie pochodne metryki. Geodezyjne możemy też zdefiniować jako krzywe najkrótszej/najdłuższej długości, i są to wówczas te same geodezyjne co zdefiniowane wyżej.

Z fizycznego punktu widzenia metryka przypomina potencjał, a współczynniki koneksji – siły. Jaką postać moze mieć równanie pola w teorii Einsteina? Źródłem pola grawitacyjnego są masy, a u Einsteina także pędy i energie. Dla zbioru cząstek opisu dostarcza symetryczny tensor energii pędu: T_{\mu\nu}. Potrzebujemy więc jakiegoś tensora krzywizny o dwóch wskaźnikach. Taką wielkością jest tensor Ricciego zdefiniowany jako

R_{\mu\nu}=R^{\lambda}_{\mu\lambda\nu},

(sumowanie po wskaźnku \lambda). Można więc oczekiwać równania typu

R_{\mu\nu}=\kappa T_{\mu\nu}.

I jest to prawie dobre równanie, należy tylko zmodyfikować w nim lekko lewą stronę. Rzecz w tym, że tensor energii pędu powinien być zachowany, a lewa strona, tensor Ricciego nie spełnia tego warunku. Należy zastąpić go więc tensorem Einsteina:

G_{\mu\nu}=R_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R=\kappa T_{\mu\nu},

gdzie R to skalar Ricciego: R=g^{\mu\nu}R_{\mu\nu} (g^{\mu\nu} jest macierzą odwrotną do g_{\mu\nu}. Jest to subtelność techniczna, na którą natrafił Einstein w listopadzie 1915 roku: 11 listopada proponuje pierwszą wersję, a 25 listopada tę niższą, już prawidłową. Ostatnie równanie można też przepisać w równoważnej postaci:

R_{\mu\nu}=\kappa (T_{\mu\nu}-\frac{1}{2}g_{\mu\nu}T^{\lambda}_{\lambda}).

W dalszym ciągu przyda nam się składowa 00 tego równania, w najprostszej sytuacji spoczywającej materii tylko składowa 00 tensora energii pędu jest różna od zera i równa jest gęstości materii \varrho. Otrzymamy wówczas

R_{00}=\kappa (T_{00}-\frac{1}{2}T_{00})=\frac{1}{2}\kappa T_{00}=\frac{1}{2}\kappa \varrho.

Aby znaleźć stałą \kappa, należy skorzystać z równań dla grawitacji Newtonowskiej, która powinna być przypadkiem granicznym.

W tym celu wyobraźmy sobie równanie dewiacji zastosowane do dwóch swobodnie spadających cząstek. Zakładamy, że w chwili początkowej \tau=0 obie spoczywają względem siebie. Wybieramy układ współrzędnych związany z cząstką centralną (względem której obliczana jest dewiacja). W takim układzie odniesienia czas własny i czas t są tym samym. Dla wskaźników przestrzennych i=1,2,3 równanie dewiacji sprowadza się do

\dfrac{d^2\eta^i}{dt^2}=R^{i}_{00l}\eta^l=-R^i_{0l0}\eta^l.

Skorzystaliśmy z faktu, że nasza cząstka centralna spoczywa: \frac{dx^\mu}{dt}=(1,0,0,0). W drugiej równości zmieniliśmy znak wraz z przestawieniem pary ostatnich wskaźników w tensorze Riemanna. Wynik ten obowiązuje dla trzech przyspieszeń wzdłuż trzech osi kartezjańskich. Załóżmy, że mamy kulę pyłu o promieniu r, początkowo nieruchomą, której środek obraliśmy za początek wektora \eta. Objętość kuli to

V=\dfrac{4\pi}{3}r_x r_y r_z,

gdzie zaznaczyliśmy, że wzdłuż trzech osi kartezjańskich promienie mogą się zmieniać niezależnie (przekształcając kulę w elipsoidę). Obliczając drugą pochodną objętości w chwili t=0 (pamiętamy, że pierwsze pochodne znikają), otrzymujemy:

\dfrac{\ddot{V}}{V}=\dfrac{\ddot{r}_x}{r_x}+\dfrac{\ddot{r}_y}{r_y}+\dfrac{\ddot{r}_z}{r_z}=-R_{00}.

W ostatniej równości, skorzystaliśmy z faktu, że R^0_{000}=0 – można więc sumowanie po wskaźnikach przestrzennych rozszerzyć o wskaźnik czasowy. Możemy tę samą wielkość obliczyć z Newtonowskiego prawa ciążenia. Przyspieszenie grawitacyjne na powierzchni kuli pyłu o masie M równe jest

g=\dfrac{GM}{r^2},

Wobec tego druga pochodna objętości spełnia równanie

\dfrac{\ddot{V}}{V}=-3\dfrac{g}{r}=-4\pi G \varrho.

gdzie \varrho to gęstość naszej kuli (&). Zatem szukana stała równa jest \kappa=8\pi G. Równanie Einsteina powinno mieć zatem postać.

G_{\mu\nu}=8\pi G T_{\mu\nu}.

Podsumowując, w roku 1915 Albert Einstein (podobnie zresztą jak najlepsi ówcześni matematycy) nie rozumiał dokładnie roli tensora Ricciego i nie widział, że równania pola są praktycznie wyznaczone przez kilka dość prostych warunków matematycznych. Oczywiście, nie są to jedyne możliwe matematycznie równania, ale jak pokazują przykłady późniejszych teorii grawitacji (a było ich przez sto lat sporo), równania Einsteina są najprostsze i jak dotąd potwierdzane są przez obserwacje. Kiedy później uczony zrozumiał, że w gruncie rzeczy można by dojść do teorii grawitacji drogą matematyczną, zaczął wyżej cenić osiągnięcia czystej matematyki. Stało się to poniekąd źródłem jego późniejszych niepowodzeń przy konstrukcji jednolitej teorii pola: z braku danych fizycznych szukał bowiem drogi matematycznej. Skonczyło się na dość jałowych próbach, które nie wzbogaciły zbytnio ani matematyki, ani fizyki.

(&) Nie jest to całkiem ścisłe rozumowanie, ponieważ milcząco założyliśmy, że nie ma innej materii niż kula pyłowa. Naprawdę należałoby obliczyć strumień pola grawitacyjnego przez powierzchnię kuli (on już zależy wyłącznie od tego, co znajduje się wewnątrz kuli), a potem skorzystać z tw. Gaussa-Ostrogradskiego i obliczyć dywergencję pola grawitacyjnego w punkcie centralnym. Tę wartość można porównać z tym, co wynika z równania dewiacji geodezyjnej. Oczywiście wynik jest taki sam.

Nie rozwijałem tu kwestii, czym są tensory. W największym skrócie są to obiekty niezależne od wyboru współrzędnych, podobnie jak trójwymiarowe wektory (które są szczególnym jednowskaźnikowym typem tensora). W teorii Einsteina dopuszczamy praktycznie wszelkie gładkie transformacje współrzędnych (ogólna kowariantność). Równania prawidłowo zapisane w ten sosób automatycznie słuszne będą w każdym układzie współrzędnych. Einstein wrócił do tensorów już w trakcie swej „rewolucji listopadowej” – kiedy co tydzień publikował nową pracę na temat teorii grawitacji, przy okazji modyfikując albo zmieniając poprzednie. Ten dziwny tryb publikowania wiązał się z tym, że w Getyndze David Hilbert, jeden z czołowych matematyków świata, także pracował nad podobną teorią. Einsteinowi groziło, że po siedmiu latach pracy zostanie prześcignięty, by tak rzec na ostatnich metrach przed finiszem. Nigdy później (ani wcześniej) nie publikował tak gorączkowo. Starał się też zazwyczaj wykazywać bardziej olimpijski spokój, co oczywiście było znacznie łatwiejsze, kiedy się było autorem epokowej teorii.

Gdyby ktoś chciał szczegółowo przejść obliczenia tensora krzywizny i równania dewiacji, może znaleźć je np. tutaj, na stronie Alana Heavensa s. 22-24.

Interpretacja tensora Ricciego za pomocą objętości kul opisana jest np. w pracy Johna C. Baeza i Emory’ego F. Bunna.

Michele Angelo Besso, przyjaciel Einsteina

Historia zna wiele przypadków, kiedy tylko pesymiści mieli rację, a radosna większość beztrosko podążała ku zgubie. W roku 1936 większość Niemców zadowolona była z kanclerza Hitlera, który podniósł kraj z kolan i zlikwidował bezrobocie. Prawie nikt oprócz przeciwników reżimu nie myślał o nieuniknionym smutnym końcu tego państwa. Einstein, obserwując sytuację w Europie, pisał z Ameryki do Bessa:

Sprawy ludzkie w naszych czasach mniej niż kiedykolwiek napawają radością, by nie wspomnieć o tych głupcach z Niemiec. Teraz okazuje się w końcu, jak proroczym umysłem był prof. Winteler, który tak wcześnie rozpoznał całą powagę tego zagrożenia [Fölsing, s. 55].

Znali się z Bessem wówczas niemal czterdzieści lat i choć nie mieli się już nigdy spotkać osobiście, pisali do siebie regularnie. Albert Einstein miał dar zaprzyjaźniania się z ludźmi, i to na całe życie. Jedna z najdłuższych znajomości wiązała go z Michele Angelo Besso, starszym o sześć lat inżynierem budowy maszyn po Politechnice w Zurychu (późniejszej ETH). Poznali się na wieczorku muzycznym w salonie państwa Hüni, właścicieli sklepu muzycznego w Zurychu, obaj bowiem grali na skrzypcach. Czytając o ludziach z końca XIX wieku, ma się wrażenie, że niemal wszyscy muzykowali, a w każdym razie bywali na różnych domowych wydarzeniach muzycznych. Łączyło to ludzi w różnym wieku, różnych zawodów i upodobań. Osiemnastoletni Einstein kończył już zapewne pierwszy rok studiów na kierunku nauczycielskim tej samej uczelni. Można sądzić, że zbliżyło ich także i to, że uczyli się u tych samych profesorów fizyki: Heinricha Webera i Johanna Perneta i matematyki: Adolfa Hurwitza i Karla Geisera. Besso uzyskiwał zresztą lepsze stopnie niż Einstein, który chodził swoimi drogami, szybko przestał cenić wiedzę przekazywaną na uczelni i niezbyt się przykładał, zwłaszcza do matematyki. Besso zawdzięczał też Einsteinowi i owym wieczorkom muzycznym znajomość ze swą przyszłą żoną Anne Winteler.

Rodzina Wintelerów stała się wspólnym ogniwem łączącym ich życie. Einstein trafił do domu Josta i Pauline Winteler w Aarau w roku 1895 po oblanych egzaminach na Politechnikę. W tamtejszej szkole kantonalnej uzupełniać miał wiedzę z potrzebnych przedmiotów, mieszkając na stancji u Wintelerów. Jost Winteler, językoznawca, autor nowatorskiej dysertacji na temat jednego ze szwajcarskich dialektów, filolog, ornitolog i poeta, należał do grona nauczycielskiego szkoły. Jego żona Pauline szybko stała się dla Alberta kimś bliskim, niemalże drugą matką. Wintelerowie mieli też siódemkę dzieci, od najstarszej Anne, przez Josta Fridolina, Rosę, Marie, Mathiasa, Josta juniora do Paula. Swój pierwszy romans przeżył Albert z Marie Winteler. Odsunął się jednak od niej, kiedy podczas studiów poznał Milevę Marić, swą późniejszą żonę. Marie mocno to przeżyła i związki Alberta z Wintelerami przejściowo osłabły. Po kilku latach Marie wyszła za mąż za dyrektora fabryki zegarków. Wiadomo, że w późniejszych latach ich romans odżył w sekrecie. Kilka lat po Albercie również jego siostra, Maja, mieszkała przez czas nauki u Wintelerów i wyszła potem za mąż za najmłodszego ich syna Paula.

Rodzina Wintelerów: od lewej Marie, Maja Einstein, Paul, Anna, rodzice: Jost i Pauline, Rosa

Jost Winteler kultywował staroświecki liberalizm, ideały republikańskie, kształcił swoje dzieci (także córki), niechętnie myślał o niemieckim szowinizmie, który znał jeszcze swe swych studiów w Jenie i który docierał aż do Szwajcarii. Einstein zawdzięczał Jostowi wiele swych poglądów na świat polityki i historii. Podobne liberalne poglądy żywił Alfred Stern, profesor historii, u którego Albert bywał jako student na obiadach. Besso uczęszczał na jeden z jego wykładów. Szwajcarskie środowisko młodego Einsteina nie przywiązywało wagi do narodowości. Einstein dopiero w Berlinie wiele lat później poczuł się Żydem.

Jeszcze innym elementem łączącym Bessa i Alberta oraz Maję Einsteinów były Włochy. Besso, urodzony pod Zurychem, pochodził z rodziny wywodzącej się z Triestu. Mówił równie swobodnie po włosku i po niemiecku, znał też francuski i angielski. Rodzice Einsteinów mieszkali wówczas we Włoszech, więc Albert kursował między Pawią a Zurychem. Choć uczony nie znał dobrze włoskiego, lubił ten język i w korespondencji z Tulio Levi-Civitą podczas pierwszej wojny światowej, nalegał, by matematyk pisał do niego w swoim języku (odpowiadał mu jednak po niemiecku). Besso także w pewnych okresach życia mieszkał we Włoszech. We Florencji spędzili wiele lat Maja Einstein (doktor filologii romańskiej) z Paulem: ona usiłowała prowadzić pensjonat, on malował obrazy.

Namiętnością Bessa była wiedza. Przez całe życie, aż do późnej starości, pochłaniał książki, uczęszczał na wykłady, robił notatki, należał do towarzystw naukowych. Zajmował się przy tym dziedzinami tak różnymi, jak filozofia, neurofizjologia, polityka, psychologia, prawo przemysłowe, literatura angielska, różne dziedziny fizyki i matematyki. I nie były to zainteresowania powierzchowne: Besso chodził na wykłady takich uczonych, jak Einstein czy Hermann Weyl i był ich aktywnym uczestnikiem, zadającym pytania i starającym się zrozumieć różne kwestie. Przez kilka lat Albert i Michele pracowali razem w Urzędzie Patentowym w Bernie. To Einstein ściągnął tam przyjaciela, często razem wracali do domu, dyskutując nad zagadnieniami fizyki. Besso jest jedyną osobą, którą Einstein wymienia z wdzięcznością w swoim epokowym artykule na temat teorii względności.

Przyjaciele współpracowali też w czerwcu 1913 roku, gdy Besso (mieszkający wtedy w Gorycji) odwiedził Einsteina w Zurychu. Uczony ukończył wtedy ważną pracę wspólnie z Marcelem Grossmannem, w której podał równania pola grawitacyjnego. Była to tzw. teoria Entwurf (co znaczy tyle co zarys). Einstein przekonał wówczas sam siebie, iż jest to prawidłowa teoria. Nie była ona szczególnie elegancka, ale w końcu nikt nie powiedział, że równania fizyki muszą koniecznie być eleganckie. Mają prawidłowo opisywać zjawiska, i to wszystko. Kłopot w tym, że nie było zbyt wielu zjawisk możliwych wtedy do wykrycia. Inaczej mówiąc, stara teoria Newtona nawet po przeszło dwóch wiekach trzymała się dobrze. Czemu więc w ogóle ulepszać coś, co okazało się dobre? Einstein był fizykiem dobrze „słyszącym” pojęcia i wychwytującym świetnie wszelki fałsz i brak harmonii. To go zaprowadziło do szczególnej teorii względności. Ale szczególna teoria względności była niekompatybilna z grawitacją. Potrzebna była teoria traktująca grawitację jako pole, analogiczne do pola elektrycznego i magnetycznego. Do tego punktu Einstein nie był sam – wielu innych próbowało w tych latach zbudować teorię grawitacji jako pola. Einstein miał jednak inny punkt wyjścia: grawitacja, podobnie jak bezwładność, mierzona jest masą. Właściwie są to dwa różne pojęcia masy: można osobno mierzyć masę grawitacyjną i osobno bezwładną. Okazuje się, że są one równe. Z punktu widzenia teorii był to swoisty „cud”, arbitralne założenie, dodane, by opisać rzeczywistość. Toteż Einstein pracował nad teorią, w której bezwładność i grawitacja będą wymienne, a to zaprowadziło go do przestrzeni zakrzywionych i szukania pomocy u Marcela Grossmanna, matematyka i przyjaciela ze studiów.

Istniał niewielki efekt, którego astronomom nie udawało się wyjaśnić: orbita Merkurego, w pierwszym przybliżeniu eliptyczna, obraca się powoli. Większość tego obrotu (równego 570’’) wyjaśnić można przyciąganiem innych planet, pozostawała jednak niewielka różnica 41 sekund kątowych na stulecie. Zauważył to jeszcze w połowie XIX wieku Urbain Le Verrier i po półwieczu analiz różnica ta nadal się utrzymywała i nikt nie miał dobrego pomysłu na jej wyjaśnienie. Chwytano się pomysłów rozpaczliwych, np., że wykładnik w prawie grawitacji różni się troszeczkę od dwóch albo że są jakieś niewidoczne obłoki materii blisko Słońca, które wpływają na ruch Merkurego. Mając teorię Entwurf Einstein chciał sprawdzić, czy uda się za jej pomocą wyjaśnić obrót peryhelium Merkurego. Zachował się rękopis (Einstein Papers, t. 4, doc. 14), w którym obaj przyjaciele obliczali ową wielkość obrotu peryhelium. Jest on świadectwem, że w osobie Bessa Einstein miał nie tylko interlokutora, ale i do pewnego stopnia kolegę. Niewykluczone też, że uczony chciał wciągnąć w ten sposób Bessa do pracy naukowej i zachęcić do przeprowadzenia dalszych rozważań, które można by opublikować. Wielkość efektu, którą uzyskali równa była 1821’’, czyli około pół stopnia na stulecie. Musieli jednak później zdać sobie sprawę z błędu w rachunkach: wstawili do obliczeń przez pomyłkę sto razy za dużą masę Słońca. Efekt ów był naprawdę równy 18’’ na stulecie. Czyli nadal źle, ale w końcu nie było żadnej pewności, czy w ogóle owe 41’’ uda się wyjaśnić za pomocą innej teorii grawitacji. Astronomowie mogli się gdzieś po drodze pomylić albo nie wziąć pod uwagę jakichś istotnych faktów. Inne teorie grawitacji z tego okresu nie radziły sobie lepiej. Besso wrócił wkrótce do Włoch, zabierając ze sobą obliczenia. W następnym roku obliczenia podobne do Einsteina i Bessa opublikował Johannes Droste, holenderski nauczyciel matematyki, który później napisał doktorat poświęcony ogólnej teorii względności. Besso nigdy nie zrobił doktoratu, może czuł, że aktywna praca naukowa nie jest dla niego. W tamtych czasach nie było zresztą łatwo o płatną posadę naukową i często nawet wybitni uczeni musieli przez wiele lat zarabiać w inny sposób. Jak się zdaje, Besso nie był w dostatecznym stopniu skoncentrowany na jednym, interesowało go wiele rzeczy, a przy tym brakowało mu uporu, aby zmagać się z jednym zagadnieniem przez długi czas. Ludzie tacy jak Besso nie osiągają zaszczytnych stanowisk, choć może to dzięki nim świat wydaje się nieco lepszy. Einstein lubił idealistów, nawet dziwaków, niezwykle wysoko cenił też zawsze inteligencję Bessa, a przecież z biegiem lat poznał najwybitniejsze umysły epoki. Kiedy już obaj byli starzy, napisał przyjacielowi: „Nadal wierzę, że gdybyś był w większym stopniu monomaniakiem, mógłbyś osiągnąć coś naukowo wartościowego. Motyl nie jest kretem, ale żaden motyl nie pownien tego żałować” [6 I 1948].

Ostatecznie teoria Entwurf okazała się fałszywa, co Einstein zauważył dopiero we wrześniu 1915 roku. Jednak obliczenia przeprowadzone w roku 1913 wraz Michele Besso okazały się niezwykle pomocne, gdy w listopadzie sformułował nowe równania pola i powtórzył rachunki dla peryhelium Merkurego – tym razem dały one prawidłowy rezultat. Było to, jak Einstein później twierdził, jego najsilniejsze przeżycie naukowe: teoria zbudowana tak, by uzyskać większą przejrzystość pojęć, w oderwaniu od bezpośrednich danych eksperymentalnych, dała oto prawidłowy rezultat dla efektu znanego i niewyjaśnionego od dawna. A więc składając ze sobą starannie i uważnie idee oderwane, można wyjrzeć z platońskiej jaskini i lepiej zrozumieć ruch planet.

Później Besso, który znał także Milevę, służył często jako pośrednik w jej trudnych kontaktach z Einsteinem, czy nawet jako swego rodzaju zastępczy ojciec dla jego synów. Po I wojnie światowej zamieszkał znowu w Szwajcarii znajdował się więc znacznie bliżej dawnej rodziny Einsteina. Uczony żywił dużo szacunku dla moralnej postawy Bessa, ale chwilami trudno im się było porozumieć, zwłaszcza podczas bolesnego i wieloletniego konfliktu Alberta z Milevą zakończonego rozwodem. Ona walczyła zażarcie o pieniądze i pełne decydowanie o życiu synów. Jak się zdaje, w obu kwestiach osiągnęłaby to samo, nie stawiając spraw na ostrzu noża. Einstein chciał być dobrym ojcem i nie był też skąpy. Zapewne to urażona duma i zawiedziona miłość Milevy stały się główną przeszkodą w negocjacjach.

Besso, namawiany wielokrotnie do napisania biografii przyjaciela, miał na tyle dużo taktu, aby tego nie robić, choć postać Einsteina gwarantowała finansowy sukces przedsięwzięcia. Po dojściu Hitlera do władzy Einstein wyjechał na stałe do Stanów Zjednoczonych i nawet po wojnie nie odwiedził Europy, szczególnie unikając kontaktów z Niemcami. Besso mieszkał w Bernie, potem w Genewie. Na początku roku 1955 Einstein dowiedział się o śmierci przyjaciela. Odpisał wtedy jego synowi (któremu kiedyś zbudował pierwszego latawca), podkreślając harmonię życia zmarłego, jego udane życie rodzinne, którego sam nie osiągnął, a także jego niezawodny zmysł moralny.

Teraz znowu, raz jeszcze, wyprzedził mnie, żegnając ten dziwny świat. To nie ma żadnego znaczenia. Dla nas, wierzących fizyków, podział na przeszłość, teraźniejszość i przyszłość jest jedynie iluzją, nawet jeśli mocno zakorzenioną [A. Einstein do Vero i Bice Besso, 15 III 1955].

Rękopis Einsteina-Bessa znajduje się w Einstein Papers, t. 4.

Istota teorii względności (1923) – Albert Einstein

Ślepy żuk pełznący po powierzchni globusa nie wie, że tor, po którym się porusza, jest zakrzywiony. Ja miałem szczęście to zauważyć [A. Einstein]

Ta niewielka książeczka jest jedynym kompletnym przedstawieniem teorii przez jej twórcę, adresowanym do zawodowych uczonych, stanowiąc coś pośredniego między monografią a podręcznikiem. Ukazała się najpierw w 1923 roku w wersji angielskiej nakładem Princeton University Press oraz w wersji niemieckiej w wydawnictwie Vieweg & Sohn (z datą roczną 1922). Od tamtej pory doczekała się niezliczonych wydań w wielu językach. Uczony nie zmieniał głównego tekstu, choć z czasem dołączył kilka dodatków traktujących o późniejszych osiągnięciach.

Podstawą książki były wykłady wygłoszone w maju 1921 roku na uniwersytecie w Princeton. Czterdziestodwuletni Einstein wybrał się w swą pierwszą podróż za ocean, towarzysząc Chaimowi Weizmannowi i delegacji syjonistów. Ich celem było zebranie funduszy na założenie uniwersytetu w Jerozolimie. Uczony, który w kilku poprzednich latach z odrazą obserwował antysemityzm narastający w społeczeństwie niemieckim i który sam stał się ofiarą niewybrednych ataków z rasistowskimi podtekstami, zgodził się na ten wyjazd, rezygnując z udziału w pierwszym po wojnie Kongresie Solvaya, konferencji gromadzącej szczupłe grono najwybitniejszych fizyków świata. Po raz pierwszy wystąpił więc Einstein w roli działacza społecznego, wykorzystując autorytet naukowy do propagowania bliskich mu poglądów. Uczony witany był w Ameryce owacyjnie, zwłaszcza przez społeczność żydowską w Nowym Jorku, Bostonie, Cleveland. Niektórzy koledzy Einsteina, jak Fritz Haber, wybitny chemik, Żyd i niemiecki szowinista, mieli mu za złe podróż do Stanów Zjednoczonych, kraju niedawnego wroga. Rany wojenne nie zdążyły się jeszcze zabliźnić, zwłaszcza w Niemczech dźwigających ciężar przegranej wojny. Wielu niemieckich Żydów sądziło też, iż nie należy prowokować antysemityzmu i lepiej siedzieć cicho. Einstein, czy to dlatego, że spędził wiele lat w Szwajcarii, czy też z racji swego charakteru, nie podzielał takiego nastawienia, przeciwnie, to właśnie antysemityzm przyspieszył dojrzewanie jego żydowskiej tożsamości.

Podróż po Stanach Zjednoczonych miała też ważną część naukową. Einstein miał wykłady na Columbia University i w City College w Nowym Jorku, na uniwersytecie w Chicago oraz uniwersytecie Harvarda. W Princeton otrzymał stopień honorowy i wygłosił sławne zdanie, które później wyryto nad kominkiem w sali Wydziału Matematyki: „Pan Bóg jest wyrafinowany, lecz nie jest złośliwy” (odnosiło się ono do pewnych wyników eksperymentalnych zaprzeczających jego teorii). Bezpośrednio po uroczystościach rozpoczął się cykl pięciu wykładów odbywających się w kolejne dni tygodnia. Dwa pierwsze były popularne, następne bardziej techniczne. Wykładu inauguracyjnego słuchało około czterystu osób, podczas drugiego audytorium znacznie się przerzedziło, a kolejne odbywały się już w mniejszej sali dla niewielkiego grona słuchaczy. Na początku pobytu w Princeton uczony podpisał umowę z wydawnictwem uniwersytetu na publikację tekstu jego wystąpień. Ponieważ odbywały się one po niemiecku, wydawnictwo wynajęło niemiecką stenografkę, która notowała na żywo. Każdy z wykładów był na koniec podsumowywany po angielsku przez profesora fizyki Edwina Plimptona Adamsa, który został też tłumaczem wersji książkowej. Dopiero w styczniu 1922 roku uczony przesłał niemiecki tekst książki do wydawnictwa Vieweg & Sohn, wydrukowane przez nie korekty stały się podstawą angielskiego przekładu. Prace te wraz z poprawkami autorskimi zajęły cały rok 1922. Pod jego koniec wydrukowano wydanie niemieckie, a w styczniu ukończono druk wydania angielskiego. W trakcie tych prac ogłoszono wiadomość, że Albert Einstein został laureatem Nagrody Nobla za rok 1921. Laureat przebywał w tym czasie w Azji w drodze do Japonii.

Uczony spodziewał się otrzymać Nagrodę Nobla, w istocie przyszła ona dość późno i z istotnym zastrzeżeniem. Jak pisał Christopher Aurivillius, sekretarz Królewskiej Szwedzkiej Akademii Nauk, w liście do laureata: „Akademia (…) postanowiła przyznać panu Nagrodę Nobla w dziedzinie fizyki za ubiegły rok w uznaniu Pana dokonań w fizyce teoretycznej, w szczególności odkrycia teoretycznych podstaw zjawiska fotoelektrycznego, lecz z pominięciem zasług, które staną się Pana udziałem, gdy potwierdzą się sformułowane przez Pana teorie względności i grawitacji”. Teoria względności była więc w oczach szwedzkich akademików osiągnięciem kontrowersyjnym, podobnie myślało wielu uczonych.

Niewykluczone, że Einstein pragnął swoją książką przekonać część kolegów po fachu. Na początku lat dwudziestych obie teorie względności: szczególną z roku 1905 oraz ogólną z roku 1915 można było uznać za zakończony etap. Dzięki pracy Einsteina, ale także szeregu innych fizyków i matematyków, jak Max Planck, Max von Laue, David Hilbert, Felix Klein, Emmy Noether, Max Born, Hermann Weyl, Tullio Levi-Civita, Karl Schwarzschild, Hans Thirring, Josef Lense, Willem de Sitter, Hendrik Lorentz, Gunnar Nordström, Erich Kretschmann, Arthur Eddington, Paul Ehrenfest, Johannes Droste, Paul Langevin udało się wyjaśnić wiele aspektów nowej teorii – już sama lista nazwisk wskazuje, że praca Einsteina nie przebiegała w próżni, a ranga tych uczonych świadczy o poważnym traktowaniu osiągnięć Einsteina. Miał on jednak także sporo przeciwników, którzy z rozmaitych powodów odmawiali jego teorii naukowej wartości, a często także kwestionowali intelektualną uczciwość jej twórcy. Berliński profesor optyki Ernst Gehrcke uznawał teorię Einsteina za skutek zbiorowej sugestii, wybitni eksperymentatorzy (i laureaci Nagrody Nobla) Philipp Lenard i Johannes Stark nie potrafili się pogodzić ze światem nowych pojęć i widzieli w teorii względności produkt reklamy oraz sprytne pomieszanie elementów filozofii, matematyki i fizyki tak, by trudno było znaleźć uczonego zdolnego ją krytykować bez wykraczania poza ramy swej specjalności. Obaj ostatni nie ukrywali też swego antysemityzmu i stali się zwolennikami Adolfa Hitlera jeszcze we wczesnych latach dwudziestych, na długo przed rządami nazistów. Niektórzy, jak szwedzki oftalmolog i laureat Nagrody Nobla Allvar Gullstrand, sądzili, że teoria względności jest pusta wewnętrznie i może prowadzić do różnych wyników w tej samej sytuacji. Dochodziły do tego ostre podziały wśród filozofów, niektórzy jak Hans Reichenbach i Moritz Schlick mocno ją popierali, wielu jednak, jak Oskar Kraus czy Henri Bergson, wyrażało sceptycyzm, jeśli nie wrogość, wobec nowej teorii.
Większość uczonych była na ogół wciąż zdezorientowana, nie wiedząc, co sądzić. Toteż książka Einsteina skupiła się na podkreślaniu ciągłości w rozwoju fizyki, uwydatnieniu pewnej linii rozwoju, w której teoria względności stawała się naturalnym ogniwem. Nie sposób jednak ukryć, że teorie Einsteina zrywały z pojęciami absolutnej przestrzeni i absolutnego czasu, stanowiącymi fundament mechaniki, a z nią całej fizyki od czasów Isaaca Newtona. Kwestionowanie uświęconych tradycją zdobyczy nauki w oczach wielu było gestem obrazoburczym i świętokradczym. To, co starszych przejmowało zgrozą i oburzeniem, w oczach ówczesnych ludzi młodych stawało się fascynującą rewolucją. Karl Popper wspominał, jak wielką rolę w jego myśleniu o nauce odegrała teoria Einsteina, już sam fakt, że można było stworzyć realną alternatywę wobec królującej mechaniki Newtona miał dla niego rangę intelektualnego objawienia.

Zacząć wypada od samej nazwy: teoria względności. Z początku mówiło się o zasadzie względności, potem określać tak zaczęto teorię Einsteina z roku 1905 (szczególną teorię względności), a później Einstein zaczął mówić o uogólnionej bądź ogólnej teorii względności. W dyskursie potocznym zaczęto nazwy tę wiązać z zanegowaniem absolutnego czasu, a nawet szerzej z zanegowaniem dotychczasowej fizyki czy wręcz obowiązującej logiki albo etyki. Oczywiście, teoria względności, tak jak żadna udana teoria fizyczna, nie zmienia świata doświadczenia, ponieważ musi być zgodna z dotychczasowymi danymi eksperymentalnymi. Zmienia jedynie nasz sposób widzenia świata, przewidując nowe zjawiska i rozszerzając tym samym granice wiedzy. Mechanika newtonowska nadal obowiązuje, znamy tylko dokładniej jej ograniczenia. Max Planck, jeden z najwcześniejszych zwolenników teorii Einsteina, przekonuje w swej autobiografii naukowej, że jego zainteresowanie teorią względności wynikło właśnie z szukania w fizyce absolutu, ponieważ w świecie teorii względności są także wielkości oraz pojęcia niezmienne i absolutne. Dlatego nazwa ta bywa myląca.

W czerwcu 1905 roku redakcja „Annalen der Physik” otrzymała pracę nikomu nieznanego urzędnika Biura Patentowego w Bernie zatytułowaną O elektrodynamice ciał w ruchu. Rzecz dotyczyła jednego z najważniejszych zagadnień fizyki teoretycznej, którym w poprzednim dziesięcioleciu zajmowali się dwaj uznani luminarze Henri Poincaré i Hendrik Lorentz. Chodziło o eter – hipotetyczny ośrodek wypełniający świat. Na początku XIX stulecia Thomas Young i Augustin Fresnel wykazali, że światło jest falą. Wyobrażano sobie, że musi ono być falą sprężystą w eterze, czyli drganiem, które propaguje się na wszystkie strony podobnie jak fale akustyczne w powietrzu bądź innych ośrodkach sprężystych. Eter ów charakteryzować się musiał dość osobliwymi własnościami, gdyż z jednej strony był na tyle rzadki, by nie hamować ruchów planet, z drugiej zaś musiał być niezmiernie sprężysty, gdyż prędkość światła jest niewyobrażalnie duża w porównaniu np. z prędkością dźwięku. W przypadku dźwięku wiemy, że jego prędkość dodaje się wektorowo do prędkości powietrza: zmierzona prędkość będzie więc zależeć od prędkości ruchu powietrza. Podobne zjawisko zachodzić powinno także w przypadku światła. Ruch roczny Ziemi po orbicie wokół Słońca zachodzi z prędkością około 30 km/s, co stanowi 1/10 000 prędkości światła. Precyzyjne pomiary powinny wykryć zmiany obserwowanej prędkości światła. Przez cały wiek XIX szereg eksperymentatorów od François Arago w roku 1810 aż do Alberta Michelsona i Edwarda Morleya w roku 1887 starało się za pomocą różnych metod optycznych wykryć ruch Ziemi w eterze. Wyniki wszystkich tych doświadczeń były negatywne. Wyglądało to tak, jakby eter poruszał się razem z Ziemią, ale taka hipoteza rodziła sprzeczności z innymi obserwacjami.

Obok optyki innym wielkim tematem dziewiętnastowiecznej fizyki były elektryczność i magnetyzm. W latach sześćdziesiątych XIX wieku James Clerk Maxwell podsumował te wszystkie badania, podając jednolitą matematyczną teorię zjawisk elektrycznych, magnetycznych oraz optycznych – okazało się bowiem, że powinny istnieć fale elektromagnetyczne. Ich prędkość wynikająca z teorii Maxwella była bliska prędkości światła w próżni. Maxwell wysnuł więc wniosek, że światło jest rodzajem fal elektromagnetycznych. W latach 1887-1888 Heinrich Hertz wykazał, że można w laboratorium wytworzyć fale elektromagnetyczne o długości kilku metrów, które także rozchodzą się z prędkością światła. Teoria Maxwella została potwierdzona, stając się praktycznym narzędziem pracy inżynierów. Niemal równocześnie rozwijały się bowiem techniczne zastosowania elektromagnetyzmu: oświetlenie elektryczne, telefon i pierwsze elektrownie. Ojciec i stryj Einsteina, bracia Rudolf i Jakob, prowadzili najpierw w Monachium, później w północnych Włoszech firmę elektryczną i Albert niemal od dziecka miał do czynienia z techniką elektryczną. Elektrodynamika była także ważnym tematem zajęć laboratoryjnych i wykładów na Politechnice w Zurychu. Einstein jednak od początku nie chciał zostać inżynierem i narzekał, że program studiów nie obejmuje teorii Maxwella.

Teoria Maxwella pozwalała w jednolity sposób opisać ogromny obszar zjawisk. Czyniła to za pomocą pojęć pola elektrycznego oraz magnetycznego. W każdym punkcie przestrzeni i w każdej chwili można było za pomocą dwóch wektorów scharakteryzować stan pola. Wydawało się, że eter z początku wieku zyskał teraz nową funkcję, nośnika pola. Ważną cechą nowego podejścia była lokalność: to, co dzieje się z polem elektrycznym i magnetycznym w danym punkcie zależy od ładunków i prądów w tym samym punkcie. Zaburzenia pola rozchodzą się jako fale elektromagnetyczne. Była to więc fizyka pojęciowo odmienna od Newtonowskiej grawitacji, w której dwie masy oddziałują na siebie na odległość w sposób natychmiastowy. W teorii Maxwella ładunek jest źródłem pola w otaczającej go przestrzeni i pole to z kolei oddziałuje na inne ładunki. Prędkość rozchodzenia się zmian pola jest wielka, ale nie nieskończona. Choć Maxwell dokonał najważniejszej pracy, formułując teorię w sposób logicznie zamknięty, to dopiero jego następcy, m.in. Oliver Heaviside i Hendrik Lorentz, znaleźli prostsze i bardziej eleganckie jej wersje. Okazało się np., że każdy prąd elektryczny jest jedynie ruchem ładunków. Mamy więc dwa rodzaje ładunków, których położenia i prędkości określają stan pola w różnych miejscach – są to równania pola, czyli równania Maxwella. Znając zaś wartość pola elektrycznego i magnetycznego, możemy obliczyć siłę działającą na ładunek – są to równania ruchu (siła Lorentza).

Teoria Maxwella wyrastała z modelu pewnego ośrodka sprężystego i uczony, podobnie jak większość współczesnych, uważał, że jego rolą jest sprowadzenie zjawisk elektrycznych i magnetycznych do zjawisk mechanicznych. W odróżnieniu od teorii Newtona, w której mamy pojedyncze punkty materialne, tutaj substratem jest eter, który wyobrażano sobie jako pewien sprężysty materiał. Paradoksalny status eteru opisał na zjeździe Brytyjskiego Towarzystwa Krzewienia Nauk w Oksfordzie w roku 1894 markiz Salisbury, stwierdzając, że „główną, jeśli nie wyłączną, własnością słowa eter było dostarczanie rzeczownika do czasownika falować”.

Problem wykrycia ruchu Ziemi w eterze stał się tym bardziej palący. Wiadomo było wprawdzie, że inżynier stosować może równania Maxwella, nie przejmując się takimi subtelnościami, ale należało wyjaśnić negatywne wyniki doświadczeń. Hendrik Lorentz spróbował podejść do tego problemu w sposób systematyczny i wykazał, że każdemu stanowi pól w nieruchomym eterze odpowiada pewien stan pól w eterze ruchomym. Chciał w ten sposób podać ogólny dowód, że wszelkie zjawiska elektromagnetyczne przebiegają w taki sposób, aby nie można było ruchu Ziemi wykryć. Wprowadził przy tym dość szczególną konstrukcję matematyczną: w poruszającym się układzie należało zdefiniować czas w taki sposób, że zależał on od współrzędnej przestrzennej. Był to zdaniem Lorentza czas fikcyjny, potrzebny do dowodu niemożliwości wykrycia ruchu przez eter. Okazało się też, że należy założyć coś osobliwego na temat długości obiektów poruszających się: powinny one ulec nieznacznemu skróceniu o czynnik \sqrt{1-v^2/c^2}, gdzie v jest prędkością ruchu obiektu, a c – prędkością światła.

Praca Alberta Einsteina, eksperta technicznego III klasy z Berna, proponowała już we wstępie krok decydujący: pojęcie eteru świetlnego jest w fizyce „zbyteczne”. W ten sposób cała dziedzina badań nad zjawiskami w poruszającym się eterze przechodziła do historii, rozpoczynała się natomiast era szczególnej teorii względności.

Fizycy znali wcześniej zasadę względności. Dotyczyła ona mechaniki. I zasada dynamiki, czyli zasada bezwładności, mówi, że gdy żadne siły nie działają na ciało, to porusza się ono ruchem jednostajnym i prostoliniowym bądź spoczywa. Zasada ta nie dotyczy każdego układu współrzędnych (in. układu odniesienia). Obserwator w hamującym pociągu widzi, jak przewracają się przedmioty, które dotąd spokojnie sobie tkwiły w bezruchu. Hamujący pociąg nie jest więc układem odniesienia, w którym zasada bezwładności ma zastosowanie. Fizycy mówią: nie jest układem inercjalnym (tzn. takim, w którym obowiązuje zasada bezwładności). Pociąg jadący ruchem jednostajnym jest dobrym przybliżeniem układu inercjalnego, podobnie jak powierzchnia Ziemi. Wiemy jednak, że także powierzchnia Ziemi nie jest idealnym układem inercjalnym, ponieważ Ziemia wiruje wokół osi, a także porusza się ruchem rocznym wokół Słońca. Układ inercjalny jest więc pewnym ideałem teoretycznym. Zasady dynamiki mają w takim układzie szczególnie prostą postać i zazwyczaj tak są domyślnie sformułowane.

Ważną cechą układów inercjalnych jest to, że każdy układ odniesienia poruszający się ruchem jednostajnym i prostoliniowym względem jednego z nich jest także układem inercjalnym. mamy więc do czynienia z klasą równoważnych fizycznie układów odniesienia. W każdym z nich obowiązują zasady dynamiki w zwykłej postaci. Nie znaczy to, że nie możemy opisywać ruchu np. w odniesieniu do hamującego pociągu, musimy jednak wtedy uwzględnić dodatkowe siły, które nie wynikają z żadnych oddziaływań, lecz są skutkiem ruchu układu: w hamującym pociągu pasażerowie odczuwają siłę zwróconą ku jego przodowi, która znika, gdy pociąg się zatrzyma.

Isaac Newton sformułował w Matematycznych zasadach filozofii przyrody pojęcia absolutnej przestrzeni – czegoś w rodzaju nieskończonego pojemnika na wszystkie obiekty w świecie oraz absolutnego czasu. Prawa dynamiki obowiązywać miały, gdy ruch odnosimy do owej przestrzeni absolutnej, ale także w każdym układzie odniesienia poruszającym się ruchem jednostajnym i prostoliniowym. W rezultacie w fizyce Newtona nie ma sposobu na ustalenie, który z nieskończonego zbioru układów inercjalnych jest absolutną przestrzenią albo w języku dziewiętnastego wieku: eterem. Nie możemy więc ustalić absolutnego położenia żadnego przedmiotu w sposób empiryczny: dwa zdarzenia zachodzące w odstępie jednej minuty w tym samym punkcie (inercjalnego) pociągu zachodzą w różnych miejscach przestrzeni zdaniem obserwatora na peronie. Fizycznie oba punkty widzenia są równoprawne, a także punkty widzenia wszelkich innych obserwatorów inercjalnych. Absolutna przestrzeń należy więc do założeń metafizycznych Newtona, żadne eksperymenty nie pozwalają jej zlokalizować. Inaczej można powiedzieć, że w fizyce Newtona obowiązuje zasada względności: prawa fizyki są takie same w każdym układzie inercjalnym.

Czas w fizyce Newtona jest rzeczywiście absolutny, to znaczy, można zawsze ustalić, czy zdarzenia są równoczesne, nawet gdy zachodzą one daleko od siebie (zresztą dla pewnego obserwatora inercjalnego będą one równoczesne i zarazem w tym samym punkcie przestrzeni).

Einstein uważał, iż zasadę względności należy rozciągnąć także na zjawiska elektromagnetyczne i zaproponował, aby obowiązywała ona jako nowe prawo fizyki: wszelkie prawa fizyki mają taką samą postać w każdym układzie inercjalnym. Drugim postulatem jego teorii było przyjecie, że prędkość światła w próżni jest dla każdego obserwatora inercjalnego równa tej samej wartości c (wynikającej z teorii Maxwella). Zamiast analizować szczegóły zaproponował więc dwie zasady ogólne, które jego współczesnym wydawały się przeczyć sobie wzajemnie. Rozszerzenie zasady względności na całą fizykę byłoby wprawdzie eleganckim wyjaśnieniem, dlaczego nie obserwujemy ruchu Ziemi w eterze (bo eteru nie ma), ale pojawia się trudność z drugim postulatem. Znaczy on bowiem, że nie tylko prędkość światła zawsze jest równa c, bez względu na ruch źródła światła, ale także równa jest c bez względu na to, czy obserwator goni falę świetlną, czy też porusza się jej naprzeciw. Przeczy to prawu składania prędkości, a przecież eksperymenty potwierdzają je na co dzień: gdy pasażer porusza się z prędkością u (względem pociągu) w kierunku do przodu pociągu jadącego z prędkością v (względem peronu), to jego prędkość względem peronu jest sumą u+v. Dlaczego prawo to nie działa, gdy jednym z obiektów jest światło?

Czyniono często zarzut Einsteinowi, że prędkość światła w próżni jest w jego teorii jakoś szczególnie wyróżniona. Rzeczywiście, istnieje w tej teorii graniczna prędkość poruszania się obiektów materialnych, np. przekazywania energii albo informacji, i to jest właśnie c. Można powiedzieć, że światło ma tę szczególną własność, iż porusza się z ową maksymalną prędkością. Nie ma jednak żadnych przeszkód, aby istniały inne obiekty poruszające się z prędkością c. Wiemy, że światło składa się z fotonów (było to treścią innej pracy Einsteina z tego samego roku, nie bez powodu nazywanego jego „cudownym rokiem”), cząstek poruszających się z prędkością c. Podobnie poruszają się inne cząstki, odkryte później, jak gluony, albo wciąż czekające na odkrycie, jak grawitony. Cząstki takie nie istnieją w stanie spoczynku, lecz zawsze poruszają się z prędkością c.

Istnienie maksymalnej prędkości, i to w dodatku zawsze jednakowej, pozwala na eksperymentalne badanie równoczesności dwóch zjawisk. Obserwator inercjalny może rozmieścić w swoim układzie odniesienia zegary w różnych punktach. Znając odległość tych puntów oraz prędkość światła, może te zegary zsynchronizować. Gdy jego zegar wskazuje czas t, wysyła sygnał do punktu odległego o r i umawia się z kolegą, który tam przebywa, że moment odebrania sygnału będzie czasem t+r/c. Dzięki temu przepisowi wszystkie zegary zostaną zsynchronizowane i można będzie ustalić zawsze czas danego zdarzenia, obserwując go na pobliskim zegarze. Metoda ta zastosowana w innym układzie inercjalnym może dać inne wyniki w odniesieniu do tej samej pary zdarzeń.

Przykład podany przez Einsteina pomaga to zrozumieć. Wyobraźmy sobie jadący pociąg i obserwatora na peronie. W chwili, gdy mija go środek pociągu, w jego początek i koniec uderzają równocześnie dwa pioruny. Ich uderzenia są równoczesne, ponieważ światło obu błyskawic dociera do naszego obserwatora w jednej chwili, a wiadomo, że odległość obu końców pociągu od obserwatora była w tym momencie taka sama. Inaczej opisze te zdarzenia obserwator siedzący w środku pociągu. Jego zdaniem piorun najpierw uderzył w przód pociągu, a dopiero później w jego tył (linia świata pasażera jest na rysunku zakreskowana, jest to zarazem jego oś czasu). Skoro równoczesność dwóch zdarzeń zależy od układu odniesienia, to znaczy, że czas absolutny nie istnieje. Wbrew pozorom nie burzy to jednak naszych koncepcji przyczyny i skutku. Musimy tylko precyzyjnie opisywać zdarzenia, podając ich położenie oraz czas. Zdarzenia takie, jak jednoczesne uderzenia dwóch piorunów w dwóch różnych punktach nie są z pewnością połączone związkiem przyczynowo-skutkowym, ponieważ wymagałoby to oddziaływania przenoszącego się natychmiastowo, z nieskończoną prędkością. Wszystkie zaś oddziaływania fizyczne mogą przenosić się co najwyżej z prędkością światła w próżni. Dlatego zmiana kolejności czasowej obu uderzeń pioruna nie burzy fizyki. Jeśli natomiast jakieś zdarzenie A może potencjalnie być przyczyną innego zdarzenia B, to dla każdego obserwatora ich kolejność czasowa będzie taka sama: t_A<t_B. Obalenie koncepcji absolutnego czasu nie oznacza zatem wprowadzenia anarchii w relacjach czasoprzestrzennych, lecz zaprowadzenie innego ładu niż dotąd.

Był to najważniejszy wniosek Einsteina. Oznaczał konieczność przebudowy samych podstaw fizyki: pojęć czasu i przestrzeni. Okazywało się, że teoria Maxwella zgodna jest z teorią względności, nie wymaga więc żadnej przebudowy. Przeciwnie, fikcyjny czas lokalny Lorentza należy interpretować jako czas rzeczywisty mierzony przez innego obserwatora. Póki znajdujemy się w jednym ustalonym układzie inercjalnym czas wydaje nam się absolutny. Rewolucja dotyczyła porównywania wyników pomiarów dokonywanych przez różnych obserwatorów. W przypadku elektrodynamiki oznaczało to względność pól elektrycznych i magnetycznych. Jeśli np. w jednym układzie odniesienia mamy spoczywający ładunek wytwarzający pole elektryczne, to w innym układzie ładunek ten będzie się poruszać – będziemy więc mieli do czynienia z prądem, i obserwować będziemy zarówno pole elektryczne, jak i magnetyczne. Oba wektory pola elektromagnetycznego stanowią więc z punktu widzenia teorii względności jedną całość, jeden obiekt matematyczny, którego składowe w różnych układach są różne, podobnie jak składowe zwykłego wektora w różnych układach współrzędnych.

Równania Maxwella są takie same w każdym układzie inercjalnym, więc i prędkość fali świetlnej będzie w każdym układzie taka sama. Większej przebudowy wymagała mechanika. Jej newtonowska wersja nadal pozostaje słuszna, gdy ciała poruszają się wolno w porównaniu do prędkości światła. Najważniejszą konsekwencją nowej mechaniki stało się słynne równanie E=mc^2, które pozwala zrozumieć m.in. reakcje, w których powstają albo giną cząstki, oraz skąd gwiazdy czerpią energię na świecenie przez miliardy lat.

Szczególna teoria względności rozwiązywała problemy, które od lat uciążliwie towarzyszyły fizykom, choć były one głównie natury pojęciowej. Można było na co dzień nie zaprzątać sobie głowy ruchem Ziemi w eterze i uprawiać fizykę tak, jakby Ziemia była nieruchoma. Także narzędzia do rozwiązania owych problemów zostały już wypracowane, głównie przez Lorentza i Poincarégo, Einstein je tylko radykalnie zreinterpretował. Pierwszy z fizyków pogodził się z sytuacją i zaprzyjaźnił z Einsteinem, drugi starał się ignorować prace młodszego kolegi (być może zresztą jego stosunek do Einsteina uległby z czasem zmianie, Poincaré zmarł w roku 1912, a więc przed stworzeniem ogólnej teorii względności). Ostatecznie elektrodynamika ciał w ruchu przeszła do historii, a podstawą fizyki stała się szczególna teoria względności.
Natomiast jej uogólnienie, czyli Einsteinowska teoria grawitacji, było praktycznie dziełem jednego tylko autora, stworzonym w latach 1907-1915.

Pojęciowym punktem wyjścia była prosty eksperyment myślowy: obserwator swobodnie spadający w polu grawitacyjnym nie będzie odczuwał grawitacji – będzie w stanie nieważkości, dziś dobrze znanym z lotów kosmicznych. Einstein uznał tę obserwację za „najszczęśliwsza myśl swego życia”. Z punktu widzenia fizyki Newtonowskiej istnieją dwa rodzaje masy: grawitacyjna i bezwładna. Pierwsza określa siłę, z jaką na ciało będzie oddziaływać grawitacja. Druga określa przyspieszenie ciała. Ponieważ obie te masy są jednakowe, więc przyspieszenie dowolnego ciała w danym polu grawitacyjnym jest takie same. Ilustruje to się czasem, demonstrując spadanie różnych ciał w rurze próżniowej. Obie masy skracają się zawsze, kiedy obliczamy przyspieszenie. Zdaniem Einsteina należało tę tożsamość wbudować w strukturę fizyki, zamiast ją tylko postulować jako dodatkowy warunek. Uczony sformułował zasadę równoważności pola grawitacyjnego i przyspieszenia. Znajdując się w zamkniętej kapsule, nie potrafilibyśmy odróżnić, czy nasza kapsuła porusza się ruchem przyspieszonym, czy spoczywa w polu grawitacyjnym (możliwe byłyby także kombinacje obu stanów). Grawitacja jest więc w fundamentalny sposób związana z bezwładnością. Einstein dążył do stworzenia teorii, która objaśniałaby jednocześnie grawitację oraz bezwładność. Argumentował przy tym, że układy inercjalne są sztucznym ograniczeniem dla fizyki, powinniśmy więc dopuścić także układy przyspieszone, nieinercjalne. Podobnie jak w szczególnej teorii względności każda prędkość ma zawsze charakter względny, w teorii uogólnionej także przyspieszenie miało stać się pojęciem względnym. Nawiązywał tu do rozważań Ernsta Macha, który sądził, że przyspieszenie jest względne. W swoim czasie Isaac Newton posłużył się przykładem wiadra z wodą wirującego na skręconym sznurze. Gdy wiadro przekaże ruch wirowy wodzie, jej powierzchnia staje się wklęsła, co jest skutkiem sił odśrodkowych. Możemy w ten sposób stwierdzić, czy woda wiruje względem absolutnej przestrzeni. Zdaniem Macha eksperyment ten dowodzi tylko tego, że woda obraca się względem dalekich gwiazd. Gdyby to owe gwiazdy zaczęły się obracać, skutek byłby ten sam, a przestrzeń absolutna nie istnieje.

Droga Einsteina do ogólnej teorii względności była zawikłana, lecz z perspektywy roku 1921 jej struktura matematyczna została już wyjaśniona. Rolę układów inercjalnych odgrywały teraz swobodnie spadające układy odniesienia. Obserwator znajdujący się w jednym z nich może stosować szczególną teorię względności. Różnica fizyczna między obiema teoriami polega jednak na tym, że szczególną teorię względności stosować można jedynie lokalnie. Nawet bowiem w spadającym swobodnie laboratorium można wykryć niewielkie zmiany przyspieszenia między różnymi jego punktami – są to siły przypływowe (poznane historycznie na przykładzie zjawiska przypływów i odpływów w oceanach, które są z różnymi siłami przyciągane grawitacyjnie przez Księżyc oraz Słońce). Oznacza to, że nie można wprowadzić jednego układu inercjalnego dla całego wszechświata, można tylko wprowadzać je lokalnie. Matematycznie rzecz biorąc, różnica między teorią ogólną i szczególną polega na geometrii: zakrzywionej w pierwszym przypadku, płaskiej w drugim. Einstein posłużył się czterowymiarowym sformułowaniem swej teorii szczególnej podanym przez Hermanna Minkowskiego. Czas i przestrzeń stanowią tu pewną całość, czasoprzestrzeń. W przypadku dwuwymiarowym w każdym punkcie powierzchni możemy zbudować płaszczyznę styczną. Jest ona zarazem dobrym przybliżeniem geometrii w otoczeniu danego punktu: w taki sposób posługujemy się planami miast, mimo że Ziemia nie jest płaska.

Teorię dwuwymiarowych powierzchni zawartych w trójwymiarowej przestrzeni zbudował Karl Friedrich Gauss. Zauważył przy tym, że wystarczy posługiwać się wielkościami dostępnymi bez wychodzenia poza powierzchnię. Można np. w ten sposób ustalić, czy jest ona zakrzywiona. Podejście Gaussa uogólnił później Bernhard Riemann, a inni matematycy rozwinęli je w systematyczne procedury dla powierzchni o dowolnej liczbie wymiarów.

W geometrii Riemanna współrzędne można wybrać w sposób dowolny, w przypadku zakrzywionych przestrzeni nie istnieje na ogół żaden szczególnie prosty układ współrzędnych, który mógłby odegrać taką rolę jak współrzędne kartezjańskie w przestrzeni euklidesowej. Nadal decydującą rolę odgrywa tu pojęcie odległości. Dla pary bliskich punktów możemy ją zawsze obliczyć w sposób euklidesowy, a długość dowolnej krzywej uzyskać przez sumowanie takich elementarnych odległości. Zamiast równania ds^2=dx^2+dy^2 na płaszczyźnie, mamy teraz równanie nieco bardziej skomplikowane

ds^2=g_{11}dx_1^2+2g_{12}dx_1dx_2+g_{22}dx_2^2.

Geometrię przestrzeni określa więc zbiór funkcji g_{\mu\nu} pozwalających obliczyć odległość punktów. Funkcje g_{\mu\nu} noszą nazwę tensora metrycznego (albo metryki). Można za ich pomocą wyrazić wszelkie własności geometryczne danej przestrzeni. W przypadku dwuwymiarowym wystarczą trzy takie funkcje, w przypadku czterowymiarowym należy znać ich dziesięć.

W zakrzywionej przestrzeni nie ma linii prostych, można jednak znaleźć ich odpowiedniki. Są to linie geodezyjne (albo geodetyki). Mają one niektóre własności linii prostych w geometrii euklidesowej: są np. najkrótszą drogą łączącą dwa punkty. Krzywe geodezyjne w teorii Einsteina są liniami świata cząstek poruszających się pod wpływem grawitacji. Metryka określa więc, jak poruszają się cząstki – grawitacja nie jest z punktu widzenia Einsteina siłą, lecz własnością czasoprzestrzeni. Należy dodać, że inne rodzaje sił działających na dane ciało sprawią, że przestanie się ono poruszać po geodezyjnej. Jedynie grawitacja wiąże się tak ściśle z geometrią. Jest to zgodne z faktem, że grawitacja jest powszechna, tzn. dotyczy wszystkich cząstek, a także działa na wszystkie w taki sam sposób – dzięki czemu można ją opisać jako własność czasoprzestrzeni. W teorii Einsteina nie potrzeba osobnej masy grawitacyjnej i bezwładnej.

Znając metrykę czasoprzestrzeni, możemy wyznaczyć geodezyjne, czyli obliczyć, jak poruszają się ciała pod wpływem grawitacji. Są to równania ruchu, zastępujące zasady dynamiki Newtona. Aby jednak wyznaczyć metrykę, potrzebne są równania, które musi ona spełniać. Są to równania pola, największe osiągnięcie Einsteina jako fizyka. Przystępując do pracy nad ogólną teorią względności uczony wiedział jedynie, że powinna ona zawierać teorię szczególną a także Newtonowską teorię grawitacji. Równania pola powinny mieć postać znaną z teorii Maxwella: (pewne kombinacje pochodnych pól)=(źródła pola). W przypadku grawitacyjnym źródłem powinna być masa, ale to także znaczy: energia. W teorii szczególnej opisuje się energię i pęd zbioru cząstek jako tensor energii pędu T_{\mu\nu}, zbiór dziesięciu wielkości danych w każdym punkcie czasoprzestrzeni. Masy powinny decydować o krzywiźnie czasoprzestrzeni. Zatem po lewej stronie równań pola powinna znaleźć się wielkość informująca o krzywiźnie. Okazuje się, że praktycznie jedyną możliwością jest tu tzw. tensor Einsteina, G_{\mu\nu} zbiór dziesięciu pochodnych metryki. Równania muszą więc przybrać postać

G_{\mu\nu}=\kappa T_{\mu\nu}.

gdzie \kappa jest odpowiednio dobraną stałą związaną ze stałą grawitacyjną. Sama postać zapisu tych równań zapewnia, że możemy w dowolny sposób wybrać współrzędne, a równania nadal pozostaną słuszne. Znalezienie prawidłowych równań pola pod koniec listopada 1915 roku zakończyło odyseję Einsteina: ogólna teoria względności została zbudowana.

Jeszcze w listopadzie 1915 roku uzyskał Einstein dla swej teorii pierwsze potwierdzenie obserwacyjne. Obliczył bowiem wielkość obrotu orbity Merkurego wokół Słońca – niewielkiej rozbieżności między obserwacjami a teorią Newtona nie udawało się wyjaśnić od półwiecza. Teraz okazało się, że przyczyną rozbieżności było niedokładne prawo grawitacji. Przewidział też Einstein, że promienie gwiazd biegnące blisko powierzchni Słońca powinny uginać się o kąt 1,74’’. Efekt ten został w roku 1919 potwierdzony podczas całkowitego zaćmienia Słońca przez dwie ekspedycje brytyjskie. Teoria grawitacji Einsteina okazała się ogromnym sukcesem, jest powszechnie uważana za najpiękniejszą teorię w fizyce. Nie wszystko jednak poszło po myśli jej twórcy. Okazało się np., że choć wprawdzie grawitacja i bezwładność zostały ze sobą zespolone, to nie udało się jednak zrealizować idei Macha. W teorii Einsteina wirowanie całego wszechświata jest czym innym niż wirowanie wiadra Newtona. Einstein z pewnym uporem trzymał się zasady Macha nawet wówczas, gdy wykazano, że nie obowiązuje ona w jego teorii. Wbrew przewidywaniom twórcy grawitacja może prowadzić do zapadania się materii i tworzenia czarnych dziur, w których zamknięta jest osobliwość czasoprzestrzeni. Einstein zmieniał w ciągu swej późniejszej kariery zdanie na temat tego, czy istnieją fale grawitacyjne: początkowo je przewidywał, później nabrał wątpliwości. Jego początkowe przybliżone podejście okazało się słuszne i fale grawitacyjne zostały odkryte w roku 2015.

Balony i ciemne gwiazdy Johna Michella (1783)

We wrześniu 1783 roku podpisano traktat pokojowy między Stanami Zjednoczonymi a Wielką Brytanią. Amerykańska kolonia wywalczyła sobie niepodległość. Sporą rolę w politycznych zabiegach o wolność odegrał Benjamin Franklin, znany uczony i pierwszy Amerykanin sławny na cały ówczesny świat. Sędziwy uczony pełnił w tych latach funkcję ambasadora we Francji, co miało ogromne znaczenie – bez francuskiej pomocy finansowej i wojskowej kolonie nie zdołałyby się wyzwolić. Franklin, członek Towarzystwa Królewskiego, który spędził przedtem wiele lat w Londynie i czuł się tam jak w domu, uznał jesienią tego roku, że czas nawiązać zerwane z powodu wojny stosunki naukowe. Nic jednak na tym świecie nie wraca do punktu wyjścia, rozbrat z Anglią stał się nieodwracalny. Toteż pisząc do sir Josepha Banksa, przewodniczącego Towarzystwa Królewskiego, Franklin dał mu odczuć po której stronie się znajduje.

Jesień tego roku upłynęła w Paryżu pod znakiem kolejnych prób lotów balonem. Dziesiątki tysięcy ludzi przyglądało się pierwszym lotom. Niektórzy widzieli w tym jedynie niepoważną modę, Franklin sądził inaczej. Pisał do Banksa:

Przykro mi, że ten eksperyment pozostaje całkowicie zaniedbany w Anglii, gdzie tak silny jest geniusz mechaniczny. Szkoda, że nie ma takiego samego współzawodnictwa między narodami, jakie widzę tutaj między dwoma stronnictwami: wasza filozofia wydaje się zbyt nieśmiała. W tym kraju nie boimy się tak bardzo, że ktoś się może z nas śmiać. Jeśli zrobimy coś głupiego, to pierwsi jesteśmy gotowi się z tego śmiać i niemal taką samą przyjemność sprawia nam bon mot albo dobra chanson, gdy wyśmiewają niepowodzenie jakiegoś projektu, jak i chwalą sukces. Nie wydaje mi się, aby warto było rezygnować z przeprowadzenia nowego eksperymentu tylko dlatego, że nie widzimy, do czego można by wykorzystać tę umiejętność.

Opisał mu też jedną z takich prób:

Ponieważ czułem się trochę niedysponowany, powietrze było chłodne, a ziemia wilgotna, zrezygnowałem z udania się do Ogrodu Tuileries, gdzie umieszczony był balon, nie wiedząc, jak długo będzie trzeba czekać, zanim będzie on gotów do odlotu, i zdecydowałem pozostać w mym powozie blisko posągu Ludwika XV (…) ranek był mglisty, ale koło pierwszej znacznie się przejaśniło ku wielkiemu zadowoleniu widzów, których była niezliczona rzesza, gdyż kilka dni wcześniej ogłoszono w gazetach zamiar przeprowadzenia eksperymentu, tak że wyległ na zewnątrz nie tylko cały Paryż: w okolicach Tuileries, na nabrzeżach i mostach, na ulicach, w oknach i na dachach domów, ale także mieszkańcy okolicznych miast i wiosek. Nigdy dotąd żaden eksperyment filozoficzny nie zgromadził tyle publiczności. (…) Między pierwszą a drugą widzowie uraczeni zostali widokiem [balonu] wznoszącego się majestatycznie ponad drzewa, a następnie stopniowo ponad budynki, co dostarczyło niezwykle pięknego spektaklu! Na wysokości jakichś dwustu stóp dzielni śmiałkowie wychylili się i pomachali białym proporczykiem na obie strony swej gondoli, aby pozdrowić widzów, którzy odpowiedzieli gromkim aplauzem. (…) Miałem ze sobą kieszonkową lunetę, za pomocą której śledziłem balon, stopniowo przestając rozróżniać najpierw ludzi, potem gondolę, a kiedy po raz ostatni widziałem balon, wydawał mi się nie większy niż orzeszek laskowy

W odpowiedzi Banks przywoływał zasługi brytyjskie: biskupa Johna Wilkinsa, który w XVII wieku fantazjował na temat machin latających i Henry’ego Cavendisha, który pierwszy napełniał bańki mydlane palnym powietrzem (tzn. wodorem).

Kiedy jednak nasi przyjaciele po Pańskiej stronie morza nieco ochłoną, zauważą z pewnością, jak przyglądamy się zbiorowiskom gwiazd i meteorów, badając, czy nie potrafimy zdobyć nie mniejszej wiedzy dzięki zastosowaniu teorii do tego, co znajdujemy w arsenałach nieba.
Pan Michell przedstawił interesujący artykuł, w którym traktuje światło jako podlegające działaniu grawitacji na równi z innymi ciałami.

John Michell, duchowny, geolog, badacz magnetyzmu i autor pierwszego przyrządu do „zważenia Ziemi”, tzn. wyznaczenia jej średniej gęstości (albo masy, co na jedno wychodzi), uznał, że grawitacja działa także na cząstki światła. Ponieważ przyspieszenie nadawane przez siły grawitacji nie zależy od rodzaju ciała, więc nie musimy nic wiedzieć na temat mas takich cząstek światła.

Posługując się mechaniką Newtona, obliczył on, o ile cząstki światła dobiegające do Ziemi spowalniane są przez grawitację Słońca. Potrzebował do tego obliczyć prędkość ucieczki ze Słońca v w porównaniu z prędkością światła c. Otrzymał

\dfrac{v}{c}\approx \dfrac{1}{497}.

Oznaczało to, że prędkość cząstek światła daleko od powierzchni Słońca można wyznaczyć z warunku

c_{\infty}^2=c^2-v^2 \Rightarrow c_{\infty}=\sqrt{c^2-v^2}\approx c\left(1-\dfrac{1}{494000}\right).

Prędkość zmieniałaby się więc w tym przypadku nieznacznie. Można jednak wyobrazić sobie, że we wszechświecie istnieją ciała znacznie masywniejsze od Słońca. Jeśli przyjmiemy, że mają one tę samą co ono gęstość średnią, to wystarczy, by ich promień był 497 razy większy od promienia Słońca, by światło nie mogło uciec z ich pola grawitacyjnego. Byłyby to więc ciemne gwiazdy, niewidoczne optycznie. Możliwe byłyby także sytuacje, gdy prędkość cząstek światła jest znacznie zmniejszona w stosunku do swej wartości wyjściowej. Można by zaobserwować takie zmiany dzięki zjawisku załamania, które zależy od prędkości światła w obu ośrodkach. Astronomowie dość szybko stwierdzili, że nie obserwuje się takich zmian.

Cztery uwagi na koniec.

  1. Hipoteza Michella jest naturalna w cząstkowej teorii światła. Nie ma natomiast powodu, aby światło podlegało działaniu grawitacji, jeśli jest ono falą w eterze. Nie ma też takiego powodu w elektromagnetycznej teorii Maxwella. Oddziaływanie grawitacji na światło pojawia się dopiero w teorii Einsteina, ponieważ deformuje się czasoprzestrzeń, w której porusza się światło i nie ma tu znaczenia, czym jest światło – każda cząstka o zerowej masie będzie się poruszać tak samo.
  2. Wynik Michella dla ciemnych gwiazd jest liczbowo taki sam, jak wzór na promień Schwarzschilda dla czarnej dziury.  Znaczy to, że możliwa jest czarna dziura zbudowana z materii o gęstości Słońca, a więc rzędu gęstości wody, byle tylko masa była dostatecznie duża: 500^3=125\cdot 10^6 mas Słońca. Takie czarne dziury znajdują się w centrach galaktyk. To przykład, że utworzenie się czarnej dziury nie musi następować w warunkach skrajnie wielkiej gęstości. Promień Schwarzschilda jest proporcjonalny do masy, więc średnia gęstość równa masa/promień^3 jest proporcjonalna do M^{-2}.
  3. Gwiazda Michella różni się od czarnej dziury: światło mogłoby z niej uciec, gdyby zostało wyemitowane np. ze wznoszącej się rakiety. Podobnie astronauta mógłby uciec z ciemnej gwiazdy Michella posługując się rakietą. W przypadku czarnej dziury nie ma takiej możliwości.
  4. Teoria emisyjna światła broniona była na początku XX w. przez Waltera Ritza. Silnym kontrargumentem obserwacyjnym jest wobec niej fakt, że nie obserwuje się zmian prędkości światła wysyłanego przez składniki gwiazd podwójnych. Zmiany prędkości źródła nie wpływają na prędkość światła – zwrócił na to uwagę Willem de Sitter.

Zobaczmy, jak Michell obliczył prędkość ucieczki ze Słońca.
Promień kątowy Słońca to 16’, czyli w radianach 1/214,19. Promień Słońca R jest więc 214,19 razy mniejszy od promienia orbity Ziemi. Z III prawa Keplera zastosowanego do Ziemi i satelity Słońca na orbicie równej jego promieniowi, otrzymujemy okres obiegu takiego (hipotetycznego) satelity: T=10067 \mbox{ s}. Wiadomo z dzieła Newtona, że prędkość ucieczki jest \sqrt{2} razy większa od prędkości satelity na orbicie kołowej. Wiadomo wreszcie, że światło biegnie ze Słońca t=488\mbox{ s} (używamy tu danych Michella).
Mamy więc

\dfrac{v}{c}=\sqrt{2}\,\dfrac{2\pi R}{T}\dfrac{t}{214,19 R}\approx \dfrac{1}{497}.

Kwadrat prędkości ucieczki z pola grawitacyjnego równy jest kwadratowi prędkości uzyskanej w spadaniu ze spoczynku aż do powierzchni (Słońca w naszym przypadku):

{\displaystyle v^2=\int_{R}^{\infty}\dfrac{2GM}{r^2}dr=\dfrac{2GM}{R}}.

Na rysunku całka to pole pod krzywą zaznaczone na niebiesko i równe polu powierzchni czerwonego prostokąta z lewej strony. Do tradycji szkoły brytyjskiej należało posługiwanie się geometrią i opisem słownym, bez wyrażeń algebraicznych.

Zauważmy, że przy powiększaniu ciała bez zmiany gęstości masa M będzie proporcjonalna do R^3 i prędkość będzie proporcjonalna do R: dlatego ciemna gwiazda powinna mieć promień 497 razy większy od Słońca.
Michell, podobnie jak Newton, nie znał pojęcia energii potencjalnej. Dziś zapisalibyśmy zasadę zachowania energii w nieskończoności i na powierzchni Słońca:

\dfrac{c_{\infty}^2}{2}=\dfrac{c^2}{2}-\dfrac{GM}{R}.

Jak gęsta może być materia? Białe karły, Stoner i Chandrasekhar (1930-1931)

31 lipca 1930 roku z Mumbaju odpłynął parowiec „Lloyd Triestino”. Wśród pasażerów znajdował się dziewiętnastoletni Subrahmanyan Chandrasekhar, udający się do Anglii stypendysta rządu indyjskiego. Zdążył on opublikować już pierwszą pracę na temat statystyk kwantowych, dwa lata wcześniej dowiedział się od przebywającego gościnnie w Indiach Arnolda Sommerfelda, że całej fizyki mikroświata należy nauczyć się na nowo i wszystkie podręczniki sprzed kilku lat są już nieaktualne. Zaczął więc z zapałem czytać artykuły dotyczące mechaniki kwantowej i pierwszą swą pracę wysłał do Anglii do Ralpha Fowlera z Cambridge. Wiedział o nim tylko tyle, że uczony ten zaproponował kwantowe wyjaśnienie problemu tzw. białych karłów – niewielkich gwiazd zbudowanych z niezwykle gęstej materii nawet 100 000 razy gęstszej od wody. Astronomowie, którzy uzyskiwali tak wysokie szacowania gęstości, nie potrafili zrazu w nie uwierzyć, sądząc, że w obliczenia musiał wkraść się jakiś niezidentyfikowany błąd. W astronomii dość często się zdarza, że trzeba rewidować dotychczasowe założenia i wyniki. Podczas podróży Chandrasekhar unikał balów i wieczorków organizowanych na statku, był zresztą wegetarianinem i nie brał do ust wielu podawanych potraw. Pracował. Jego obliczenia wskazywały, że białe karły nie mogą być zbyt masywne, gdyż nie będą stabilne. Wynik ten stał w sprzeczności z dotychczasową wiedzą i Chandrasekhar miał stoczyć trudną wieloletnią walkę o uznanie prawdziwości jego obliczeń. Białe karły są ostatnim stadium ewolucji gwiazd i nie mogą być bardziej masywne niż 1,4 masy Słońca. Co w takim razie dzieje się z gwiazdami pięcio-, dziesięcio- i dwudziestokrotnie bardziej masywnymi? Czy jest możliwe, że pozbywają się one w jakiś sposób niemal całej swej masy, aby osiągnąć w końcu stadium białego karła? Jeśli tak, to czy może się to odbywać w długim czasie w sposób spokojny, czy też należy spodziewać się eksplozji? Wynik Chandrasekhara miał przełomowe znaczenie, bo wskazywał, że grawitacja może stać się siłą, która dosłownie kruszy materię. O jego wadze świadczy fakt, iż pół wieku później za tę pracę indyjski uczony otrzymał Nagrodę Nobla. Spędził długie i twórcze życie naukowe, stając się jednym z najbardziej znanych astrofizyków dwudziestego wieku, a jednak właśnie to młodzieńcze osiągnięcie wydawało się godne uhonorowania najważniejszą nagrodą.

W Londynie pierwszą książką, którą kupił Chandrasekhar, były Principles of Quantum Mechanics, fundamentalne, pomnikowe dzieło dwudziestoośmioletniego Paula Diraca, który zdążył już stać się klasykiem tej młodej dziedziny. W istocie były to lata zupełnie wyjątkowe w dziejach fizyki: niemal każda nowa praca miała szanse przejść do historii. Odkrywano bowiem kolejne zastosowania nowego formalizmu: w fizyce, w chemii, w astrofizyce. Zasady wprowadzone dla wyjaśnienia zjawisk atomowych okazały się w zasadniczym zrębie słuszne także w fizyce jąder atomowych, cząstek elementarnych, pozwalały też zrozumieć, jak przebiegają zjawiska we wszechświecie: od źródeł energii gwiazd, przez ich budowę oraz rodzaje wysyłanego promieniowania. Był to okres pionierski, gdy wyznaczano dopiero granice nowego terytorium i wciąż przesuwały się one dalej. Coś takiego zdarza się niezwykle rzadko, a w życiu uczonego najwyżej raz. Chandrasekhar znalazł się też w znakomitym miejscu: Trinity College w Cambridge, gdzie pracowali Fowler i jego niedawny doktorant Dirac, a także Arthur Stanley Eddington, astrofizyk, autor książki The Internal Constitution of the Stars, którą starannie przestudiował i z której korzystał podczas pracy na statku.

Na czym polegał problem białych karłów? W dostępnych nam eksperymentalnie warunkach materii nie można zbyt mocno ścisnąć. Atomy zachowują się bowiem jak sztywne kulki i nawet pod wielkim ciśnieniem gęstość ciał stałych niemal się nie zmniejsza się, ledwie przekraczając – w przypadku najcięższych metali – dwudziestokrotność gęstości wody. Większą gęstość – ponad sto gęstości wody – osiąga materia blisko centrum Słońca. Składa się ona głównie z produktów jonizacji wodoru: protonów i elektronów o bardzo wysokiej temperaturze. Mimo tak wielkich gęstości plazmę tę wciąż można traktować jak gaz doskonały. Przeskok do gęstości milion razy większych od gęstości wody nie wydawał się fizycznie możliwy bez temperatur sięgających miliony stopni, powierzchnia białego karła świeciła w zakresie widzialnym jak gwiazda, musiała więc mieć temperaturę liczoną w tysiącach stopni.

Kwantowe wyjaśnienie zaproponował Ralph Fowler, pod którego patronatem, lecz zupełnie samodzielnie, pracował Paul Dirac. Elektrony są, jak dziś mówimy, fermionami, tzn. podlegają szczególnemu ograniczeniu: w jednym stanie kwantowym może znajdować się jeden elektron (a jeśli ignorujemy stany spinowe, to dwa różniące się rzutem spinu). Właśnie Paul Dirac obok Enrico Fermiego pierwszy zaproponował kwantowomechaniczny opis takich cząstek (nazwa fermiony, a nie np. dirakiony, nie ma głębszego uzasadnienia historycznego, a prawdopodobnie jedynie fonetyczne). Samą zasadę jeden stan – jeden elektron zaproponował zresztą nieco wcześniej Wolfgang Pauli, jeszcze jeden z dwudziestoparolatków wywracających wtedy fizykę do góry nogami. Zasada ta wyjaśnia sposób zapełniania się powłok i podpowłok w atomach. Fowler wyobraził sobie, że biały karzeł cały jest jedną wielką cząsteczką, w której elektrony tworzą coś w rodzaju gazu. Było to pierwsze zastosowanie tej idei, nieco później Arnold Sommerfeld zastosował ją do elektronów w metalach.

W atomie stan określają liczby kwantowe. W przypadku elektronów zamkniętych w gwieździe niczym w pudle skwantowane są ich wartości pędu. Dozwolone wartości tworzą sieć punktów kratowych w przestrzeni pędu (bez początku, ponieważ pęd całkowity równy zeru jest zabroniony przez zasadę nieoznaczoności). Rysunek przedstawia takie  pudło w 2D. Elektrony będą stopniowo zapełniać dozwolone stany aż do pewnej maksymalnej wartości pędu p_F, zwanej pędem Fermiego.

Jest to tzw. zdegenerowany gaz elektronowy. W pierwszym przybliżeniu można ograniczyć się do temperatury zerowej, ponieważ energia elektronów w tej sytuacji wynika nie z wysokiej temperatury, ale stąd, że wszystkie niższe stany energetyczne są zajęte. Objętość komórki w przestrzeni pędów przypadająca na dwa elektrony o różnym spinie równa jest

\Delta p_x\Delta p_y\Delta p_z=\dfrac{h^3}{V},

gdzie h jest stałą Plancka, a V objętością gwiazdy/pudła z elektronami. Widzimy, że gdy objętość pudła maleje, komórki w przestrzeni pędu rosną i przy tej samej liczbie elektronów pęd Fermiego wzrośnie. Oznacza to, że wraz z gęstością gwiazdy rośnie energia kinetyczna elektronów (równa \frac{mv^2}{2}=\frac{p^2}{2m}). Gwiazda utrzymywana jest siłami grawitacyjnymi. Energia grawitacyjna kuli o masie M i promieniu R równa jest

E_p=-\alpha \dfrac{GM^2}{R},

gdzie \alpha jest współczynnikiem zależnym od rozkładu gęstości i równym \frac{3}{5} dla kuli jednorodnej. Grawitacja jest siłą przyciągającą, więc energia rośnie tu, gdy zwiększa się promień: gdyby działała jedynie grawitacja, materia skurczyłaby się do punktu. Można znaleźć punkt równowagi, gdy suma energii kinetycznej elektronów oraz energii potencjalnej grawitacji jest najmniejsza. Promień gwiazdy jest wówczas równy

R\approx 1,15 a_B \lambda \dfrac{1}{N_n^{1/3}},

gdzie a_B=0,5\cdot 10^{-10} m jest promieniem Bohra, \lambda=1,25\cdot 10^{36} to stosunek sił elektrostatycznych do sił grawitacyjnych między protonami, a N_n jest łączną liczbą nukleonów w gwieździe. Widzimy, że im większa gwiazda, tym mniejszy promień, a więc gęstość gwiazdy rośnie jak kwadrat masy, co jest zachowaniem dość osobliwym. Promień obliczony z powyższego wzoru okazuje się dla gwiazdy o masie Słońca tego samego rzędu co promień Ziemi: a więc ogromna masa Słońca skupiłaby się w objętości zbliżonej do Ziemi. Znaczy to, że materia gwiazdy osiąga ogromne gęstości. Rzeczywiste gęstości są jeszcze większe, niż sądzono w latach trzydziestych i przekraczają milion gęstości wody. Gaz elektronowy pozwalał też objaśnić, czemu biały karzeł nie skurczy się już więcej: w istocie temperatura ma niewielki wpływ na konfigurację elektronów i struktura taka jest stabilna nawet w zerze absolutnym.

Praca Fowlera uchodzi za najwybitniejszą pozycję w jego dorobku: była w zasadzie rzuceniem idei, ale idei znakomitej, podjętej potem nie tylko w astrofizyce, ale i w fizyce ciała stałego. Jedna tak płodna idea i jeden doktorant tej klasy co Dirac, to zdecydowanie wystarczy na spełnioną karierę naukową.

Obliczenia takie, jak zarysowane powyżej, wykonał Edmund Stoner w 1929 roku. Interesowało go pytanie, czy istnieje maksymalna gęstość materii? Stoner także należał do ludzi Cambridge, jednak jego doktorat był eksperymentalny i nie odebrał on matematycznego wykształcenia, które zawsze było mocną stroną tamtejszych absolwentów. Mimo to zajął się teorią i to z powodzeniem. Jego praca The distribution of electrons among atomic energy levels z 1924 roku zainspirowała Wolfganga Pauliego do sformułowania słynnej zasady wykluczania. W reakcji na artykuł Stonera mało znany fizyk Wilhelm Anderson, pracujący w Tartu w Estonii, zwrócił uwagę, że przy dużych gęstościach, duży będzie pęd Fermiego i nie można używać newtonowskiego wyrażenia na energię kinetyczną (\frac{1}{2}mv^2), lecz należy zastosować wyrażenie relatywistyczne

E=\sqrt{(pc)^2+(mc^2)^2}\approx pc.

W przypadku skrajnie relatywistycznym obowiązuje przybliżenie zapisane powyżej. Okazuje się, że teraz nie dla każdej masy istnieje rozwiązanie i biały karzeł musi mieć masę nieprzekraczającą pewnej wartości granicznej. Anderson wyznaczył tę granicę, choć jego praca nie była całkowicie poprawna. Stoner w następnym artykule uwzględnił relatywistyczne wyrażenie na energię elektronów i prawidłowo wyznaczył maksymalną liczbę nukleonów, a więc i masę białego karła:

N_n =0,77 \left(\dfrac{c\hbar}{Gm_n^2}\right)^{\frac{3}{2}} \sim \left(\dfrac{m_{P}}{m_n}\right)^3.

Po prawej stronie wyraziliśmy tę wielkość przez masę Plancka m_P: jest to kombinacja trzech fundamentalnych stałych fizycznych – stałej Plancka, prędkości światła i stałej grawitacyjnej. Maksymalna masa zwana jest granicą Chandrasekhara i po uwzględnieniu współczynników liczbowych równa jest 1,4 masy Słońca. Przyjmujemy, że na każdy elektron przypadają dwa nukleony.

Zależność promienia białego karła od masy (https://en.wikipedia.org/wiki/Chandrasekhar_limit)

Naszkicowane przez nas podejście zakłada minimalizację energii w jednorodnym gazie elektronowym. Tak właśnie obliczył to Stoner. Subrahmanyan Chandrasekhar wybrał podejście bardziej szczegółowe, w którym analizuje się warunki równowagi w gwieździe. Jego pierwsza praca, pisana podczas podróży do Anglii, była tylko krótkim zarysem, szczegółowe rozwinięcie podał w następnych latach. Prowadzi ono do podobnych wniosków, nieco różniących się liczbowo. Czemu więc granica ta związana została w historii jedynie z nazwiskiem Chandrasekhara? Jak się zdaje, Edmund Stoner nie walczył zbytnio o priorytet. Być może tematyka astrofizyczna nie była mu tak bliska jak Chandrasekharowi, stopniowo zajął się bowiem fizyką ciała stałego.

Także Lew Landau otrzymał graniczną wartość masy w bardzo eleganckiej krótkiej pracy z 1931 roku. Jednak graniczna wartość masy wydawała mu się wnioskiem absurdalnym. Pisał: „Ponieważ w rzeczywistości masy takie spokojnie sobie istnieją jako gwiazdy, nie wykazując żadnych takich absurdalnych tendencji, musimy wywnioskować, że wszystkie gwiazdy o masie przekraczającej 1,5 masy Słońca zawierają z pewnością obszary, w których prawa mechaniki kwantowej (a więc także statystyki kwantowej) są naruszone” (Neutron Stars, Black Holes and Binary X-Ray Sources, ed. H. Gursky, R. Ruffini, D. Reidel 1975, s. 272). Musimy zdawać sobie sprawę, że zarówno teoria względności, jak i mechanika kwantowa były względnie nowymi dziedzinami i nie było jasne, czy nie pojawią się nowe idee, które zmienią zasadniczo punkt widzenia. Dopiero z perspektywy dziesięcioleci widać, że zarówno teoria względności, jak i fizyka kwantowa zostały w fizyce na dobre i są niezmiernie odporne na wszelkie „poprawianie” – to dlatego trudno jest w fizyce o nowe pomysły, muszą one bowiem stanowić uogólnienie tego, co już znamy, a co zostało bardzo dokładnie przetestowane teoretycznie i przede wszystkim eksperymentalnie.

Chandrasekhar bardzo zaciekle bronił wniosku o maksymalnej masie białego karła. Arthur Eddington – podobnie jak Landau – uważał go za absurd. W ciągu kilku lat spór między Eddingtonem, uznanym autorytetem, a młodym uczonym z Indii stał się na tyle gorący, że Chandrasekhar nie mógł pozostać w Trinity College i wyjechał do Stanów Zjednoczonych.

Rację miał Chandrasekhar (i Stoner). Gwiazdy o dużych masach nie mogą stać się białymi karłami. Mogą zostać gwiazdami neutronowymi, w których materia ma gęstość zbliżoną do materii jądrowej. Znów jednak pojawia się graniczna wartość masy, powyżej której niemożliwe jest stabilne istnienie gwiazdy neutronowej. Przy dużych masach grawitacja zwycięża i jedyną możliwością staje się utworzenie czarnej dziury. Granica Chandrasekhara była pierwszą wskazówką, że struktura materii nie jest odporna na grawitacyjne zapadanie się. Być może zaakceptowanie tej sytuacji było trudne także dlatego, że intuicyjnie chcemy wierzyć w stabilny świat, dający nam metafizyczne i psychologiczne oparcie. Dlatego kłopoty miał Galileusz, z tego samego powodu zwalczano teorię ewolucji, a także niechętnie uznano teorię Wielkiego Wybuchu. Uświadomienie sobie, że zamieszkujemy narażony na rozmaite kataklizmy kawałek skalnej skorupy pływający w ciekłym podłożu i krążący po niezbyt stabilnej orbicie w zmieniającym się ciągle i katastroficznym wszechświecie, nie poprawia, by tak rzec, filozoficznego samopoczucia.

Kosmologia relatywistyczna w kwadrans II

  • Metryka czasoprzestrzeni

Dla naszego jednorodnego i izotropowego modelu z płaską 3-przestrzenią metryka wszechświata przyjmuje prostą postać:

ds^2=c^2 dt^2-R^2 d\vec{x}\,^2=c^2 dt^2-R^2 (dr^2+r^2 d\vartheta^2+r^2 \sin^2\vartheta d\varphi^2).

Druga postać zapisana jest przez współrzędne sferyczne r, \vartheta, \varphi. Współrzędne x,y,z oraz r, \vartheta, \varphi dla danej galaktyki pozostają stałe (o ile nie ma ona ruchu własnego, a tylko bierze udział w rozszerzaniu wszechświata: przepływie Hubble’a). Jedyny parametr, czynnik skali R(t) opisuje ewolucję wszechświata, czyli jego rozszerzanie (choć równie dopuszczalne teoretycznie byłoby kurczenie się). Czasoprzestrzeń ta nie jest płaska, mimo że płaska jest 3-przestrzeń. Ogólna teoria względności dopuszcza dowolne układy współrzędnych, ten nasz wyróżniony jest fizycznie: w tym układzie współrzędnych mamy wspólny kosmiczny czas oraz współrzędne współporuszające się. Odległość danej galaktyki od nas (r=0) równa jest

D=R(t)r,

oznacza to, że szybkość oddalania się danej galaktyki równa jest (przyjmujemy, że galaktyka nie ma ruchu własnego):

\dot{D}=\dot{R}r =\dfrac{\dot{R}}{R}Rr\equiv H(t) D.

Jest to prawo Hubble’a. Zauważmy, że ta odległość mierzona jest w danej chwili kosmicznego czasu, a więc i prędkość powinna być obecną prędkością galaktyki. W rzeczywistości nie możemy obserwować całej przestrzeni w żadnej chwili – jedyne, co widzimy, to stożek przeszłości: dalsze obiekty w chwilach odpowiednio wcześniejszych itd. W napisanym powyżej prawie Hubble’a prędkość nie musi być mniejsza niż c. Nie musimy się tym przejmować, ponieważ startujemy z metryki, która automatycznie zapewnia lokalną stałość prędkości, a jedynie to się liczy.

  • Mikrofalowe promieniowanie tła (CMB)

Do tej pory mówiliśmy tylko o grawitacji, nie interesowaliśmy się zjawiskami opisanymi przez inne dziedziny fizyki. Jeśli wszechświat był kiedyś gęsty, to musiał także być gorący. Rozpatrzmy, co się dzieje z gęstością energii promieniowania u (w dżulach na metr sześcienny), gdy objętość V się zmienia. Z I zasady termodynamiki mamy (rozszerzanie jest adiabatyczne):

dE=d(uV)=V du+u dV=-p dV,

gdzie p jest ciśnieniem promieniowania. Jest ono równe p=\frac{1}{3}u. Wstawiając to do I zasady termodynamiki i korzystając z faktu, że V=\frac{4}{3}\pi R^3, a dV=4\pi R^2 dR, dostaniemy

\dfrac{du}{u}+4\dfrac{dR}{R}=0\Rightarrow u\sim R^{-4}.

Gęstość energii podzielona przez c^2 daje wkład promieniowania do całkowitej gęstości materii – wielkość, którą należy traktować jako źródło grawitacji w równaniu (*) z pierwszej części. Patrząc nieco inaczej, długość fali promieniowania powinna skalować się, jak R^{-1}, a liczba fotonów w jednostce objętości jak R^{-3}.

Ponieważ energia atomów zależy od współczynnika skali jak R^{-3}, więc dla małych R energia promieniowania wszystko zdominuje. Wiadomo też, że gęstość energii promieniowania jest proporcjonalna do czwartej potęgi temperatury T^4, otrzymujemy więc

T\sim\dfrac{1}{R}.

Temperatura promieniowania jest tym wyższa, im bliżej Wielkiego Wybuchu jesteśmy i energia promieniowania dominuje nad innymi postaciami energii. Mamy więc gorący Wielki Wybuch. W 1965 roku zaobserwowano promieniowanie, które pozostało z wczesnego etapu wszechświata i które z tego powodu zwane jest też reliktowym, jest bowiem czymś w rodzaju skamieliny. Od tamtej pory badane jest ono z coraz większą dokładnością przez różne misje, ostatnią był satelita Planck.

To, co dociera do nas z każdego kierunku wszechświata jest promieniowaniem cieplnym, rozkładem Plancka, o temperaturze niecałe 3K, a więc głównie mikrofalowym. Promieniowanie to jest obrazem wszechświata w chwili t=380 \,000 lat po Wielkim Wybuchu. Zostało wyemitowane gdy czynnik skali był 1000 razy mniejszy niż dziś, miało więc ono wówczas temperaturę 3000 K i przypadało na obszar widzialny i podczerwień. Co więcej, okazuje się, że z bardzo dużą dokładnością (10^{-5}) temperatura owego promieniowania jest taka sama w każdym kierunku. Kolejne misje satelitarne badały właśnie owe fluktuacje: ich rozkład i wielkość zawierają najróżniejsze informacje na temat wszechświata w tamtym momencie. Z niejednorodności tych wyewoluował dzisiejszy wszechświat.

Skąd wzięło się promieniowanie tła? Wszechświat przed t=380\, 000 lat składał się głównie z protonów i elektronów, które miały na tyle dużą energię kinetyczną (temperaturę), że nie łączyły się w atomy wodoru. Taka plazma silnie rozprasza promieniowanie elektromagnetyczne, ponieważ naładowane cząstki wprawiane są przez nie w drgania, a to z kolei oznacza wysyłanie nowej fali elektromagnetycznej (jak w antenie) kosztem energii fali pierwotnej. W rezultacie energia wysyłana jest na wszystkie strony, ośrodek nie przepuszcza promieniowania. Sytuacja zmieniła się, gdy temperatura spadła na tyle, by elektrony mogły utworzyć z protonami atomy wodoru. Powstał wtedy zwykły atomowy gaz, tak samo przezroczysty jak np. powietrze. Od tamtej pory termodynamiczne losy atomów i promieniowania rozprzęgły się. Z atomów powstało wszystko, co dziś widzimy: gwiazdy, planety, galaktyki itp., natomiast promieniowanie stygło w miarę rozszerzania, aż dotarło do nas.

Mała dygresja. Przy okazji promieniowania zauważmy, że statyczny wszechświat Einsteina, omawiany poprzednio, byłby niestabilny także z powodów astrofizycznych. Gdyby nawet dobrać odpowiednio jego gęstość i stałą grawitacyjną, to po pewnym czasie zmieniłaby się jego zawartość: gwiazdy syntetyzują hel z wodoru i cięższe pierwiastki z lżejszych, zamieniając różnicę energii na promieniowanie. Z czasem więc mniej będzie materii atomowej, a więcej promieniowania. Gdyby to było wszystko, pole grawitacyjne by się nie zmieniło, ponieważ obie zmiany są równe za sprawą zasady zachowania energii. Jednak źródłem pola grawitacyjnego jest nie sama gęstość materii \varrho, lecz wielkość \varrho+3p/c^2. Oznacza to, że pole grawitacyjne stanie się silniejsze po zamianie materii atomowej na promieniowanie, gdyż dla promieniowania (po uwzględnieniu, że p=u/3c^2\equiv \varrho/3) mamy: \varrho +3p/c^2=2\varrho. W einsteinowskiej grawitacji ciśnienie światła też jest źródłem pola grawitacyjnego.

  • Odległości

W rozszerzającym się wszechświecie należy być ostrożnym, kiedy mówi się o odległościach. Jedną z możliwych definicji wymieniliśmy wyżej: to odległość mierzona w danym momencie kosmicznego czasu. Do innej miary odległości prowadzi chwila wyemitowania światła t_e, które obserwujemy dziś w t_0. Światło to biegło więc t_0-t_e lat. Jak daleko znajdowało się owe źródło w chwili emisji? Inaczej mówiąc, jak daleko dotrze światło wysłane w chwili t_e z punktu r=0 i odebrane w chwili t_0? Światło biegnie po linii świata, dla której ds=0, a więc jego współrzędna r w chwili t_0 będzie równa

c dt=R(t) dr \Rightarrow r={\displaystyle \int_{t_e}^{t_0}}\dfrac{c dt}{R(t)}.

Odległość tego punktu w chwili emisji jest dana równaniem

D=R(t_e)r,

a dzisiejsza odległość tego punktu równa jest

D_{now}=R(t_0)r.

Odległość D jako funkcja chwili emisji jest to stożek przeszłości zbudowany na zdarzeniu tu i teraz. Ponieważ wszechświat kurczy się, gdy cofamy się w czasie, więc odległości D osiągają maksimum dla pewnej chwili emisji. Oznacza to, że wszystko, co widzimy, znajduje się w odległościach nie większych od owego maksimum. W ten sposób kątowe rozmiary galaktyk osiągają pewne minimum, a te, które wysłały światło jeszcze wcześniej, będą widziane jako większe na niebie (choć słabsze).

Na rysunku widzimy kształt stożka przeszłości i dwie linie świata galaktyk. Każdą z nich mogliśmy zobaczyć w chwili przecięcia jej linii świata ze stożkiem przeszłości. Obie były wtedy w podobnej odległości, powinny więc być jednakowej wielkości kątowej. Światło odpowiadające czerwonej galaktyce biegło do nas dłużej, a  jego długość fali rozciągnęła się bardziej, uległa większemu przesunięciu ku czerwieni w języku astronomów. Dziś obie znajdują się znacznie dalej od nas, ale już tego nie zobaczymy.

  • Trudności kosmologii Wielkiego Wybuchu: płaskość i horyzonty

Obserwowana 3-przestrzeń jest płaska. Oznacza to, że całkowita gęstość wszystkich form energii równa się dokładnie wartości krytycznej. Inaczej mówiąc nasz wszechświat ma dokładnie prędkość ucieczki: ani mniej, ani więcej. Oznacza to, że np. w jedną nanosekundę po Wielkim Wybuchu gęstość musiała być dopasowana bardzo ściśle, inaczej nasz wszechświat zachowywałby się całkiem inaczej. To tak, jakbyśmy wystrzelili z Ziemi pocisk z prędkością idealnie równą 11,2 km/s, ani trochę więcej, ani trochę mniej. Nie jest to niemożliwe, nie wygląda jednak na sytuację zbyt „naturalną” – postawiłem cudzysłów, ponieważ nie wiemy, co jest, a co nie jest naturalne dla wszechświata. Fizycy woleliby jakiś mechanizm, który faworyzuje płaski wszechświat.

Źródło: Ned Wright Cosmological Tutorial

Innym problemem jest stałość temperatury promieniowania tła docierającego z każdej strony. Na pierwszy rzut oka stałość ta wygląda zdroworozsądkowo: gaz był w równowadze termicznej, więc wysyłał promieniowanie o jednej temperaturze. Żeby zobaczyć, dlaczego jest to problem, wprowadźmy tzw. czas konforemny, spełniający warunek dt =R d\tau. Mamy wówczas

ds^2=R^2(c^2 d\tau^2-d\vec{x}\,^2).

Nasza metryka jest taka jak przestrzeni Minkowskiego, choć niezupełnie, gdyż przemnożona jest przez pewien wspólny czynnik skali. Nie ma sztuczki sprowadzającej zakrzywioną przestrzeń do płaskiej, ponieważ są one geometrycznie różne. Nasza czasoprzestrzeń nadal jest zakrzywiona, czego oznaką jest funkcja R(t). Jednak takie współrzędne są wygodne, gdyż zapewniają, że światło na wykresie czasoprzestrzennym biegnie pod kątem \pm 45^{\circ} (przyjmujemy c=1). Galaktyki w tym układzie współrzędnych mają stałe położenia, czyli ich linie świata biegną pionowo w górę. Sytuacja wygląda wówczas następująco. W chwili rozprzęgnięcia promieniowania z atomami stożki przeszłości różnych punktów CMB były rozłączne.

Rozłączne stożki przeszłości oznaczają, że w przeszłości zdarzenia takie nie miały żadnych wspólnych zdarzeń, a więc i możliwości wyrównania temperatury, bo takie wyrównywanie następuje dzięki wymianie energii. Izotropia promieniowania tła staje się więc wynikiem jakiegoś bardzo szczególnego wyboru warunków początkowych. Znów: fizycy woleliby nie zakładać aż tak szczególnych warunków początkowych. Obliczenia pokazują, że promieniowanie docierające z kątów większych niż $1,5^{\circ}$ powinno być fizycznie niezależne. Cała sfera niebieska rozpada się na ok. 10 000 niezależnych kawałków. Z jakiegoś powodu wszystkie te kawałki mają taką samą temperaturę.

Standardowym sposobem uniknięcia tych paradoksów jest inflacja. W bardzo wczesnym etapie po Wielkim Wybuchu, np. t=10^{-35} s przez bardzo krótki czas mamy dużą stałą kosmologiczną i wszechświat rozszerza się wykładniczo zgodnie z modelem de Sittera. Potem wraca do zwykłego modelu, o którym mówiliśmy. W przypadku płaskości skutek inflacji jest taki, jakbyśmy niewiarygodnie mocno nadmuchali balon: jego powierzchnia stanie się automatycznie płaska, przynajmniej dla naszej dokładności pomiarów. Także problem horyzontu rozwiązuje się wtedy dość naturalnie. Inflacja trwa bardzo krótko, licząc w czasie kosmicznym, ale długo w czasie konforemnym. Wygląda to tak.

Skutek jest więc taki, jakbyśmy cofnęli chwilę Wielkiego Wybuchu i dzięki temu stożki przeszłości różnych punktów promieniowania tła zdążyły się zetknąć.

Inflacja przewiduje także właściwe zachowanie fluktuacji promieniowania tła, co jest ważne, bo przesądza o dalszej ewolucji wszechświata.

Jak to zwykle bywa, każde rozwiązanie rodzi dalsze pytania i trudności. Nie wiadomo nic o konkretnym fizycznym mechanizmie inflacji, to znaczy wiadomo tyle, ile wynika z ograniczeń kosmologicznych, nic nie wiemy natomiast o konkretnych polach, które miałyby inflację wywołać. Jest też problem łagodnego wyjścia z fazy inflacyjnej, tzw. graceful exit. Chodzi o to, że modele przewidujące inflację na ogół nie chcą się zatrzymać, lecz dalej wywołują zachowania budzące wątpliwości. Np. generują bąble czasoprzestrzeni, które byłyby oddzielnymi wszechświatami. Nie ma więc żadnego ogólnie przyjętego opisu tej fazy wszechświata. Niektórzy, np. Roger Penrose, sądzą, że idea ta więcej kłopotów rodzi niż rozwiązuje.