Dlaczego grawitacja wiąże się z krzywizną czasoprzestrzeni?

  • Przeniesienie równoległe

Wyobraźmy sobie najpierw powierzchnię zanurzoną w przestrzeni euklidesowej. Załóżmy, że określiliśmy na niej pewne współrzędne x=(x^1, \ldots, x^n) . Położenie punktu powierzchni możemy więc zapisać jako \vec{r}=\vec{r}(x^i) . Pochodne tego wektora po współrzędnych, utworzą zbiór wektorów stycznych do naszej powierzchni:

\vec{e}_j=\dfrac{\partial \vec{r}}{\partial x^j}.

Dowolny wektor styczny do powierzchni w danym punkcie można przedstawić jako kombinację liniową \vec{e}_j:

\vec{v}=v^j \vec{e}_j,

gdzie sumujemy po powtarzającej się parze wskaźników: górnym i dolnym. Jest to tzw. konwencja Einsteina, uczony mówił żartobliwie, że stanowi ona jego największe odkrycie matematyczne. W geometrii ważną rolę odgrywa równoległość: wiemy, co znaczy, że dwa wektory w przestrzeni euklidesowej są równoległe. Można koncepcję równoległości przenieść na nieskończenie bliskie wektory na zakrzywionej powierzchni. W przestrzeni euklidesowej nasz wektor \vec{v} ma pozostać stały, co oznacza, że

\delta\vec{v}=0=\delta v^j \vec{e}_j+v_j \delta \vec{e}_j.

W drugim wyrazie uwzględniliśmy, że nasza baza względem przestrzeni euklidesowej może się obracać. Zmiana każdego z wektorów bazy powinna być równa:

\delta\vec{e}_j=\dfrac{\partial \vec{r}}{\partial x^j \partial x^i }\delta x^i\stackrel{.}{=}{\Gamma}^k_{ij}\delta x^i \vec{e}_k.

Ostatnia równość \stackrel{.}{=} to w istocie rzut wektora z lewej strony na płaszczyznę styczną, pomijamy więc tę część wektora, która „wystaje” z powierzchni. Podstawiając to do warunku równoległości, otrzymujemy

\delta v^k=-\Gamma_{ij}^k v^i \delta x^j. \mbox{ (*)}

Oznacza to, że współrzędne wektora równoległego nieco się zmienią i zmianę tę opisują współczynniki \Gamma , zwane uczenie koneksją afiniczną. Znając funkcje koneksji, możemy dokonać przesunięcia równoległego wektora. Jeśli rozpatrzymy pewną krzywą x^j=x^j(\tau) (gdzie \tau jest czasem własnym), pochodne współrzędnych utworzą wektor prędkości styczny do toru:

v^k=\dfrac{d x^k}{d\tau}.

Najprostszym fizycznie ruchem będzie przesunięcie równoległe tego wektora wzdłuż krzywej (linii świata):

\delta \left(\dfrac{d x^k}{d\tau}\right)=-\Gamma_{ij}^k v^i \delta x^k,

skąd otrzymujemy równanie geodezyjnej:

\dfrac{{d\,}^2 x^k}{d\tau^2}+\Gamma_{ij}^k \,\dfrac{d x^i}{d\tau}\,\dfrac{d x^j}{d\tau}=0. \mbox{ (**)}

Jest to warunek na przeniesienie równoległe wektora prędkości wzdłuż krzywej, a więc coś najbliższego ruchowi jednostajnemu i prostoliniowemu z I zasady dynamiki.

Możemy teraz zapomnieć o przestrzeni euklidesowej i rozpatrywać przestrzeń, w której określone są współczynniki koneksji. Mamy wówczas krzywe geodezyjne – coś najbardziej zbliżonego do linii prostej. W teorii względności krzywe geodezyjne opisują ruch cząstki pod działaniem pola grawitacyjnego. Jak widać współczynniki koneksji komplikują równania ruchu i można je uważać za składowe pola grawitacyjnego, czy dokładniej grawitacyjno–bezwładnościowego. Kiedy współczynniki koneksji znikają, wracamy do ruchu prostoliniowego i szczególnej teorii względności (tzn. nie ma pola grawitacyjnego).

Równania geodezyjnej mogą więc nieść informację o polu grawitacyjnym. Zgodnie z zasadą równoważności nic tu nie zależy od masy poruszającej się cząstki. Okazuje się, że można za pomocą koneksji opisać grawitację także w mechanice klasycznej (zrobił to É. Cartan, już znając teorię Einsteina). Automatycznie opisujemy też siły bezwładności. Z punktu widzenia fizyka wcale nie jest dziwne, że w równaniu geodezyjnej mamy aż dwie prędkości: powinniśmy bowiem w tym formalizmie otrzymać zarówno siły Coriolisa liniowe w prędkości, jak i siły odśrodkowe, kwadratowe w prędkości. Z punktu widzenia zasady równoważności nie możemy lokalnie rozstrzygnąć, czy w naszym przypadku mamy do czynienia z polem grawitacyjnym, czy siłami bezwładności.

  • Krzywizna

Koneksja pozwala nam przenosić wektory równolegle wzdłuż krzywej. Wynik takiego przesuniecia może więc zależeć od kształtu krzywej. Aby zobaczyć, jak to działa, rozpatrzmy przesunięcie równoległe wektora v^i po infinitezymalnym zamkniętym równoległoboku geodezyjnych: po drodze x, x+\delta a, x+\delta a+\delta b, x+\delta b, x. Łączna zmiana wektora dana jest wyrażeniem:

\delta v^i=-\Gamma_{kj}^i(x) v^k(x) \delta a^j-\Gamma_{kj}^i(x+\delta a) v^k(x+\delta a) \delta b^j\\ \\ +\Gamma_{kj}^i(x+\delta b) v^k(x+\delta b) \delta a^j+\Gamma_{kj}^i(x) v^k(x) \delta b^j.

Można to wszystko zapisać w postaci:

\delta v^i=R^i_{kjl} v^k \delta b^j \delta a^l, \mbox{(***)}

gdzie R^i_{kjl} nazywa się tensorem krzywizny Riemanna i wyraża wzorem:

R^i_{kjl}=\Gamma^i_{lk,j}-\Gamma^i_{jk,l}+\Gamma^i_{jm}\Gamma^m_{kl}-\Gamma^i_{lm}\Gamma^m_{kl}.

W ostatnim wyrażeniu przecinki przed indeksem oznaczają różniczkowanie po odpowiedniej współrzędnej: A_{,i}\equiv\frac{\partial}{\partial x^i}. Przestrzeń jest zakrzywiona wtedy i tylko wtedy, gdy tensor krzywizny jest różny od zera. (Wektory i tensory transformują się w odpowiedni sposób przy zmianie układu współrzędnych, tak że znikanie w jednym układzie oznacza znikanie we wszystkich.) Koneksja jest zatem nietrywialna, gdy tensor krzywizny znika. Równanie (***) można zilustrować poglądowo: zmiana wektora proporcjonalna jest tu do pola powierzchni równoległoboku. Ponieważ każdą powierzchnię możemy rozbić na takie równoległoboki, więc łączna zmiana wektora w przesunięciu równoległym po zamkniętej pętli powinna być związana z krzywizną oraz polem powierzchni pętli. W przypadku sfery krzywizna jest stała i kąt obrotu wektora jest proporcjonalny do pola powierzchni pętli. W teorii względności pojawienie się krzywizny oznacza, że mamy nietrywialne pole grawitacyjne.

Tensor krzywizny ma wiele symetrii, które sprawiają, że ma nieco mniej niezależnych składowych, niż to wygląda na pierwszy rzut oka. W przypadku dwuwymiarowej powierzchni ma tylko jedną składową, w czterowymiarowej – dwadzieścia.

Klasycznym zastosowaniem przeniesienia równoległego jest wahadło Foucaulta.

  • Równanie dewiacji geodezyjnej

Brzmi to okropnie, nieco bardziej logiczne jest określenie: dewiacja linii geodezyjnych. Chodzi o to, co dzieje się wzdłuż pobliskich linii geodezyjnych. Możemy sobie wyobrazić dwie cząstki pyłu, które znajdują się nieskończenie blisko siebie w chwili początkowej. Obserwujemy, jak bedzie się zachowywać z czasem ich odległość mierzona różnicami współrzędnych. Zakladamy, że rozsądnie zaczynamy liczyć czas, tak żeby ułatwić porównanie dwóch ruchów.

Równanie dewiacji ma następującą postać:

\dfrac{D^2 \eta^i}{D\tau^2}=R^i_{jkl}\,\dfrac{dx^j}{d\tau}\,\dfrac{dx^k}{d\tau}\,\eta^l.

Różniczkowanie po lewej stronie oznacza pochodną po czasie własnym obliczoną jednak z uwzględnieniem przeniesienia równoległego. Nie możemy bowiem porównywać w przestrzeni zakrzywionej wektorów w dwóch różnych punktach przestrzeni, najpierw należy przenieść jeden z nich do punktu zaczepienia drugiego. Różnicę wektora wzdłuż krzywej wynikającą z jego zmiany: \frac{d\eta^i}{d\tau}d\tau należy poprawić, odejmując zmianę wynikającą z przesunięcia (*), łącznie otrzymamy

\dfrac{D\eta^i}{D\tau}=\dfrac{d\eta^i}{d\tau}+\Gamma^i_{jk}\,\dfrac{dx^j}{d\tau}\,\eta^k.

Jest to tzw. pochodna absolutna wzdłuż krzywej. Używając tego zapisu, możemy równanie geodezyjnej (**) zapisać w postaci

\dfrac{D}{D\tau}\dfrac{dx^i}{d\tau}=0.

Pochodna absolutna znika, gdy współrzędne wektora zmieniają się jedynie za sprawą przesunięcia równoległego, czyli w sensie fizycznym można powiedzieć, że się nasz wektor nie zmienia – przenosi się jedynie równolegle wzdłuż krzywej.

  • Równania pola Einsteina

Warto zauważyć, że do tej pory nie mówiliśmy nic o metryce naszej przestrzeni. W szczególnej teorii względności mamy naturalną miarę odległości dwóch zdarzeń w czasoprzestrzeni:

ds^2=dt^2-dx^2-dy^2-dz^2.

(Przyjmujemy c=1.) W zakrzywionej czasoprzestrzeni ogólnej teorii względności możemy zawsze wprowadzić taki układ współrzędnych, w którym interwał ds^2 przyjmie powyższą postać w danym punkcie. Nie można natomiast zwykle zrobić tego globalnie. Interwał czasoprzestrzenny ogólnie biorąc określa tensor metryczny g_{\mu\nu}. Podaje on przepis na obliczenie interwału za pomocą danych współrzędnych (gdy zmienimy współrzędne, postać metryki też się odpowiednio zmieni):

ds^2=g_{\mu\nu}dx^{\mu}dx^{\nu}.

Tutaj wskaźniki \mu,\nu=0,1,2,3. Mamy tu 10 niezależnych wartości (symetryczna macierz 4×4). Z matematycznego punktu widzenia koneksja i metryka to dwie różne struktury. Można je uzgodnić i tak jest w ogólnej teorii względności. Koneksja oraz tensor krzywizny wyrażają się przez metrykę. Lokalnie, w danym punkcie, nie tylko metryka może przybrać wartości znane ze szczególnej teorii względności, ale także współczynniki koneksji mogą znikać. Nie ma natomiast takiej transformacji współrzędnych, która sprowadza tensor Riemanna do zera, jeśli był niezerowy w innym układzie współrzędnych. Tensor Riemanna zawiera pierwsze i drugie pochodne metryki. Geodezyjne możemy też zdefiniować jako krzywe najkrótszej/najdłuższej długości, i są to wówczas te same geodezyjne co zdefiniowane wyżej.

Z fizycznego punktu widzenia metryka przypomina potencjał, a współczynniki koneksji – siły. Jaką postać moze mieć równanie pola w teorii Einsteina? Źródłem pola grawitacyjnego są masy, a u Einsteina także pędy i energie. Dla zbioru cząstek opisu dostarcza symetryczny tensor energii pędu: T_{\mu\nu}. Potrzebujemy więc jakiegoś tensora krzywizny o dwóch wskaźnikach. Taką wielkością jest tensor Ricciego zdefiniowany jako

R_{\mu\nu}=R^{\lambda}_{\mu\lambda\nu},

(sumowanie po wskaźnku \lambda). Można więc oczekiwać równania typu

R_{\mu\nu}=\kappa T_{\mu\nu}.

I jest to prawie dobre równanie, należy tylko zmodyfikować w nim lekko lewą stronę. Rzecz w tym, że tensor energii pędu powinien być zachowany, a lewa strona, tensor Ricciego nie spełnia tego warunku. Należy zastąpić go więc tensorem Einsteina:

G_{\mu\nu}=R_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R=\kappa T_{\mu\nu},

gdzie R to skalar Ricciego: R=g^{\mu\nu}R_{\mu\nu} (g^{\mu\nu} jest macierzą odwrotną do g_{\mu\nu}. Jest to subtelność techniczna, na którą natrafił Einstein w listopadzie 1915 roku: 11 listopada proponuje pierwszą wersję, a 25 listopada tę niższą, już prawidłową. Ostatnie równanie można też przepisać w równoważnej postaci:

R_{\mu\nu}=\kappa (T_{\mu\nu}-\frac{1}{2}g_{\mu\nu}T^{\lambda}_{\lambda}).

W dalszym ciągu przyda nam się składowa 00 tego równania, w najprostszej sytuacji spoczywającej materii tylko składowa 00 tensora energii pędu jest różna od zera i równa jest gęstości materii \varrho. Otrzymamy wówczas

R_{00}=\kappa (T_{00}-\frac{1}{2}T_{00})=\frac{1}{2}\kappa T_{00}=\frac{1}{2}\kappa \varrho.

Aby znaleźć stałą \kappa, należy skorzystać z równań dla grawitacji Newtonowskiej, która powinna być przypadkiem granicznym.

W tym celu wyobraźmy sobie równanie dewiacji zastosowane do dwóch swobodnie spadających cząstek. Zakładamy, że w chwili początkowej \tau=0 obie spoczywają względem siebie. Wybieramy układ współrzędnych związany z cząstką centralną (względem której obliczana jest dewiacja). W takim układzie odniesienia czas własny i czas t są tym samym. Dla wskaźników przestrzennych i=1,2,3 równanie dewiacji sprowadza się do

\dfrac{d^2\eta^i}{dt^2}=R^{i}_{00l}\eta^l=-R^i_{0l0}\eta^l.

Skorzystaliśmy z faktu, że nasza cząstka centralna spoczywa: \frac{dx^\mu}{dt}=(1,0,0,0). W drugiej równości zmieniliśmy znak wraz z przestawieniem pary ostatnich wskaźników w tensorze Riemanna. Wynik ten obowiązuje dla trzech przyspieszeń wzdłuż trzech osi kartezjańskich. Załóżmy, że mamy kulę pyłu o promieniu r, początkowo nieruchomą, której środek obraliśmy za początek wektora \eta. Objętość kuli to

V=\dfrac{4\pi}{3}r_x r_y r_z,

gdzie zaznaczyliśmy, że wzdłuż trzech osi kartezjańskich promienie mogą się zmieniać niezależnie (przekształcając kulę w elipsoidę). Obliczając drugą pochodną objętości w chwili t=0 (pamiętamy, że pierwsze pochodne znikają), otrzymujemy:

\dfrac{\ddot{V}}{V}=\dfrac{\ddot{r}_x}{r_x}+\dfrac{\ddot{r}_y}{r_y}+\dfrac{\ddot{r}_z}{r_z}=-R_{00}.

W ostatniej równości, skorzystaliśmy z faktu, że R^0_{000}=0 – można więc sumowanie po wskaźnikach przestrzennych rozszerzyć o wskaźnik czasowy. Możemy tę samą wielkość obliczyć z Newtonowskiego prawa ciążenia. Przyspieszenie grawitacyjne na powierzchni kuli pyłu o masie M równe jest

g=\dfrac{GM}{r^2},

Wobec tego druga pochodna objętości spełnia równanie

\dfrac{\ddot{V}}{V}=-3\dfrac{g}{r}=-4\pi G \varrho.

gdzie \varrho to gęstość naszej kuli (&). Zatem szukana stała równa jest \kappa=8\pi G. Równanie Einsteina powinno mieć zatem postać.

G_{\mu\nu}=8\pi G T_{\mu\nu}.

Podsumowując, w roku 1915 Albert Einstein (podobnie zresztą jak najlepsi ówcześni matematycy) nie rozumiał dokładnie roli tensora Ricciego i nie widział, że równania pola są praktycznie wyznaczone przez kilka dość prostych warunków matematycznych. Oczywiście, nie są to jedyne możliwe matematycznie równania, ale jak pokazują przykłady późniejszych teorii grawitacji (a było ich przez sto lat sporo), równania Einsteina są najprostsze i jak dotąd potwierdzane są przez obserwacje. Kiedy później uczony zrozumiał, że w gruncie rzeczy można by dojść do teorii grawitacji drogą matematyczną, zaczął wyżej cenić osiągnięcia czystej matematyki. Stało się to poniekąd źródłem jego późniejszych niepowodzeń przy konstrukcji jednolitej teorii pola: z braku danych fizycznych szukał bowiem drogi matematycznej. Skonczyło się na dość jałowych próbach, które nie wzbogaciły zbytnio ani matematyki, ani fizyki.

(&) Nie jest to całkiem ścisłe rozumowanie, ponieważ milcząco założyliśmy, że nie ma innej materii niż kula pyłowa. Naprawdę należałoby obliczyć strumień pola grawitacyjnego przez powierzchnię kuli (on już zależy wyłącznie od tego, co znajduje się wewnątrz kuli), a potem skorzystać z tw. Gaussa-Ostrogradskiego i obliczyć dywergencję pola grawitacyjnego w punkcie centralnym. Tę wartość można porównać z tym, co wynika z równania dewiacji geodezyjnej. Oczywiście wynik jest taki sam.

Nie rozwijałem tu kwestii, czym są tensory. W największym skrócie są to obiekty niezależne od wyboru współrzędnych, podobnie jak trójwymiarowe wektory (które są szczególnym jednowskaźnikowym typem tensora). W teorii Einsteina dopuszczamy praktycznie wszelkie gładkie transformacje współrzędnych (ogólna kowariantność). Równania prawidłowo zapisane w ten sosób automatycznie słuszne będą w każdym układzie współrzędnych. Einstein wrócił do tensorów już w trakcie swej „rewolucji listopadowej” – kiedy co tydzień publikował nową pracę na temat teorii grawitacji, przy okazji modyfikując albo zmieniając poprzednie. Ten dziwny tryb publikowania wiązał się z tym, że w Getyndze David Hilbert, jeden z czołowych matematyków świata, także pracował nad podobną teorią. Einsteinowi groziło, że po siedmiu latach pracy zostanie prześcignięty, by tak rzec na ostatnich metrach przed finiszem. Nigdy później (ani wcześniej) nie publikował tak gorączkowo. Starał się też zazwyczaj wykazywać bardziej olimpijski spokój, co oczywiście było znacznie łatwiejsze, kiedy się było autorem epokowej teorii.

Gdyby ktoś chciał szczegółowo przejść obliczenia tensora krzywizny i równania dewiacji, może znaleźć je np. tutaj, na stronie Alana Heavensa s. 22-24.

Interpretacja tensora Ricciego za pomocą objętości kul opisana jest np. w pracy Johna C. Baeza i Emory’ego F. Bunna.

Istota teorii względności (1923) – Albert Einstein

Ślepy żuk pełznący po powierzchni globusa nie wie, że tor, po którym się porusza, jest zakrzywiony. Ja miałem szczęście to zauważyć [A. Einstein]

Ta niewielka książeczka jest jedynym kompletnym przedstawieniem teorii przez jej twórcę, adresowanym do zawodowych uczonych, stanowiąc coś pośredniego między monografią a podręcznikiem. Ukazała się najpierw w 1923 roku w wersji angielskiej nakładem Princeton University Press oraz w wersji niemieckiej w wydawnictwie Vieweg & Sohn (z datą roczną 1922). Od tamtej pory doczekała się niezliczonych wydań w wielu językach. Uczony nie zmieniał głównego tekstu, choć z czasem dołączył kilka dodatków traktujących o późniejszych osiągnięciach.

Podstawą książki były wykłady wygłoszone w maju 1921 roku na uniwersytecie w Princeton. Czterdziestodwuletni Einstein wybrał się w swą pierwszą podróż za ocean, towarzysząc Chaimowi Weizmannowi i delegacji syjonistów. Ich celem było zebranie funduszy na założenie uniwersytetu w Jerozolimie. Uczony, który w kilku poprzednich latach z odrazą obserwował antysemityzm narastający w społeczeństwie niemieckim i który sam stał się ofiarą niewybrednych ataków z rasistowskimi podtekstami, zgodził się na ten wyjazd, rezygnując z udziału w pierwszym po wojnie Kongresie Solvaya, konferencji gromadzącej szczupłe grono najwybitniejszych fizyków świata. Po raz pierwszy wystąpił więc Einstein w roli działacza społecznego, wykorzystując autorytet naukowy do propagowania bliskich mu poglądów. Uczony witany był w Ameryce owacyjnie, zwłaszcza przez społeczność żydowską w Nowym Jorku, Bostonie, Cleveland. Niektórzy koledzy Einsteina, jak Fritz Haber, wybitny chemik, Żyd i niemiecki szowinista, mieli mu za złe podróż do Stanów Zjednoczonych, kraju niedawnego wroga. Rany wojenne nie zdążyły się jeszcze zabliźnić, zwłaszcza w Niemczech dźwigających ciężar przegranej wojny. Wielu niemieckich Żydów sądziło też, iż nie należy prowokować antysemityzmu i lepiej siedzieć cicho. Einstein, czy to dlatego, że spędził wiele lat w Szwajcarii, czy też z racji swego charakteru, nie podzielał takiego nastawienia, przeciwnie, to właśnie antysemityzm przyspieszył dojrzewanie jego żydowskiej tożsamości.

Podróż po Stanach Zjednoczonych miała też ważną część naukową. Einstein miał wykłady na Columbia University i w City College w Nowym Jorku, na uniwersytecie w Chicago oraz uniwersytecie Harvarda. W Princeton otrzymał stopień honorowy i wygłosił sławne zdanie, które później wyryto nad kominkiem w sali Wydziału Matematyki: „Pan Bóg jest wyrafinowany, lecz nie jest złośliwy” (odnosiło się ono do pewnych wyników eksperymentalnych zaprzeczających jego teorii). Bezpośrednio po uroczystościach rozpoczął się cykl pięciu wykładów odbywających się w kolejne dni tygodnia. Dwa pierwsze były popularne, następne bardziej techniczne. Wykładu inauguracyjnego słuchało około czterystu osób, podczas drugiego audytorium znacznie się przerzedziło, a kolejne odbywały się już w mniejszej sali dla niewielkiego grona słuchaczy. Na początku pobytu w Princeton uczony podpisał umowę z wydawnictwem uniwersytetu na publikację tekstu jego wystąpień. Ponieważ odbywały się one po niemiecku, wydawnictwo wynajęło niemiecką stenografkę, która notowała na żywo. Każdy z wykładów był na koniec podsumowywany po angielsku przez profesora fizyki Edwina Plimptona Adamsa, który został też tłumaczem wersji książkowej. Dopiero w styczniu 1922 roku uczony przesłał niemiecki tekst książki do wydawnictwa Vieweg & Sohn, wydrukowane przez nie korekty stały się podstawą angielskiego przekładu. Prace te wraz z poprawkami autorskimi zajęły cały rok 1922. Pod jego koniec wydrukowano wydanie niemieckie, a w styczniu ukończono druk wydania angielskiego. W trakcie tych prac ogłoszono wiadomość, że Albert Einstein został laureatem Nagrody Nobla za rok 1921. Laureat przebywał w tym czasie w Azji w drodze do Japonii.

Uczony spodziewał się otrzymać Nagrodę Nobla, w istocie przyszła ona dość późno i z istotnym zastrzeżeniem. Jak pisał Christopher Aurivillius, sekretarz Królewskiej Szwedzkiej Akademii Nauk, w liście do laureata: „Akademia (…) postanowiła przyznać panu Nagrodę Nobla w dziedzinie fizyki za ubiegły rok w uznaniu Pana dokonań w fizyce teoretycznej, w szczególności odkrycia teoretycznych podstaw zjawiska fotoelektrycznego, lecz z pominięciem zasług, które staną się Pana udziałem, gdy potwierdzą się sformułowane przez Pana teorie względności i grawitacji”. Teoria względności była więc w oczach szwedzkich akademików osiągnięciem kontrowersyjnym, podobnie myślało wielu uczonych.

Niewykluczone, że Einstein pragnął swoją książką przekonać część kolegów po fachu. Na początku lat dwudziestych obie teorie względności: szczególną z roku 1905 oraz ogólną z roku 1915 można było uznać za zakończony etap. Dzięki pracy Einsteina, ale także szeregu innych fizyków i matematyków, jak Max Planck, Max von Laue, David Hilbert, Felix Klein, Emmy Noether, Max Born, Hermann Weyl, Tullio Levi-Civita, Karl Schwarzschild, Hans Thirring, Josef Lense, Willem de Sitter, Hendrik Lorentz, Gunnar Nordström, Erich Kretschmann, Arthur Eddington, Paul Ehrenfest, Johannes Droste, Paul Langevin udało się wyjaśnić wiele aspektów nowej teorii – już sama lista nazwisk wskazuje, że praca Einsteina nie przebiegała w próżni, a ranga tych uczonych świadczy o poważnym traktowaniu osiągnięć Einsteina. Miał on jednak także sporo przeciwników, którzy z rozmaitych powodów odmawiali jego teorii naukowej wartości, a często także kwestionowali intelektualną uczciwość jej twórcy. Berliński profesor optyki Ernst Gehrcke uznawał teorię Einsteina za skutek zbiorowej sugestii, wybitni eksperymentatorzy (i laureaci Nagrody Nobla) Philipp Lenard i Johannes Stark nie potrafili się pogodzić ze światem nowych pojęć i widzieli w teorii względności produkt reklamy oraz sprytne pomieszanie elementów filozofii, matematyki i fizyki tak, by trudno było znaleźć uczonego zdolnego ją krytykować bez wykraczania poza ramy swej specjalności. Obaj ostatni nie ukrywali też swego antysemityzmu i stali się zwolennikami Adolfa Hitlera jeszcze we wczesnych latach dwudziestych, na długo przed rządami nazistów. Niektórzy, jak szwedzki oftalmolog i laureat Nagrody Nobla Allvar Gullstrand, sądzili, że teoria względności jest pusta wewnętrznie i może prowadzić do różnych wyników w tej samej sytuacji. Dochodziły do tego ostre podziały wśród filozofów, niektórzy jak Hans Reichenbach i Moritz Schlick mocno ją popierali, wielu jednak, jak Oskar Kraus czy Henri Bergson, wyrażało sceptycyzm, jeśli nie wrogość, wobec nowej teorii.
Większość uczonych była na ogół wciąż zdezorientowana, nie wiedząc, co sądzić. Toteż książka Einsteina skupiła się na podkreślaniu ciągłości w rozwoju fizyki, uwydatnieniu pewnej linii rozwoju, w której teoria względności stawała się naturalnym ogniwem. Nie sposób jednak ukryć, że teorie Einsteina zrywały z pojęciami absolutnej przestrzeni i absolutnego czasu, stanowiącymi fundament mechaniki, a z nią całej fizyki od czasów Isaaca Newtona. Kwestionowanie uświęconych tradycją zdobyczy nauki w oczach wielu było gestem obrazoburczym i świętokradczym. To, co starszych przejmowało zgrozą i oburzeniem, w oczach ówczesnych ludzi młodych stawało się fascynującą rewolucją. Karl Popper wspominał, jak wielką rolę w jego myśleniu o nauce odegrała teoria Einsteina, już sam fakt, że można było stworzyć realną alternatywę wobec królującej mechaniki Newtona miał dla niego rangę intelektualnego objawienia.

Zacząć wypada od samej nazwy: teoria względności. Z początku mówiło się o zasadzie względności, potem określać tak zaczęto teorię Einsteina z roku 1905 (szczególną teorię względności), a później Einstein zaczął mówić o uogólnionej bądź ogólnej teorii względności. W dyskursie potocznym zaczęto nazwy tę wiązać z zanegowaniem absolutnego czasu, a nawet szerzej z zanegowaniem dotychczasowej fizyki czy wręcz obowiązującej logiki albo etyki. Oczywiście, teoria względności, tak jak żadna udana teoria fizyczna, nie zmienia świata doświadczenia, ponieważ musi być zgodna z dotychczasowymi danymi eksperymentalnymi. Zmienia jedynie nasz sposób widzenia świata, przewidując nowe zjawiska i rozszerzając tym samym granice wiedzy. Mechanika newtonowska nadal obowiązuje, znamy tylko dokładniej jej ograniczenia. Max Planck, jeden z najwcześniejszych zwolenników teorii Einsteina, przekonuje w swej autobiografii naukowej, że jego zainteresowanie teorią względności wynikło właśnie z szukania w fizyce absolutu, ponieważ w świecie teorii względności są także wielkości oraz pojęcia niezmienne i absolutne. Dlatego nazwa ta bywa myląca.

W czerwcu 1905 roku redakcja „Annalen der Physik” otrzymała pracę nikomu nieznanego urzędnika Biura Patentowego w Bernie zatytułowaną O elektrodynamice ciał w ruchu. Rzecz dotyczyła jednego z najważniejszych zagadnień fizyki teoretycznej, którym w poprzednim dziesięcioleciu zajmowali się dwaj uznani luminarze Henri Poincaré i Hendrik Lorentz. Chodziło o eter – hipotetyczny ośrodek wypełniający świat. Na początku XIX stulecia Thomas Young i Augustin Fresnel wykazali, że światło jest falą. Wyobrażano sobie, że musi ono być falą sprężystą w eterze, czyli drganiem, które propaguje się na wszystkie strony podobnie jak fale akustyczne w powietrzu bądź innych ośrodkach sprężystych. Eter ów charakteryzować się musiał dość osobliwymi własnościami, gdyż z jednej strony był na tyle rzadki, by nie hamować ruchów planet, z drugiej zaś musiał być niezmiernie sprężysty, gdyż prędkość światła jest niewyobrażalnie duża w porównaniu np. z prędkością dźwięku. W przypadku dźwięku wiemy, że jego prędkość dodaje się wektorowo do prędkości powietrza: zmierzona prędkość będzie więc zależeć od prędkości ruchu powietrza. Podobne zjawisko zachodzić powinno także w przypadku światła. Ruch roczny Ziemi po orbicie wokół Słońca zachodzi z prędkością około 30 km/s, co stanowi 1/10 000 prędkości światła. Precyzyjne pomiary powinny wykryć zmiany obserwowanej prędkości światła. Przez cały wiek XIX szereg eksperymentatorów od François Arago w roku 1810 aż do Alberta Michelsona i Edwarda Morleya w roku 1887 starało się za pomocą różnych metod optycznych wykryć ruch Ziemi w eterze. Wyniki wszystkich tych doświadczeń były negatywne. Wyglądało to tak, jakby eter poruszał się razem z Ziemią, ale taka hipoteza rodziła sprzeczności z innymi obserwacjami.

Obok optyki innym wielkim tematem dziewiętnastowiecznej fizyki były elektryczność i magnetyzm. W latach sześćdziesiątych XIX wieku James Clerk Maxwell podsumował te wszystkie badania, podając jednolitą matematyczną teorię zjawisk elektrycznych, magnetycznych oraz optycznych – okazało się bowiem, że powinny istnieć fale elektromagnetyczne. Ich prędkość wynikająca z teorii Maxwella była bliska prędkości światła w próżni. Maxwell wysnuł więc wniosek, że światło jest rodzajem fal elektromagnetycznych. W latach 1887-1888 Heinrich Hertz wykazał, że można w laboratorium wytworzyć fale elektromagnetyczne o długości kilku metrów, które także rozchodzą się z prędkością światła. Teoria Maxwella została potwierdzona, stając się praktycznym narzędziem pracy inżynierów. Niemal równocześnie rozwijały się bowiem techniczne zastosowania elektromagnetyzmu: oświetlenie elektryczne, telefon i pierwsze elektrownie. Ojciec i stryj Einsteina, bracia Rudolf i Jakob, prowadzili najpierw w Monachium, później w północnych Włoszech firmę elektryczną i Albert niemal od dziecka miał do czynienia z techniką elektryczną. Elektrodynamika była także ważnym tematem zajęć laboratoryjnych i wykładów na Politechnice w Zurychu. Einstein jednak od początku nie chciał zostać inżynierem i narzekał, że program studiów nie obejmuje teorii Maxwella.

Teoria Maxwella pozwalała w jednolity sposób opisać ogromny obszar zjawisk. Czyniła to za pomocą pojęć pola elektrycznego oraz magnetycznego. W każdym punkcie przestrzeni i w każdej chwili można było za pomocą dwóch wektorów scharakteryzować stan pola. Wydawało się, że eter z początku wieku zyskał teraz nową funkcję, nośnika pola. Ważną cechą nowego podejścia była lokalność: to, co dzieje się z polem elektrycznym i magnetycznym w danym punkcie zależy od ładunków i prądów w tym samym punkcie. Zaburzenia pola rozchodzą się jako fale elektromagnetyczne. Była to więc fizyka pojęciowo odmienna od Newtonowskiej grawitacji, w której dwie masy oddziałują na siebie na odległość w sposób natychmiastowy. W teorii Maxwella ładunek jest źródłem pola w otaczającej go przestrzeni i pole to z kolei oddziałuje na inne ładunki. Prędkość rozchodzenia się zmian pola jest wielka, ale nie nieskończona. Choć Maxwell dokonał najważniejszej pracy, formułując teorię w sposób logicznie zamknięty, to dopiero jego następcy, m.in. Oliver Heaviside i Hendrik Lorentz, znaleźli prostsze i bardziej eleganckie jej wersje. Okazało się np., że każdy prąd elektryczny jest jedynie ruchem ładunków. Mamy więc dwa rodzaje ładunków, których położenia i prędkości określają stan pola w różnych miejscach – są to równania pola, czyli równania Maxwella. Znając zaś wartość pola elektrycznego i magnetycznego, możemy obliczyć siłę działającą na ładunek – są to równania ruchu (siła Lorentza).

Teoria Maxwella wyrastała z modelu pewnego ośrodka sprężystego i uczony, podobnie jak większość współczesnych, uważał, że jego rolą jest sprowadzenie zjawisk elektrycznych i magnetycznych do zjawisk mechanicznych. W odróżnieniu od teorii Newtona, w której mamy pojedyncze punkty materialne, tutaj substratem jest eter, który wyobrażano sobie jako pewien sprężysty materiał. Paradoksalny status eteru opisał na zjeździe Brytyjskiego Towarzystwa Krzewienia Nauk w Oksfordzie w roku 1894 markiz Salisbury, stwierdzając, że „główną, jeśli nie wyłączną, własnością słowa eter było dostarczanie rzeczownika do czasownika falować”.

Problem wykrycia ruchu Ziemi w eterze stał się tym bardziej palący. Wiadomo było wprawdzie, że inżynier stosować może równania Maxwella, nie przejmując się takimi subtelnościami, ale należało wyjaśnić negatywne wyniki doświadczeń. Hendrik Lorentz spróbował podejść do tego problemu w sposób systematyczny i wykazał, że każdemu stanowi pól w nieruchomym eterze odpowiada pewien stan pól w eterze ruchomym. Chciał w ten sposób podać ogólny dowód, że wszelkie zjawiska elektromagnetyczne przebiegają w taki sposób, aby nie można było ruchu Ziemi wykryć. Wprowadził przy tym dość szczególną konstrukcję matematyczną: w poruszającym się układzie należało zdefiniować czas w taki sposób, że zależał on od współrzędnej przestrzennej. Był to zdaniem Lorentza czas fikcyjny, potrzebny do dowodu niemożliwości wykrycia ruchu przez eter. Okazało się też, że należy założyć coś osobliwego na temat długości obiektów poruszających się: powinny one ulec nieznacznemu skróceniu o czynnik \sqrt{1-v^2/c^2}, gdzie v jest prędkością ruchu obiektu, a c – prędkością światła.

Praca Alberta Einsteina, eksperta technicznego III klasy z Berna, proponowała już we wstępie krok decydujący: pojęcie eteru świetlnego jest w fizyce „zbyteczne”. W ten sposób cała dziedzina badań nad zjawiskami w poruszającym się eterze przechodziła do historii, rozpoczynała się natomiast era szczególnej teorii względności.

Fizycy znali wcześniej zasadę względności. Dotyczyła ona mechaniki. I zasada dynamiki, czyli zasada bezwładności, mówi, że gdy żadne siły nie działają na ciało, to porusza się ono ruchem jednostajnym i prostoliniowym bądź spoczywa. Zasada ta nie dotyczy każdego układu współrzędnych (in. układu odniesienia). Obserwator w hamującym pociągu widzi, jak przewracają się przedmioty, które dotąd spokojnie sobie tkwiły w bezruchu. Hamujący pociąg nie jest więc układem odniesienia, w którym zasada bezwładności ma zastosowanie. Fizycy mówią: nie jest układem inercjalnym (tzn. takim, w którym obowiązuje zasada bezwładności). Pociąg jadący ruchem jednostajnym jest dobrym przybliżeniem układu inercjalnego, podobnie jak powierzchnia Ziemi. Wiemy jednak, że także powierzchnia Ziemi nie jest idealnym układem inercjalnym, ponieważ Ziemia wiruje wokół osi, a także porusza się ruchem rocznym wokół Słońca. Układ inercjalny jest więc pewnym ideałem teoretycznym. Zasady dynamiki mają w takim układzie szczególnie prostą postać i zazwyczaj tak są domyślnie sformułowane.

Ważną cechą układów inercjalnych jest to, że każdy układ odniesienia poruszający się ruchem jednostajnym i prostoliniowym względem jednego z nich jest także układem inercjalnym. mamy więc do czynienia z klasą równoważnych fizycznie układów odniesienia. W każdym z nich obowiązują zasady dynamiki w zwykłej postaci. Nie znaczy to, że nie możemy opisywać ruchu np. w odniesieniu do hamującego pociągu, musimy jednak wtedy uwzględnić dodatkowe siły, które nie wynikają z żadnych oddziaływań, lecz są skutkiem ruchu układu: w hamującym pociągu pasażerowie odczuwają siłę zwróconą ku jego przodowi, która znika, gdy pociąg się zatrzyma.

Isaac Newton sformułował w Matematycznych zasadach filozofii przyrody pojęcia absolutnej przestrzeni – czegoś w rodzaju nieskończonego pojemnika na wszystkie obiekty w świecie oraz absolutnego czasu. Prawa dynamiki obowiązywać miały, gdy ruch odnosimy do owej przestrzeni absolutnej, ale także w każdym układzie odniesienia poruszającym się ruchem jednostajnym i prostoliniowym. W rezultacie w fizyce Newtona nie ma sposobu na ustalenie, który z nieskończonego zbioru układów inercjalnych jest absolutną przestrzenią albo w języku dziewiętnastego wieku: eterem. Nie możemy więc ustalić absolutnego położenia żadnego przedmiotu w sposób empiryczny: dwa zdarzenia zachodzące w odstępie jednej minuty w tym samym punkcie (inercjalnego) pociągu zachodzą w różnych miejscach przestrzeni zdaniem obserwatora na peronie. Fizycznie oba punkty widzenia są równoprawne, a także punkty widzenia wszelkich innych obserwatorów inercjalnych. Absolutna przestrzeń należy więc do założeń metafizycznych Newtona, żadne eksperymenty nie pozwalają jej zlokalizować. Inaczej można powiedzieć, że w fizyce Newtona obowiązuje zasada względności: prawa fizyki są takie same w każdym układzie inercjalnym.

Czas w fizyce Newtona jest rzeczywiście absolutny, to znaczy, można zawsze ustalić, czy zdarzenia są równoczesne, nawet gdy zachodzą one daleko od siebie (zresztą dla pewnego obserwatora inercjalnego będą one równoczesne i zarazem w tym samym punkcie przestrzeni).

Einstein uważał, iż zasadę względności należy rozciągnąć także na zjawiska elektromagnetyczne i zaproponował, aby obowiązywała ona jako nowe prawo fizyki: wszelkie prawa fizyki mają taką samą postać w każdym układzie inercjalnym. Drugim postulatem jego teorii było przyjecie, że prędkość światła w próżni jest dla każdego obserwatora inercjalnego równa tej samej wartości c (wynikającej z teorii Maxwella). Zamiast analizować szczegóły zaproponował więc dwie zasady ogólne, które jego współczesnym wydawały się przeczyć sobie wzajemnie. Rozszerzenie zasady względności na całą fizykę byłoby wprawdzie eleganckim wyjaśnieniem, dlaczego nie obserwujemy ruchu Ziemi w eterze (bo eteru nie ma), ale pojawia się trudność z drugim postulatem. Znaczy on bowiem, że nie tylko prędkość światła zawsze jest równa c, bez względu na ruch źródła światła, ale także równa jest c bez względu na to, czy obserwator goni falę świetlną, czy też porusza się jej naprzeciw. Przeczy to prawu składania prędkości, a przecież eksperymenty potwierdzają je na co dzień: gdy pasażer porusza się z prędkością u (względem pociągu) w kierunku do przodu pociągu jadącego z prędkością v (względem peronu), to jego prędkość względem peronu jest sumą u+v. Dlaczego prawo to nie działa, gdy jednym z obiektów jest światło?

Czyniono często zarzut Einsteinowi, że prędkość światła w próżni jest w jego teorii jakoś szczególnie wyróżniona. Rzeczywiście, istnieje w tej teorii graniczna prędkość poruszania się obiektów materialnych, np. przekazywania energii albo informacji, i to jest właśnie c. Można powiedzieć, że światło ma tę szczególną własność, iż porusza się z ową maksymalną prędkością. Nie ma jednak żadnych przeszkód, aby istniały inne obiekty poruszające się z prędkością c. Wiemy, że światło składa się z fotonów (było to treścią innej pracy Einsteina z tego samego roku, nie bez powodu nazywanego jego „cudownym rokiem”), cząstek poruszających się z prędkością c. Podobnie poruszają się inne cząstki, odkryte później, jak gluony, albo wciąż czekające na odkrycie, jak grawitony. Cząstki takie nie istnieją w stanie spoczynku, lecz zawsze poruszają się z prędkością c.

Istnienie maksymalnej prędkości, i to w dodatku zawsze jednakowej, pozwala na eksperymentalne badanie równoczesności dwóch zjawisk. Obserwator inercjalny może rozmieścić w swoim układzie odniesienia zegary w różnych punktach. Znając odległość tych puntów oraz prędkość światła, może te zegary zsynchronizować. Gdy jego zegar wskazuje czas t, wysyła sygnał do punktu odległego o r i umawia się z kolegą, który tam przebywa, że moment odebrania sygnału będzie czasem t+r/c. Dzięki temu przepisowi wszystkie zegary zostaną zsynchronizowane i można będzie ustalić zawsze czas danego zdarzenia, obserwując go na pobliskim zegarze. Metoda ta zastosowana w innym układzie inercjalnym może dać inne wyniki w odniesieniu do tej samej pary zdarzeń.

Przykład podany przez Einsteina pomaga to zrozumieć. Wyobraźmy sobie jadący pociąg i obserwatora na peronie. W chwili, gdy mija go środek pociągu, w jego początek i koniec uderzają równocześnie dwa pioruny. Ich uderzenia są równoczesne, ponieważ światło obu błyskawic dociera do naszego obserwatora w jednej chwili, a wiadomo, że odległość obu końców pociągu od obserwatora była w tym momencie taka sama. Inaczej opisze te zdarzenia obserwator siedzący w środku pociągu. Jego zdaniem piorun najpierw uderzył w przód pociągu, a dopiero później w jego tył (linia świata pasażera jest na rysunku zakreskowana, jest to zarazem jego oś czasu). Skoro równoczesność dwóch zdarzeń zależy od układu odniesienia, to znaczy, że czas absolutny nie istnieje. Wbrew pozorom nie burzy to jednak naszych koncepcji przyczyny i skutku. Musimy tylko precyzyjnie opisywać zdarzenia, podając ich położenie oraz czas. Zdarzenia takie, jak jednoczesne uderzenia dwóch piorunów w dwóch różnych punktach nie są z pewnością połączone związkiem przyczynowo-skutkowym, ponieważ wymagałoby to oddziaływania przenoszącego się natychmiastowo, z nieskończoną prędkością. Wszystkie zaś oddziaływania fizyczne mogą przenosić się co najwyżej z prędkością światła w próżni. Dlatego zmiana kolejności czasowej obu uderzeń pioruna nie burzy fizyki. Jeśli natomiast jakieś zdarzenie A może potencjalnie być przyczyną innego zdarzenia B, to dla każdego obserwatora ich kolejność czasowa będzie taka sama: t_A<t_B. Obalenie koncepcji absolutnego czasu nie oznacza zatem wprowadzenia anarchii w relacjach czasoprzestrzennych, lecz zaprowadzenie innego ładu niż dotąd.

Był to najważniejszy wniosek Einsteina. Oznaczał konieczność przebudowy samych podstaw fizyki: pojęć czasu i przestrzeni. Okazywało się, że teoria Maxwella zgodna jest z teorią względności, nie wymaga więc żadnej przebudowy. Przeciwnie, fikcyjny czas lokalny Lorentza należy interpretować jako czas rzeczywisty mierzony przez innego obserwatora. Póki znajdujemy się w jednym ustalonym układzie inercjalnym czas wydaje nam się absolutny. Rewolucja dotyczyła porównywania wyników pomiarów dokonywanych przez różnych obserwatorów. W przypadku elektrodynamiki oznaczało to względność pól elektrycznych i magnetycznych. Jeśli np. w jednym układzie odniesienia mamy spoczywający ładunek wytwarzający pole elektryczne, to w innym układzie ładunek ten będzie się poruszać – będziemy więc mieli do czynienia z prądem, i obserwować będziemy zarówno pole elektryczne, jak i magnetyczne. Oba wektory pola elektromagnetycznego stanowią więc z punktu widzenia teorii względności jedną całość, jeden obiekt matematyczny, którego składowe w różnych układach są różne, podobnie jak składowe zwykłego wektora w różnych układach współrzędnych.

Równania Maxwella są takie same w każdym układzie inercjalnym, więc i prędkość fali świetlnej będzie w każdym układzie taka sama. Większej przebudowy wymagała mechanika. Jej newtonowska wersja nadal pozostaje słuszna, gdy ciała poruszają się wolno w porównaniu do prędkości światła. Najważniejszą konsekwencją nowej mechaniki stało się słynne równanie E=mc^2, które pozwala zrozumieć m.in. reakcje, w których powstają albo giną cząstki, oraz skąd gwiazdy czerpią energię na świecenie przez miliardy lat.

Szczególna teoria względności rozwiązywała problemy, które od lat uciążliwie towarzyszyły fizykom, choć były one głównie natury pojęciowej. Można było na co dzień nie zaprzątać sobie głowy ruchem Ziemi w eterze i uprawiać fizykę tak, jakby Ziemia była nieruchoma. Także narzędzia do rozwiązania owych problemów zostały już wypracowane, głównie przez Lorentza i Poincarégo, Einstein je tylko radykalnie zreinterpretował. Pierwszy z fizyków pogodził się z sytuacją i zaprzyjaźnił z Einsteinem, drugi starał się ignorować prace młodszego kolegi (być może zresztą jego stosunek do Einsteina uległby z czasem zmianie, Poincaré zmarł w roku 1912, a więc przed stworzeniem ogólnej teorii względności). Ostatecznie elektrodynamika ciał w ruchu przeszła do historii, a podstawą fizyki stała się szczególna teoria względności.
Natomiast jej uogólnienie, czyli Einsteinowska teoria grawitacji, było praktycznie dziełem jednego tylko autora, stworzonym w latach 1907-1915.

Pojęciowym punktem wyjścia była prosty eksperyment myślowy: obserwator swobodnie spadający w polu grawitacyjnym nie będzie odczuwał grawitacji – będzie w stanie nieważkości, dziś dobrze znanym z lotów kosmicznych. Einstein uznał tę obserwację za „najszczęśliwsza myśl swego życia”. Z punktu widzenia fizyki Newtonowskiej istnieją dwa rodzaje masy: grawitacyjna i bezwładna. Pierwsza określa siłę, z jaką na ciało będzie oddziaływać grawitacja. Druga określa przyspieszenie ciała. Ponieważ obie te masy są jednakowe, więc przyspieszenie dowolnego ciała w danym polu grawitacyjnym jest takie same. Ilustruje to się czasem, demonstrując spadanie różnych ciał w rurze próżniowej. Obie masy skracają się zawsze, kiedy obliczamy przyspieszenie. Zdaniem Einsteina należało tę tożsamość wbudować w strukturę fizyki, zamiast ją tylko postulować jako dodatkowy warunek. Uczony sformułował zasadę równoważności pola grawitacyjnego i przyspieszenia. Znajdując się w zamkniętej kapsule, nie potrafilibyśmy odróżnić, czy nasza kapsuła porusza się ruchem przyspieszonym, czy spoczywa w polu grawitacyjnym (możliwe byłyby także kombinacje obu stanów). Grawitacja jest więc w fundamentalny sposób związana z bezwładnością. Einstein dążył do stworzenia teorii, która objaśniałaby jednocześnie grawitację oraz bezwładność. Argumentował przy tym, że układy inercjalne są sztucznym ograniczeniem dla fizyki, powinniśmy więc dopuścić także układy przyspieszone, nieinercjalne. Podobnie jak w szczególnej teorii względności każda prędkość ma zawsze charakter względny, w teorii uogólnionej także przyspieszenie miało stać się pojęciem względnym. Nawiązywał tu do rozważań Ernsta Macha, który sądził, że przyspieszenie jest względne. W swoim czasie Isaac Newton posłużył się przykładem wiadra z wodą wirującego na skręconym sznurze. Gdy wiadro przekaże ruch wirowy wodzie, jej powierzchnia staje się wklęsła, co jest skutkiem sił odśrodkowych. Możemy w ten sposób stwierdzić, czy woda wiruje względem absolutnej przestrzeni. Zdaniem Macha eksperyment ten dowodzi tylko tego, że woda obraca się względem dalekich gwiazd. Gdyby to owe gwiazdy zaczęły się obracać, skutek byłby ten sam, a przestrzeń absolutna nie istnieje.

Droga Einsteina do ogólnej teorii względności była zawikłana, lecz z perspektywy roku 1921 jej struktura matematyczna została już wyjaśniona. Rolę układów inercjalnych odgrywały teraz swobodnie spadające układy odniesienia. Obserwator znajdujący się w jednym z nich może stosować szczególną teorię względności. Różnica fizyczna między obiema teoriami polega jednak na tym, że szczególną teorię względności stosować można jedynie lokalnie. Nawet bowiem w spadającym swobodnie laboratorium można wykryć niewielkie zmiany przyspieszenia między różnymi jego punktami – są to siły przypływowe (poznane historycznie na przykładzie zjawiska przypływów i odpływów w oceanach, które są z różnymi siłami przyciągane grawitacyjnie przez Księżyc oraz Słońce). Oznacza to, że nie można wprowadzić jednego układu inercjalnego dla całego wszechświata, można tylko wprowadzać je lokalnie. Matematycznie rzecz biorąc, różnica między teorią ogólną i szczególną polega na geometrii: zakrzywionej w pierwszym przypadku, płaskiej w drugim. Einstein posłużył się czterowymiarowym sformułowaniem swej teorii szczególnej podanym przez Hermanna Minkowskiego. Czas i przestrzeń stanowią tu pewną całość, czasoprzestrzeń. W przypadku dwuwymiarowym w każdym punkcie powierzchni możemy zbudować płaszczyznę styczną. Jest ona zarazem dobrym przybliżeniem geometrii w otoczeniu danego punktu: w taki sposób posługujemy się planami miast, mimo że Ziemia nie jest płaska.

Teorię dwuwymiarowych powierzchni zawartych w trójwymiarowej przestrzeni zbudował Karl Friedrich Gauss. Zauważył przy tym, że wystarczy posługiwać się wielkościami dostępnymi bez wychodzenia poza powierzchnię. Można np. w ten sposób ustalić, czy jest ona zakrzywiona. Podejście Gaussa uogólnił później Bernhard Riemann, a inni matematycy rozwinęli je w systematyczne procedury dla powierzchni o dowolnej liczbie wymiarów.

W geometrii Riemanna współrzędne można wybrać w sposób dowolny, w przypadku zakrzywionych przestrzeni nie istnieje na ogół żaden szczególnie prosty układ współrzędnych, który mógłby odegrać taką rolę jak współrzędne kartezjańskie w przestrzeni euklidesowej. Nadal decydującą rolę odgrywa tu pojęcie odległości. Dla pary bliskich punktów możemy ją zawsze obliczyć w sposób euklidesowy, a długość dowolnej krzywej uzyskać przez sumowanie takich elementarnych odległości. Zamiast równania ds^2=dx^2+dy^2 na płaszczyźnie, mamy teraz równanie nieco bardziej skomplikowane

ds^2=g_{11}dx_1^2+2g_{12}dx_1dx_2+g_{22}dx_2^2.

Geometrię przestrzeni określa więc zbiór funkcji g_{\mu\nu} pozwalających obliczyć odległość punktów. Funkcje g_{\mu\nu} noszą nazwę tensora metrycznego (albo metryki). Można za ich pomocą wyrazić wszelkie własności geometryczne danej przestrzeni. W przypadku dwuwymiarowym wystarczą trzy takie funkcje, w przypadku czterowymiarowym należy znać ich dziesięć.

W zakrzywionej przestrzeni nie ma linii prostych, można jednak znaleźć ich odpowiedniki. Są to linie geodezyjne (albo geodetyki). Mają one niektóre własności linii prostych w geometrii euklidesowej: są np. najkrótszą drogą łączącą dwa punkty. Krzywe geodezyjne w teorii Einsteina są liniami świata cząstek poruszających się pod wpływem grawitacji. Metryka określa więc, jak poruszają się cząstki – grawitacja nie jest z punktu widzenia Einsteina siłą, lecz własnością czasoprzestrzeni. Należy dodać, że inne rodzaje sił działających na dane ciało sprawią, że przestanie się ono poruszać po geodezyjnej. Jedynie grawitacja wiąże się tak ściśle z geometrią. Jest to zgodne z faktem, że grawitacja jest powszechna, tzn. dotyczy wszystkich cząstek, a także działa na wszystkie w taki sam sposób – dzięki czemu można ją opisać jako własność czasoprzestrzeni. W teorii Einsteina nie potrzeba osobnej masy grawitacyjnej i bezwładnej.

Znając metrykę czasoprzestrzeni, możemy wyznaczyć geodezyjne, czyli obliczyć, jak poruszają się ciała pod wpływem grawitacji. Są to równania ruchu, zastępujące zasady dynamiki Newtona. Aby jednak wyznaczyć metrykę, potrzebne są równania, które musi ona spełniać. Są to równania pola, największe osiągnięcie Einsteina jako fizyka. Przystępując do pracy nad ogólną teorią względności uczony wiedział jedynie, że powinna ona zawierać teorię szczególną a także Newtonowską teorię grawitacji. Równania pola powinny mieć postać znaną z teorii Maxwella: (pewne kombinacje pochodnych pól)=(źródła pola). W przypadku grawitacyjnym źródłem powinna być masa, ale to także znaczy: energia. W teorii szczególnej opisuje się energię i pęd zbioru cząstek jako tensor energii pędu T_{\mu\nu}, zbiór dziesięciu wielkości danych w każdym punkcie czasoprzestrzeni. Masy powinny decydować o krzywiźnie czasoprzestrzeni. Zatem po lewej stronie równań pola powinna znaleźć się wielkość informująca o krzywiźnie. Okazuje się, że praktycznie jedyną możliwością jest tu tzw. tensor Einsteina, G_{\mu\nu} zbiór dziesięciu pochodnych metryki. Równania muszą więc przybrać postać

G_{\mu\nu}=\kappa T_{\mu\nu}.

gdzie \kappa jest odpowiednio dobraną stałą związaną ze stałą grawitacyjną. Sama postać zapisu tych równań zapewnia, że możemy w dowolny sposób wybrać współrzędne, a równania nadal pozostaną słuszne. Znalezienie prawidłowych równań pola pod koniec listopada 1915 roku zakończyło odyseję Einsteina: ogólna teoria względności została zbudowana.

Jeszcze w listopadzie 1915 roku uzyskał Einstein dla swej teorii pierwsze potwierdzenie obserwacyjne. Obliczył bowiem wielkość obrotu orbity Merkurego wokół Słońca – niewielkiej rozbieżności między obserwacjami a teorią Newtona nie udawało się wyjaśnić od półwiecza. Teraz okazało się, że przyczyną rozbieżności było niedokładne prawo grawitacji. Przewidział też Einstein, że promienie gwiazd biegnące blisko powierzchni Słońca powinny uginać się o kąt 1,74’’. Efekt ten został w roku 1919 potwierdzony podczas całkowitego zaćmienia Słońca przez dwie ekspedycje brytyjskie. Teoria grawitacji Einsteina okazała się ogromnym sukcesem, jest powszechnie uważana za najpiękniejszą teorię w fizyce. Nie wszystko jednak poszło po myśli jej twórcy. Okazało się np., że choć wprawdzie grawitacja i bezwładność zostały ze sobą zespolone, to nie udało się jednak zrealizować idei Macha. W teorii Einsteina wirowanie całego wszechświata jest czym innym niż wirowanie wiadra Newtona. Einstein z pewnym uporem trzymał się zasady Macha nawet wówczas, gdy wykazano, że nie obowiązuje ona w jego teorii. Wbrew przewidywaniom twórcy grawitacja może prowadzić do zapadania się materii i tworzenia czarnych dziur, w których zamknięta jest osobliwość czasoprzestrzeni. Einstein zmieniał w ciągu swej późniejszej kariery zdanie na temat tego, czy istnieją fale grawitacyjne: początkowo je przewidywał, później nabrał wątpliwości. Jego początkowe przybliżone podejście okazało się słuszne i fale grawitacyjne zostały odkryte w roku 2015.

Od nacjonalizmu do idiotyzmu: duch francuski i fizyka niemiecka (1915, 1936)

Ponieważ przybliża się chwila, gdy nasze niestrudzone władze powołają wreszcie do życia Narodowy Instytut Fizyki im. Antoniego od Wielu Wybuchów, więc warto może przypomnieć chlubne przykłady z przeszłości. Złudne jest bowiem mniemanie, że dziedziny takie, jak matematyka albo fizyka nie mają charakteru narodowego. Otóż mają i dlatego tak ważne jest promowanie autentycznie polskiej fizyki. A jakaż to będzie radość dla dziatek naszych najmilszych, gdy w programie szkół po Koperniku będzie od razu Maria Skłodowska-Curie, wypadną zaś te wszystkie Newtony, Ohmy, Hertze i Einsteiny. Wszak żarówkę wynalazł Łodygin, nie jakiś Edison. A była przecież i lampa naftowa Łukasiewicza, i elektryczne świece Jabłoczkowa. My, Słowianie (czyli w zasadzie Polacy), daliśmy światu tyle, tylko on o tym nic nie wie. Kto zaś będzie negował nasze osiągnięcia, ten skazany być może na 3 lata naszej szkoły i nawet wśród pingwinów dopadnie go karząca ręka prawa i sprawiedliwości.

Pierwszy przykład pięknej myśli narodowej w naukach ścisłych znajdujemy u Pierre’a Duhema. Wybitny specjalista od termodynamiki, najbardziej znany jest jako filozof i historyk nauki. Wprowadził on rozróżnienie umysłów naukowych na typ angielski i francuski. Miało się ono wywodzić z tego, co Blaise Pascal określał jako zmysł życiowy (esprit de finesse) oraz zmysł geometryczny (esprit de géométrie). W nauce mielibyśmy uczonych, którzy tworzą różne modele, trzymając się danych doświadczalnych, nawet gdy wprowadza to pewien zamęt pojęciowy; drudzy to budowniczowie prostych teorii, koncentrujący się na ich konsekwencjach. Przykładem typu angielskiego miał być Michael Faraday, francuskiego – Isaac Newton. Rozróżnienie nie miało więc charakteru nacjonalnego, lecz analityczny. Duhem nie lubił brytyjskiej szkoły posługującej się pojęciem pola elektromagnetycznego i mocno atakował Jamesa Clerka Maxwella z pozycji filozoficznych. Oczywiście, żadna filozofia nie mogła na dłuższą metę zaszkodzić osiągnięciom Maxwella, filozofowie mówią swoje, a nauka idzie dalej, nawet bez ich pozwolenia.

Gdy wybuchła pierwsza wojna światowa, czyli wielka wojna (nikt jeszcze nie wiedział, że będzie następna), Duhem, za stary, aby iść na front, zaczął pisać i nauczać o niemieckiej nauce. Co pochlebnego można było powiedzieć o nauce wrogów? Duhem nie zamierzał ich chwalić, wprowadził i omówił pojęcie umysłu typu niemieckiego. Nauka niemiecka była formalistyczna, polegająca na wywodach logicznych nawet tam, gdzie to nie ma większego sensu. „Niemiec jest pracowity, skrupulatny, zdyscyplinowany i podporządkowany”. To geometra, brak mu subtelności. Przykładem Bernhard Riemann, twórca abstrakcyjnego ujęcia geometrii nieeuklidesowej. „Doktryna Riemanna jest ścisłą algebrą, gdyż wszystkie twierdzenia, jakie się w niej formułuje, są bardzo precyzyjnie wydedukowane z przyjętych postulatów; zaspokaja to zmysł geometryczny. Nie jest jednak prawdziwą geometrią, gdyż, wprowadzając swoje postulaty, wcale nie zatroszczyła się, aby wnioski z nich zgadzały się w każdym punkcie z osądami wyprowadzonymi z doświadczenia, które składają się na nasze intuicje dotyczące przestrzeni; w ten sposób przeczy ona zdrowemu rozsądkowi”. Był luty roku 1915, w listopadzie Albert Einstein zapisał równania pola grawitacyjnego w swej teorii. Od kilku lat ci, którzy śledzili rozwój fizyki, wiedzieli, że właśnie geometria riemannowska jest językiem matematycznym nowej teorii. Inaczej mówiąc: owa formalistyczna geometria, rzekomo ignorująca nasze pojęcie przestrzeni, okazała się nauką o fizycznej czasoprzestrzeni, jak najbardziej konkretną, podlegającą pomiarom. Duhem nie śledził zapewne grawitacyjnych prac Einsteina, ponieważ już wcześniejsza szczególna teoria względności nie zyskała w jego oczach aprobaty. Sądził, iż nie istnieje graniczna prędkość w przyrodzie, gdyż można sobie zawsze wyobrazić przebycie określonej drogi w dowolnie krótkim czasie, nawet gdy praktycznie nie potrafimy tego zrealizować. Przyjęcie zasady względności Einsteina, Minkowskiego i Lauego sprawia, że prędkość ponadświetlna staje się sprzecznością logiczną – twierdzi Duhem. „To, iż zasada względności dezorganizuje wszelkie intuicje wynikające ze zdrowego rozsądku, nie wywołuje u fizyków niemieckich żadnych wątpliwości. Przyjęcie jej oznacza siłą rzeczy obalenie wszystkich doktryn dotyczących przestrzeni, czasu, ruchu, wszystkich teorii mechaniki i fizyki; w tak wielkiej dewastacji nie ma niczego, co by nie mogło się podobać myśli germańskiej. Na terenie, który zostanie oczyszczony z dawnych poglądów, geometryczny zmysł Niemców pozwoli im całym sercem oddać się dziełu zbudowania na nowo całej fizyki, której fundamentem stanie się zasada względności”. Widzimy więc na tych przykładach, jak bardzo niefrancuska, a tym samym przykra dla zrównoważonego umysłu, była niemiecka nauka Einsteina.

Mamy drugi jeszcze przykład, jak wolna myśl narodowa kształtować może zdrową etnicznie fizykę. Autorem naszym jest Philipp Lenard, laureat Nagrody Nobla z fizyki eksperymentalnej, człowiek mimo to zgorzkniały i upatrujący odrodzenia nauki aryjskiej w wyzwoleniu się od wpływów żydowskich. Zdaniem Lenarda fizyka stworzona została niemal wyłącznie przez Aryjczyków: Francuzów w jego opowieści nie było, Anglicy, Szkoci i Skandynawowie to praktycznie Niemcy. Niemcami byli też wielcy eksperymentatorzy, jak Heinrich Hertz, odkrywca fal elektromagnetycznych, u którego Lenard pracował kiedyś jako asystent. Hertz nie był jednak „czystej krwi”: jego ojciec, prawnik i senator hanzeatyckiego miasta Hamburga, był Żydem przechrzczonym na luteranizm. Miało to złowieszcze, zdaniem Lenarda, następstwa, gdyż w ostatnich latach życia Hertz zajmował się zasadami mechaniki. W pracy tej „silnie wyszedł na jaw duch żydowski, który w jego wcześniejszych owocnych pracach pozostawał w ukryciu”. W 1936 roku ukazało się czterotomowe dzieło Philippa Lenarda, zatytułowane Deutsche Physik. Był to podręcznik zawierający zdrową pod względem narodowym część fizyki, a nie – jakby ktoś złośliwy mógł pomyśleć – to, co z fizyki zrozumiał Lenard. We wstępie do swego wiekopomnego dzieła skromny jego autor zwracał się do czytelnika: „«Fizyka niemiecka?» – zapytacie. Mógłbym równie dobrze powiedzieć fizyka aryjska albo fizyka ludzi typu nordyckiego, fizyka badaczy rzeczywistości, poszukiwaczy prawdy, fizyka tych, którzy stworzyli badania naukowe. «Nauka jest międzynarodowa i zawsze taka pozostanie» – zaczniecie protestować. (…) W rzeczywistości tak samo, jak wszystko, co tworzy człowiek, również nauka zdeterminowana jest przez rasę albo krew. (…) Należy powiedzieć tu nieco o «fizyce» narodu żydowskiego, ponieważ stoi ona w jaskrawym przeciwieństwie do fizyki niemieckiej (…) fizyka żydowska dopiero niedawno poddana została wyważonej ocenie publicznej. Pod koniec wojny, kiedy Żydzi w Niemczech zaczęli dominować i narzucać ton, wezbrała niczym powódź i ujawniły się jej wszystkie cechy. Znalazła szybko gorliwych zwolenników wśród wielu autorów krwi innej niż żydowska albo nie czysto żydowska”. Oczywiście, przykładem fizyki żydowskiej par excellence musiał być Albert Einstein, jego teorie „kompletnie zgrały się w zetknięciu z rzeczywistością. Najwyraźniej nie były nawet w zamierzeniu prawdziwe. Żyd pozbawiony jest całkowicie zrozumienia prawdy innej niż tylko powierzchowna zgodność z rzeczywistością, [prawdy], która nie zależy od ludzkiej myśli. (…) Zdumiewające jest, że prawda czy rzeczywistość nie wydają się Żydowi czymś szczególnym bądź różnym od nieprawdy, lecz są one równoważne jednej z wielu możliwych opcji teoretycznych”.

Lenard nie mógł przeboleć, że powstaje nowa fizyka, tworzona m.in. przez Einsteina, a popierana ku jego niezadowoleniu przez Maksa Plancka czy Maksa Lauego, późn. von Laue – niewątpliwych etnicznych Niemców. Poglądy wygłaszane przez Lenarda, choć sformułowane prymitywniej, są w istocie zbliżone do zarzutów Duhema. Dla obu teoria względności sprzeczna była ze zdrowym rozsądkiem, była wykwitem zbyt dużej skłonności do abstrakcji oderwanej od rzeczywistości, przerośniętym esprit de géométrie. Duhem widział w tym cechę niemiecką, Lenard natomiast żydowską.

„«Ja cierpię» – Lepiej tak powiedzieć, niż powiedzieć: «Ten krajobraz jest brzydki»” (Simone Weil).

Einstein – żydowski prorok we własnym kraju

Obserwacje zaćmienia Słońca w 1919 roku potwierdziły zjawisko odchylenia światła w polu grawitacyjnym i to w wersji Einsteina (wartość jest dwa razy większa od newtonowskiej). Uczony w ciągu paru miesięcy został jednym z najsławniejszych ludzi na Ziemi.

Nie wszyscy czuli się przekonani do teorii względności, i nic w tym dziwnego: sformułowana została zaledwie parę lat wcześniej i nikt, łącznie z Einsteinem, nie zdawał sobie jeszcze sprawy z tego, jak głębokie zmiany nastąpią w fizyce pod jej wpływem. Widać to dopiero dziś, patrząc wstecz. W roku 1919 teoria ta wydawała się czymś niezwykle śmiałym i skomplikowanym matematycznie – poza niektórymi matematykami nikt bowiem nie znał geometrii riemannowskiej, potrzebnej do jej sformułowania (to jeszcze jedno z wielkich osiągnięć Bernharda Riemanna).

W listopadzie 1919 roku Einstein napisał krótki artykuł o swej teorii do „Timesa”, zakończony żartobliwym zdaniem: „Przystosowując teorię względności do upodobań czytelników, w Niemczech nazywają mnie niemieckim uczonym, a w Anglii – szwajcarskim Żydem. Jeśli zacznę być uważany za bête noire [czarną owcę], określenia te zostaną odwrócone: dla Niemców będę szwajcarskim Żydem, a dla Anglików niemieckim uczonym”.

Albert Einstein, Physiker, D/USA, Titelblatt Berliner Illustrirte

W grudniu portret uczonego ukazał się na stronie tytułowej „Berliner Illustrirte Zeitung” z podpisem: „Nowa znakomitość w dziejach świata: Albert Einstein; jego badania oznaczają zupełny przewrót w naszym rozumieniu przyrody, a jego idee dorównują w ważności osiągnięciom Kopernika, Keplera i Newtona”. Podobnie entuzjastyczny ton przyjął „Berliner Tagenblatt”.

Nie wszyscy byli jednak zachwyceni Einsteinem i jego teorią. Niemieckie gazety, które wychwalały Einsteina, należały do Żydów. Dla wielu „prawdziwych Niemców” był to tylko kolejny przykład żydowskiej propagandy, która niszczy i relatywizuje autentyczne wartości. „Berliner Tagenblatt” nazwany był w niektórych kręgach „Judenblatt” (skąd my to znamy?). Sama zaś teoria była uznawana za bezsensowny bełkot albo plagiat. Czasem nawet za jedno i drugie jednocześnie!

Proces przemiany Einsteina w szwajcarskiego Żyda był znacznie szybszy, niż on sam przypuszczał jesienią 1919 roku. Zdarzały się antysemickie incydenty na jego wykładach (miał ich zresztą niewiele, Einstein nie lubił uczyć). W sierpniu 1920 roku odbył się w sali Filharmonii Berlińskiej zjazd organizacji o nazwie Grupa Studyjna Niemieckich Badaczy Przyrody w Obronie Czystej Nauki. Organizację tę założył niejaki Paul Weyland, znany historii nie tylko ze swego antysemityzmu, ale i z tego, że działał na rzecz oderwania Śląska od Polski. Na zjeździe przemawiał także Ernst Gehrcke, profesor fizyki, utalentowany eksperymentator, którego stosunek do osoby Einsteina nazwać chyba należy namiętną nienawiścią. Twierdził on, że teoria względności to przykład zbiorowej hipnozy. W zasadzie jedynym tematem owego zjazdu było publiczne potępienie poglądów Einsteina, który zresztą wybrał się wraz z Waltherem Nernstem, aby tego posłuchać.

Na zjeździe nie było najwybitniejszego przeciwnika Einsteina, laureata nagrody Nobla, Philippa Lenarda, który w ostatniej chwili zrezygnował, być może uważając całe to przedsięwzięcie za nie dość poważne. Lenard był badaczem promieni katodowych – choć miał tego pecha, że najważniejsze odkrycie w tej dziedzinie, czyli odkrycie elektronu wiąże się nie z jego nazwiskiem, lecz z Anglikiem J.J. Thomsonem. Badał też zjawisko fotoelektryczne. Jego wyniki eksperymentalne na ten temat streszcza i podsumowuje znane równanie Einsteina z 1905 roku. Do bezpośredniego starcia z Lenardem doszło kilka tygodni później na zjeździe niemieckich przyrodników i lekarzy w Bad Nauheim. Dyskusja była dość jałowa, lecz tym razem merytoryczna. Zarzuty Lenarda były klasycznymi zastrzeżeniami praktyka w obliczu zmatematyzowanej teorii, której nie rozumie. Z mocno skróconych relacji z tego zjazdu trudno wywnioskować, czy w wystąpieniu Lenarda znalazły się jawne akcenty antysemickie. Wiadomo jednak, że starał się on wynaleźć przykłady Niemców, którzy wcześniej rzekomo osiągnęli takie same wyniki jak Einstein. I tak obrót perihelium Merkurego pojawił się już w pracy Paula Gerbera, nauczyciela ze Stargardu (praca była błędna). Związek masy i energii, słynne E=mc^2, pojawił się wcześniej w pracy Friedricha Hasenöhrla, teoretyka, który zginął podczas wojny światowej (w istocie jego równanie miało postać E=\frac{3}{4} mc^2 i nie było pierwszym wynikiem tego typu, rzecz analizowana była niedawno w pracy S. Boughna i T. Rothmana, ArXiv:1108.2250).

Albert Einstein jako jeden z pierwszych odczuł siłę niemieckiego nacjonalizmu. Wyjątkowo dobrze pasował do stereotypu Żyda-kosmopolity, choć Niemcy były jedyną ojczyzną, jaką kiedykolwiek miał, tu mieszkała jego kuzynka Elza, z którą wziął niedawno ślub. Miał potrzebę stabilizacji i odpowiadała mu niemiecka Gemütlichkeit. Ludzie mówili tu jego językiem ojczystym. W nadchodzących latach siły nacjonalistycznego obłędu doświadczyli również tacy Żydzi, którzy czuli się jak najbardziej lojalnymi obywatelami Niemiec, a bywało, że i niemieckimi szowinistami, jak Fritz Haber. Uczeni żydowskiego pochodzenia zostali zmuszeni do emigracji, Niemcy amputowały sobie naukową głowę, która nie odrosła do tej pory.

W roku 1920 wciąż daleko było jeszcze do 1933 i kanclerstwa Adolfa Hitlera. Niemcy, pokonane w wojnie i przeżywające trudności gospodarcze, były wciąż krajem budzącym szacunek zwłaszcza w kulturze i nauce. Czy rzeczywiście przyszłość już wtedy rysowała się czarno? Jednym z ważnych symptomów nadciągającej katastrofy było powszechna wśród niemieckich elit pogarda dla liberalizmu i demokracji. To właśnie dlatego nikt nie protestował w roku 1933, a Kościoły i uniwersytety poparły austriackiego ćwierćinteligenta na stanowisku przywódcy państwa.

Warto może wspomnieć o dalszych losach „bohaterów” antysemickich wystąpień przeciwko Einsteinowi. Paul Weyland w 1933 usiłował się zapisać do partii nazistowskiej i do związku niemieckich pisarzy. Nie udało mu się, ponieważ organizacje te broniły się przed masowym napływem świeżo upieczonych zwolenników nazizmu. Lata wojny przesiedział w obozach w Dachau i Sachsenhausen (nic nie wiadomo, by walczył o jakąkolwiek uczciwą sprawę), później wyemigrował do USA, gdzie udało mu się złożyć donos na Einsteina. Ówczesny szef FBI J. Edgar Hoover polecił zbadać „sprawę Einsteina”, dzięki czemu teczka uczonego w tej instytucji zawiera około 1500 stron. Ernst Gehrcke przez całe dziesięciolecia aż do swej śmierci w roku 1960 zbierał wszelkie możliwe wycinki z prasy wielu krajów na temat Einsteina, mimowolnie tworząc zbiór interesujący dla historyków i udostępniony obecnie online. Nie doczekał chwili przebudzenia ludzkości ze zbiorowej hipnozy, zwanej teorią względności. Philipp Lenard był doradcą Hitlera ds. fizyki aryjskiej, od 1931 roku był emerytowanym profesorem uniwersytetu w Heidelbergu. Stanowisko to stracił w 1945 roku po klęsce Rzeszy.

Dyskusja z Bad Nauheim dostępna jest tu w oryginale, a tu w angielskim przekładzie.

Rok 1859, Hipoteza Riemanna

W czasach PRL-u krążył dowcip, że socjalizm polega na heroicznych próbach rozwiązania problemów, które sam stworzył. To samo stosuje się w znacznej mierze do matematyki, która mimo swych rozlicznych zastosowań pozostaje dziedziną samowystarczalną, labiryntem, gdzie można błądzić latami, napotykając wciąż nowe cuda platońskiego świata. Jednym z najważniejszych nierozwiązanych problemów matematyki jest kwestia prawdziwości tzw. hipotezy Riemanna. Za jej udowodnienie Instytut Matematyczny Claya wyznaczył nagrodę równą milion dolarów.

Teoria liczb

Liczby naturalne, obok podstaw geometrii, poznajemy we wczesnym dzieciństwie. Zwykle też w szkole podstawowej uczono trochę o podzielności liczb i istnieniu liczb pierwszych: tj. takich, które mają dokładnie dwa dzielniki: 1 oraz samą siebie. Sposób na odsianie liczb pierwszych spośród całej reszty, podał jeszcze w starożytności Eratostenes, zwany przez zawistnych kolegów Betą – ponieważ zajmował się niemal każdą dziedziną i w każdej był drugi.

Sieve_of_Eratosthenes_animation

Zaczynamy od liczby 2. Jest ona liczbą pierwszą, ale wszystkie jej wielokrotności – czyli liczby parzyste – musimy wykluczyć. Następna jest liczba 3, która też jest liczbą pierwszą. Wykluczamy wszystkie jej wielokrotności: 6, 9, 12, … Postępując w ten sposób możemy ustalić, które liczby są pierwsze, a które złożone. Widać, że liczb pierwszych jest „dużo mniej” niż wszystkich liczb naturalnych, zachodzi pytanie, czy liczb pierwszych jest nieskończenie wiele. Okazuje się, że tak, co także dobrze wiedzieli starożytni. Ze sposobu działania sita Eratostenesa widzimy, że im większa jest liczba, tym większa szansa, że będzie ona jakąś wielokrotnością. Inaczej mówiąc zbiór liczb pierwszych staje się coraz rzadszy, w miarę jak przechodzimy do coraz większych wartości. Nie jest to jednak cała prawda: bo eksplorując zbiór liczb naturalnych napotyka się dowolnie długie obszary bez liczb pierwszych, choć można też napotkać pary liczb pierwszych różniących się tylko o dwa. Wszystko wskazuje na to, że takich par jest nieskończenie wiele, ale nikt tego nie udowodnił. Podobnie jak nieudowodniona jest hipoteza Goldbacha, że każda parzysta liczba naturalna większa niż 2 jest sumą dwóch liczb pierwszych.

Do rozmieszczenia liczb pierwszych można podejść statystycznie. Carl Friedrich Gauss, zauważył w ich rozmieszczeniu pewną prawidłowość. Jeśli oznaczymy przez π(x) liczbę liczb pierwszych mniejszych niż x, otrzymujemy dwie pierwsze kolumny poniższej tabeli:

x

π(x)

x/π(x)

przyrost

x/ln(x)

10

4

2,50

 

4,3

100

25

4,00

1,50

21,7

1000

168

5,95

1,95

144,8

10000

1229

8,14

2,18

1085,7

100000

9592

10,43

2,29

8685,9

1000000

78498

12,74

2,31

72382,4

Dziesięciokrotny wzrost x daje mniej więcej stały przyrost wartości w trzeciej kolumnie, tak zachowują się logarytmy. W dodatku wygląda na to, że wartość przyrostu stabilizuje się w okolicy liczby \ln(10)\approx 2,3

Ostatecznie funkcja π(x) powinna zachowywać się następująco przy dużych wartościach x:

1x

Być może nie wydaje się to szczególnie trudne. Musimy jednak pamiętać, że Gauss miał wówczas jakieś 16 albo 17 lat. Było to pod koniec XVIII wieku. Gauss nigdy nie potrafił udowodnić swojej hipotezy.

Liczby zespolone

Liczby naturalne łatwo rozszerzyć tak, aby obejmowały zero i liczby ujemne. Dzielenie liczb naturalnych prowadzi często do ułamków – w ten sposób uzyskujemy liczby wymierne (które można zapisać jako ułamek z naturalnym licznikiem i mianownikiem). W wielu zagadnieniach liczby wymierne nie wystarczają. Rozpatrzmy np. proste równanie

2x

Wiemy, że √2 jest liczbą niewymierną, można ją przybliżać kolejnymi cyframi po przecinku, ale nie da się jej zapisać skończonym rozwinięciem dziesiętnym. Także w zbiorze liczb rzeczywistych wiele równań algebraicznych nie ma rozwiązań, np. równanie różniące się tylko znakiem od poprzedniego.

3x

Aby temu zaradzić wprowadza się jednostkę urojoną i:

4xTeraz nasze ostatnie równanie także ma dwa pierwiastki, oba czysto urojone.

5x

W pierwszej chwili postępowanie takie może wyglądać na arbitralne, ale wprowadzenie liczb urojonych nie prowadzi do żadnych sprzeczności. Liczby te możemy dodawać do liczb rzeczywistych, w ogólnym przypadku otrzymujemy więc liczbę zespoloną:

6x

Liczby zespolone możemy przedstawiać jako punkty na płaszczyźnie albo wektory wychodzące z początku układu. Np. na rysunku zaznaczona jest liczba z=2+3i

polartri

Zamiast pary x, y można podać długość wektora r oraz kąt θ.

Na liczbach zespolonych można wykonywać wszystkie działania dozwolone dla liczb rzeczywistych, każde równanie algebraiczne stopnia n ma dokładnie n pierwiastków zespolonych (niektóre mogą być wielokrotne). Najciekawsze wyniki daje jednak teoria funkcji zespolonych, ujawniając różne nieoczekiwane powiązania, np. między funkcjami trygonometrycznymi a funkcją wykładniczą. Okazuje się, że gdy funkcje zespolone mają pochodną, to muszą być różniczkowalne nieskończenie wiele razy.

Bernhard Riemann

W maju roku 1859 w wieku 54 lat zmarł Johann Peter Gustav Lejeune Dirichlet, profesor zwyczajny matematyki na uniwersytecie w Getyndze. Dzięki temu katedrę mógł objąć Bernhard Riemann. Dirichlet był wybitnym matematykiem i został profesorem zwyczajnym dopiero po śmierci Gaussa, zaledwie kilka lat wcześniej. Riemann był jednym z najbardziej twórczych matematyków w historii, mimo swych niespełna 33 lat, miał już bardzo poważny dorobek. Także i jemu nie było dane długo piastować katedrę, zapadł bowiem na gruźlicę i zmarł w 1866 roku.

Praca z 1859 jest jedyną pracą Riemanna poświęconą teorii liczb. Wprowadził on w niej pewną funkcję zwaną od tej pory ζ [zeta] Riemanna. Oto jej definicja:

8x

Po prawej stronie mamy nieskończony szereg, aby wyrażenie takie miało sens, powinno ono zmierzać do jakiejś ustalonej wartości, gdy sumujemy coraz więcej wyrazów. Wiadomo było, że szereg taki jest zbieżny dla s>1. Niektóre przypadki badał już kiedyś Leonhard Euler, który udowodnił, że

10x
Także Euler zauważył, iż można szereg taki zamienić na nieskończony iloczyn przebiegający wyłącznie liczby pierwsze:
9x

Mamy więc związek funkcji ζ z liczbami pierwszymi. Rewolucyjnym posunięciem Riemanna było rozszerzenie dziedziny funkcji ζ na liczby zespolone. Dzięki temu można było do jej zbadania użyć metod analizy zespolonej. Funkcja ζ okazała się niezwykle regularna. Wiadomo było, że szereg jest rozbieżny dla s=1 i to się oczywiście nie zmieniło po rozszerzeniu dziedziny do liczb zespolonych. Jednak oprócz tego jednego punktu funkcja ζ jest wszędzie gładka i nie ma żadnych osobliwości.

arg osie

Na rysunku przedstawione jest zachowanie funkcji ζ na płaszczyźnie zespolonej (oś x odpowiada liczbom rzeczywistym, y – urojonym). Ponieważ wartości funkcji są liczbami zespolonymi, więc w każdym punkcie powinniśmy narysować parę liczb. Zamiast tego przedstawiony został jedynie kąt θ za pomocą koloru. W okolicach miejsc zerowych funkcji oraz w okolicy punktu s=1 zbiegają się wszystkie kolory. Jeśli pamiętamy o iloczynowym przedstawieniu funkcji ζ, to jasne jest, że wartości liczb pierwszych wpływają na wartości funkcji ζ. Riemann zauważył, że także odwrotnie: w funkcji ζ zakodowane są liczby pierwsze. Dokładniej, znajomość położenia zer funkcji ζ w pionowym pasie krytycznym (na rysunku barwnym mamy tylko trzy pierwsze zera z tego pasa, na schemacie z prawej strony pas ten zaznaczony jest na niebiesko) określa funkcję rozkładu liczb pierwszych π(x). Sformułował też hipotezę, że wszystkie zera funkcji ζ mają postać:

11x

Leżą więc nie tylko w pasie krytycznym, lecz na biegnącej jego środkiem linii prostej (czerwona linia na prawym rysunku).
Hipoteza Riemanna nie została dotąd udowodniona, słabsze od niej założenia pozwoliły (dopiero kilkadziesiąt lat po śmierci Riemanna!) udowodnić przypuszczenie Gaussa nt. zachowania π(x), od którego rozpoczęliśmy. Okazuje się, że znając położenie zer funkcji ζ, można przybliżać funkcję π(x). Nie podajemy wzoru, wykres poniżej pokazuje, jak zmienia się wynik w zależności od liczby zer wziętych pod uwagę.

psi

(Animacja ze strony http://empslocal.ex.ac.uk/people/staff/mrwatkin/zeta/encoding2.htm, ściśle biorąc nie jest to nasza funkcja π(x), lecz inna, spokrewniona z nią funkcja rozkładu liczb pierwszych). Warto też obejrzeć aplet modelujący formułę Riemanna.

Istnieją przypuszczenia, że zera funkcji ζ mogą być wartościami energii jakiegoś nieznanego układu kwantowego. Jak zwykle, gdy w grę wchodzi teoria liczb, istnieją zaskakujące sformułowania hipotezy Riemanna. Każda liczba naturalna ma parzystą bądź nieparzystą liczbę czynników pierwszych, na które się rozkłada. Np. liczby pierwsze mają tylko jeden taki czynnik, 8 jest iloczynem trzech czynników pierwszych, a 9 – dwóch. Hipoteza Riemanna równoważna jest temu, że prawdopodobieństwa, iż dana liczba naturalna ma parzystą bądź nieparzystą liczbę czynników pierwszych, są jednakowe.

Czytelnikowi nieobawiającemu się matematyki, lecz niezbyt zaawansowanemu, polecam gorąco książkę Jeffreya Stopple’a, A Primer of Analytic Number Theory, Cambridge University Press 2003.