Szczęśliwy rok Erwina Schrödingera (1926)

W listopadzie 1926 roku seria sześciu ostatnich prac Schrödingera ukazała się w wydaniu książkowym. Jak sam pisał we wstępie do tego przedruku:

Młoda przyjaciółka powiedziała o nich niedawno: „Popatrz, kiedy je zaczynałeś, nie myślałeś w ogóle pojęcia, że wyjdzie z nich tak wiele sensownych rzeczy”. Powiedzenie to, z którym (prócz pochlebnego przymiotnika) w pełni się zgadzam, podkreśla fakt, że prace zebrane w tym tomie powstawały jedna po drugiej. Ich autor, pisząc wcześniejsze części, nie znał jeszcze części późniejszych.

Erwin Schrödinger stał się dzięki nim sławny i choć także wcześniej i później tworzył prace interesujące bądź nawet wybitne, żadna z nich nie dorównywała tej złotej serii.

Ową przyjaciółką była czternastoletnia Itha Junger („Ithi”). Ich dziadek Georg Junger był bogatym obywatelem Salzburga, właścicielem firmy zajmującej się handlem hurtowym. Interes prowadzili nadal jego dwaj synowie, to jeden z nich, Hans, był ojcem dwóch niejednakowych bliźniaczek: Ithy i Roswithy, uczęszczających do szkoły klasztornej. Mówiło się, że matka żony Schrödingera Anny była nieślubną córką Georga Jungera. W każdym razie obie rodziny były blisko i żona Hansa była matką chrzestną Anny. Itha miała kłopoty z matematyki, Anny zaproponowała, że Erwin mógłby pomóc, bliźniaczki przeniesiono do klasztoru blisko Zurychu, żeby mogły korzystać z korepetycji. Erwin bardzo się z nimi zaprzyjaźnił, a wkrótce i zakochał w Ithi. Ich osobliwy, nawet w tych swobodnych czasach, romans trwał wiele lat, związek został skonsumowany wkrótce po siedemnastych urodzinach Ithi.

Mechanika kwantowa Heisenberga i jego kolegów z Getyngi przyjmowana była z mieszanymi uczuciami przez środowisko fizyków. Przeskoki kwantowe, abstrakcyjny formalizm macierzowy, filozofia ograniczenia się tylko do wielkości bezpośrednio obserwowalnych i porzucenia raz na zawsze poglądowych wyobrażeń atomu – wszystko to traktowane było z rezerwą. Podejście Schrödingera wydawało się nie tylko bardziej zrozumiałe matematycznie, ale także umożliwiało wyobrażenie sobie, co właściwie dzieje się wewnątrz układów o skali atomowej. Schrödinger wykazał także, że przynajmniej w prostych sytuacjach oba podejścia są równoważne. Mimo to, Heisenberg wykazywał wobec „mechaniki falowej” postawę wrogą i nieprzejednaną. Jego mentor, Niels Bohr, zaprosił Schrödingera do Kopenhagi, gdzie zadręczał wręcz swojego gościa, atakując jego sposób myślenia.

Dla zwolenników Bohra elektron był punktową cząstką, a prawa kwantowe dotyczyły tylko prawdopodobieństw. Historia przyznała im rację, choć pewne problemy interpretacyjne mechaniki kwantowej pozostały do dziś. Trzeba jednak wyraźnie powiedzieć, że jak dotąd żaden eksperyment nie zaprzeczył prawom mechaniki kwantowej, „szara strefa” dotyczy raczej filozoficznego samopoczucia. Wciąż nie znamy wszystkich szczegółów przejścia z poziomu mikroświata do makroświata, w którym żyjemy i w którym powstała fizyka klasyczna.

Błyskawiczna kariera Schrödingera wiązała się z tym, że dla konserwatywnie nastawionych fizyków, jego podejście wydawało się łatwiejszą do przyjęcia wersją teorii kwantowej. Schrödinger został zasypany listami i zaproszeniami od luminarzy ówczesnej fizyki: od sędziwego Hednrika Lorentza, przez Maksa Plancka, Alberta Einsteina aż do Wilhelma Wiena i Arnolda Sommerfelda. Został członkiem bardzo elitarnego grona: Planck gościł go w swoim domu podczas wizyty w Berlinie. Dobiegający siedemdziesiątki i wieku emerytalnego Planck niewątpliwie myślał przy tym o przyszłości swojej katedry w Berlinie, najbardziej prestiżowego stanowiska w dziedzinie fizyki teoretycznej na świecie. Niedługo później Schrödinger trafił na krótką listę kandydatów i uzyskał to stanowisko. Uznano przy tym, że Werner Heisenberg, choć niewątpliwie genialny, jest po prostu jeszcze za młody na katedrę. Schrödinger odbył też podróż do Stanów Zjednoczonych, stając się jednym z długiego szeregu wizytujących sław europejskich. Amerykanie nie byli jeszcze potęgą w fizyce teoretycznej, ale starali się kusić wysokimi honorariami, uzyskując przynajmniej tyle, że odwiedzali Stany Zjednoczone wszyscy właściwie wybitni fizycy i matematycy. Schrödinger też dostał oferty pracy w USA, ale nie rozpatrywał ich poważnie. Ameryka mu się nie podobała, duch purytański, przejawiający się w owych latach, m.in. w prohibicji, wydawał mu się barbarzyństwem. Na widok Statui Wolności miał powiedzieć, że brakuje jej tylko zegarka na ręku.

William F. Meggers Gallery of Nobel Laureates

Erwin Schrödinger bronił w roku 1926 i później stanowiska, że elektron nie jest punktową cząstką, lecz raczej pewnym rozmytym obiektem. Stanowisko to nie dało się obronić. Przedstawimy jeden z argumentów Schrödingera. Jest on prawdziwy, lecz sytuacja, której dotyczy, okazała się nietypowa. Nie można było tego jednak wiedzieć latem 1926 roku.

Rozpatrzmy oscylator harmoniczny, czyli cząstkę oscylującą wokół minimum energii potencjalnej. Ponieważ każdą funkcję wokół minimum można w przybliżeniu uważać za parabolę, więc jest sens rozważać przypadek kwadratowej, czyli parabolicznej, energii potencjalnej. Rozwiązanie równania Schrödingera daje nam wówczas następujące funkcje falowe.

skrypt Sagemath do generowania obrazka

Są to drgania o różnych dopuszczalnych energiach (nieparzyste wielokrotności wielkości \frac{1}{2}\hbar \omega, gdzie \omega jest częstością kołową naszego oscylatora). Klasycznie biorąc, obszar położony poza przecięciem potencjału z poziomą prostą danej energii całkowitej jest niedostępny; cząstka nie może się tam znaleźć, ponieważ musiałaby mieć ujemną energię kinetyczną. W fizyce kwantowej funkcja falowa rozlewa się poza ten klasycznie dostępny obszar, co jest tzw. zjawiskiem tunelowym. Każdy z tych stanów stacjonarnych ma bardzo prostą zależność od czasu. Należy funkcję z wykresu pomnożyć przez czynnik

\exp(-i\frac{Et}{\hbar})=\exp(-i\omega(n+\frac{1}{2})t).

Znaczy to, że zależność od czasu jest trywialna, nic się w naszej funkcji falowej nie porusza, opisane stany są falami stojącymi. Schrödinger zauważył, jak ze stanów o ustalonej energii zbudować rozwiązanie równania, które opisuje drgania w czasie. W gruncie rzeczy jest to bardzo proste. Chcąc zapoczątkować drgania oscylatora, wystarczy wychylić jego masę z położenia równowagi, a następnie puścić ciężarek, który zacznie wykonywać oscylacje.

Można analogicznie, wziąć funkcję falową stanu podstawowego oscylatora

\Psi_0(x)=C\exp(-\frac{x^2}{2}),

a następnie przesunąć ją do jakiegoś nowego położenia x_0:

\Psi(x)=C\exp(-\frac{(x-x_0)^2}{2}),

Jeśli tę ostatnią funkcję potraktujemy jako warunek początkowy w równaniu Schrödingera, to otrzymamy funkcje opisujące paczkę falową poruszającą się oscylacyjnie wokół położenia równowagi. W pracy Schrödingera („Naturwissenschaften”, 1926) przedstawiona została jej część rzeczywista:

Jest to zdjęcie migawkowe, paczka falowa będzie bowiem oscylować wokół położenia równowagi. Zdaniem Schrödingera ta właśnie fala jest elektronem. Ponieważ ciągle traktował on liczby zespolone jako wypadek przy pracy, więc wziął cząść rzeczywistą rozwiązania.

Wiemy jednak, że rację miał tu Max Born: należy obliczyć kwadrat zespolonego modułu funkcji falowej i jego wielkość określa rozkład prawdopodobieństwa. Otrzymamy wówczas klasyczne drgania rozmytej funkcji falowej.

Wikimedia Commons

Nie jest to jednak elektron, lecz prawdopodobieństwo jego znalezienia w danym miejscu i czasie. Dziś stany takie znane są jako stany koherentne. Przypadek oscylatora jest wyjątkowy: na ogół taka zlokalizowana funkcja falowa rozmywa się w czasie, choć w niektórych przypadkach może się później odbudowywać, jak na poniższym obrazku (chodzi tu o wysokowzbudzone stany atomu wodoru: mogą one przez chwilę przypominać klasyczny elektron na orbicie Bohra, potem ten obraz się rozmywa.

Mamy tu trzydzieści keplerowskich obiegów elektronu zbudowanych ze stanów wokół n=180

Erwin Schrödinger nie pogodził się z kopenhaską interpretacją mechaniki kwantowej, stał się jednym z jej krytyków, podobnie jak Einstein poszukujących innej drogi. Romans z Ithi kontyuowany był w latach berlińskich, w jakimś momencie uczony chciał się nawet z nią ożenić, ale do tego nie doszło. Po roku 1933 nie chciał zostać w nazistowskich Niemczech (co było dość wyjątkowe, ponieważ nie był Żydem i nie musiał rezygnować), wrócił na trochę do Austrii, ale wskutek Anschlussu także Austria stała się brunatna. Jego późniejsze afery uczuciowo-erotyczne stanowiły przeszkodę w objęciu katedr w Oxfordzie i Princeton, ostatecznie znalazł sobie miejsce w katolickiej Irlandii.

Reklamy

Erwin Schrödinger: trzeci początek mechaniki kwantowej (1926)

Równanie Schrödingera zasługuje na swoją sławę: dzięki niemu znamy nie tylko budowę atomów, ale i cząsteczek chemicznych czy ciał skondensowanych. Wynikają z niego najprzeróżniejsze własności materii, która nas otacza, a także materii we wszechświecie. Jest więc równaniem niezwykle istotnym tak dla fundamentów fizyki, jak i dla zastosowań.

Autor najsłynniejszego równania dwudziestowiecznej fizyki aż do roku 1926 nie należał do ścisłej czołówki fizyków teoretycznych. Zaledwie osiem lat młodszy od Einsteina, dopiero od 1921 roku zajmował katedrę na uniwersytecie w Zurychu. Studiował w Wiedniu, zbyt późno by zetknąć się osobiście z Ludwigiem Boltzmannem czy Ernstem Machem, choć wpływ obu tych uczonych wciąż dawał się tam odczuć. Fizyki teoretycznej uczył się u Friedricha Hasenöhrla, bliskiego przyjaciela Mariana Smoluchowskiego. Do tej pory niewiele zajmował się teorią kwantową, ponieważ opierała się ona wciąż na bardzo grząskich podstawach, korzystając po trosze z fizyki klasycznej, a po trosze z postulatów kwantowania, wyraźnie z nią sprzecznych. Zwrócił jednak uwagę na pracę Louisa de Broglie na temat fal materii. Postulowała ona, że zarówno fotony, jak i inne cząstki mikroświata mają dualną naturę: zachowują się czasem jak cząstki, a czasem jak fale. Obowiązywał przy tym jeden uniwersalny przelicznik własności cząstkowych: energii E i pędu p na wielkości falowe: częstość (kołową) \omega i liczbę falową k\equiv\frac{2\pi}{\lambda} (\lambda jest długością fali). Współczynnikiem proporcjonalności w obu przypadakch miała być stała Plancka \hbar:

E=\hbar\omega,\,p=\hbar k.

Felix Bloch, wówczas początkujący fizyk, tak wspomina wspólne kolokwia (dziś powiedzielibyśmy raczej seminaria) fizyków z uniwersytetu w Zurychu i z ETH, gdzie najważniejszą postacią był Peter Debye.

Pewnego razu pod koniec kolokwium Debye powiedział coś w tym rodzaju: „Schrödinger nie zajmujesz się teraz żadnym ważnym tematem. Może opowiedziałbyś nam któregoś dnia o tym doktoracie de Broglie’a, który, zdaje się, przyciągnął sporo uwagi”. Więc na jednym z następnych kolokwiów Schrödinger przedstawił cudownie przejrzysty wykład o tym, jak de Broglie wiąże fale z cząstkami i w jaki sposób zdołał on uzyskać reguły kwantyzacji Bohra i Sommerfelda (…) Kiedy skończył, Debye stwierdził od niechcenia, że taki sposób ujęcia jest raczej dziecinny. Jako student Sommerfelda nauczył się, że właściwy sposób podejścia do fal wiedzie przez równanie falowe. Brzmiało to dość trywialnie i na pozór nie zrobiło głębszego wrażenia, ale Schrödinger najwyraźniej wrócił później do tego pomysłu. Zaledwie kilka tygodni później dał następne kolokwium, zaczynając od słów: „Kolega Debye zasugerował, że należy mieć równanie falowe, toteż je znalazłem”. [„Physics Today”, t. 29 (1976), nr 12, s. 23-24]

Najwyraźniej w pierwszej chwili obaj nie zdawali sobie sprawy z wagi tych badań. Erwin Schrödinger dzięki pracom z końca roku 1925 i roku 1926 stał się błyskawicznie jednym z najgłośniejszych fizyków świata. Seria jego artykułów natychmiast zyskała uznanie. Chwalili je Albert Einstein i Arnold Sommerfeld, który wraz ze swymi uczniami rozwijał od lat fizykę kwantową. Napisał do niego sędziwy Hendrik Lorentz, który uważnie śledził nowości i miał parę istotnych uwag. Surowy i poważny Max Planck, profesor najbardziej prestiżowej katedry w Niemczech (co wtedy znaczyło: najbardziej prestiżowej na świecie) – na uniwersytecie w Berlinie, pisał entuzjastycznie do Schrödingera:

Czytam pański artykuł tak, jak ciekawe dziecko, słuchające w napięciu rozwiązania zagadki, nad którą się długo głowiło, i cieszę się bardzo wszystkimi pięknościami, jakie tam dostrzegam, choć muszę go jeszcze dokładniej przestudiować, by wszystko z niego pojąć.

Kiedy w grudniu 1925 roku Schrödinger znalazł swe równanie, był to trzeci początek mechaniki kwantowej albo – jak wolał o tym mówić autor odkrycia – mechaniki falowej. Na pierwszy rzut oka nie miało to nic wspólnego z teorią Heisenberga, Borna, Jordana i Diraca. U Schrödingera nie było żadnych skoków kwantowych, żadnych wielkości macierzowych, nieprzemiennych iloczynów. Język był całkowicie klasyczny – była to matematyka drgań, dobrze już wówczas opracowana. W roku 1924 wyszła dwutomowa monografia Methoden der mathematischen Physik („Metody fizyki matematycznej”) zredagowana przez Richarda Couranta i innych matematyków z Getyngi na podstawie wykładów Davida Hilberta. Zawierała ona wiele materiału, który miał się okazać potrzebny fizykom za kilka lat. Jak na ironię metody Hilberta zastosowali pierwsi nie fizycy z grupy Maksa Borna, pracujący przecież głównie pod bokiem Hilberta w Getyndze, ale Erwin Schrödinger, outsider i naukowy samotnik. Fizycy z Getyngi zlekceważyli nawet wyraźną sugestię Hilberta w jednej z rozmów, że powinni poszukać równania różniczkowego, które opisuje skwantowane wartości energii. Nie próbowali iść tym tropem, przekonani, że ich mechanika kwantowa jest czymś całkowicie nowym i nie może się zawierać w książce sprzed paru lat. Źle przyjęli też pracę Schrödingera, która wydawała się recydywą fizyki klasycznej, odwrotem od kwantowej rewolucji spod sztandaru Heisenberga.

Fizycy klasyczni znali wiele przypadków drgań układów rozciągłych, czyli fal stojących. Są one np. podstawą wytwarzania dźwięku w instrumentach muzycznych takich, jak organy, flet, trąbka czy skrzypce. Wiadomo, że zamocowana na końcach struna drgać może tylko z określonymi ściśle częstościami: podstawową oraz jej wielokrotnościami. Rozważano różne bardziej skomplikowane możliwości, pisaliśmy tu o rówieśniku Einsteina, fizyku z Getyngi, Waltherze Ritzu. Idea Schrödingera polegała na tym, by wartości energii w atomie potraktować analogicznie do częstości dźwięku w pudle rezonansowym, stosując równanie falowe. Ma ono w przypadku trójwymiarowym postać:

\dfrac{\partial^2\psi}{\partial x^2}+\dfrac{\partial^2\psi}{\partial y^2}+\dfrac{\partial^2\psi}{\partial z^2}-\dfrac{1}{v^2}\dfrac{\partial^2 \psi}{\partial t^2}\equiv \Delta\psi-\dfrac{1}{v^2}\dfrac{\partial^2 \psi}{\partial t^2}=0,

gdzie v jest prędkością fal. Jeśli przyjmiemy, że nasze fale są okresowe i mają częstość \omega, możemy rozwiązania zapisać jako

\psi(x,y,z, t)=\psi(x,y,z)e^{\pm i\omega t}.

Drugą pochodna po czasie jest ta sama funkcja wykładnicza pomnożona przez stałą. Wstawiając to do równania falowego, otrzymujemy tzw. równanie Helmholtza (który pod koniec XIX wieku był profesorem w Berlinie):

\Delta \psi+k^2 \psi=0.

W równaniu tym skorzystaliśmy z tego, że \dfrac{\omega}{v}=k. Droga Schrödingera do odkrycia była dość zawikłana. Związki de Broglie’a są relatywistyczne, naturalne wydawało się więc zapisanie równania relatywistycznego. Jednak kiedy spróbujemy je rozwiązać w najprostszym przypadku atomu wodoru, okazuje się, że dopuszczalne energie nie zgadzają się z tym, co wcześniej, w starej teorii kwantów obliczył Sommerfeld i co zgadzało się z doświadczeniem (szczegóły można znaleźć u L. Schiffa, Mechanika kwantowa, s. 409 i n.). Dwa lata później sytuacja się wyjaśniła: potrzebne tu jest równanie Diraca. Dwa lata w tamtej chwili rozwoju fizyki to było więcej niż epoka, Schrödinger znajdował się dopiero u początków tej drogi i nie mógł wiedzieć, co stanie się dalej. Rozsądnie zdecydował się więc na przybliżenie nierelatywistyczne, robiąc niejako krok wstecz w porównaniu do de Broglie’a. Nie pójdziemy tu jego drogą, a właściwie kilkoma różnymi drogami, jakimi próbował uzasadnić swe równanie. Wybierzemy podejście najprostsze zaproponowane pół roku później przez Maksa Borna – musimy jednak pamiętać, że nie jest to wyprowadzenie. Nie można bowiem wyprowadzić praw mechaniki kwantowej z praw klasycznych. Dla cząstki o masie m i całkowitej energii E możemy napisać równanie zachowania energii:

E=\dfrac{\hbar^2 k^2}{2m}+V(x,y,z),

gdzie V jest energią potencjalną (pierwszy składnik to zwykła energia kinetyczna). Jeśli wyznaczymy k^2 z ostatniego równania i wstawimy do równania Helmholtza, otrzymamy tzw. równanie Schrödingera bez czasu:

-\dfrac{\hbar^2}{2m}\Delta\psi+V\psi=E\psi.

Chcąc np. opisać ruch elektronu wokół nieruchomego jądra atomowego o ładunku Ze, należy wstawić do równania Schrödingera energię potencjalną postaci

V(r)=-\dfrac{Ze^2}{4\pi \epsilon_0 r},

czyli zwykłą energię potencjalną przyciągania elektrostatycznego dwóch ładunków Ze oraz -e w odległości r. Szukamy takich funkcji \psi(x,y,z), które daleko od jądra zanikają. Okazuje się, że rozwiązania takie są możliwe tylko dla dyskretnych wartości energii równych

E_n=-\dfrac{me^4}{2(4\pi\epsilon_0)^2 \hbar^2}\dfrac{1}{n^2}, \mbox{ gdzie } n=1,2, 3, \ldots.

 Jest to wynik uzyskany w roku 1913 przez Bohra z założeń, które od początku wydawały się aktem rozpaczy, a nie solidną nauką. Równanie Schrödingera miało więc sens, choć nadal brakowało pewnych elementów do kompletnej teorii. Jednym z najważniejszych było znaczenie samej funkcji \psi. Kiedy w piszczałce organowej czy w rurce fletu wytwarzany jest dźwięk, wiemy, co drga – jest to powietrze, które ściśnięte się rozpręża, a rozprężone wraca do początkowej gęstości. Co drga w atomie wodoru? Jakie jest znaczenie funkcji \psi? Co gorsza, okazało się, że powinna ona mieć wartości zespolone, z pewnością nie było to żadne proste drganie klasyczne. Geniusz Schrödingera ujawnił się i w tym, że nie próbował odpowiedzieć na wszystkie pytania naraz i pozwolił swoim ideom rozwijać się w czasie. Publikacje uczonego z pierwszego półrocza 1926 roku wystarczyły na Nagrodę Nobla i objęcie w roku 1927 katedry w Berlinie po odchodzącym na emeryturę Maksie Plancku.

Erwin Schrödinger, człowiek wszechstronnie wykształcony, o szerokich zainteresowaniach, całkowicie zaprzecza ascetycznej wizji uczonego, który nie ma czasu na nic oprócz nauki. Wydaje się wręcz, że jego pomysłowość przy stworzeniu słynnego równania szła w parze z gorączką miłosną. Praca ta powstała w uzdrowisku Arosa, gdzie wybrał się w towarzystwie do dziś nie znanej flamy. Jego małżeństwo należało do nowoczesnych i partnerzy pozostawiali sobie bardzo wielką swobodę. Były przecież lata dwudzieste: kobiety odsłoniły nogi, tańczono charlestona, wszyscy chcieli zapomnieć o koszmarze niedawnej wielkiej wojny.

 

 

 

 

 

Oscylator kwantowy: Paul Dirac i inni (1929-1930)

Mechanika kwantowa wprowadziła rewolucyjnie nowe pojęcie stanu układu fizycznego. Klasycznie stan układu znamy, gdy dane są jego położenie i pęd w pewnej chwili. Na tej podstawie możemy obliczyć przyszłe położenia i pędy (albo i przeszłe – mechanika jest symetryczna wobec zmiany strzałki czasu). Np. znając dziesiejsze położenie i pęd planety, możemy obliczyć, gdzie znajdzie się ona za sto lat albo gdzie była, powiedzmy, w czasach Keplera. Stan układu to punkt w przestrzeni polożeń q i pędów p. Ewolucja w czasie to ruch tego punktu w owej przestrzeni fazowej.

Mechanika kwantowa zastępuje klasyczną na poziomie mikroświata. Zupełnie jednak zmienia się pojęcie stanu układu. Stanem jest teraz nie punkt, lecz wektor, a właściwie cały promień, to znaczy wektor pomnożony przez dowoloną liczbę. Przestrzeń stanów (wektorów) umożliwia dodawanie dwóch stanów. Operacja taka nie miałaby sensu w mechanice klasycznej: bo niby jak mamy dodać do siebie położenie Marsa i położenie Jowisza? Co taka suma miałaby oznaczać? W mechanice kwantowej obowiązuje zasada superpozycji, czyli dodawania stanów.

Wikipedia: Double-slit experiment

Kiedy np. przepuszczamy elektron przez przesłonę z dwiema szczelinami, jego stan kwantowy będzie sumą stanu elektronu, który przeszedł przez szczelinę nr 1 oraz stanu elektronu, który przeszedł przez szczelinę nr 2. Stosując zapis wprowadzony przez Paula Diraca w 1939 roku, możemy to zapisać jako

|\varphi\rangle=| \varphi_1\rangle+| \varphi_2\rangle.

Fizycznie znaczy to, że nasz elektron trochę przeszedł przez szczelinę nr 1, a trochę przez szczelinę nr 2. Jego stan jest superpozycją dwóch stanów. Gdybyśmy chcieli wyznaczyć prawdopodobieństwo, że w jakimś punkcie ekranu x zarejestrujemy nasz elektron, należałoby obliczyć iloczyn skalarny z wektorem przedstawiającym elektron w x:

\langle x | \varphi \rangle=\langle x| \varphi_1\rangle+ \langle x| \varphi_2\rangle.

Zapis Diraca wziął się z rozłożenia nawiasu kątowego na dwie części: nazywa się je wektorem bra i ket (od angielskiego: bracket). Z pomnożenia skalarnego dwóch wektorów otrzymujemy liczbę (prędzej czy później będziemy potrzebowali liczb, jeśli teoria ma coś przewidywać ilościowo). Powyższy zapis Diraca można też zastąpić bardziej konwencjonalnym sumowaniem funkcji:

\varphi(x)=\varphi_1(x)+\varphi_2(x).

Wartość funkcji falowej w danym punkcie x można traktować jako składową wektora \varphi. Zapis Diraca \langle a|b\rangle pozwala nam patrzeć na funkcję jako iloczyn skalarny dwóch wektorów, jeszcze wygodniej jest często operować samymi wektorami stanu: nie precyzujemy wówczas, co chcielibyśmy mierzyć (może np. zamiast położenia, wolelibyśmy pędy – pierwsza forma zapisu  tego nie przesądza.

Mamy zatem abstrakcyjne wektory stanu i iloczyn skalarny. Wartości tego iloczynu skalarnego są na ogół zespolone, inaczej mówiąc, funkcje falowe są zespolone (*). Nie mogą one mieć bezpośredniego sensu fizycznego. Sens taki mają natomiast kwadraty ich modułów: |\varphi(x)|^2 daje nam prawdopodobieństwo zarejestrowania elektronu w punkcie x (dokładniej: gęstość prawdopodobieństwa, bo współrzędna przyjmuje dowolne wartości rzeczywiste). Tam gdzie prawdopodobieństwo jest duże, elektrony będą częściej trafiały, gdy zbierze się dostateczna statystyka, będziemy mogli zaobserwować, że „trafienia” układają się w prążki interferencyjne. Wynik jest taki, jakby dwie fale nakładały się na siebie.

Obrazki powyżej pochodzą z rzeczywistego doświadczenia Akira Tonomury, Proc. Natl. Acad. Sci. U.S.A. 102 (2005) 14952-14959. Liczba elektronów wzrasta od 10 do 140 000, widzimy, jak uwidaczniają się prążki interferencyjne. W doświadczeniu tym elektrony przepuszczane były pojedynczo, wiemy więc, że każdy elektron interferuje niejako sam z sobą, nie jest to skutek jakichś oddziaływań między nimi. Ze względów technicznych doświadczenie to przeprowadzone było stosunkowo niedawno, ale że wynik musi być właśnie taki, zdawali sobie sprawę już pierwsi badacze mechaniki kwantowej: Heisenberg, Born, Jordan, Dirac. W 1927 r. Lester Germer i Clinton Davisson oraz niezależnie George Paget Thomson zaobserwowali dyfrakcję elektronów, za co otrzymali Nagrodę Nobla (G.P. Thomson był synem J.J. Thomsona, który odkrył elektron, mówiono, że ojciec dostał Nagrodę Nobla za odkrycie, iż elektron jest cząstką, a syn – za odkrycie, że elektron jest falą). Oczywiście, elektron (podobnie jak np. foton) jest cząstką, do opisu której musimy stosować mechanikę kwantową.

Tak więc choć dodawanie stanów wydaje się abstrakcyjne, to w istocie jest obserwowane w eksperymentach. Skoro stany są wektorami i można je dodawać oraz mnożyć przez liczbę, to naturalnym rodzajem przekształceń takiej przestrzeni są operatory liniowe, czyli odwzorowania przypisujące każdemu wektorowi |\varphi \rangle jakiś inny wektor: A |\varphi \rangle, przy czym

A(\lambda_1 | \varphi_1\rangle+\lambda_2 |\varphi_2\rangle)=\lambda_1 A |\varphi_1\rangle+\lambda_2 A |\varphi_2\rangle,

gdzie \lambda_1,\lambda_2 są dowolnymi liczbami. Operatory takie w mechanice kwantowej zastępują wielkości fizyczne, które można mierzyć: mamy więc operatory pędu, położenia, energii itd. W jaki sposób formalizm ten pozwala otrzymywać w pewnych sytuacjach skwantowane wartości np. energii? Operator wielkości A działając na pewne odpowiednio wybrane wektory daje bardzo prosty wynik: mnoży wektor wyjściowy przez liczbę. Np.

A |\varphi_a\rangle=a|\varphi_a\rangle,

co zwykle zapisuje się krócej:

A|a\rangle =a|a\rangle.

Litera a oznacza wartość wielkości fizycznej, a więc powinna to być liczba rzeczywista, a przynależny jej stan |a\rangle jest wektorem. Mówi się, że jest to wektor własny, a wartość nazywamy wartością własną. Z doświadczalnego punktu widzenia, gdy układ jest w stanie własnym, to wynikiem pomiaru owej wielkości jest na pewno a. Przestrzeń stanów jest nieskończenie wymiarowa i może zawierać wiele różnych wektorów odpowiadających różnym wartościom własnym. Może się np. okazać, że tylko pewien dyskretny zbiór wartości jest dopuszczalny – i wtedy właśnie wielkość fizyczna się kwantuje.

Pokażemy, jak formalizm ten działa w przypadku oscylatora harmonicznego. Jest to najprostszy niecałkiem trywialny układ, mający zresztą liczne zastosowania: wszystko, co gdzieś drga, można w pierwszym przybliżeniu opisać jako oscylator harmoniczny albo ich zbiór – mogą to być drgania kryształów, atomów w cząsteczkach chemicznych, a nawet fale elektromagnetyczne, które matematycznie są podobne do oscylatorów.

W jednowymiarowym przypadku, gdy masa cząstki oraz częstość oscylatora są jednostkowe, energia ma postać:

E=\frac{1}{2}(p^2+x^2),

jest to więc suma kwadratów pędu i współrzędnej (kwadratowy potencjał odpowiada sile proporcjonalnej do wychylenia z położenia równowagi, jak w przypadku masy na sprężynie). W mechanice kwantowej zastępujemy tę funkcję operatorem Hamiltona (hamiltonianem), który ma postać taką samą, jak klasyczna:

H=\frac{1}{2}(p^2+x^2),

teraz jednak po prawej stronie mamy operatory pędu i położenia. Wiemy o nich od czasów Borna i Jordana oraz Diraca, że są nieprzemienne i spełniają regułę komutacji:

xp-px=i\hbar.

Okazuje się, że wystarczy to do znalezienia wartości energii oscylatora (dla uproszczenia przyjmiemy jednostki \hbar=1). Metoda, którą zastosujemy, przypisywana jest zwykle Paulowi Diracowi, choć w druku pojawiła się po raz pierwszy w książce Maksa Borna i Pascuala Jordana z roku 1930.

Hamiltonian jest sumą kwadratów, możemy więc spróbować rozłożyć go na czynniki. Wprowadzamy dwa nowe operatory:

a=\frac{1}{\sqrt{2}}(x+ip), \; a^{\dag}=\frac{1}{\sqrt{2}}(x-ip).

Gdyby x, p były liczbami rzeczywistymi, iloczyn obu naszych operatorów byłby równy hamiltonianowi. Musimy jednak uwzględnić nieprzemienność mnożenia operatorów:

a^{\dag}a=\frac{1}{2}(x^2+p^2+ixp-ipx)=H-\frac{1}{2}.

W podobny sposób możemy obliczyć iloczyn wzięty w odwrotnej kolejności:

aa^{\dag}=\frac{1}{2}(x^2+p^2-ixp+ipx)=H+\frac{1}{2}.

Odejmując ostatnie dwie równości stronami, otrzymamy

a^{\dag}a-aa^{\dag}=1.

Zbadajmy teraz wartości własne operatora N=a^{\dag}a – muszą one być o \frac{1}{2} mniejsze niż wartości własne operatora H. Jeśli |\lambda\rangle jest wektorem własnym N o wartości \lambda, to mamy

Na|\lambda \rangle=(a^{\dag}a)a|\lambda\rangle=(aa^{\dag}-1)a|\lambda\rangle=(\lambda-1)a|\lambda\rangle.

Oznacza to, że wektor a|\lambda\rangle też jest wektorem własnym N o wartości o 1 mniejszej. Działając kolejny raz operatorem a na tak uzyskany wektor, otrzymamy wektor o wartości własnej mniejszej o 2 itd. Procedura ta musi się jednak zakończyć po skończonej liczbie kroków, ponieważ operator N, tak jak i H, jest ograniczony od dołu. Hamiltonian jest sumą kwadratów i nie może mieć ujemnych wartości własnych, energia każdego układu ograniczona jest od dołu, gdyby tak nie było świat by się zapadł w stany o ujemnej energii. Znaczy to, że istnieje taki wektor |0\rangle, że

a  |0\rangle=0.

Po prawej stronie mamy wektor zerowy, czyli brak jakiegokolwiek stanu. Oczywiście, N |0\rangle=0, czyli wektorowi temu odpowiada zerowa wartość własna. Możemy teraz do tego wektora zastosować operator a^{\dag}, otrzymamy

Na^{\dag}|0\rangle=a^{\dag}aa^{\dag}|0\rangle=a^{\dag}(a^{\dag}a+1)|0\rangle=a^{\dag}|0\rangle,

czyli wektor a^{\dag}|0\rangle ma wartość własną 1. Powtarzając ten zabieg stosowania operatora a^{\dag} wykreujemy stany o wartościach własnych równych kolejnym liczbom naturalnym. Z tego powodu operator a^{\dag} nazywa się operatorem kreacji, a a – operatorem anihilacji. Generują one stany o większej bądź mniejszej wartości N. Zatem wartości własne naszego hamiltonianu równe są

E_n=n+\frac{1}{2}, \mbox{ gdzie  } n=0,1, 2,\ldots.

W zwykłych jednostkach energie wyrażają się przez częstość oscylatora \omega=\sqrt{\frac{k}{m}}:

E_n=\hbar\omega(n+\frac{1}{2}).

Wynik ten znany był od lat, po raz pierwszy jednak powstał w latach 1925-1926 spójny formalizm pozwalający otrzymać ten i wiele innych rezultatów.

Na obrazku widzimy rezultat zastosowania formalizmu: niebieska linia to kształt potencjału (parabola x^2), linie poziome oznaczają dozwolone wartości energii. Nawet najmniejsza energia musi być dodatnia: oznacza to, że kwantowy oscylator nigdy nie może spoczywać. Gdybyśmy zrobili kwantowe wahadło, musiałoby ono zawsze drgać. Z tego powodu nawet w temperaturze zera bezwględnego atomy w kryształach czy cząsteczkach chemicznych drgają – są to tzw. drgania zerowe.

Wynik dla oscylatora ma konsekwencje fizyczne: już w 1900 r. Max Planck zauważył, że energie te powinny przybierać skwantowane wartości, jeśli chcemy prawidłowo opisać promieniowanie ceieplne. Kilka lat później Albert Einstein wyjaśnił eksperymentalne wyniki dotyczące diamentu właśnie za pomocą tego kwantowania.

Prosty formalizm operatorów kreacji i anihilacji odegrał niezmiernie ważną rolę w rozwoju mechaniki kwantowej, pozwalając zbudować kwantową teorię pola. O jej początkach innym razem.

(*) Iloczyn skalarny dwóch wektorów przypisuje parze wektorów liczbę zespoloną i spełnia następujące aksjomaty:

\langle a| b\rangle=\langle b|a\rangle^{\star}.

\langle a| \lambda b+c\rangle=\langle a| b\rangle+\lambda\langle a| c\rangle.

Iloczyn wektora z samym sobą jest liczbą rzeczywistą nieujemną – kwadratem jego długości, zwanym też normą:

||{a}||^2:=\langle a|a\rangle.

 

 

Werner Heisenberg: pierwsza praca z mechaniki kwantowej (1925)

Dwudziestotrzyletni Heisenberg już od kilku lat był aktywnym uczonym zajmującym się fizyką teoretyczną atomu. Dwa lata wcześniej, po trzech latach studiów, zrobił doktorat w Monachium u Arnolda Sommerfelda, który pierwszy zwrócił uwagę na jego talent. Sommerfeld, aktywny uczestnik w rozwoju nowej dziedziny, miał dar przyciągania zdolnych studentów: czterech jego doktorantów otrzymało Nagrody Nobla, a wielu studentów i stażystów przewijających się przez jego instytut zyskało międzynarodową sławę. W latach dwudziestych Monachium traciło pomału pozycję na rzecz Getyngi, gdzie teoretykom przewodził Max Born. Mechanika kwantowa powstała w Getyndze, a także w Kopenhadze, dokąd Niels Bohr stale zapraszał młodych naukowców z całego świata. Heisenberg zdążył już spędzić długi staż u Bohra, wiosną roku 1925 pracowali tam intensywnie wraz ze starszym o półtora roku Wolfgangiem Paulim, który już wtedy stał się dla Heisenberga punktem odniesienia. Pauli zaczął pracę naukową zaraz po maturze publikacją na temat ogólnej teorii względności. Doktorat u Sommerfelda zrobił także po trzech latach studiów – w najkrótszym prawnie dopuszczalnym terminie. Napisał też w tym czasie długi, ponaddwustustronicowy artykuł przeglądowy na temat teorii względności, w którym omówiona została krytycznie cała literatura przedmiotu. Niezwykle utalentowany, Pauli znany był też z bezwzględnego atakowania prac, które uważał za bezwartościowe. W późniejszych latach słynne było jego powiedzenie o jakiejś słabej pracy: „to nawet nie jest błędne”.

Heisenberg w 1924 roku, podczas wykładu habilitacyjnego w Getyndze.

Chłopięco wyglądający Heisenberg zaangażowany był w ruch skautingowy, spędzał sporo czasu na wycieczkach z młodymi ludźmi. Panowała tam beztroska atmosfera braterstwa i wspólnego przeżywania przygód. Była to jednak organizacja stawiająca sobie cele paramilitarne. Werner Heisenberg wraz z kolegami odwiedzali np. regiony zamieszkane przez Niemców, a pozostające poza granicami Rzeszy, jak np. Górny Tyrol, Finlandia, gdzie było trochę niemieckich emigrantów, a także niektóre tereny Węgier i Polski. W przypadku Heisenberga chodziło chyba raczej o młodzieńczą przygodę, a także odskocznię od intensywnej pracy naukowej. Nie był zwolennikiem skrajnej prawicy, starał się być apolityczny, choć można o nim chyba powiedzieć, że był nacjonalistą. Podczas II wojny światowej nie widział nic niewłaściwego w wizytach w okupowanej Kopenhadze czy Krakowie. Zamiłowanie Heisenberga do spędzania czasu  wyłącznie w męskim towarzystwie wydało się potem podejrzane, gdy jego biografii zaczęło przyglądać się SS. Nie doszukali się jednak niczego nieobyczajnego, do tej pory zresztą uczony miał już żonę i powiększającą się gromadkę dzieci.

Niels Bohr stał się dla młodego Wernera nie tylko mentorem, ale także wzorem i duchowym ojcem. Z prawdziwym ojcem Augustem Heisenbergiem, profesorem bizantynistyki w Monachium, Werner miał stosunki dość napięte. Jak się zdaje, ojciec nie wierzył w jego talent, a może w ogóle w fizykę teoretyczną, która wciąż uchodziła za coś mniej solidnego niż prowadzenie eksperymentów. Werner jako nastolatek chciał zostać pianistą, fizykę wybrał dość późno. August źle reagował na złe wieści o synu, kiedy np. dowiedział się, że Werner ledwo zdał egzamin doktorski. Egzaminatorów było dwóch: teoretyk Sommerfeld oraz eksperymentator Willy Wien. Ten drugi szybko wykrył braki w wiedzy młodego człowieka, który nie potrafił obliczyć zdolności rozdzielczej mikroskopu ani powiedzieć, jak działa ogniwo elektryczne (cztery lata później mikroskop pojawi się w pracy Heisenberga na temat zasady nieoznaczoności). Wien dopiero po dyskusji z Sommerfeldem zgodził się przepuścić Heisenberga, ale jego ocena końcowa była słaba: cum laude (można było otrzymać doktorat summa cum laude, magno cum laude, cum laude i bez żadnego dodatkowego określenia). Wien w senacie uniwersytetu spotykał się z profesorem Heisenbergiem i nie omieszkał się poskarżyć. Werner potrzebował pomocy finansowej, ponieważ nie od razu uzyskał płatną posadę. Ojciec napisał do Borna, pytając o perspektywy naukowe syna. Prosił też Jamesa Francka, eksperymentatora z Getyngi, przyszłego noblistę, aby umożliwił Wernerowi pracę w swoim laboratorium. Franck się zgodził, ale niewiele z tego wyszło i Werner wrócił do pracy teoretyka. Bohr, skracający dystans, biorący udział we wspólnych wycieczkach z młodymi ludźmi, a także zapraszający ich do domu, stał się Heisenbergowi bardzo bliski zarówno pod względem naukowym, jak i prywatnym.

Co ciekawe, najważniejszą swą pracę naukową Heisenberg napisał z dala od Bohra i Pauliego, nie zwierzając się także Maksowi Bornowi. Jak się zdaje, Bohr przy całej swej życzliwości wywierał silną presję na otoczenie, co nie zawsze służyło młodszym, mniej asertywnym uczonym. W kwietniu 1925 roku Heisenberg dostał silnego ataku kataru siennego i wyjechał na wyspę Helgoland, gdzie nie było roślin i w związku z tym pyłku w powietrzu. Tam zdał sobie sprawę, że jedna z ostatnich prac Bohra jest błędna (chodziło w niej o podważenie zasady zachowania energii, tzw. praca BKS). Odbyło się to w scenerii godnej obrazów Caspara Friedricha, Werner spędził noc duchowych zmagań na skalistym wybrzeżu, czekając na wschód słońca. Udało mu się znaleźć nową metodę postępowania, zastosował ją do prostych przypadków. Nie był jednak pewny, czy jest na dobrym tropie. Po powrocie z Helgolandu wręczył gotową pracę Bornowi, pytając o opinię. Do ojca pisał w tym czasie: „Moja własna praca nie idzie w tej chwili najlepiej. Nie uzyskuję zbyt wielu rezultatów i nie wiem, czy w tym semestrze wyjdzie z tego następny artykuł”.

Max Born zadecydował, że pracę trzeba opublikować, mimo że nie rozumiał jej do końca. Pisał w lipcu 1925 roku do Alberta Einsteina: „Moi młodzi ludzie: [Werner] Heisenberg, [Pascual] Jordan, [Friedrich] Hund są znakomici. Muszę się czasem poważnie wysilić, aby nadążyć za ich rozważaniami. Wprost bajecznie opanowali tak zwaną zoologię termów. Najnowsza praca Heisenberga, która się niebawem ukaże, wygląda bardzo mistycznie, ale jest prawdziwa i głęboka”. Heisenberg po jej napisaniu wyjechał do Cambridge, a później do Kopenhagi. W tym czasie Born wraz z Jordanem starali się zrozumieć, co właściwie Heisenberg zaproponował. Okazało się, że jest to decydujący krok w oderwaniu się od tzw. starej teorii kwantów, czyli fizyki klasycznej z kwantowymi dodatkami, jak model atomu Bohra – gdzie orbity elektronów są obliczane klasycznie, tak jak orbity planet, a do tego dokłada się warunek kwantowania, mówiący, jakie orbity są dozwolone. Problemem tego modelu i jego późniejszych coraz bardziej wyrafinowanych matematycznie ulepszeń była wewnętrzna sprzeczność: w fizyce klasycznej niemożliwe są stabilne orbity elektronów. Cały obraz atomu jako kłębowiska orbit elektronowych jest fałszywy. Stawało się to coraz bardziej widoczne przed rokiem 1925.

Heisenberg postanowił z konieczności zrobić cnotę: Nie powinniśmy w ogóle wyobrażać sobie żadnych orbit, nikt nie zaobserwował elektronu na orbicie i nie ma sensu mówić tutaj o ruchu w sposób klasyczny. Należy ograniczyć się do wielkości, które są możliwe do zaobserwowania w doświadczeniach, porzucając spekulacje na temat ruchu elektronu w atomie. Trzeba zmienić fizykę na poziomie kinematyki: nie można opisywać ruchu elektronu tak, jak ruchu kamienia czy innego obiektu makroskopowego. Powoływał się przy tym na podejście Einsteina, który zwracał w teorii względności uwagę, że aby np. mówić o równoczesności, należy podać metodę eksperymentalnego rozstrzygnięcia, czy dane zdarzenia są równoczesne. Metodologia tego rodzaju niekoniecznie sprawdza się w budowaniu teorii fizycznych, ale Heisenbergowi w tamtym momencie pomogła.

Podstawową informacją na temat atomów były linie widmowe. Atom promieniuje fale elektromagnetyczne o pewnych określonych częstościach. Najprostszym układem, który wysyła taką falę, jest drgający elektron. Aby mieć układ drgający należy wyobrazić sobie, że na elektron działa siła zależna od wychylenia, tak jakby nasz elektron był na sprężynie. Jednowymiarowy układ tego rodzaju jest najprostszym oscylatorem (masa na sprężynie, innym przykładem jest wahadło). Do opisania fal emitowanych przez oscylatory atomowe w przypadku klasycznym możemy zastosować analizę Fouriera. Współrzędna naszego oscylatora (o częstości kołowej \omega) jest funkcją okresową, można ją więc przedstawić jako sumę sinusów i cosinusów:

{\displaystyle x(t)=\sum_{n=0}^{\infty}(A_n\cos n\omega t+B_n \sin\omega t)}.

Dwa ciągi liczb rzeczywistych A_n, B_n określają jednoznacznie funkcję. Możemy także zapisać tę sumę krócej w postaci zespolonej:

{\displaystyle x(t)=\sum_{n=-\infty}^{+\infty}x(n) e^{i\omega n t}, \mbox{ (*)}}

gdzie korzystamy ze wzoru Eulera: e^{iz}=\cos z+i\sin z. Z punktu widzenia fizyki ważna jest nie tylko częstość, ale także amplituda drgań. Wypromieniowywana przez oscylator moc jest proporcjonalna do kwadratu amplitudy, czyli sumy |x(n)|^2.

Heisenberg uznał, że zamiast budować model atomu, w którym elektron jakoś się porusza, należy skupić się na wielkościach możliwych do zaobserwowania, czyli częstościach i kwadratach amplitudy.

Przeanalizował następnie, w jaki sposób buduje się kwadrat x(t). Zgodnie z naszym rozwinięciem w szereg Fouriera kwadrat funkcji będzie równy

x^2(t)=\sum_{n}\sum_{m}x(n)x(m)e^{i\omega(n+m)t}.

Wyrażenie to ma postać rozwinięcia Fouriera, jeśli wprowadzimy nową nazwę indeksu p=n+m, to nasz kwadrat można zapisać następująco:

x^2=\sum_{p} e^{i\omega pt}\left(\sum_{n}x(n)x(p-n)\right).

Wyrażenie w nawiasie mówi nam, jak otrzymać rozwinięcie fourierowskie kwadratu funkcji:

x^2(p)=\sum_{n}x(n)x(p-n).

Inaczej mówiąc, aby otrzymać wyraz o częstości \omega p, musimy wysumować wszystkie iloczyny x(n), w których suma częstości jest równa \omega p.

Następnie, i to był najważniejszy pomysł pracy, zastanowił się Heisenberg nad tym, co powinno zastąpić rozwinięcie fourierowskie w sytuacji kwantowej. Pojawia się wtedy oczywiście wiele różnych częstości, nie można przyjąć, że są one wielokrotnością jednej tylko częstości \omega. Co więcej, częstości zależą teraz od dwóch wskaźników:

\omega_{mn}=\dfrac{E_{m}-E_{n}}{\hbar}, \mbox{  (**)}

jest to warunek Bohra, będący w istocie zasadą zachowania energii (\hbar jest stałą Plancka podzieloną przez 2\pi). Można więc uznać, że teraz potrzebujemy także amplitud zależnych od dwóch wskaźników. Współrzędna x naszego oscylatora powinna być jakoś reprezentowana przez zbiór owych amplitud:

x \rightarrow \left\{ x_{mn}e^{i\omega_{mn} t} \right\} .

Nie powinniśmy teraz liczyć na to, że x(t) jest sumą takich wyrazów, raczej mówimy o pewnym zbiorze, który reprezentuje współrzędną w mechanice kwantowej, Heisenberg był tu nieprecyzyjny, bo prawdopodobnie nie potrafił lepiej tego wyrazić.

Czym będzie w takim razie kwadrat współrzędnej albo – co ciekawsze – iloczyn dwóch współrzędnych x oraz y? Mówimy o tym samym układzie, którego zestaw energii, a więc i częstości, jest ustalony. Jeśli także y dane będzie podobnym zestawem co x powyżej, to iloczynowi powinien odpowiadać zbiór

xy \rightarrow \left\{ (xy)_{mp}e^{i\omega_{mp}t} \right\},

gdzie

\boxed{(xy)_{mp}=\sum_{n} x_{mn}y_{np}.}

Zauważmy, że definicja ta daje prawidłowy czynnik wykładniczy:

e^{i\omega_{mp}t}=e^{i\omega_{mn}t}e^{i\omega_{np}t},

gdyż korzystając z (**), otrzymujemy:

\omega_{mp}=\omega_{mn}+\omega_{np}.

Definicja z ramki okazała się najważniejszym wynikiem tej przełomowej pracy Heisenberga. Zauważył on natychmiast, że przy takiej definicji xy\neq yx, czyli mnożenie dwóch wielkości będzie na ogół nieprzemienne.

Potrzebował jeszcze warunku kwantowania, uzyskał go w dość skomplikowanej postaci. Następnie zastosował wynaleziony formalizm do przypadku oscylatora anharmonicznego, tzn. gdy siła oprócz składnika proporcjonalnego do wychylenia zawiera także poprawkę kwadratową w wychyleniu. Nie będziemy powtarzać jego rachunków, pokażemy tylko, co stało się w następnym miesiącu.

Otóż w czasie gdy Heisenberg wojażował, Born wraz z Jordanem (młodszym o rok od Heisenberga, a więc mającym dwadzieścia dwa lata!) przyjrzeli się jego pracy z bardziej matematycznego punktu widzenia. Max Born skojarzył po kilku dniach, że widział już kiedyś takie mnożenie jak w ramce. Było to jeszcze na studiach we Wrocławiu, a chodziło o mnożenie macierzy. Wielkości Heisenberga były po prostu macierzami. Zauważyli też obaj, że ów skomplikowany warunek Heisenberga można macierzowo zapisać jako

\boxed{xp-px=i\hbar \mathbf{I},}

gdzie x,p były macierzami położenia i pędu, a \mathbf{I} macierzą jednostkową. Wielkości kwantowomechaniczne były więc macierzami i to takimi, które nie komutują. Od komutowania dzieli je niewiele, bo tylko stała Plancka – znaczy to, że w wielu sytuacjach różnica ta będzie nie do wykrycia, gdyż stała Plancka jest mała w zwykłych jednostkach (ujmując to inaczej, to nasze, dostosowane do ludzkiego ciała, jednostki są ogromne w skali atomowej, bo my sami składamy się z ogromnej liczby atomów).

Trudno dziś uwierzyć, że Max Born, matematyk z wykształcenia, dawny asystent Hermanna Minkowskiego, musiał wygrzebywać z zakamarków pamięci definicję mnożenia macierzy. Algebra liniowa przez ostatnie sto lat stała się dziedziną bardzo podstawową i uczy się jej powszechnie, nie tylko ze względu na mechanikę kwantową, ale także różne bardziej przyziemne zastosowania, np. w statystyce.

Najprostszym zastosowaniem mechaniki macierzowej jest oscylator harmoniczny. Jego energia ma postać:

H=\dfrac{1}{2}m\dot{x}^2+\dfrac{1}{2}m\omega^2 x^2,

(gdzie m to masa oscylatora), a równanie ruchu (odpowiednik równania Newtona):

\ddot{x}+\omega^2 x=0.

Wyrażenia mają tę samą postać co w mechanice klasycznej (kropki oznaczają pochodną po czasie), ale wszystkie wielkości x,\dot{x},\ddot{x} są teraz macierzami. Nietrudno znaleźć postać macierzy x_{mn}. Można wybrać ją jako macierz symetryczną: x_{mn}=x_{nm} i jedyne nieznikające wyrazy równe są

x_{n,n-1}=x_{n-1,n}=\sqrt{\dfrac{n\hbar}{2m\omega}}.

Macierz energii (zwana hamiltonianem) staje się diagonalna, tzn. nie znikają jedynie wyrazy z jednakowymi wskaźnikami:

H_{nn}=\hbar\omega\left(n+\dfrac{1}{2}\right), \mbox{ gdzie }\, n=0,1,2,\ldots.

Nasze macierze są nieskończone, gdyż oscylator ma nieskończenie wiele stanów wzbudzonych. Całe obliczenie znaleźć można w klasycznej książce L.D. Landaua i E.M. Lifszyca, Mechanika kwantowa.

Mechanikę kwantową rozwijali ludzie młodzi pod kierunkiem starszych oraz Erwin Schrödinger. Isnieje dość zabawne zdjęcie z uroczystości noblowskich w roku 1933, gdy twórcy mechaniki kwantowej odbierali swoje nagrody. Mamy tam Diraca i Heisenberga z matkami oraz Schrödingera z żoną. Ten ostatni, już po czterdziestce, mógł być niemalże ojcem młodszych laureatów.

Warto dodać może parę słów o Pacualu Jordanie. Był potomkiem hiszpańskiego oficera wojsk napoleońskich i zawziętym nacjonalistą, a także nazistą. W roku 1933 Born z racji żydowskiego pochodzenia był już na emigracji, Getynga wyglądała zupełnie inaczej. Jordan, który brał od początku udział w powstaniu mechaniki kwantowej, współtworzył także równolegle do Paula Diraca kwantową teorię pola, czyli relatywistyczną mechanikę kwantową. Gdyby nie nazistowskie sympatie, z pewnością zostałby laureatem Nagrody Nobla. Z czysto naukowego punktu widzenia należała mu się ona, choć trudno nie podzielać wątpliwości szwedzkiego komitetu, że przyznanie nagrody w takich okolicznościach byłoby złym sygnałem dla świata.

 

 

P.A.M. Dirac i jego równanie (1927-1928)

Paul Dirac znany był z powściągliwej małomówności i z tego, że nie wdaje się w grzecznościowe pogaduszki. Richard Feynman opowiadał, że kiedy spotkał po raz pierwszy Paula Diraca na jakiejś konferencji, to po długiej chwili milczenia starszy uczony rzekł: „Mam równanie. Czy pan także?”

Rozmaite wypowiedzi Diraca cytowane są często jako żarty, gdyż brzmią z pozoru absurdalnie. Paul Adrien Maurice Dirac sprawiał wrażenie postaci beckettowskiej: chudy, z długimi kończynami i wielkimi stopami, nie okazujący emocji, porozumiewający się pełnymi zdaniami (ponieważ nie wolno zacząć zdania, jeśli się nie wie, jak je zakończyć), myślący w kategoriach logicznych i matematycznych, a nie emocjonalnych czy etycznych. Jego przyjaciel Charles Galton Darwin, fizyk, wnuk twórcy teorii ewolucji, dopiero po kilku latach znajomości z Dirakiem odważył się zapytać, co właściwie znaczą inicjały P.A.M. przed jego nazwiskiem. Po przeczytaniu Zbrodni i kary Dostojewskiego Dirac miał tylko jedną uwagę, i to raczej techniczną niż etyczną czy psychologiczną: otóż w książce słońce wschodzi dwukrotnie tego samego dnia.

Anegdota z równaniem mówi sporo o obu rozmówcach. Dirac cenił konkrety, lubił np. słuchać wielogodzinnych monologów Nielsa Bohra, ale wątpił, czy coś z nich wyniósł, ponieważ prawie wcale nie było w nich równań. Toteż cenił sobie niewątpliwie fakt, iż odkrył jedno z fundamentalnych równań przyrody, które stosuje się do wszystkich cząstek o spinie ½: a więc elektronów, protonów, nieodkrytych jeszcze wtedy neutronów oraz kwarków, z których nukleony się składają. Feynman pozostawił po sobie wprawdzie całki Feynmana, diagramy Feynmana i wiele innych osiągnięć, nie odkrył jednak nigdy żadnego fundamentalnego prawa przyrody i jak się zdaje jego ambicja cierpiała z tego powodu.

Jesienią 1927 roku Paul Dirac, młodzieniec zaledwie dwudziestopięcioletni, zaproszony został na Kongres Solvaya do Brukseli. Była to konferencja bardzo elitarna, gromadząca obecne i przyszłe znakomitości naukowe. Na pamiątkowym zdjęciu siedzi w samym środku za Einsteinem, wiemy, że bardzo był dumny z tej fotografii i posłał ją na swój macierzysty uniwersytet w Bristolu. Niewykluczone, że specjalnie usiadł za Einsteinem, jego teorię względności podziwiał bowiem od lat i poznał, zanim jeszcze zajął się fizyką atomową – jak to wtedy mówiono, czyli fizyką mikroświata. Najważniejsze postacie na tym zdjęciu to Niels Bohr i Max Born, przywódcy i patroni całego ruchu kwantowej odnowy w fizyce. W Kopenhadze i Getyndze tworzyły się zasady nowej mechaniki. Zaczęła ją praca Wernera Heisenberga z 1925 roku. Niedługo później dołączyli Born i Pascual Jordan.

Od jesieni 1925 roku mechanikę kwantową współtworzył też Paul Dirac. Był studentem Ralpha Fowlera w Cambridge. Fowler rozpoznał jego niebywały talent: młody inżynier elektryk i absolwent studiów drugiego stopnia z matematyki na uniwersytecie w Bristolu dostał stypendium do Cambridge i błyskawicznie uzupełnił braki z fizyki, nie tylko najnowszej, nie znał np. dotąd równań Maxwella. Fowler miał znakomite kontakty i chyba one przydały się Diracowi najbardziej. Młody uczony otrzymał od niego jeszcze przed drukiem korekty artykułu Heisenberga i zrozumiał ich znaczenie. Kiedy niedługo później opublikował swoją pierwszą pracę na temat mechaniki kwantowej, Max Born zdumiony był, że pojawił się ktoś spoza wąskiej grupy znanych mu ludzi pracujących w tej dziedzinie i w dodatku jego osiągnięcia są porównywalne do tego, co udało się stworzyć w Getyndze i Kopenhadze. Dirac, równieśnik Jordana, miał dwadzieścia trzy lata, pół roku mniej niż Heisenberg i dwa lata mniej niż Wolfgang Pauli. Pracował nad doktoratem. Dzięki Fowlerowi jego prace szybko się ukazywały w „Proceedings of the Royal Society”, a czas bardzo się wtedy liczył. Dirac zaczął korespondować z Hiesenbergiem, który od razu poczuł ogromny respekt do brytyjskiego kolegi. Po doktoracie wyjechał do Kopenhagi i Getyngi. Poznał wielu fizyków, ale nie zmienił swej metody pracy: przez sześć dni w tygodniu intensywne myślenie od rana do obiadu, w niedziele piesze wycieczki. Nie współpracował też z nikim, przez całe życie pracował sam, uważając, że tak jest najlepiej, bo ważne idee są zawsze dziełem konkretnego człowieka, nie zespołu.

Tak więc po dwóch latach swej naukowej kariery Dirac znalazł się w elitarnym gronie na Konferencji Solvaya. Przeszła ona do historii za sprawą dyskusji Bohra z Einsteinem, który nie potrafił się pogodzić z probabilistycznym charakterem nowej mechaniki – można w niej obliczać i przewidywać jedynie prawdopodobieństwa zdarzeń. To w trakcie jednej z takich dyskusji padły słynne słowa: „Bóg nie gra w kości”. W mechanice kwantowej zrezygnować trzeba także z pełnej wiedzy o zjawiskach w mikroświecie: im dokładniej zmierzymy położenie elektronu, tym mniej będziemy wiedzieli na temat jego pędu. Dirac zupełnie nie interesował się sporami filozoficznymi na temat podstaw mechaniki kwantowej. Dla niego była to piękna teoria, do której zbudowania się przyczynił, fascynowała go matematyczna elegancja całego obrazu, napisał zresztą niedługo później słynną książkę The Principles of Quantum Mechanics, przedstawiającą całą tę konstrukcję w niezrównany klarowny, choć też niezwykle zwięzły sposób.

Jesienią 1927 roku Paul Dirac pragnął odkryć swoje równanie. Chodziło o rozwiązanie zagadnienia elektronu w sposób zgodny z teorią względności Einsteina. Z problemem tym pierwszy zetknął się w roku 1925 Erwin Schrödinger, drugi outsider fizyki kwantowej, pracujący w Zurychu. Wiadomo było, że cząstki takie jak elektron związane są z pewnymi wielkościami falowymi. Schrödinger przyjął, że stan elektronu opisywany jest pewną funkcją położenia i czasu \psi(\vec{r},t). Funkcja ta spełniać musi równanie o postaci

i\hbar \dfrac{\partial\psi}{\partial t}=H\psi \mbox{ (*)},

gdzie H jest pewnym operatorem działającym na funkcję. Najłatwiej wyjaśnić to na przykładach. Operatorem takim jest np. mnożenie \psi przez którąś ze współrzędnych, np. x. Wynikiem działania tego operatora jest nowa funkcja równa x\psi. Innym operatorem jest różniczkowanie, np. po zmiennej x. Wynikiem działania tego operatora jest wówczas \frac{\partial \psi}{\partial x}. Innym przykładem operatora jest pochodna po czasie z lewej strony równania Schrödingera. Za każdym razem tworzymy z wyjściowej funkcji \psi jakąś nową funkcję. Operator H zwany hamiltonianem (albo operatorem Hamiltona) jest kwantową wersją wyrażenia na energię cząstki. Jeśli np. energia cząstki o masie m składa się z energii kinetycznej i potencjalnej V(\vec{x}), to możemy ją zapisać w postaci

E=\dfrac{{\vec{p}\,}^2}{2m}+V(\vec{x}).

Kwantowy operator Hamiltona będzie wówczas równy

H=-\dfrac{\hbar^2}{2m}\left(\dfrac{\partial^2}{\partial x^2}+\dfrac{\partial^2}{\partial y^2}+\dfrac{\partial^2}{\partial z^2}\right)+V(\vec{r})\equiv -\dfrac{\hbar^2}{2m}\Delta+V(\vec{r}).

Operator V(\vec{r}) jest po prostu operatorem mnożenia, energię kinetyczną konstruujemy z pędu za pomocą podstawienia

p_x\rightarrow -i\hbar\dfrac{\partial}{\partial x}

i analogicznie dla pozostałych współrzędnych. Równanie Schrödingera (*) jest podstawowym prawem mechaniki kwantowej. Rozwiązując je, dowiadujemy się, w jaki spośob zmienia się funkcja falowa, a więc stan naszego elektronu. Najprostszym możliwym rozwiązaniem tego równania w przypadku cząstki swobodnej (tzn. gdy V=0) jest funkcja opisującą falę:

\psi=A \exp{\frac{i}{\hbar}(\vec{p}\,\vec{r}-Et)}, \mbox{ (**)}

gdzie p_x, p_y, p_x oraz E są parametrami liczbowymi. Łatwo sprawdzić, że różniczkowanie tej funkcji sprowadza się do mnożenia przez odpowiedni czynnik i ostatecznie równanie Schrödingera da nam warunek:

E=\dfrac{\vec{p}\,^2}{2m},

jak powinno być dla cząstki swobodnej i parametry są składowymi pędu oraz energią cząstki. Zbudowaliśmy stan o określonej energii i jednocześnie określonym pędzie. Jasne jest, że przyjmujemy tu energię kinetyczną w postaci newtonowskiej, a więc nierelatywistycznej.

Erwin Schrödinger początkowo poszukiwał równania relatywistycznego dla swojej funkcji \psi i nawet takie równanie znalazł. Ma ono następującą postać w przypadku swobodnym:

\dfrac{1}{c^2}\dfrac{\partial^2 \psi}{\partial {t}^2}-\Delta \psi+\left(\dfrac{mc}{\hbar}\right)^2 \psi=0.

Podstawiając do niego funkcję (**), otrzymamy równanie

E^2-p^2c^2=m^2c^4,

a więc prawidłowy związek energii i pędu dla cząstki o masie m w teorii względności. Oczywiście równanie dla cząstki swobodnej niewiele znaczy, interesujące są przypadki, gdy mamy pewien potencjał V(\vec{r}), np. gdy elektron porusza się w polu elektrostatycznym nieruchomego protonu. Jest to prawie atom wodoru (prawie – ponieważ w prawdziwym atomie wodoru proton, choć znacznie masywniejszy, może też się poruszać). Nietrudno równanie Kleina-Gordona rozszerzyć tak, aby zawierało zewnętrzne pole elektromagnetyczne. Wiadomo było jednak, że elektron ma spin, co sprawia, że jego stany są podwojone i np. w polu magnetycznym ta różnica się ujawnia jako rozszczepienie linii widmowych (efekt Zeemana). Czemu więc Schrödinger nie opublikował tego równania, które dziś nazywa się równaniem Kleina-Gordona? Schrödinger uznał, że trzeba ograniczyć się na początek do równania nierelatywistycznego i opublikował równanie (*) zastosowane m.in. do atomu wodoru. Nie jest jasne, czy chodziło mu o brak spinu, czy może dostrzegł inne trudności z rozwiązaniami równania Kleina-Gordona.

Z punktu widzenia Diraca równanie Kleina-Gordona nie było rozwiązaniem problemu elektronu. Owszem, relatywistyczny związek między energią i pędem cząstki był spełniony, ale równanie zawierało drugą pochodną czasową, a nie pierwszą jak równanie Schrödingera. Zdaniem Diraca równanie podstawowe powinno być pierwszego rzędu w czasie, tak aby wartości funkcji falowej w danej chwili determinowały jej wartości w przyszłości (w przypadku równania drugiego rzędu należy znać jeszcze wartości pochodnych czasowych). Jak pogodzić to z relatywistyczną postacią energii? Hamiltonian powinien mieć postać:

H=\sqrt{-c^2\hbar^2 \Delta+m^2c^4},

Oczywiście, wyciąganie pierwiastka kwadratowego z laplasjanu nie jest operacją standardową. Inżyniersko nastawiony do matematyki Paul Dirac, nieodrodny spadkobierca Olivera Heaviside’a, nie zamierzał się poddawać z tak trywialnego powodu. Równanie dla cząstki swobodnej powinno być pierwszego rzędu w czasie, w teorii względności znaczy to, że powinno być także pierwszego rzędu w pochodnych przestrzennych – poniważ przestrzeń i czas są symetryczne u Einsteina. Należy więc szukać równania postaci

i\hbar \gamma^{\mu}\dfrac{\partial \psi}{\partial x^{\mu}}=mc\psi, \mbox{ (***)}

gdzie sumujemy po wskaźnikach czasoprzestrzennych \mu=0,1,2,3 oraz x^0=ct. Żądamy, aby \gamma^{\mu} nie zależały od czasu ani współrzędnych przestrzennych, a także aby dwukrotne zastosowanie operatora po lewej stronie dało nam m^2, jak w równaniu Kleina-Gordona – wtedy relatywistyczny związek energii i pędu będzie spełniony. Łatwo zauważyć, że stanie się tak, jeśli

\gamma^{\mu}\gamma^{\nu}+\gamma^{\nu}\gamma^{\mu}=2g^{\mu\nu}=2\cdot diag(1,-1-1-1),

gdzie g^{\mu\nu} jest metryką czasoprzestrzeni Minkowskiego. Jakimi obiektami muszą być owe cztery \gamma^{\mu}? Mają one antykomutować ze sobą, czyli ich iloczyn zmienia znak przy przestawieniu, a kwadraty mają być równe \pm 1. Dirac odkrył, że \gamma^{\mu} muszą być macierzami 4×4, a więc funkcja \psi musi zawierać cztery składowe:

\psi=\begin{pmatrix} \psi_1\\ \psi_2 \\ \psi_3 \\ \psi_4 \end{pmatrix}.

Inaczej mówiąc, równanie (***) jest układem czterech równań liniowych o stałych współczynnikach. Zaraz po Nowym Roku 1928 Ralph Fowler przekazał pracę do druku i miesiąc później się ukazała. Po miesiącu Dirac uzupełnił ją o drugą część. Mógł być teraz pewien: miał swoje równanie.

Dirac zaczął sprawdzać konsekwencje odkrytego równania. Okazało się, że zawiera ono informację o stanach spinowych elektronu. Co więcej, spinowy moment pędu okazywał się równy \hbar/2, a moment magnetyczny równy dokładnie magnetonowi Bohra. Znaczyło to, że w tym przypadku stosunek momentu magnetycznego do momentu pędu jest dwukrotnie większy niż dla orbitalnego momentu pędu, co potwierdzały eksperymenty (Nb. w roku 1915 Albert Einstein i Wander de Haas, zięć Hendrika Lorentza, przegapili okazję do pierwszorzędnego odkrycia doświadczalnego, zmierzyli bowiem ten stosunek i wyszedł im taki, jak oczekiwali, ale dwa razy mniejszy niż w rzeczywistości). Równanie elektronu Diraca w polu kulombowskim odtwarzało znane wyniki dla energii uzyskane wcześniej przez Arnolda Sommerfelda za pomocą relatywistycznej wersji modelu Bohra (model Bohra-Sommerfelda).

Co z czterema składowymi funkcji falowej? Potrzebne były dwie składowe do opisania spinu, ale cztery? Równanie Diraca zawiera rozwiązania zarówno dla energii dodatniej +\sqrt{p^2c^2+m^2c^4}, jak i -\sqrt{p^2c^2+m^2c^4}. Paul Dirac zauważył też, że rozwiązania te stwarzają realny problem: energia elektronu nie jest bowiem ograniczona z dołu, a to w przypadku układu kwantowego znaczy, że prędzej czy później powinien on przejść do stanu o niższej energii. W mechanice kwantowej panuje skrajny liberalizm: wszystko, co nie jest zabronione, jest dozwolone i się kiedyś zdarzy. Jedynym wyjściem wydawało się znaleźć jakiś zakaz, który musiałby być naruszany podczas takiego przejścia. Dwa lata później Dirac zaproponował, że stany o ujemnej energii są zajęte, więc ponieważ elektrony podlegają zakazowi Pauliego, zwykle nie ma takich przejść. Możliwe jest wzbudzenie elektronu z ujemną energią do stanu z energią dodatnią, pozostawi on dziurę, która będzie się zachowywać jak cząstka o takiej samej masie, lecz dodatnia. Otrzymujemy w ten sposób parę elektron i antyelektron. W 1932 roku cząstka taka została odkryta i nazwana pozytonem. Nic więc dziwnego, że już w roku następnym P.A.M. Dirac otrzymał Nagrodę Nobla (po połowie ze Schrödingerem). Inne wyjaśnienie dla rozwiązań o energii ujemnej podał później Richard Feynman: u niego pozytony są elektronami, które poruszają się wstecz w czasie, zamiast energii zmienia się znak czasu. Współczesna kwantowa teoria pola nie potrzebuje takich obrazów, wprowadza się w niej przestrzeń stanów bogatszą niż w mechanice kwantowej, gdyż pojawia się możliwość procesów kreacji oraz anihliacji par. Równanie Diraca obowiązuje nadal, lecz zamiast funkcji falowej mamy operator pola, obiekt jeszcze nieco bardziej abstrakcyjny.

Znakomitą biografię Diraca napisał Graham Farmelo, została ona jednak całkiem popsuta w polskim przekładzie, który językowo jest poniżej wszelkiej krytyki. Szkoda, bo pewnie nieprędko pojawi się drugie wydanie.

Elementy – Euklides (ok. 300 p.npe.)

Myślimy często o starożytnej Grecji jako o cywilizacji, która dała nam filozofię, teatr, poezję, historię, sztukę, logikę, demokrację. Mniej dostrzegane są początki nauk ścisłych, które, wbrew wszelkiemu prawdopodobieństwu, osiągnęły u Greków niezwykle wysoki poziom. Dwa najważniejsze dzieła, Elementy i Almagestpowstały w Aleksandrii, pierwsze na początku świetności miasta, drugie już pod jej koniec. Oddzielone od siebie ponad czterema wiekami, skondensowały w sobie to, co najlepsze w starożytnym dorobku. A bez greckiej geometrii i astronomii nie do pomyślenia byłaby późniejsza nauka islamska, a także praca Mikołaja Kopernika i jego następców prowadząca do rewolucji naukowej XVII wieku.

Tekst Elementów, podzielony na trzynaście ksiąg, obejmuje w sposób systematyczny najważniejsze osiągnięcia matematyki greckiej przed Archimedesem. Napisane około roku 300 p.n.e. dzieło było przez wieki kopiowane zarówno w greckim oryginale, jak i w przekładach na hebrajski, arabski i łacinę, a od 1482 roku zaczęło ukazywać się drukiem w niezliczonych wydaniach książkowych, które liczbą ustępują tylko wydaniom Biblii. Aż do początku XIX wieku znano tekst Euklidesa jedynie w redakcji Teona z Aleksandrii, uczonego z IV w.n.e., ojca Hypatii. W 1808 r. François Peyrard, pierwszy bibliotekarz École Polytechnique w Paryżu, odkrył, iż rękopis Elementów zrabowany z Watykanu przez Napoleona (Vaticanus graecus 190, zwany też P) jest wcześniejszą wersją dzieła. Stała się ona później podstawą definitywnego wydania opracowanego przez duńskiego filologa Johana Ludviga Heiberga.

[Vaticanus graecus 190]

Dzieło Euklidesa nie było pierwszym noszącym ten tytuł, szybko stało się jednak klasyczne, czego pośrednim dowodem jest fakt, że nie zachowały się niemal żadne wcześniejsze teksty matematyczne – w czasach gdy kopiowanie książek było kosztowne i pracochłonne, następowała swoista selekcja naturalna rękopisów, w której te bardziej przydatne wypierały mniej użyteczne. Elementy są najwcześniejszym zachowanym greckim traktatem poświęconym matematyce, ponieważ stanowią one podręcznik, z którego można nauczyć się podstaw matematyki. Stosowane były w tej funkcji nie tylko w starożytności, ale i w czasach późniejszych aż po dziewiętnasty wiek.

Zadziwiająco mało wiemy o autorze tekstu, nawet jego istnienie podawano w wątpliwość, argumentując, że dzieło jest niejednorodne i różne jego księgi wykazują rozmaity stopień dojrzałości. Na ogół sądzi się jednak, że Euklides działał i prawdopodobnie także urodził się w Aleksandrii, mieście niedługo wcześniej założonym przez Aleksandra Wielkiego i przez długie wieki stanowiącym ośrodek nauki i kultury greckiej. Według Proklosa, neoplatończyka z V w.n.e., Euklides żył za panowania Ptolemeusza I i był młodszy niż krąg uczniów Platona, a starszy od Archimedesa i Eratostenesa. Miał być platonikiem i z tego powodu dzieło jego kulminowało konstrukcją i omówieniem pięciu brył platońskich, znanych z Timajosa. Euklidesa nie uważano nigdy za oryginalnego twórcę, sądzono, że zebrał on i usystematyzował osiągniecia poprzedników, w szczególności Eudoksosa i Teajteta. Elementy nie są jednak prostą kompilacją znanego już materiału, lecz próbą zbudowania dedukcyjnego systemu wiedzy matematycznej. Możliwe, że tak jak i w późniejszej historii matematyki, po okresach szybkich postępów następowały okresy systematyzacji i porządkowania wiedzy i Elementy są świadectwem takiego dążenia. Choć odkrycia późniejszych matematyków, takich jak Archimedes, Apoloniusz i Pappus, znacznie wykroczyły poza problematykę Elementów, dzieło to pozostało najszerzej używanym podręcznikiem w historii. Jego znaczenie nie ogranicza się do matematyki: dedukcyjny system wiedzy stał się ideałem wielu późniejszych filozofów i uczonych. W naukach ścisłych aż do dziś uważa się możliwość ustrukturyzowania wykładu na wzór greckiej geometrii za ważny sprawdzian dojrzałości danej dyscypliny. Wprowadzając postulaty, z których następnie wyprowadzamy twierdzenia, osiągamy pojęciową jasność i większą przejrzystość konstrukcji myślowych, musimy bowiem uświadomić sobie jasno przyjęte założenia.

Pamiętać też należy, iż grecka geometria nie była traktowana jako abstrakcyjna gra logiczna, lecz jako teoria wywodząca się z obserwacji dotyczących ciał w przestrzeni, stanowiła więc i nadal stanowi (wraz z nieeklidesowymi rozszerzeniami) podstawę fizyki. Można więc traktować ją jako pierwszą matematyczną teorię fizyczną. Kiedy niedługo później Archimedes w podobny sposób ujmował zasady równowagi ciał, rozszerzał niejako geometrię, tworząc zarazem pierwszą fizykę matematyczną.

Poniżej skoncentrujemy się na przedstawieniu metody postępowania Euklidesa, ograniczając się do tego, co było znane i czytane najszerzej i nie ograniczało się tylko do samej matematyki. Aksjomatyczna konstrukcja wiedzy jest osiągnięciem greckim nie mniejszym niż demokratyczne rządy albo rzeźba. Dzięki Euklidesowi nigdy już nie stracono z oczu, przynajmniej w kręgu śródziemnomorskim, owej metody uzyskiwania zdań niezbitych i pewnych. Jeśli prawdą jest, że (jak ujął to Alfred North Whitehead) filozofia europejska stanowi ciąg przypisów do Platona, to z niemniejszą dozą słuszności powiedzieć można, że nauki ścisłe – fizyka w nie mniejszym stopniu niż matematyka – stanowią rozbudowany komentarz do Elementów Euklidesa.

Każda z ksiąg (albo grup ksiąg) poprzedzona jest definicjami. Księga pierwsza zaczyna się od wymienienia pięciu postulatów geometrii oraz pięciu ogólniejszych prawidłowości odnoszących się do tego, co Euklides nazywa wielkościami – może tu chodzić (jak czytelnik dowiaduje się przy okazji kolejnych twierdzeń) o długość odcinka, wielkość kąta, pole powierzchni czy objętość pewnych brył. Następnie z owych dziesięciu założeń wyprowadzane są kolejne twierdzenia oraz konstrukcje. Księgi I-IV oraz VI, XI-XIII poświęcone są geometrii, sięga V zawiera wykład teorii proporcji Eudoksosa (odgrywały one w matematyce greckiej rolę dzisiejszych liczb rzeczywistych), księgi VII-IX dotyczą arytmetyki, w księdze X dyskutowane są rozmaite rodzaje liczb niewymiernych, zawsze jednak traktowanych jako proporcje długości pewnych odcinków. Ostatnia księga XIII kończy się twierdzeniem, że istnieje dokładnie pięć brył platońskich (sześcian oraz foremne: czworościan, ośmiościan, dwunastościan i dwudziestościan).

Podejście Euklidesa niewątpliwie wiele zawdzięcza istniejącej już tradycji matematycznej, a także platońskiemu rozróżnieniu między przedmiotami postrzeganymi przez zmysły a bytami idealnymi: korzystając z rysunków, traktuje je tylko jako pomoc w wyobrażeniu sobie, jak mają się do siebie idealne figury geometryczne. Koncepcję uporządkowania wiedzy, zaczynając od założeń, których prawdziwość przyjmuje się bez dowodu, znaleźć można u Arystotelesa, nie wiadomo jednak, czy występuje tu jakaś bezpośrednia zależność, czy tylko wspólna tradycja filozoficzna. Geometria stała się pierwszą wyspecjalizowaną dziedziną wiedzy, uprawianą nie ze względów praktycznych, lecz dla niej samej. Wysokie mniemanie o pedagogicznych wartościach geometrii żywił Platon, sądząc, że kieruje ona uwagę ku temu, co wieczne i niezmienne. Stobajos przytacza następującą anegdotę:

Ktoś zaczął się uczyć u Euklidesa i kiedy poznał pierwsze twierdzenie, spytał:
– Co mi przyjdzie z tego, żem się tego nauczył?

Na to Euklides zawołał niewolnika i powiedział:

– Daj mu trzy obole, jeśli musi mieć zysk z tego, czego się uczy.

Omówimy bliżej główne linie rozumowania księgi I Elementów. Tekst poprzedzają 23 definicje, np. „Punkt jest tym, co nie ma żadnych części”, „Linia zaś jest długością bez szerokości”, „Równoległe są proste, które będąc na tej samej płaszczyźnie rozciągają się bez kresu w obie strony, ale w żadnej części się nie przetną” (przeł. M. Roszkowski). Linia prosta u Euklidesa jest zawsze skończona, tzn. jest odcinkiem wedle dzisiejszej terminologii. Dzisiejsi matematycy nie definiują wszystkich pojęć danej teorii, część z nich muszą bowiem stanowić pojęcia pierwotne, które przyjmuje się bez definicji, a ich sens ujawnia się dopiero, gdy badamy, w jaki sposób pojęcia występują one w aksjomatach i twierdzeniach.

Pięć postulatów głosi kolejno, że

1. Z każdego punktu do każdego innego można poprowadzić prostą (odcinek).
2. Odcinek można (obustronnie) przedłużać.
3. Z dowolnego środka można zakreślić okrąg przechodzący przez dany punkt.
4. Wszystkie kąty proste są wzajemnie równe.
5. Jeśli prosta przecina dwie inne proste, tworząca dwa kąty wewnętrzne mniejsze (w sumie) od dwóch kątów prostych, to można owe dwie proste przedłużyć tak, aby się przecięły.

Kąt prosty zdefiniowany jest tak, jak to widać na rysunku: gdy oba kąty utworzone przez półprostą o początku leżącym na danej prostej są równe, to kąty są kątami prostymi. Postulat 4 głosi, że dowolne kąty proste są równe, co znaczy tyle, że są przystające – mogą być na siebie nałożone tak, aby ich wierzchołki oraz ramiona się pokrywały (Euklides nie mówi tego wprost).

Pięć aksjomatów ogólnych stwierdza (w redakcji M. Kordosa):
1. Dwie wielkości równe trzeciej są równe.
2. Dodając do równych równe, dostajemy równe.
3. Odejmując od równych równe, dostajemy równe.
4. Wielkości dające się zamienić są równe.
5. Część jest mniejsza od całości.

Aksjomaty te stosowane są do porównania długości, kątów, figur, jak np. trójkąty. Mniejszy oznacza np. w przypadku odcinków, że po ich nałożeniu zostaje jeszcze jakaś niepokryta część większego (całości). Euklides nie posługuje się żadnymi miarami, porównuje tylko wielkości między sobą. Dlatego np. trójkąty są równe, gdy są przystające (można je na siebie nałożyć), ale także, gdy mają np. wspólną podstawę oraz jednakowe wysokości – dziś powiedzielibyśmy, że ich pola powierzchni są równe. Euklides nie myślał o długości jako liczbie, ani o polu prostokąta jako iloczynie długości boków, porównywał co najwyżej między sobą dwie wielkości.

Cały wykład podzielony jest na zagadnienia, które mogą być albo rozwiązaniem problemu konstrukcyjnego, albo twierdzeniem. W księdze I znajduje się 48 zagadnień, twierdzenie I,47 to twierdzenie dziś nazywane tw. Pitagorasa, I,48 to twierdzenie do niego odwrotne. Przyjrzyjmy się postępowaniu Euklidesa. Stosujemy dla przejrzystości nieco uwspółcześnioną terminologię, sformułowania nasze nie są wprawdzie dosłownym przekładem oryginału, ale też i nie odbiegają od niego zbyt daleko.

I,1 Mając dany odcinek AB, skonstruować na nim trójkąt równoboczny.

Konstrukcja sprowadza się do zakreślenia dwóch okręgów (Post. 3), które wyznaczą punkty przecięcia (co jednak nie wynika z aksjomatów Euklidesa, choć jest prawdą). Mając punkt przecięcia C, budujemy dwa odcinki AB oraz BC (Post. 1). Odcinki te są równe, ponieważ równe są odcinkowi AB (Aksj. 1). Trójkąt jest więc równoboczny. Warto zwrócić uwagę na eliminowanie kroków „oczywistych” i zastępowanie ich odwołaniami do postulatów i aksjomatów – w tym leży matematyczna siła Euklidesa, choć w oczach mniej matematycznie nastawionego czytelnika wywołuje to wrażenie (może nadmiernej) pedanterii.

I,2 Mając dany odcinek BC oraz punkt A nie leżący na nim, skonstruować odcinek AE=BC.

Łączymy w tym celu punkty AB (Post. 1) i budujemy trójkąt równoboczny za pomocą I,1. Promieniem BC zakreślamy okrąg o środku B (Post. 3). Przedłużamy następnie odcinek BD (Post. 2) do przecięcia z tym okręgiem H. Następnie promieniem HD zakreślamy okrąg o środku D. Przedłużenie AD (Post. 2) przetnie się z tym okręgiem w punkcie E. Odcinek AE (Post. 1) jest szukanym odcinkiem równym BC. Z aksjomatów ogólnych łatwo wnioskujemy, że odcinki te są równe, tzn. równe są ich długości (promień większego okręgu na rysunku to suma AB i boku trójkąta, odejmując potem bok trójkąta, otrzymujemy naszą tezę).
Warto zauważyć, że konstrukcje Euklidesa wykonywane są za pomocą linijki bez żadnej skali oraz cyrkla, który także nie pozwala przenosić odległości, lecz tylko poprwadzić okrąg z danego środka przez dany punkt (po przeniesieniu cyrkiel „nie pamięta” swego rozwarcia). Dzięki I,2 możemy uwolnić się od tego ograniczenia i odtwarzać odległość dwóch punktów w innym miejscu.

I,4 Dwa trójkąty, których dwa boki oraz zawarty między nimi kąt są równe, są przystające (równe).

Jest to cecha przystawania trójkątów bok-kąt-bok (bkb). Euklides dowodzi tego twierdzenia, nakładając na siebie oba trójkąty. Nie jest to postępowanie oczywiste, jeśli nie uważamy naszych figur za sztywne obiekty, które można przemieszczać bez zmiany kształtu i długości. David Hilbert przyjął w XIX w. to twierdzenie za jeden z aksjomatów w swoim wykładzie geometrii euklidesowej.

I,5 W trójkącie równoramiennym ABC, w którym AB=BC, kąty wewnętrzne przy podstawie są równe.

Przedłużamy ramiona trójkąta o jednakowe odcinki BF=CG. Trójkąty ABG i ACF są przystające na mocy poprzedniego twierdzenia, zatem także kąty ABG oraz ACF są równe. Trójkąty BFC i CGB są przystające na mocy tego samego twierdzenia (kąty BFC i BGC są równe, gdyż oba trójkąty pierwszej pary są przystające). Kąty ABC i BCA można przedstawić jako różnicę odpowiednio równych kątów (np. \sphericalangle ABC=\sphericalangle ABG-\sphericalangle CBG), muszą zatem być równe.
Twierdzenie to zyskało w średniowieczu nazwę Pons asinorum („ośli most”), nie wiadomo, czy z powodu kształtu towarzyszącego mu rysunku, czy też dlatego, że w tym miejscu ujawniał się już podział na tych, którzy rozumieją geometrię i na tych, którzy jej nie rozumieją. Pappus przedstawił prostszy dowód, w którym I,4 stosujemy do trójkątów BAC i CAB: ich boki są parami równe, a kąt przy wierzchołku jest tym samym kątem BAC, zatem oba trójkąty są przystające i kąty przy podstawie są równe. Euklides mógł mieć opory przeciwko takiemu potraktowaniu jednego trójkąta jako dwóch.

I,6 Jeśli kąty przy podstawie trójkąta są równe, to trójkąt jest równoramienny.

Euklides dowodzi tego twierdzenia przez sprowadzenie do niedorzeczności (reductio ad absurdum). Zakładamy, że teza twierdzenia jest fałszywa, a następnie staramy się wykazać, że wynika stąd zaprzeczenie założeń twierdzenia. Jeśli AB\neq AC, to któryś z odcinków jest większy, tzn. ma większą długość. Załóżmy, że AB>AC. Możemy wówczas na odcinku AB odłożyć odcinek AD=AC. Kąt DCB jest zatem mniejszy od kąta ACB. Jednocześnie trójkąt DBC jest równoboczny, a więc kąty DCB i DBC są równe na mocy poprzedniego twierdzenia. Kąt DBC jest tym samym, co kąt ABC, ergo ABC jest mniejszy od ACB wbrew założeniu.

I,9 Skonstruować dwusieczną danego kąta.

Na ramionach kąta odkładamy równe odcinki AD i AE. Następnie na odcinku AD konstruujemy trójkąt równoboczny. Jego trzeci wierzchołek wraz z wierzchołkiem kąta wyznaczają szukaną dwusieczną, co można łatwo udowodnić: kąty ADE i AED są równe jako kąty przy podstawie trójkąta równoramiennego. W takim razie także kąty ADF i AEF są równe i oba trójkąty ADF i AEF są przystające. Wobec tego kąty DAF i FAE są równe c.n.d.

I,11 Skonstruować prostopadłą do danej prostej w punkcie D.

Wyznaczamy na prostej dwa punkty A i B w równych odległościach od D: AD=DB. Następnie na odcinku AB konstruujemy trójkąt równoboczny. Jego trzeci wierzchołek C wraz z punktem D wyznaczają szukaną prostopadłą. Aby to udowodnić, zauważamy, że trójkąty ADC i BDC są przystające, a zatem kąty CDA i CDB są równe – spełniona jest więc definicja kąta prostego i oba te kąt są równe kątowi prostemu. Tym samym DC jest prostopadła do prostej AB.

I,20 (Nierówność trójkąta) Dwa boki trójkąta razem są dłuższe od trzeciego boku.

Niech będzie dany trójkąt CAB, chcemy dowieść, że odcinki AC wraz z CB są większe od AB. W tym celu na przedłużeniu AC odkładamy odcinek CD=CB. Kąt ABD jest większy od kąta CBD. Ten ostatni równy jest kątowi CDB, czyli ADB. W trójkącie ABD naprzeciwko większego kąta leży większy bok (I, 19; nie przytaczamy dowodu), a zatem AD=AC+CB>AB (stosując współczesny zapis).
Z twierdzenia tego wynika, że długość łamanej łączącej dwa punkty jest zawsze większa niż długość odcinka łączącego te punkty. W konsekwencji, jeśli połączymy oba punkty jakąś krzywą gładką, ale taką że zarówno samą krzywą, jak i jej długość można dowolnie przybliżać za pomocą łamanych, to długość łuku krzywej nie może być mniejsza niż długość odcinka łączącego dane punkty. Inaczej mówiąc, odcinek jest krzywą o najmniejszej długości (przy ustalonych obu końcach). Euklides nie dowodzi takiego twierdzenia, ale było ono znane greckim geometrom.
Dopiero blisko połowy księgi I staje się potrzebny Postulat 5.

I,29 Jeśli prosta EF przecina parę prostych równoległych AB i CD, to kąty naprzemianległe wewnętrzne są równe.

Wykażemy, że kąt AGF równy jest kątowi EHD. Załóżmy, że oba te kąty nie są równe. Niech np. AGF będzie większy od EHD. Ponieważ kąty AGF i BGF dopełniają się do dwóch kątów prostych (I,14; nie przytaczamy dowodu), więc suma kątów BGF i EHD jest mniejsza od dwóch kątów prostych. Z Post. 5 wynika, że proste AB i CD (po ewentualnym przedłużeniu) przetną się, nie są zatem – wbrew założeniu – prostymi równoległymi.
Postulat 5 sformułowany został tak, aby wygodnie się nim było posługiwać do wykazania, że dwie proste nie są równoległe. Nie wydawał się on tak oczywisty jak pozostałe i wzbudzał zawsze rozmaite wątpliwości. Jest on równoważny innemu postulatowi sformułowanemu przez Playfaira: Przez punkt nie leżący na danej prostej można przeprowadzić dokładnie jedną prostą równoległą do danej. Postulat 5 jest także równoważny twierdzeniu o sumie kątów wewnętrznych trójkąta.

I,32 Suma kątów wewnętrznych trójkąta równa jest dwóm kątom prostym.

Wystarczy zauważyć równość zaznaczonych kątów na rysunku (linia przerywana jest równoległa do boku trójkąta).

I,47 (Tw. Pitagorasa) W trójkącie prostokątnym suma kwadratów zbudowanych na przyprostokątnych jest równa kwadratowi zbudowanemu na przeciwprostokątnej.

Zwróćmy uwagę na sformułowanie: należy najpierw skonstruować kwadraty, o których mowa w twierdzeniu, a następnie wykazać, że suma (pól) dwóch mniejszych kwadratów jest równa polu kwadratu największego. Wysokość trójkąta opuszczona z kąta prostego po przedłużeniu dzieli kwadrat na dwa prostokąty. Euklides wykazuje, że dla trójkąta ABΓ oba pola zaznaczone na zielono oraz oba pola zaznaczone na niebiesko są równe.

Dowód Euklidesa korzysta z konstrukcji I,46 kwadratu na danym odcinku oraz linii równoległej do BΔ i ΓE przechodzącej przez dany punkt A (I,31). Wykazuje następnie, że AH jest przedłużeniem AΓ oraz AΘ jest przedłużeniem AB (I,14). Trójkąty ABΔ oraz ZBΓ są przystające na mocy twierdzenia I,4 (bkb). Prostokąt BΛ o podstawie BΔ ma tę samą wysokość co trójkąt ABΔ o tej samej podstawie. Na mocy I,41 prostokąt jest dwa razy większy od trójkąta (to wynik równoważny wzorowi na pole trójkąta, gdy określimy pole prostokąta). Kwadrat BH jest z tego samego powodu dwa razy większy od trójkąta ZBΓ o podstawie ZB. W analogiczny sposób pokazać można, że oba pola zaznaczone na niebiesko są równe, co kończy dowód.

W księdze VI Euklides przytacza inny dowód tw. Pitagorasa, oparty na podobieństwie mniejszych trójkątów na rysunku i trójkąta wyjściowego. Ten drugi dowód znany był prawdopodobnie wcześniej, dowód I,47, pochodzący zapewne od samego Euklidesa, jest bardziej zadowalający matematycznie, gdyż używa mniejszej liczby założeń: w księdze I daleko jeszcze jesteśmy od tak subtelnych konstrukcji jak figury podobne.
Ostatnie twierdzenie tej księgi I,48 jest odwrotne do tw. Pitagorasa: Jeśli spełniony jest warunek pól dla kwadratów zbudowanych na bokach trójkąta, to trójkąt ów jest prostokątny.

Elementy są podręcznikiem i były nim już w chwili powstania. Ścisłość rozumowań Euklidesa stała się wzorem dla przyszłych matematyków. Wybitny matematyk XX wieku André Weil pisał: „ [Elementy] Euklidesa to pierwszy zachowany tekst matematyczny, w którym pojęcie dowodu utożsamione zostało z łańcuchem wnioskowań pozbawionym luk; nie bez powodu ten sposób widzenia przedmiotu zachował swą aktualność do dziś”.

Nie sposób oczywiście przedstawić nawet pobieżnie wpływu książki czytanej w ciągu dwudziestu kilku wieków przez tysiące ludzi: wybitnych matematyków, jak i myślicieli czy po prostu uważnych czytelników mniej lub bardziej oddalonych od nauk ścisłych.

Greckie manuskrypty Elementów przechowywane były w Bizancjum. Od nich pochodziły przekłady arabskie, które z kolei dały początek rozpowszechnianiu się tekstu zarówno na Wschód (języki hebrajski, syryjski, perski), jak i na Zachód (łacina). W europejskim średniowieczu przekładano Euklidesa z arabskiego na łacinę wielokrotnie w wieku dwunastym i później. Już sama międzynarodowa lista tłumaczy daje pojęcie o zainteresowaniu Elementami: Adelard z Bath, Hermann z Karyntii, Gerard z Cremony, Robert z Chester, Campanus z Novary. Przekład tego ostatniego stał się podstawą pierwszego drukowanego wydania Elementów w Wenecji w roku 1482. W XVI wieku udało się też dotrzeć do tekstu greckiego (w wersji Teona). Od tamtej pory ukazały się niezliczone wydania oraz przekłady na języki narodowe (brak nadal kompletnego przekładu polskiego, choć już w 1808 Józef Czech, dyrektor Liceum Krzemienieckiego, przełożył osiem ksiąg, opierając się na angielskiej wersji Roberta Simonsa).

Twierdzenie Pitagorasa w weneckim wydaniu z 1482 r. (numeracja twierdzenia lekko w nim szwankowała)

Geometria oraz arytmetyka miały w średniowieczu mocną pozycję jako sztuki wyzwolone wchodzące w skład quadrivium („czterodroże”) wraz z astronomią i muzyką (która obejmowała głównie teoretyczną naukę o proporcjach dźwięków w różnych skalach). Także i później podstawy geometrii stanowiły nieodzowny element wykształcenia, Elementów długo jeszcze używano jako podręcznika. Bertrand Russell, logik i filozof, wspomina: „W wieku jedenastu lat zacząłem Euklidesa z moim bratem w roli tutora. Było to w moim życiu wielkie wydarzenie, równie olśniewające co pierwsza miłość. Wcześniej nie wyobrażałem sobie nawet, że istnieje na świecie coś tak zachwycającego. Kiedy przeszedłem Zagadnienie 5 (Pons asinorum), brat powiedział mi, że powszechnie uchodzi ono za trudne, ja jednak nie napotkałem w nim żadnych trudności. To wtedy po raz pierwszy zaświtało w mej głowie, że może obdarzony zostałem jakąś inteligencją”. Kilka lat młodszy Albert Einstein nie uczył się wprawdzie z Elementów, lecz z podręcznika będącego ich zmodernizowaną wersją; także dla niego odkrycie geometrii było wielkim przeżyciem, wspominał potem podręcznik jako „świętą książeczkę”, co w jego ustach – uduchowionego niedowiarka i spinozisty – miało swoją wymowę. Einstein sądził wręcz, że głęboki wstrząs intelektualny, jaki wówczas przeżył, stanowi niejako rodzaj probierza, czy ktoś się do nauki nadaje, czy nie. Zanim jeszcze podręcznik trafił w jego ręce, udało mu się znaleźć dowód twierdzenia Pitagorasa oparty na podobieństwie trójkątów (VI,31).

Metoda geometryczna kusiła też filozofów. Thomas Hobbes, mając już czterdzieści lat, natknął się w bibliotece znajomego gentlemana na egzemplarz Elementów, które otwarte były na stronie zawierającej twierdzenie Pitagorasa. Przeczytawszy jego treść, wykrzyknął: na Boga, to niemożliwe! Potem jednak cofając się stopniowo do twierdzeń, na których oparty był dowód, zrozumiał, że rozumowanie Euklidesa jest bez zarzutu. René Descartes sam był wybitnym matematykiem i z geometrią zapoznał się wcześnie w jezuickim kolegium w La Flèche. Właśnie na goemetrii wzorował się w swym podejściu do filozofii, która miała być nowym początkiem ludzkiej wiedzy. „Owe długie łańcuchy uzasadnień, zupełnie proste i łatwe, którymi zazwyczaj posługują się geometrzy, by dotrzeć do swych najtrudniejszych dowodzeń, dały mi sposobność do wyobrażenia sobie, że wszystkie rzeczy dostępne poznaniu ludzkiemu wynikają w taki sam sposób wzajemnie ze siebie, a także, że nie mogą istnieć tak odległe, do których byśmy wreszcie nie dotarli, i tak ukryte, których byśmy nie wykryli, bylebyśmy tylko nie przyjmowali za prawdziwą żadnej rzeczy, która by prawdziwą nie była, i zachowywali zawsze należyty porządek w wyprowadzaniu jednych z drugich” (przeł. W. Wojciechowska, Rozprawa o metodzie, PWN 1981, s. 23). Zdaniem Immanuela Kanta przedmioty, które bada matematyka: przestrzeń i czas nie pochodzą z doświadczenia, ale mają swe źródło w poznającym przedmiocie. Geometria stała się w ten sposób nauką o jedynie możliwej przestrzeni.

Tymczasem matematycy nabierali coraz więcej wątpliwości. Karl Friedrich Gauss już w roku 1813 rozmyślał nad geometrią nieuklidesową, lecz oportunistycznie nie zdecydował się na publikację swych wyników. Także Ferdinand Karl Schweikart, profesor prawa, rozwijał podobne idee w zaciszu gabinetu. Dopiero János Bolyai i Nikołaj Iwanowicz Łobaczewski, niezależnie od siebie zaryzykowali publikację prac sprzecznych z dotychczasową tradycją, nie były one przyjęte dobrze. Obaj zajmowali się geometrią hiperboliczną, w której istnieje nieskończenie wiele prostych równoległych do danej prostej. Postulat 5 Euklidesa jest bowiem niezależny od pozostałych i równie dobrze można zbudować konsekwentną geometrię, wychodząc z jego zaprzeczenia. Pod koniec XIX wieku David Hilbert podał ścisłe sformułowanie geometrii euklidesowej. Znalazło się w nim dwadzieścia aksjomatów, trzy pojęcia pierwotne (punkt, linia prosta, płaszczyzna) oraz cztery relacje pierwotne (leżenia pomiedzy, zawierania oraz przystawania odcinków oraz kątów). Różnica w podejściu między dawną geometrią a jej nowoczesnym, abstrakcyjnym sformułowaniem podkreślona została przez Hilberta następująco: „Powinno się w każdej chwili móc wstawić w miejsce punktów, linii i płaszczyzn – stoły, krzesła i kufle do piwa” (oczywiście pod warunkiem, że obiekty te spełniają aksjomaty geometrii).

Dlaczego grawitacja wiąże się z krzywizną czasoprzestrzeni?

  • Przeniesienie równoległe

Wyobraźmy sobie najpierw powierzchnię zanurzoną w przestrzeni euklidesowej. Załóżmy, że określiliśmy na niej pewne współrzędne x=(x^1, \ldots, x^n) . Położenie punktu powierzchni możemy więc zapisać jako \vec{r}=\vec{r}(x^i) . Pochodne tego wektora po współrzędnych, utworzą zbiór wektorów stycznych do naszej powierzchni:

\vec{e}_j=\dfrac{\partial \vec{r}}{\partial x^j}.

Dowolny wektor styczny do powierzchni w danym punkcie można przedstawić jako kombinację liniową \vec{e}_j:

\vec{v}=v^j \vec{e}_j,

gdzie sumujemy po powtarzającej się parze wskaźników: górnym i dolnym. Jest to tzw. konwencja Einsteina, uczony mówił żartobliwie, że stanowi ona jego największe odkrycie matematyczne. W geometrii ważną rolę odgrywa równoległość: wiemy, co znaczy, że dwa wektory w przestrzeni euklidesowej są równoległe. Można koncepcję równoległości przenieść na nieskończenie bliskie wektory na zakrzywionej powierzchni. W przestrzeni euklidesowej nasz wektor \vec{v} ma pozostać stały, co oznacza, że

\delta\vec{v}=0=\delta v^j \vec{e}_j+v_j \delta \vec{e}_j.

W drugim wyrazie uwzględniliśmy, że nasza baza względem przestrzeni euklidesowej może się obracać. Zmiana każdego z wektorów bazy powinna być równa:

\delta\vec{e}_j=\dfrac{\partial \vec{r}}{\partial x^j \partial x^i }\delta x^i\stackrel{.}{=}{\Gamma}^k_{ij}\delta x^i \vec{e}_k.

Ostatnia równość \stackrel{.}{=} to w istocie rzut wektora z lewej strony na płaszczyznę styczną, pomijamy więc tę część wektora, która „wystaje” z powierzchni. Podstawiając to do warunku równoległości, otrzymujemy

\delta v^k=-\Gamma_{ij}^k v^i \delta x^j. \mbox{ (*)}

Oznacza to, że współrzędne wektora równoległego nieco się zmienią i zmianę tę opisują współczynniki \Gamma , zwane uczenie koneksją afiniczną. Znając funkcje koneksji, możemy dokonać przesunięcia równoległego wektora. Jeśli rozpatrzymy pewną krzywą x^j=x^j(\tau) (gdzie \tau jest czasem własnym), pochodne współrzędnych utworzą wektor prędkości styczny do toru:

v^k=\dfrac{d x^k}{d\tau}.

Najprostszym fizycznie ruchem będzie przesunięcie równoległe tego wektora wzdłuż krzywej (linii świata):

\delta \left(\dfrac{d x^k}{d\tau}\right)=-\Gamma_{ij}^k v^i \delta x^k,

skąd otrzymujemy równanie geodezyjnej:

\dfrac{{d\,}^2 x^k}{d\tau^2}+\Gamma_{ij}^k \,\dfrac{d x^i}{d\tau}\,\dfrac{d x^j}{d\tau}=0. \mbox{ (**)}

Jest to warunek na przeniesienie równoległe wektora prędkości wzdłuż krzywej, a więc coś najbliższego ruchowi jednostajnemu i prostoliniowemu z I zasady dynamiki.

Możemy teraz zapomnieć o przestrzeni euklidesowej i rozpatrywać przestrzeń, w której określone są współczynniki koneksji. Mamy wówczas krzywe geodezyjne – coś najbardziej zbliżonego do linii prostej. W teorii względności krzywe geodezyjne opisują ruch cząstki pod działaniem pola grawitacyjnego. Jak widać współczynniki koneksji komplikują równania ruchu i można je uważać za składowe pola grawitacyjnego, czy dokładniej grawitacyjno–bezwładnościowego. Kiedy współczynniki koneksji znikają, wracamy do ruchu prostoliniowego i szczególnej teorii względności (tzn. nie ma pola grawitacyjnego).

Równania geodezyjnej mogą więc nieść informację o polu grawitacyjnym. Zgodnie z zasadą równoważności nic tu nie zależy od masy poruszającej się cząstki. Okazuje się, że można za pomocą koneksji opisać grawitację także w mechanice klasycznej (zrobił to É. Cartan, już znając teorię Einsteina). Automatycznie opisujemy też siły bezwładności. Z punktu widzenia fizyka wcale nie jest dziwne, że w równaniu geodezyjnej mamy aż dwie prędkości: powinniśmy bowiem w tym formalizmie otrzymać zarówno siły Coriolisa liniowe w prędkości, jak i siły odśrodkowe, kwadratowe w prędkości. Z punktu widzenia zasady równoważności nie możemy lokalnie rozstrzygnąć, czy w naszym przypadku mamy do czynienia z polem grawitacyjnym, czy siłami bezwładności.

  • Krzywizna

Koneksja pozwala nam przenosić wektory równolegle wzdłuż krzywej. Wynik takiego przesuniecia może więc zależeć od kształtu krzywej. Aby zobaczyć, jak to działa, rozpatrzmy przesunięcie równoległe wektora v^i po infinitezymalnym zamkniętym równoległoboku geodezyjnych: po drodze x, x+\delta a, x+\delta a+\delta b, x+\delta b, x. Łączna zmiana wektora dana jest wyrażeniem:

\delta v^i=-\Gamma_{kj}^i(x) v^k(x) \delta a^j-\Gamma_{kj}^i(x+\delta a) v^k(x+\delta a) \delta b^j\\ \\ +\Gamma_{kj}^i(x+\delta b) v^k(x+\delta b) \delta a^j+\Gamma_{kj}^i(x) v^k(x) \delta b^j.

Można to wszystko zapisać w postaci:

\delta v^i=R^i_{kjl} v^k \delta b^j \delta a^l, \mbox{(***)}

gdzie R^i_{kjl} nazywa się tensorem krzywizny Riemanna i wyraża wzorem:

R^i_{kjl}=\Gamma^i_{lk,j}-\Gamma^i_{jk,l}+\Gamma^i_{jm}\Gamma^m_{kl}-\Gamma^i_{lm}\Gamma^m_{kl}.

W ostatnim wyrażeniu przecinki przed indeksem oznaczają różniczkowanie po odpowiedniej współrzędnej: A_{,i}\equiv\frac{\partial}{\partial x^i}. Przestrzeń jest zakrzywiona wtedy i tylko wtedy, gdy tensor krzywizny jest różny od zera. (Wektory i tensory transformują się w odpowiedni sposób przy zmianie układu współrzędnych, tak że znikanie w jednym układzie oznacza znikanie we wszystkich.) Koneksja jest zatem nietrywialna, gdy tensor krzywizny znika. Równanie (***) można zilustrować poglądowo: zmiana wektora proporcjonalna jest tu do pola powierzchni równoległoboku. Ponieważ każdą powierzchnię możemy rozbić na takie równoległoboki, więc łączna zmiana wektora w przesunięciu równoległym po zamkniętej pętli powinna być związana z krzywizną oraz polem powierzchni pętli. W przypadku sfery krzywizna jest stała i kąt obrotu wektora jest proporcjonalny do pola powierzchni pętli. W teorii względności pojawienie się krzywizny oznacza, że mamy nietrywialne pole grawitacyjne.

Tensor krzywizny ma wiele symetrii, które sprawiają, że ma nieco mniej niezależnych składowych, niż to wygląda na pierwszy rzut oka. W przypadku dwuwymiarowej powierzchni ma tylko jedną składową, w czterowymiarowej – dwadzieścia.

Klasycznym zastosowaniem przeniesienia równoległego jest wahadło Foucaulta.

  • Równanie dewiacji geodezyjnej

Brzmi to okropnie, nieco bardziej logiczne jest określenie: dewiacja linii geodezyjnych. Chodzi o to, co dzieje się wzdłuż pobliskich linii geodezyjnych. Możemy sobie wyobrazić dwie cząstki pyłu, które znajdują się nieskończenie blisko siebie w chwili początkowej. Obserwujemy, jak bedzie się zachowywać z czasem ich odległość mierzona różnicami współrzędnych. Zakladamy, że rozsądnie zaczynamy liczyć czas, tak żeby ułatwić porównanie dwóch ruchów.

Równanie dewiacji ma następującą postać:

\dfrac{D^2 \eta^i}{D\tau^2}=R^i_{jkl}\,\dfrac{dx^j}{d\tau}\,\dfrac{dx^k}{d\tau}\,\eta^l.

Różniczkowanie po lewej stronie oznacza pochodną po czasie własnym obliczoną jednak z uwzględnieniem przeniesienia równoległego. Nie możemy bowiem porównywać w przestrzeni zakrzywionej wektorów w dwóch różnych punktach przestrzeni, najpierw należy przenieść jeden z nich do punktu zaczepienia drugiego. Różnicę wektora wzdłuż krzywej wynikającą z jego zmiany: \frac{d\eta^i}{d\tau}d\tau należy poprawić, odejmując zmianę wynikającą z przesunięcia (*), łącznie otrzymamy

\dfrac{D\eta^i}{D\tau}=\dfrac{d\eta^i}{d\tau}+\Gamma^i_{jk}\,\dfrac{dx^j}{d\tau}\,\eta^k.

Jest to tzw. pochodna absolutna wzdłuż krzywej. Używając tego zapisu, możemy równanie geodezyjnej (**) zapisać w postaci

\dfrac{D}{D\tau}\dfrac{dx^i}{d\tau}=0.

Pochodna absolutna znika, gdy współrzędne wektora zmieniają się jedynie za sprawą przesunięcia równoległego, czyli w sensie fizycznym można powiedzieć, że się nasz wektor nie zmienia – przenosi się jedynie równolegle wzdłuż krzywej.

  • Równania pola Einsteina

Warto zauważyć, że do tej pory nie mówiliśmy nic o metryce naszej przestrzeni. W szczególnej teorii względności mamy naturalną miarę odległości dwóch zdarzeń w czasoprzestrzeni:

ds^2=dt^2-dx^2-dy^2-dz^2.

(Przyjmujemy c=1.) W zakrzywionej czasoprzestrzeni ogólnej teorii względności możemy zawsze wprowadzić taki układ współrzędnych, w którym interwał ds^2 przyjmie powyższą postać w danym punkcie. Nie można natomiast zwykle zrobić tego globalnie. Interwał czasoprzestrzenny ogólnie biorąc określa tensor metryczny g_{\mu\nu}. Podaje on przepis na obliczenie interwału za pomocą danych współrzędnych (gdy zmienimy współrzędne, postać metryki też się odpowiednio zmieni):

ds^2=g_{\mu\nu}dx^{\mu}dx^{\nu}.

Tutaj wskaźniki \mu,\nu=0,1,2,3. Mamy tu 10 niezależnych wartości (symetryczna macierz 4×4). Z matematycznego punktu widzenia koneksja i metryka to dwie różne struktury. Można je uzgodnić i tak jest w ogólnej teorii względności. Koneksja oraz tensor krzywizny wyrażają się przez metrykę. Lokalnie, w danym punkcie, nie tylko metryka może przybrać wartości znane ze szczególnej teorii względności, ale także współczynniki koneksji mogą znikać. Nie ma natomiast takiej transformacji współrzędnych, która sprowadza tensor Riemanna do zera, jeśli był niezerowy w innym układzie współrzędnych. Tensor Riemanna zawiera pierwsze i drugie pochodne metryki. Geodezyjne możemy też zdefiniować jako krzywe najkrótszej/najdłuższej długości, i są to wówczas te same geodezyjne co zdefiniowane wyżej.

Z fizycznego punktu widzenia metryka przypomina potencjał, a współczynniki koneksji – siły. Jaką postać moze mieć równanie pola w teorii Einsteina? Źródłem pola grawitacyjnego są masy, a u Einsteina także pędy i energie. Dla zbioru cząstek opisu dostarcza symetryczny tensor energii pędu: T_{\mu\nu}. Potrzebujemy więc jakiegoś tensora krzywizny o dwóch wskaźnikach. Taką wielkością jest tensor Ricciego zdefiniowany jako

R_{\mu\nu}=R^{\lambda}_{\mu\lambda\nu},

(sumowanie po wskaźnku \lambda). Można więc oczekiwać równania typu

R_{\mu\nu}=\kappa T_{\mu\nu}.

I jest to prawie dobre równanie, należy tylko zmodyfikować w nim lekko lewą stronę. Rzecz w tym, że tensor energii pędu powinien być zachowany, a lewa strona, tensor Ricciego nie spełnia tego warunku. Należy zastąpić go więc tensorem Einsteina:

G_{\mu\nu}=R_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R=\kappa T_{\mu\nu},

gdzie R to skalar Ricciego: R=g^{\mu\nu}R_{\mu\nu} (g^{\mu\nu} jest macierzą odwrotną do g_{\mu\nu}. Jest to subtelność techniczna, na którą natrafił Einstein w listopadzie 1915 roku: 11 listopada proponuje pierwszą wersję, a 25 listopada tę niższą, już prawidłową. Ostatnie równanie można też przepisać w równoważnej postaci:

R_{\mu\nu}=\kappa (T_{\mu\nu}-\frac{1}{2}g_{\mu\nu}T^{\lambda}_{\lambda}).

W dalszym ciągu przyda nam się składowa 00 tego równania, w najprostszej sytuacji spoczywającej materii tylko składowa 00 tensora energii pędu jest różna od zera i równa jest gęstości materii \varrho. Otrzymamy wówczas

R_{00}=\kappa (T_{00}-\frac{1}{2}T_{00})=\frac{1}{2}\kappa T_{00}=\frac{1}{2}\kappa \varrho.

Aby znaleźć stałą \kappa, należy skorzystać z równań dla grawitacji Newtonowskiej, która powinna być przypadkiem granicznym.

W tym celu wyobraźmy sobie równanie dewiacji zastosowane do dwóch swobodnie spadających cząstek. Zakładamy, że w chwili początkowej \tau=0 obie spoczywają względem siebie. Wybieramy układ współrzędnych związany z cząstką centralną (względem której obliczana jest dewiacja). W takim układzie odniesienia czas własny i czas t są tym samym. Dla wskaźników przestrzennych i=1,2,3 równanie dewiacji sprowadza się do

\dfrac{d^2\eta^i}{dt^2}=R^{i}_{00l}\eta^l=-R^i_{0l0}\eta^l.

Skorzystaliśmy z faktu, że nasza cząstka centralna spoczywa: \frac{dx^\mu}{dt}=(1,0,0,0). W drugiej równości zmieniliśmy znak wraz z przestawieniem pary ostatnich wskaźników w tensorze Riemanna. Wynik ten obowiązuje dla trzech przyspieszeń wzdłuż trzech osi kartezjańskich. Załóżmy, że mamy kulę pyłu o promieniu r, początkowo nieruchomą, której środek obraliśmy za początek wektora \eta. Objętość kuli to

V=\dfrac{4\pi}{3}r_x r_y r_z,

gdzie zaznaczyliśmy, że wzdłuż trzech osi kartezjańskich promienie mogą się zmieniać niezależnie (przekształcając kulę w elipsoidę). Obliczając drugą pochodną objętości w chwili t=0 (pamiętamy, że pierwsze pochodne znikają), otrzymujemy:

\dfrac{\ddot{V}}{V}=\dfrac{\ddot{r}_x}{r_x}+\dfrac{\ddot{r}_y}{r_y}+\dfrac{\ddot{r}_z}{r_z}=-R_{00}.

W ostatniej równości, skorzystaliśmy z faktu, że R^0_{000}=0 – można więc sumowanie po wskaźnikach przestrzennych rozszerzyć o wskaźnik czasowy. Możemy tę samą wielkość obliczyć z Newtonowskiego prawa ciążenia. Przyspieszenie grawitacyjne na powierzchni kuli pyłu o masie M równe jest

g=\dfrac{GM}{r^2},

Wobec tego druga pochodna objętości spełnia równanie

\dfrac{\ddot{V}}{V}=-3\dfrac{g}{r}=-4\pi G \varrho.

gdzie \varrho to gęstość naszej kuli (&). Zatem szukana stała równa jest \kappa=8\pi G. Równanie Einsteina powinno mieć zatem postać.

G_{\mu\nu}=8\pi G T_{\mu\nu}.

Podsumowując, w roku 1915 Albert Einstein (podobnie zresztą jak najlepsi ówcześni matematycy) nie rozumiał dokładnie roli tensora Ricciego i nie widział, że równania pola są praktycznie wyznaczone przez kilka dość prostych warunków matematycznych. Oczywiście, nie są to jedyne możliwe matematycznie równania, ale jak pokazują przykłady późniejszych teorii grawitacji (a było ich przez sto lat sporo), równania Einsteina są najprostsze i jak dotąd potwierdzane są przez obserwacje. Kiedy później uczony zrozumiał, że w gruncie rzeczy można by dojść do teorii grawitacji drogą matematyczną, zaczął wyżej cenić osiągnięcia czystej matematyki. Stało się to poniekąd źródłem jego późniejszych niepowodzeń przy konstrukcji jednolitej teorii pola: z braku danych fizycznych szukał bowiem drogi matematycznej. Skonczyło się na dość jałowych próbach, które nie wzbogaciły zbytnio ani matematyki, ani fizyki.

(&) Nie jest to całkiem ścisłe rozumowanie, ponieważ milcząco założyliśmy, że nie ma innej materii niż kula pyłowa. Naprawdę należałoby obliczyć strumień pola grawitacyjnego przez powierzchnię kuli (on już zależy wyłącznie od tego, co znajduje się wewnątrz kuli), a potem skorzystać z tw. Gaussa-Ostrogradskiego i obliczyć dywergencję pola grawitacyjnego w punkcie centralnym. Tę wartość można porównać z tym, co wynika z równania dewiacji geodezyjnej. Oczywiście wynik jest taki sam.

Nie rozwijałem tu kwestii, czym są tensory. W największym skrócie są to obiekty niezależne od wyboru współrzędnych, podobnie jak trójwymiarowe wektory (które są szczególnym jednowskaźnikowym typem tensora). W teorii Einsteina dopuszczamy praktycznie wszelkie gładkie transformacje współrzędnych (ogólna kowariantność). Równania prawidłowo zapisane w ten sosób automatycznie słuszne będą w każdym układzie współrzędnych. Einstein wrócił do tensorów już w trakcie swej „rewolucji listopadowej” – kiedy co tydzień publikował nową pracę na temat teorii grawitacji, przy okazji modyfikując albo zmieniając poprzednie. Ten dziwny tryb publikowania wiązał się z tym, że w Getyndze David Hilbert, jeden z czołowych matematyków świata, także pracował nad podobną teorią. Einsteinowi groziło, że po siedmiu latach pracy zostanie prześcignięty, by tak rzec na ostatnich metrach przed finiszem. Nigdy później (ani wcześniej) nie publikował tak gorączkowo. Starał się też zazwyczaj wykazywać bardziej olimpijski spokój, co oczywiście było znacznie łatwiejsze, kiedy się było autorem epokowej teorii.

Gdyby ktoś chciał szczegółowo przejść obliczenia tensora krzywizny i równania dewiacji, może znaleźć je np. tutaj, na stronie Alana Heavensa s. 22-24.

Interpretacja tensora Ricciego za pomocą objętości kul opisana jest np. w pracy Johna C. Baeza i Emory’ego F. Bunna.