Widmo wodoru i symetrie (2/2)

III. Wolfgang Pauli (1925)

Mechaniką kwantową nazywano z początku jedynie podejście macierzowe zapoczątkowane przez Wernera Heisenberga. Heisenberg nie potrafił jednak sobie poradzić z rachunkami dla atomu wodoru. Pierwsze kwantowe obliczenia energii stanów związanych elektronu w atomie wodoru przeprowadził Wolfgang Pauli. Wiemy z listu Heisenberga, że stało się to przed początkiem listopada 1925 r. Dopiero w połowie stycznia Pauli nadesłał tę pracę do „Zeitschrift für Physik”. Z kolei pierwsza praca Schrödingera w „Annalen der Physik” nosi datę wpłynięcia do wydawcy 27 I 1926 r. Obaj autorzy próbowali także rozwiązać zagadnienie relatywistyczne, ale im się to nie udało. Podejście Schrödingera omówiliśmy w poprzedniej części. Teraz zajmiemy się historycznie wcześniejszym, czysto algebraicznym podejściem Pauliego. 

Mamy do czynienia z hamiltonianem

H=\dfrac{{\bf p}^2}{2m}-\dfrac{e^2}{r}.

Rozwiązując zagadnienie klasyczne, należy znaleźć jak najwięcej całek ruchu, czyli wielkości zależnych od pędu i współrzędnych, które nie zmieniają się z czasem. Taką wielkością jest sam hamiltonian (zasada zachowania energii), a także moment pędu

L_i=\varepsilon_{ijk}x_jp_k,

gdzie sumujemy po powtarzających się indeksach, a \varepsilon_{123}=1, a poza tym jest antysymetryczne we wskaźnikach, tzn zmienia znak przy każdej zamianie pary wskaźników, np.

\varepsilon_{213}=-\varepsilon_{123}=-1;\;\; \varepsilon_{223}=-\varepsilon_{223}=0.

W prawej części zastosowaliśmy regułę antysymetrii do przestawienia wskaźników 22, co oczywiście nic nie zmienia i dlatego nasz symbol antysymetryczny znika. Pauli skorzystał z faktu, że w przypadku ruchu keplerowskiego, znana jest jeszcze inna całka ruchu – wektor Lagrange’a-Laplace’a-Rungego-Lenza, o którego zawiłych dziejach pisaliśmy wcześniej:

{\bf R}=-\dfrac{e^2 {\bf x}}{r}+\dfrac{{\bf p}\times {\bf L}}{m}.

W przypadku kwantowym operatory pędu i momentu pędu nie komutują ze sobą, więc ich kolejność w iloczynie wektorowym nie jest oczywista. Ponadto nasz wektor powinien mieć składowe hermitowskie, jeśli ma opisywać jakąś wielkość fizyczną. Pauli stwierdził, że odpowiednim wektorem będzie

{\bf R}=-\dfrac{e^2 {\bf x}}{r}+\dfrac{1}{2}\,\dfrac{{\bf p}\times {\bf L}-{\bf L}\times{\bf p} }{m}.

Korzystamy ze związków komutacyjnych pędu i współrzędnych znalezionych przez Heisenberga: [x_j,p_j]=i\hbar \delta_{ij}, gdzie symbol Kroneckera równy jest 1, gdy i=j i znika w pozostałych przypadkach. Okazuje się, że mamy wówczas następujące związki komutacyjne: 

gif

Trójka operatorów R_{i} komutuje też z hamiltonianem, czyli rzeczywiście jest to stała ruchu: [H, R_{i}] =0. Jeśli ograniczymy się do stanów o ustalonej energii E<0, możemy hamiltonian uważać za mnożenie przez tę energię:

png

Czynnik liczbowy po prawej stronie możemy uprościć, definiując nowy wektor

{\bf B}=\sqrt{\dfrac{m}{-2E}}{\bf R}.

Cała algebra upraszcza się, gdy zdefiniujemy nowe operatory:

{\bf A}_{\pm}=\dfrac{1}{2}\left({\bf L}\pm {\bf B}\right).

Mamy wtedy

[A_{\pm i}, A_{\pm j}]=i\hbar \varepsilon_{ijk} A_{\pm k},

dwie trójki operatorów zachowujące się dokładnie tak jak moment pędu:

[L_i,L_j]=i\hbar \varepsilon_{ijk} L_k.

Obie trójki operatorów komutują między sobą: [A_{+i},A_{-j}]=0. Możemy zastosować tutaj fakty znane w przypadku momentu pędu: dozwolone wartości kwadratu operatora to

\begin{array}{l} {\bf A}_{+}^2=\hbar^2 a_{-}(a_{-}+1), \\[10pt] {\bf A}_{-}^2=\hbar^2 a_{+}(a_{+}+1).\end{array}

Wektory {\bf R} oraz {\bf L} są prostopadłe: {\bf R}\cdot {\bf L}=0. Wobec tego

{\bf A}_{\pm}^2=\dfrac{1}{4}\left({\bf L}^2+\dfrac{m}{-2E}{\bf R}^2\right).

Oznacza to, że wartości obu kwadratów są jednakowe: a_{+}=a_{-}\equiv a. Obliczając kwadrat wektora LLRL, otrzymujemy:

{\bf R}^2=e^4+\dfrac{2H}{m}\,(L^2+\hbar^2)=e^4-\dfrac{-2E}{m}\,(L^2+\hbar^2).

Zatem

{\bf A}_{\pm}^2=\dfrac{1}{4}\left(\dfrac{me^4}{-2E}-\hbar^2\right),

skąd dozwolone energie stanów związanych E<0 są równe

E=-\dfrac{me^4}{2\hbar^2 (2a+1)^2}.

Wartości 2a+1 są równe liczbie dozwolonych rzutów operatora A_{\pm}3, czyli właśnie 2a+1=n. Ponieważ a przyjmować mogą wyłącznie wartości połowkowe: 0, 1/2,1, 3/2,\ldots, więc n=1,2,3,\ldots. Mamy n stanów o różnym rzucie A_{-3} i także n stanów o różnym rzucie A_{+3}, łącznie zatem n^2 stanów o tej samej energii.

Wolfgang Pauli w roku 1925 nie znał teorii grup i algebr Liego, ponieważ dotąd nie były to dziedziny przydatne w fizyce. Algebry operatorów z komutatorem nazywają się algebrami Liego. Obliczenia Pauliego wykorzystały fakt, że mamy tu do czynienia z sumą prostą dwóch algebr \mathfrak{so}(3) odpowiadających grupie obrotów w przestrzeni trójwymiarowej (operatory momentu pędu to generatory obrotów). Suma prosta jest w tym przypadku izomorficzna z algebrą obrotów w przestrzeni czterowymiarowej: \mathfrak{so}(4)=\mathfrak{so}(2)\bigoplus \mathfrak{so}(2). Pauli odkrył więc, że stany związane atomu wodoru podlegają symetrii obrotowej w czterech wymiarach i stąd bierze się degeneracja poziomów energetycznych. Rozważania teoriogrupowe pierwszy przedstawił w tym kontekście asystent Pauliego z Zurychu Valentin Bargmann, który niedługo potem pracował z Einsteinem w Princeton.

IV. Vladimir Fock (1935)

Bezpośrednie podejście do symetrii stanów związanych atomu wodoru zaprezentował Vladimir Fock na seminarium w swoim Instytucie Fizyki Uniwersytetu Leningradzkiego 8 lutego 1935 roku i w tym samym roku opublikował. W Związku Sowieckim rozkręcała się właśnie paranoja towarzysza Stalina znana jako Wielki Terror albo jeżowszczyzna – od nazwiska Nikołaja Jeżowa. To w tym właśnie roku Stalin stwierdził z trybuny: „Żyje się lepiej, żyje się weselej”. Trzydziestosześcioletni Fock, wybitny fizyk matematyczny, aresztowany został 8 marca 1935 roku, lecz tego samego dnia wypuszczony. Nocą 11 lutego 1937 roku znów został aresztowany (były to czasy, gdy wielu ludzi, jak kompozytor Dymitr Szostakowicz, czekało nocami ze spakowaną walizką, aż podjedzie czarny samochód NKWD). Terror stalinowski tym się różnił od nazistowskiego, że w Niemczech znane były z góry prześladowane grupy: Żydzi, komuniści, lewicowi artyści, reszta mogła spać w miarę spokojnie. W Rosji każdy mógł okazać się winny, choćby sam o tym nie wiedział. Fock został po kilku dniach zwolniony, ponieważ wstawił się za nim Piotr Kapica, mający dojście do ucha Stalina. Lata trzydzieste są bardzo twórczym okresem życia Vladimira Focka (metoda Hartree-Focka, przestrzeń Focka itd.), być może fizyka matematyczna była dla niego sposobem wymknięcia się z upiornej rzeczywistości.

Praca Focka wykorzystuje przestrzeń pędów. Funkcję falową można przedstawić jako transformatę Fouriera:

\psi({\bf x})={\displaystyle \int \exp{\left(\frac{i{\bf px}}{\hbar}\right)} \psi({\bf p})d^3{\bf p} }. 

Funkcja \psi({\bf p}) odgrywa jest gęstością prawdopodobieństwa w przestrzeni pędów. Transformacja taka jest, jak wiadomo, odwracalna i wzajemnie jednoznaczna. Równanie Schrödingera przyjmuje w przestrzeni pędów następującą postać:

\left( \dfrac{{\bf p}^2}{2m}-E \right)\psi({\bf p})=\dfrac{e^2}{2\pi^2\hbar}{\displaystyle \int \dfrac{ \psi({\bf q}) d^{3}{\bf q} }{|{\bf p}-{\bf q}|^2}}.

Uprościła się nam część z energią kinetyczną: teraz operator pędu to mnożenie przez pęd, ale nieco skomplikowała część z energią potencjalną: iloczyn funkcji przeszedł w splot transformat. Jeśli wprowadzimy oznaczenie:

E=-\dfrac{p^2_0}{2m},

możemy równanie Schrödingera zapisać w postaci quasi-czterowymiarowej:

\left( {\bf p}^2+p^2_0 \right)\psi({\bf p})=\dfrac{me^2}{\pi^2\hbar}{\displaystyle \int \dfrac{ \psi({\bf q}) d^{3}{\bf q} }{|{\bf p}-{\bf q}|^2}}.

Następnym krokiem jest zamiana zmiennych dana rzutem stereograficznym.

stereo

Trówymiarowy wektor {\bf p}/p_0 rzutujemy na punkt u leżący na 3-sferze tak, że linia łącząca końce wektorów przechodzi przez biegun północny 3-sfery. Nadal mamy trzy wymiary, ale teraz zanurzone w przestrzeni czterowymiarowej. Definiujemy nową funkcję

\hat{\psi}(u)=\dfrac{1}{\sqrt{p_0}}\left(\dfrac{p^2_0+{\bf p}^2}{2p_0} \right)^4 \psi({\bf p}).

Można obliczyć, że przy takiej definicji zachowane jest unormowanie funkcji:

CodeCogsEqn

Po lewej stronie całkujemy po powierzchni 3-sfery, po prawej po trójwymiarowej przestrzeni pędów. W nowych zmiennych równanie Schrödingera przybiera postać następującą:

\hat{\psi}(u)=\dfrac{me^2}{2\pi^2 p_0\hbar}{\displaystyle \int \dfrac{\hat{\psi}(v) dS}{|v-u|^2}}.

W tej postaci równanie jest jawnie symetryczne na obroty w przestrzeni czterowymiarowej (grupa SO(4)). Na 3-sferze zanurzonej w przestrzeni czterowymiarowej można określić harmoniki sferyczne podobnie jak na 2-sferze zanurzonej w przestrzeni trójwymiarowej. Rozpatrujemy w tym celu jednorodne wielomiany \mathcal{ Y} stopnia \lambda, które spełniają równanie Laplace’a w czterech wymiarach:

\Delta {\mathcal Y}_{\lambda\alpha}(u)=0,

gdzie \alpha numerują różne wielomiany spełniające ten warunek. Jest ich w przestrzeni czterowymiarowej (\lambda+1)^2. Gdy wyłączymy z tych wielomianów czynnik |u|^{\lambda}, otrzymamy harmoniki sferyczne w czterech wymiarach:

\Delta {\mathcal Y}_{\lambda\alpha}(u)=|u|^{\lambda}Y_{\lambda\alpha}(u/|u|).

Harmoniki (hiper-)sferyczne zależą tylko od współrzędnych kątowych na sferze. Okazuje się, że funkcje te spełniają równanie (dowód poniżej):

Y_{\lambda\alpha}(u)=\dfrac{\lambda+1}{2\pi^2}{\displaystyle \int \dfrac{Y_{\lambda\alpha}(v) dS}{|v-u|^2}}.

Porównując z równaniem Schrödingera, otrzymujemy

\dfrac{me^2}{p_0\hbar}=\lambda+1 \Rightarrow E=-\dfrac{me^4}{2\hbar^2 (\lambda+1)^2}.

Widać, że \lambda+1=n=1,2,3,\ldots, bo \lambda było stopniem wielomianu, a więc liczbą całkowitą nieujemną. Liczba różnych stanów kwantowych o tej samej energii jest równa liczbie harmonik hipersferycznych, czyli n^2. Zaiste, żyje się lepiej, żyje się weselej.

Całą tę procedurę można uugólnić na „atom wodoru” w \mathbb{R}^n dla n\ge 2, lecz oprócz ew. przypadku dwuwymiarowego, ma to znaczenie tzw. akademickie. Zmieniają się tylko różne współczynniki, w 1957 r. zrobił te obliczenia S.P. Alliluev.

Podejście Focka doczekało się później przeniesienia do mechaniki klasycznej. O jednej z prac tego rodzaju kiedyś tu wspominałem. 

Obliczenia

Podamy dowód równania całkowego dla harmonik sferycznych w czterech wymiarach elegancką metodą podaną przez M. Bandera, C. Itzyksona, Rev. Mod. Phys. 38 (1966), 330-345. Korzystamy z faktu, że f(v)=1/|u-v|^2 spełnia w \mathbb{R}^4 równanie Laplace’a. Bierzemy jeszcze drugą funkcję harmoniczną {\mathcal Y}(v) i korzystamy z tożsamości Greena:

{\displaystyle \int (f\Delta {\mathcal Y}-{\mathcal Y}\Delta f) d^4 v=\int \left(f\dfrac{ \partial {\mathcal Y} }{\partial n}-{\mathcal Y}    \dfrac{ \partial f}{\partial n}\right)dS,}

po obszarze zaznaczonym na rysunku: jest to 3-sfera o promieniu jednostkowym wklęśnięta małą 3-sferą o promieniu \varepsilon\rightarrow 0 wokół punktu u. Zwrot wektorów normalnych zaznaczony jest na czerwono.

wcieta sfera

Lewa strona równania równa się zero. Obliczamy prawą stronę. Z jednorodności {\mathcal Y} wynika, że 

\dfrac{ \partial {\mathcal Y} }{\partial n}=\lambda {\mathcal Y}.

Wkład do drugiego składnika obliczamy osobno dla dużej i małej sfery. Oznaczmy s=|u-v|. Gradient funkcji f(v)=s^{-2} ma kierunek do punktu u.

gradient

Wartość gradientu to pochodna (s^{-2})'=-2s^{-3}. Zatem składowa normalna pochodnej jest równa na dużej sferze

\dfrac{ \partial f}{\partial n}=-\dfrac{2\sin\alpha/2}{s^2\cdot 2\sin\alpha/2}=-\dfrac{1}{s^2}.

Została nam jeszcze całka po małej sferze. W miarę jak zbliżamy się do punktu u możemy z coraz lepszą dokładnością zastąpić {\mathcal Y}(v) przez wartość w środku małej sfery: {\mathcal Y}(u). Gradient f ma kierunek i zwrot taki, jak normalne zewnątrzne dla małej sfery, czyli zostaje nam całka po połowie małej sfery:

{\displaystyle {\mathcal Y}(u) \dfrac{2}{\varepsilon^3} \int dS={\mathcal Y}(u) 2\pi^2,}

gdzie skorzystaliśmy z faktu, że pole powierzchni 3-sfery to 2\pi^2 r^3. Łącząc otrzymane wyniki, dostajemy równanie całkowe na funkcję Y={\mathcal Y}|_{S^3}.

V. Jeszcze raz Erwin Schrödinger, czyli supersymetryczna mechanika kwantowa avant la lettre (1940)

Idea supersymetrii, zwanej pieszczotliwie SUSY, powstała w latach siedemdziesiątych XX w. W kwantowej teorii pola oznaczało to symetrię między bozonami i fermionami. Schrödinger nigdy nie słyszał o tym pojęciu, jednak z perspektywy czasu jego metoda, którą tu przedstawimy, znalazła swoje miejsce w supersymetrycznej mechanice kwantowej. Niezależnie od tego, czy w przyrodzie istnieje supersymetria, metody te znalazły swoje zastosowania w innych dziedzinach.

Schrödinger zajmował się zagadnieniem faktoryzacji hamiltonianu, tzn. przedstawienia operatora Hamiltona jako iloczynu innych operatorów. Pokażemy najpierw ideę tego podejścia, a potem zastosujemy je do atomu wodoru.

Załóżmy, że mamy rozwiązać jednowymiarowe zagadnienie własne dla operatora Hamiltona z pewnym potencjałem V(x):

H=-\dfrac{d^2}{dx^2}+V(x).

Tworzymy parę operatorów

{\mathcal A}=\dfrac{d}{dx}+{\mathcal W}(x),

{\mathcal A}^{\dag}=-\dfrac{d}{dx}+{\mathcal W}(x).

Za ich pomocą da się utworzyć dwa hamiltoniany:

H^{(1)}={\mathcal A}^{\dag}{\mathcal A}=-\dfrac{d^2}{dx^2}+{\mathcal W}^{2}(x)-{\mathcal W}'(x),

H^{(2)}={\mathcal A}{\mathcal A}^{\dag}=-\dfrac{d^2}{dx^2}+{\mathcal W}^{2}(x)+{\mathcal W}'(x).

Funkcję {\mathcal W}(x) nazywamy superpotencjałem, należy ją dobrać tak, żeby przydała się w rozwiązaniu wyjściowego zagadnienia.

Niech \psi będzie funkcją własną operatora H^{(1)}, tzn. H^{(1)}\psi=E\psi. Działając na obie strony tej równości z lewej strony operatorem {\mathcal A} otrzymamy:

{\mathcal AA}^{\dag}{\mathcal A}\psi=E{\mathcal A}\psi \,\, \Rightarrow H^{(2)}{\mathcal A}\psi=E{\mathcal A}\psi.

Znaczy to, że {\mathcal A}\psi jest funkcją własną operatora H^{(2)} o tej samej wartości własnej. Podobnie możemy pokazać, że startując od funkcji własnej operatora H^{(2)}\chi=E\chi, możemy skonstruować wektor własny operatora H^{(1)} jako {\mathcal A}^{\dag}\chi. Jedynym wyjątkiem jest sytuacja, gdy {\mathcal A}\psi=0 lub {\mathcal A}^{\dag}\chi=0. Można pokazać, że tylko jedna z tych funkcji o zerowej wartości własnej daje się unormować (jest całkowalna w kwadracie).

Zastosujemy metodę SUSY do równania dla radialnej funkcji falowej (por. część II):

-\dfrac{\hbar^2}{2m}\,\dfrac{\partial^2 u}{\partial r^2}+\left(\dfrac{\hbar^2 l(l+1)}{2m r^2}-\dfrac{e^2}{r}\right)u=Eu.

Zapiszemy je w wersji przeskalowanej, żeby mniej pisać:

H_{l}=-\dfrac{d^2}{dx^2}-\dfrac{1}{x}+\dfrac{l(l+1)}{x^2}.

Jako superpotencjał wybieramy funkcję

{\mathcal W}(x)=-\dfrac{l+1}{x}+\dfrac{1}{2(l+1)}.

Pomocnicze hamiltoniany są równe:

H_{l}^{(1)}=H_{l}+\dfrac{1}{4(l+1)^2}.

H_{l}^{(2)}=H_{l+1}+\dfrac{1}{4(l+1)^2}.

Widzimy, że operatory {\mathcal A, \mathcal A}^{\dag} pozwalają przechodzić między różnymi wartościami l bez zmiany energii. Zaczniemy od poszukania funkcji odpowiadającej energii zero:

{\mathcal A}\psi=\left(\dfrac{d}{dx}-\dfrac{l+1}{x}+\dfrac{1}{2(l+1)}\right)\psi=0.

Rozwiązaniem tego równania jest funkcja

\psi_{0l}(x)=\exp{(-\int_{0}^{x}{\mathcal W}(y)dy)}=x^{l+1}\exp{(-x/2(l+1))}.

Energia tego stanu jest równa

E=-\dfrac{1}{4(l+1)^2},

co w jednostkach fizycznych daje -me^2/(2\hbar^2 (l+1)^2).

Związek między operatorami pomocniczymi można zapisać jako

H_{l}^{(2)}=H_{l+1}^{(1)}+\dfrac{1}{4(l+1)^2}-\dfrac{1}{4(l+2)^2}.

Niech \psi_{0,l+1} będzie stanem zerowym operatora H_{l+1}^{(1)}. Mamy więc

H^{(2)}_{l} \psi_{0,l+1}=\left(\dfrac{1}{4(l+1)^2}-\dfrac{1}{4(l+2)^2}\right) \psi_{0,l+1}.

W takim razie stan \psi_{1,l+1}={\mathcal A}_{l}^{\dag}\psi_{0,l+1} jest także stanem własnym H^{(1)}_{l} o tej samej wartości własnej, czyli mamy

H^{(1)}_{l}\psi_{1,l+1}=\left(\dfrac{1}{4(l+1)^2}-\dfrac{1}{4(l+2)^2}\right) \psi_{1,l+1}.

Ale H_{l}^{(1)}=H_{l}+\dfrac{1}{4(l+1)^2}, zatem

H_{l}\psi_{1,l+1}=-\dfrac{1}{4(l+2)^2}\psi_{1,l+1}, 

energia stanu \psi_{1,l+1} jest równa -\frac{1}{4(l+2)^2}. Kontynuując tę procedurę, otrzymamy po \nu krokach stan \psi_{\nu l}={\mathcal A}_{l}^{\dag}{\mathcal A}_{l+1}^{\dag}\ldots {\mathcal A}_{l+\nu-1}^{\dag}\psi_{0,l+1} o energii

E_{\nu l}=-\dfrac{1}{4(l+\nu+1)^2}.

Zazwyczaj oznacza się l+\nu-1=n. Procedura ta pozwala także wyznaczyć funkcje falowe za pomocą działania operatorów {\mathcal A}^{\dag}

Tutaj kończymy niekompletny przegląd sposobów podejścia do problemu atomu wodoru w nierelatywistycznej mechanice kwantowej. Od samego początku, od 1925 roku, wiedziano, że potrzebne jest podejście relatywistyczne. Od strony rachunkowej zapewniło to równanie Diraca, choć strona pojęciowa – kwantowa teoria pola – utrwaliła się nieco później. Poprawki relatywistyczne obejmują strukturę subtelną oraz jeszcze mniejszy efekt: przesunięcie Lamba, które ekscytowało fizyków pod koniec lat czterdziestych ub. wieku. Wygląda to następująco od strony eksperymentalnej.

Dlaczego atomy są trwałe?

Atomów nie można opisać za pomocą dziewiętnastowiecznej fizyki klasycznej. W doświadczeniach Hansa Geigera i Ernesta Marsdena, prowadzonych pod kierunkiem Ernesta Rutherforda w Manchesterze w latach 1909-1913, okazało się, że praktycznie cała masa atomu mieści się w bardzo małym obszarze o promieniu pojedynczych femtometrów (1 {\rm fm}=10^{-15} {\rm m}). Przedtem sądzono (model J.J. Thomsona), że atom zawiera rozmyty ładunek dodatni, w którym znadują się, niczym rodzynki w cieście, lekkie punktowe elektrony. Przy bombardowaniu cienkiej złotej folii za pomocą cząstek α (jąder helu) zdarzało się jednak, że cząstki te rozpraszały się pod wielkimi kątami, niemal zawracały. Byłoby to niemożliwe, gdyby dodatni ładunek rozmyty był na znacznym obszarze. Tak silne pole elektryczne wymagało niemal punktowego ładunku – atom musi więc zawierać niewielkie jądro. Tak narodził się model planetarny Ernesta Rutherforda.

Na rysunku nie można oddać różnicy skali między modelami Thomsona i Rutherforda. Elektrony krążą w znacznie większym obszarze kilkudziesięciu pikometrów (1 {\rm pm}=10^{-12} {\rm m}): w przypadku wodoru objętość atomu jest 2\cdot 10^{14} razy większa od objętości protonu w centrum. Znaczy to, że atom jest praktycznie pusty. Analogia z planetami krążącymi wokół Słońca niezbyt się tu jednak stosuje, ponieważ poruszający się z  przyspieszeniem elektron powinien emitować energię w postaci fal elektromagnetycznych. Z teorii Maxwella wynika, że w czasie rzędu 10^{-11} \,{\rm s} elektron powinien spaść na jądro. Atomy nie są stabilne – do takiego wniosku prowadzi Newtonowska mechanika w połączeniu z elektrodynamiką Maxwella.

Prowizorycznym wyjściem z sytuacji był model Nielsa Bohra: wprowadzał on dozwolone orbity elektronów i jakimś cudem przewidywał prawidłowo długości fal w widmie wodoru. Postulat kwantowania orbit jest nie do pogodzenia z fizyką klasyczną: trzeba bowiem założyć, że elektrodynamika czasem działa, a czasem nie. Jej prawa są z jakiegoś powodu zawieszone w przypadku orbit Bohra.

 Problem rozwiązała dopiero mechanika kwantowa. Przyjrzymy się, jak objaśnia ona stabilność atomu wodoru. Dla uproszczenia będziemy mówić o ruchu elektronu w polu elektrostatycznym nieruchomego jądra (wprowadzane w ten sposób przybliżenie łatwo zastąpić dokładniejszymi rachunkami). Mamy więc elektron o energii składającej się z energii kinetycznej oraz elektrostatycznej energii potencjalnej:

E=\dfrac{{\mathbf p}^2}{2m}-\dfrac{e^2}{r},

gdzie {\mathbf p} oraz m są odpowiednio pędem i masą elektronu, r jest jego odległością od punktowego jądra, a stała e^2\equiv\frac{q_e^2}{4\pi\varepsilon_0}. Nasz problem stabilności łatwiej zrozumieć, patrząc na wykres energii potencjalnej. 

Energia potencjalna w funkcji odległości elektronu od protonu (zaznaczone są dwa najniższe poziomy energetyczne atomu wodoru)

Zaznaczone są dozwolone wartości energii całkowitej. Energia krążącego elektronu jest stała tylko pod warunkiem pominięcia promieniowania. Inaczej będzie ona szybko się zmniejszać, a więc jak widać z wykresu nasz elektron będzie coraz ciaśniej okrążał proton. Studnia potencjału jest nieskończenie głęboka, bez dna (w przybliżeniu punktowego protonu). 

Mechanika kwantowa opisuje stany elektronu za pomocą funkcji falowej \psi(x,y,z)=\psi({\mathbf r}). Jej znaczenie jest statystyczne, pozwala ona obliczać rozmaite wartości średnie: np. średnią wartość energii kinetycznej, albo potencjalnej. Prawdopodobieństwo znalezienia elektronu w danym obszarze przestrzeni V jest równe

Pr(V)={\displaystyle \int_{V} |\psi|^2 dV}.

Oznacza to, że całka po całej przestrzeni musi być równa 1, mówimy wtedy, że funkcja falowa jest unormowana. Aby otrzymać rozmaite wartości średnie, musimy mieć przepis na ich tworzenie. Jest on następujący: każdej wielkości fizycznej przypisuje się operator. Np. operatorem składowej x położenia jest mnożenie przez x. Znaczy to, że pod działaniem tego operatora funkcja \psi przechodzi w x\psi. Bardziej skomplikowanym przypadkiem jest pęd. Składowa x pędu zastępowana jest braniem pochodnej po x:

\psi \mapsto \dfrac{\hbar}{i} \dfrac{\partial\psi}{\partial x}.

Pojawia się tutaj stała Plancka \hbar znak niechybny, że mamy do czynienia z fizyką kwantową, i jest tu jednostką urojoną – nasza funkcja \psi ma wartości zespolone. Z początku budziło to pewne zdumienie ojców mechaniki kwantowej, dziś wiemy, że liczby zespolone są tu nieodzowne. 

Mając pęd i położenie, możemy zbudować operator energii, czyli hamiltonian: zastępujemy po prostu pędy i położenia ich operatorami.  W jednym wymiarze wyglądałoby to następująco

H=-\dfrac{\hbar^2}{2m}\dfrac{\partial ^2}{\partial x^2}- \dfrac{e^2}{x}.

Pierwszy składnik oznacza, że należy dea razy wziąć pochodną po x i pomnożyć przez odpwoednią stałą, drugi składnik jest zwykłym mnożeniem funkcji. W trzech wymiarach mamy trzy składowe pędu, czyli trzy pochodne składające się w symbol zwany laplasjanem (czyli operatorem Laplace’a):

\Delta=\dfrac{\partial ^2}{\partial x^2}+\dfrac{\partial ^2}{\partial y^2}+\dfrac{\partial ^2}{\partial z^2}.

Zapisany w ten sposób hamiltonian ma postać:

H=-\dfrac{\hbar^2}{2m}\Delta-\dfrac{e^2}{r}.

Ostatni potrzebny nam składnik formalizmu to przepis na znajdowanie wartości średnich. Jeśli operator przypisany szukanej zmiennej nazwiemy A, to wartość średnia zmiennej jest równa

\langle A \rangle={\bf \int }\psi^{\star}A\psi dV.

Pojawia się tu funkcja zespolona sprzężona \psi^{\star}. Operatory odpowiadające wielkościom mierzalnym fizycznie (obserwablom) to tzw. operatory hermitowskie, które dają w powyższym przepisie wynik rzeczywisty, tak jak tego oczekujemy w eksperymencie. Hermitowskie są w szczególności operatory pędu, położenia i hamiltonian.

W zasadzie tyle formalizmu wystarczy, bez rozwiązywania równań różniczkowych, by pokazać, że dla dowolnej rozsądnej funkcji falowej (normowalnej) energia ograniczona jest z dołu. Czyli nie możemy uzyskać w żadnym eksperymencie mniej niż owo dolne ograniczenie. Co więcej, w każdym stanie związanym prawdopodobieństwo, że elektron znajdzie się bardzo blisko jądra jest znikome. Formalizm mechaniki kwantowej osiąga to dzięki wprowadzeniu funkcji \psi, która skoncentrowana w małym obszarze wymusza dużą energię kinetyczną. Jakościowo odpowiada to zasadzie nieoznaczoności: mała nieoznaczoność położenia oznacza dużą nieoznaczoność pędu, a więc i energii kinetycznej. Jednak zasady nieoznaczoności nie możemy tu zastosować wprost. 

Rozpatrzmy operator {\bf A} dany równaniem

{\bf A}={\bf p}-i\beta \dfrac{{\bf r}}{r},

gdzie \beta jest dowolną liczbą rzeczywistą. Ponieważ całka z kwadratu modułu {\bf A}\psi nie może być ujemna, otrzymujemy nierówność

\langle {\bf p}^2\rangle-2\beta\hbar\left\langle\dfrac{1}{r}\right\rangle+\beta^2\ge 0,\mbox{(*)}

słuszną dla każdego \beta. Bierzemy najpierw \beta=\hbar\langle\frac{1}{r}\rangle. Dostajemy nierówność

\langle {\bf p}^2\rangle\ge \hbar^2\left\langle \dfrac{1}{r}\right\rangle^2.

Dla dowolnej wartości r_0>0 możemy ograniczyć wartość całki do obszaru r<r_0, gdzie 1/r>1/r_0, otrzymujemy w ten sposób nierówność

\langle {\bf p}^2\rangle^{\frac{1}{2}}\ge \dfrac{\hbar}{r_0} Pr(r<r_0). 

Wrócimy do niej za chwilę. Raz jeszcze korzystamy z (*), tym razem dla \beta=\frac{me^2}{\hbar}. Porządkując wyrazy, otrzymujemy wartość oczekiwaną energii:

\boxed{ \left\langle \dfrac{{\mathbf p}^2}{2m}-\dfrac{e^2}{r}\right\rangle\ge -\dfrac{me^4}{2\hbar^2.}}

Mechanika kwantowa przewiduje zatem dolną wartość energii, równą -13,6\, \rm{eV}.

Aby oszacować \langle{\mathbf p}^2\rangle , założymy, że mamy elektron w stanie związanym, a więc całkowita energia jest ujemna – klasycznie znaczy to, że elektron nie może uciec z pola elektrostatycznego protonu. 

Mamy

\left\langle \dfrac{{\mathbf p}^2}{2m}-\dfrac{e^2}{r}\right\rangle<0,

co można przepisać w postaci

\left\langle \dfrac{{\mathbf p}^2}{4m}\right\rangle<-\left\langle \dfrac{{\mathbf p}^2}{4m}-\dfrac{e^2}{r}\right\rangle.

Do prawej strony możemy zastosować nierówność z ramki przy masie cząstki równej 2m. Otrzymujemy stąd szacowanie dla

\left\langle {\mathbf p}^2\right\rangle \le \dfrac{2me^2}{\hbar}.

Ostatecznie, prawdopodobieństwo znalezienia elektronu nie dalej niż r_0 od jądra spełnia nierówność

\boxed{Pr(r<r_0)<\dfrac{2 r_0}{a_0},}

gdzie a_0\equiv \frac{\hbar}{me^2}\approx 53 \,{\rm pm} zwane jest promieniem Bohra. Jest to promień pierwszej orbity w modelu Bohra.

Widzimy więc, że formalizm mechaniki kwantowej dostarcza wyjaśnienia, czemu atomy są trwałe, co jest niezmiernie ważnym faktem. Uwzględnienie poprawek relatywistycznych itd. niewiele tu zmienia. Można udowodnić więcej: także w układzie wielu jąder i wielu oddziałujących ze sobą elektronów kolaps jest niemożliwy. W tym przypadku ważną rolę odgrywa także fakt, iż elektrony są fermionami, tzn. żadne dwa z nich nie mogą zajmować tych samych stanów (wliczając spin). Podstawowe wyniki w tym obszarze należą do Elliotta Lieba i Waltera Thirringa. Rozważania takie są interesujące ze względów poznawczych, ale także pomagają zrozumieć zachowanie dużych układów, dla których bezpośrednie rachunki bez żadnych przybliżeń są niemożliwe.

Korzystałem z książki E. B. Manoukian, 100 Years of Fundamental Theoretical Physics in the Palm of Your Hand.
Integrated Technical Treatment, Springer Nature 2020.

George Biddell Airy: Jak drobne szczegóły można dostrzec przez teleskop? (1834)

Widziałem jakiś czas temu reklamę, a w niej na zdjęciu – rzekomo satelitarnym – rozpoznawalne twarze jakichś celebrytów. Czy to możliwe technicznie? Nie bardzo. Wprawdzie w sprawach techniki lepiej nie twierdzić, że coś jest niemożliwe, ale tutaj trudności są dość zasadnicze i wynikają z falowej natury światła.

Do wyjaśnienia sprawy przyczynił się Airy, wtedy niedługo po trzydziestce, profesor katedry Plume’a w Cambridge, a niebawem 7. Astronom Królewski, ten ostatni urząd pełnił niemal pół wieku. Wyróżniał się jako zdolny młodzieniec, zanim skończył siedemnaście lat, znał dziewięć rozdziałów Matematycznych zasad filozofii przyrody Isaaca Newtona, a więc materiał matematycznie nietrywialny. Dostał się na studia do Trinity College w Cambridge jako sizar, czyli coś w rodzaju studenta służącego, ponieważ miał talent do matematyki, łaciny oraz greki. Ze zdecydowanie najlepszym wynikiem zdał Tripos, egzamin matematyczny, który bardzo ceniono. Potem przez dwa lata był profesorem katedry Lucasa – tak jak kiedyś Newton. Katedra ta nie przynosiła jednak wówczas dochodów, płacono 99 funtów rocznie, podczas gdy Airy jako młodszy tutor zarabiał 150. Namówiono go jednak, aby się o nią ubiegał ze względów wizerunkowo-prestiżowych. Szczerze mówiąc, katedra podupadła, Airy był pierwszym liczącym się profesorem na niej od czasów Newtona. Kiedy poinformowano go, że profesor katedry Plume’a („astronomia i filozofia eksperymentalna”) czuje się niezbyt dobrze i zapewne długo nie pociągnie, Airy zaczął się starać o tę posadę. Zdobył ją, kiedy się zwolniła drogą naturalną, przy okazji wydębiając od uniwersytetu podwyżkę z 300 do 500 funtów. W ten sposób został astronomem, do jego obowiązków bowiem należało kierowanie obserwatorium uniwersyteckim. Airy potrzebował pieniędzy: studia dawały mu możliwość awansu, nie upierał się, że musi być uczonym, ale skoro los tak chciał, to nim został. Pragnął też się ożenić, do czego również potrzebował pieniędzy. Był niezwykle pracowity, dobrze zorganizowany, sumienny, nie wyrzucał żadnych papierów, zszywał je, tworząc do nich system odnośników. Codziennie tłumaczył jakiś kawałek z angielskiego na łacinę. Optyką zajął się jako nauką pomocniczą astronomii. Odkrył we własnym wzroku wadę, zwaną dziś astygmatyzmem i jako pierwszy starał się ją skorygować specjalnymi soczewkami. Ogłosił drukiem 518 krótszych prac oraz kilka książek. Nie był wielkim uczonym, ale sporo osiągnął. Nie wszyscy muszą być twórczy i mieć szalone pomysły, nauka do codziennego funkcjonowania potrzebuje ludzi pracowitych i kompetentnych.

W 1834 roku Airy przedstawił w Cambridge Philosophical Society pracę na temat ugięcia światła na kołowym otworze. Sam chyba nie rozumiał wówczas, że rozstrzygnął fundamentalny problem astronomii: jakie najmniejsze kąty można rozróżnić posługując się przyrządem optycznym o danej średnicy – jego wynik dotyczy oka ludzkiego, aparatów fotograficznych, teleskopów, mikroskopów itd. Airy urodził się mniej więcej wtedy, gdy Thomas Young zaproponował falową teorię światła. Została ona rozwinięta niezależnie przez Augustine’a Fresnela. Fale mogą ze sobą interferować, to znaczy, gdy do jakiegoś obszaru docierają np. dwie niezależne fale, zaobserwujemy ich sumę. Fala wyjściowa może być silniejsza (interferencja konstruktywna)

constructive

Może też wystąpić interferencja destruktywna, w szczególnym przypadku, wypadkowa może być równa zeru.

destructive

Na obu rysunkach fala niebieska jest sumą zielonej i czerwonej. Oba rysunki możemy traktować albo jako zrobione w funkcji czasu w jednym miejscu, albo jako migawkowe zdjęcia fali w przestrzeni w pewnym określonym momencie. Ponieważ fala to przesuwające się z pewną prędkością drganie, zależności przestrzenne można przełożyć na czasowe i odwrotnie.

Rozważmy najpierw dyfrakcję na wąskiej długiej szczelinie. Z lewej strony dociera fala płaska, za szczeliną rozchodzi się fala nieco rozmyta pod względem kierunku (powierzchnie falowe są prostopadłe do kierunku rozchodzenia się fali).

Wave_Diffraction_4Lambda_Slit

Wikipedia: Diffraction

Jakie będzie kątowe rozmycie fali ugiętej? Mamy do dyspozycji dwie wielkości: \lambda – długość fali oraz d. Można z nich utworzyć kąt w radianach, które są bezwymiarowe (iloraz długości luku i promienia): \lambda/d. Prawdopodobnie nasz kąt będzie w przybliżeniu równy temu ilorazowi z dokładnością do jakegoś czynnika czysto liczbowego (odwrotny iloraz nie zachowywałby się dobrze przy \lambda\rightarrow 0, gdy dyfrakcja powinna być niewidoczna; gdyby fale miały zerową długość, wystarczyłaby do wszystkiego optyka geometryczna i wyobrażanie sobie światła jako promieni).

Właśnie to rozmycie w kierunkach ogranicza zdolność rozdzielczą. Soczewka teleskopu czy oka nie zmienia tego faktu. Bez dyfrakcji działanie soczewki wyglądałoby tak:

Lens_and_wavefronts

Wikipedia: Lens

Jeśli kierunki za soczewką (otworem) są rozmyte, to obraz w ognisku nie będzie punktowy, lecz będzie stanowił plamkę. Dlatego w dalszym ciągu zostawiamy soczewki, ponieważ nie one są tu istotne, lecz rozważamy szczelinę – w tym zjawisku liczy się fakt, że soczewka jest otworem, a nie np. z czego jest wykonana itp. Żeby obliczyć falę docierającą do jakiegoś punktu, można posłużyć się zasadą Huygensa: każdy punkt czoła fali jest źródłem kulistych fal. Należy wszystkie te fale dodać do siebie, co w przypadku szerokiej szczeliny oznacza całkowanie, ale obejdziemy się bez niego. W  przejściu przez szczelinę źródłami fal są wszystkie jej punkty. Jeśli punkt obserwacji znajduje się daleko, to fale cząstkowe będą biegły praktycznie równolegle do siebie. W kierunku prostopadłym do czoła fali padającej (kąt \theta=0) wszystkie fale cząstkowe mają tak samo daleko, więc będą się dodawać konstruktywnie: na wprost naszej szczeliny pojawi się maksimum natężenia fali. Jeśli nasz punkt obserwacji będzie nieco z boku, jedne fale będą miały dalej, drugie bliżej, więc w wyniku interferencji powstanie fala o nieco mniejszej amplitudzie: składowe fale nieco się „rozjeżdżają”, nie wszystkie drgają w tej samej fazie. Dla jakiego kąta \theta pojawi się pierwsze minimum natężenia? Sytuację przedstawia rysunek.

destruktywna

Skrajne fale elementarne z dwóch końców szczeliny mają teraz różnicę odległości równą \lambda – czyli długość fali. Te skrajne fale będą się więc wzmacniać, co jednak z resztą? Możemy naszą szczelinę podzielić w myślach na połowy i rozpatrywać pary fal, jak na rysunku. Różnica odległości między nimi to dokładnie \frac{1}{2} \lambda, a więc będą interferować destruktywnie, dając w wyniku zerowe natężenie. Ponieważ dla każdej fali z górnej połówki szczeliny możemy znaleźć drugą w dolnej połówce, która ją unicestwi, więc w efekcie dostaniemy zero: minimum natężenia. Kąt, dla którego wystąpi owo minimum spełnia warunek widoczny z rysunku:

\sin\theta=\dfrac{\lambda}{d}.\mbox{ (*)}

Dla małych kątów sinus można zamienić kątem (w radianach; 2\pi\, \mbox{rd}=360^{\circ}). Mamy więc

\theta \approx\dfrac{\lambda}{d}.

Natężenie za szczeliną przedstawia wykres.

sincsquared

Pierwsze minimum występuje dla kątów spełniających warunek (*). Większa cześć światła pojawi się jako jasny środkowy prążek, obok którego wystąpią mniej jasne prążki poboczne. Kiedy możemy rozróżnić dwie fale przybiegające z lewej strony pod różnymi kątami? Za graniczną sytuację uważa się taką, jak poniżej: główne maksimum jednej fali przypada na minimum drugiej (to tzw. kryterium Rayleigha).

rayleigh

Co się zmieni, gdy zamiast szczeliny weźmiemy okrągły otwór. To zadanie w sam raz dla Senior Wranglera (zwycięzcy Tripos). Wynik nie wyraża się przez funkcje elementarne, lecz przez funkcje Bessela. Airy obliczył je numerycznie, co w tamtych czasach – bez Wolfram Alpha, Mathematiki, Sage’a itd. – było niewyobrażalnie pracochłonne, a dziś można to liczyć w przeglądarce. Obraz jakościowo się nie zmienił. Oczywiście, będzie miał symetrię osiową, teraz będziemy mieli środkową jasną plamkę (plamkę Airy’ego), otoczoną pierścieniami.

283px-Airy-pattern.svg

Wikipedia: Airy disk

Kąt do pierwszego minimum wynosi dokładnie

\sin\theta=1,22 \, \dfrac{\lambda}{d}.

Możemy teraz obliczyć zdolność rozdzielczą fotografii satelitarnych. Oznaczmy przez x długość najmniejszego obiektu, który chcemy rozróżnić; niech nasz satelita krąży na wysokości h, wówczas kąt \theta będzie równy

\theta= \dfrac{x}{h}.

Podstawiając h=500 \mbox{ km}, d=2,5 \mbox{ m} (więcej niż teleskop Hubble’a!) oraz biorąc długość fali żółtego swiatła \lambda=0,6 μm, otrzymujemy

x=1,22 \, \dfrac{\lambda h}{d}\approx 0, 15 \mbox{ m}

Obliczyliśmy mniej więcej graniczną wartość „piksela” na zdjęciu satelitarnym. Rzeczywiste rozmiary piksela obecnych satelitów cywilnych są kilkukrotnie większe. Nie ma mowy o rozróżnianiu twarzy. Problem stanowi średnica naszego obiektywu. Większe wartości niż kilka metrów są zdecydowanie niepraktyczne. Można posłużyć się np. dwoma mniejszymi obiektywami, które będą dość daleko od siebie, np. w odległości 10 m albo i dużo więcej, i łączyć ich obrazy. Astronomowie używają czegoś takiego, więc pewnie i wojskowi mogą. Wciąż jednak mało prawdopodobne, aby stosować sprzęt tego rodzaju do sfotografowania paru celebrytów, których można bez problemu sfotografować z odległości kilku metrów.

Dyfrakcyjne ograniczenie zdolności rozdzielczej jest problemem w pewnych sytuacjach, choć astronomowie na Ziemi większy kłopot mają z ruchami atmosfery, które poruszają obrazem i zamazują go przy dłuższej ekspozycji. Rozumiejąc zjawiska dyfrakcyjne, można częściowo oczyścić z nich obraz za pomocą odpowiednich procedur matematycznych, ale niełatwo osiągnąć jakąś zdecydowaną poprawę.

Johannes Kepler: Jak w wolnych chwilach odkryć tajemnicę kosmosu? (1595)


W lipcu 1595 roku Johannes Kepler był dwudziestotrzyletnim nauczycielem w luterańskiej szkole w Grazu w Styrii. Przysłano go tam z Tybingi, gdzie się uczył i miał nadzieję zostać teologiem. Był jednak biedny i korzystał z książęcego stypendium, musiał więc pojechać do Grazu, kiedy tylko zwierzchnicy tak postanowili. Nawiasem mówiąc, Wirtembergia z czasów Keplera miała znakomity system edukacyjny, w którym biedny, lecz uzdolniony młodzieniec mógł przejść przez szkoły wszystkich stopni, nie płacąc ani za naukę, ani za utrzymanie w bursie. A był to przecież XVI wiek! Rządzący kierowali się głównie względami religijnymi: potrzeba było jak najwięcej wykształconych teologów luterańskich, ale uczono porządnie, choć raczej w duchu konserwatywnym.
Kepler podczas studiów zainteresował się astronomią, i to heliocentryczną – jego nauczyciel Michael Mästlin był bowiem jednym z niewielu zwolenników Kopernika. Pół wieku po ukazaniu się dzieła toruńskiego astronoma, zwolenników jego nauk można było policzyć na palcach jednej ręki. Nie było mowy o żadnym przewrocie kopernikańskim, ponieważ prawie nikt nie wierzył, iż Ziemia naprawdę się porusza, a przedstawiony przez Kopernika system to coś więcej niż ćwiczenie z zakresu matematyki stosowanej, bez konsekwencji kosmologicznych.
Kepler w Grazu wciąż chciał myśleć, że po kilku latach wróci do Tybingi i dokończy studia teologiczne. Stało się inaczej, pochłonęła go astronomia (i astrologia), a i władze w Tybindze niezbyt chyba chciały mieć Keplera z powrotem. Był prawdziwie pobożny, ale jak często się to zdarza takim ludziom, nie był ostrożny w wypowiadaniu poglądów i mówił to, w co wierzył. A zwierzchnikom chodziło raczej o ujednoliconą doktrynę, nie o prywatne przemyślenia. Posłuszeństwo ceniono wyżej niż błyskotliwość i gorący zapał.
Uczył w Grazu przedmiotów matematycznych, co obejmowało astrologię. Młody nauczyciel lubił opowiadać nie tylko, co myśli, ale także jak do tego doszedł. Dzięki temu wiemy, że zajął się latem 1595 roku astronomią kopernikańską: „Kiedy pragnąłem dobrze i zgodnie z kierunkiem pracy spędzić czas wolny od zajęć” [ten i poniższe cytaty za: J. Kepler, Tajemnica kosmosu, przeł. M. Skrzypczak i E. Zakrzewska-Gębka, Ossolineum 1972, nieznacznie zmienione].
W astronomii Kopernika proporcje orbit planetarnych wyznaczone są przez obserwacje. Jeśli nawet system heliocentryczny był nieco prostszy, to nasuwało się pytanie: czemu sfery planet są takiej a nie innej wielkości? Jeśli była to rzeczywista architektura kosmosu, to czym kierował się boski Architekt?

solar

A były głównie trzy problemy, których przyczyn, dlaczego jest tak a nie inaczej szukałem, a mianowicie liczba, wielkość i ruch sfer. Odwagi dodała mi owa idealna zgodność pozostających w bezruchu Słońca, gwiazd stałych i przestrzeni pośredniej, z Bogiem-Ojcem, Synem i Duchem Świętym. (…) Początkowo rozważałem zagadnienie w zależności od liczb i zastanawiałem się, czy jedna sfera może być dwa, trzy, cztery razy większa od drugiej w teorii Kopernika. Wiele czasu poświęciłem tej pracy jakby zabawie, ponieważ nie ukazywała się żadna zgodność ani samych proporcji, ani jej przyrostu. Nie osiągnąłem z tego żadnych korzyści; wbiłem sobie jednak głęboko w pamięć odległości, tak jak zostały podane przez Kopernika. (…) Wydaje się, jakoby ruch zawsze podążał za odległością i że gdzie istniał wielki przeskok między sferami, to podobny przeskok występował także między ich ruchami.

Warto zauważyć, że już wtedy Kepler usiłował dociekać, jaka jest zależność między okresem obrotu a wielkością sfery (czyli orbity) planety – w roku 1618 odkrył ścisłe prawo rządzące tą zależnością, zwane dziś III prawem Keplera. Był to więc jeden z problemów, nad którymi rozmyślał całe życie. Młody nauczyciel był pomysłowy: próbował np. umieścić między Marsem a Jowiszem nową planetę, a inną między Wenus i Merkurym, sprawdzając, czy wtedy proporcje jakoś orbit dadzą się lepiej zrozumieć. Teoretycznie było możliwe, że krążą tam gdzieś jakieś niewielkie i nie wykryte planety. Między Marsem a Jowiszem rzeczywiście krąży wiele takich ciał, znanych jako planetoidy. Badał też inne pomysły. Wszystko na próżno.

Prawie całe lato straciłem na tych męczarniach. W końcu przy jakiejś drobnej okazji przybliżyłem się do sedna sprawy. Uznałem, że z bożej łaski udało mi się znaleźć przypadkowo to, czego wcześniej nie mogłem osiągnąć pracą. Uwierzyłem w to tym bardziej, że zawsze prosiłem Boga, aby pozwolił ziścić się moim zamiarom, jeśli Kopernik miał słuszność. W dniu 19 lipca 1595 r., zamierzając pokazać moim słuchaczom skok wielkich koniunkcji przez osiem znaków (…) wpisałem w jedno koło wiele trójkątów, albo quasi-trójkątów, tak aby koniec jednego był początkiem drugiego.

koniunkcje

 

Rysunek przedstawia koniunkcje Jowisza i Saturna na tle znaków zodiaku – jest więc całkowicie abstrakcyjny. Koniunkcje te powtarzają się w odległości około jednej trzeciej zodiaku, jeśli połączyć te punkty liniami, uzyskuje się rysunek Keplera. Sądzono, że te koniunkcje mają ważne znaczenie astrologiczne, stąd taki temat lekcji. Kepler dostrzegł jednak w tym rysunku coś innego:

triangles

Teraz mamy trójkąt wpisany między dwa okręgi. Mogłyby to być sfery Saturna i Jowisza – dwóch planet najdalszych od Słońca. Może więc kwadrat należy wpisać między sferę Jowisza i Marsa itd. Pojawia się jednak kłopot: mamy tylko sześć planet (znanych ówcześnie), a wieloboków foremnych jest nieskończenie wiele. Konstrukcja powinna wyjaśniać, czemu jest akurat sześć planet, a nie np. 120. Wtedy przypomniał sobie Kepler XIII księgę Elementów Euklidesa. Grecki matematyk dowodzi tam, że istnieje dokładnie pięć wielościanów foremnych, czyli takich, że wszystkie ich ściany są jednakowymi wielobokami foremnymi.Platonic_solids

Rysunek: Wikipedia, Максим Пе

W Platońskim Timajosie wielościany te powiązane są z pięcioma elementami, z których zbudowany jest kosmos: sześcian z ziemią, dwudziestościan z wodą, ośmiościan z powietrzem, czworościan z ogniem, a dwunastościan z eterem wypełniającym wszechświat. Była to wówczas śmiała spekulacja oparta na najnowszej matematyce Teajteta, jednego z uczniów Platona. Teraz Kepler znalazł dla tych wielościanów nowe zastosowanie. Należało między sześć sfer planetarnych wpisać owe pięć brył platońskich.

kepler

Jest to konstrukcja zawrotna: pewien głęboki fakt matematyczny został powiązany z układem planetarnym – dla Keplera nasz układ był jedyny we wszechświecie, a Stwórca myślał językiem geometrii. Pozostawało tylko zająć się szczegółami: kolejnością brył, kwestią, jak cienkie powinny być sfery planetarne, czy ich środek liczyć od środka orbity Ziemi, czy od Słońca. Rozwiązana została tajemnica kopernikańskiego kosmosu. I taki właśnie tytuł: Tajemnica kosmosu, nosiło dziełko opublikowane przez Keplera w następnym roku. Zwracał się w nim do czytelnika: „Nie znajdziesz nowych i nieznanych planet, jak te, o których mówiłem nieco wyżej – nie zdobyłem się na taką zuchwałość. Znajdziesz te stare (…) tak jednak utwierdzone, że mógłbyś odpowiedzieć rolnikowi pytającemu, na jakich hakach zawieszone jest niebo, że nie osuwa się”.

Nasz Układ Słoneczny okazał się raczej dziełem dość chaotycznych procesów niż wytworem Platońskiego demiurga. Proporcje orbit nie wynikają z żadnej ścisłej matematyki, Kepler się mylił. Był to szczęśliwy błąd – uskrzydlony odkryciem, pogodził się z tym, że nie zostanie teologiem i zajął się astronomią, co z pewnością wyszło na dobre nauce. Do końca życia wierzył, że wielościany mają coś wspólnego z uporządkowaniem sfer planetarnych, umysłowi zawsze trudno się rozstać z ulubionymi chimerami. W następstwie hipotezy wielościanowej Kepler zajął się szczegółami ruchów planet – to na tej drodze czekały go wielkie odkrycia.

Wielościany foremne związane są ze skończonymi podgrupami grupy obrotów w przestrzeni trójwymiarowej. Można o nich poczytać w książce M. Zakrzewskiego, Algebra z geometrią, Oficyna Wydawnicza GiS 2015. Bardziej popularne są piękne i znakomicie ilustrowane odczyty Hermanna Weyla, wielkiego matematyka i kolegi Einsteina z Zurychu i Princeton, pt. Symetria, PWN 1960, wznowione przez wydawnictwo Prószyński i S-ka w 1997 r.