Leonhard Euler i problem bazylejski (1735)

Ścisłe sumowanie szeregów nieskończonych ma często coś z magii. Takim szeregiem słynnym w XVII wieku był szereg Leibniza:

\frac{\pi}{4}=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\ldots.

Problem bazylejski polegał na znalezieniu sumy szeregu

\zeta(2)=1+\frac{1}{2^2}+\frac{1}{3^2}+\frac{1}{4^2}+\ldots.

Oznaczyliśmy tę sumę \zeta(2), można bowiem rozważać także sumy odwrotności innych potęg liczb naturalnych. Wiadomo, że przy wartościach wykładnika s>1 szereg jest zbieżny. Tak określona funkcja to zeta Riemanna, funkcja, którą wprowadził już Euler, lecz stała się sławna dużo później i jest jedną z najważniejszych funkcji w matematyce. W roku 1735 dwudziestoośmioletni Leonhard Euler, profesor matematyki z Bazylei, pracujący w Sankt Petersburgu, udowodnił, że

\zeta(2)=\frac{\pi^2}{6}.

Niedługo później podał wyrażenia dla wartości \zeta(2n) przy całkowitych dodatnich wartościach n. Był to przełomowy moment w karierze młodego matematyka, który szybko uznany został za najwybitniejszego nie tylko w swoim pokoleniu i w swojej epoce, lecz jednego z najbardziej twórczych uczonych w całej historii matematyki i fizyki.

Odkrycie było przełomowe, ponieważ wynik jest elegancki i do pewnego stopnia zaskakujący. Piszę – do pewnego stopnia – gdyż można by się go spodziewać jako czegoś w rodzaju kwadratu szeregu Leibniza. Suma odwrotności kwadratów liczb nieparzystych wystarczy, by znaleźć \zeta(2):

\zeta(2)=1+\frac{1}{3^2}+\frac{1}{5^2}+\ldots+\frac{1}{4}\left(1+\frac{1}{2^2}+\frac{1}{3^2}+\ldots\right),

a więc mamy

\frac{3}{4}\zeta(2)=1+\frac{1}{3^2}+\frac{1}{5^2}+\ldots.

Rzeczywiście, istnieje dowód korzystający z szeregu Leibniza (por. np. M. Aigner, G.M. Ziegler, Proofs from the Book), lecz jest znacznie późniejszy.

Problem bazylejski okazał się za trudny dla Jakoba i Johanna Bernoullich, braci i dwóch najważniejszychych matematyków wywodzących się z tego miasta. Euler był o pokolenie młodszy, przyjaźnił się z synami Johanna, Danielem i Nicolasem II. Leonhard jako student filozofii i teologii  uczęszczał na sobotnie lekcje matematyki do Johanna, podczas których mógł prosić o wyjaśnienie trudnych miejsc z czytanych samodzielnie dzieł matematycznych. Łatwo wpadający w gniew Johann nie był zapewne idealnym pedagogiem, ale dla kogoś takiego jak Euler, któremu nie trzeba było objaśniać zbyt wiele, była to nauka bezcenna – bezpośrednio u najwybitniejszego żyjącego mistrza analizy matematycznej. W Sankt Petersburgu Euler mieszkał początkowo u Daniela Bernoulliego, przyjaźnił się też z Christianem Goldbachem (tym od hipotezy Goldbacha w teorii liczb). Wkrótce Euler usamodzielnił się życiowo i naukowo i nie potrzebował mentorów, choć jak wszyscy uczeni epoki chętnie korespondował z innymi matematykami.

Pierwszą trudnością w rozwiązaniu problemu bazylejskiego było znalezienie wartości liczbowej wyniku. Bezpośrednie sumowanie szeregu bez komputera jest niewykonalne. Toteż jedną z pierwszych prac Eulera poświęconych temu problemowi było znalezienie szeregu, który jest szybciej zbieżny.

W pracy tej z 1731 roku (E20) Euler rozważa następujący szereg funkcyjny:

{\displaystyle {\rm Li_2}(x)=\sum_{n=1}^{\infty}\frac{x^n}{n^2}=-\int_{0}^{x}\frac{\ln(1-t)}{t}dt.}

Funkcję tę nazywamy dziś dilogarytmem, jest ona oczywistym uogólnieniem naszego wyjściowego problemu. Mamy równość {\displaystyle {\rm Li_2}(1)=\zeta(2)}. Dla dowolnego x\in [0,1] zachodzi tożsamość

{\displaystyle {\rm Li_2}(1)={\rm Li_2}(1-x)+{\rm Li_2}(x)+\ln x\ln (1-x).}

Wystarczy teraz wziąć x=\frac{1}{2} i otrzymujemy szybko zbieżny szereg

CodeCogsEqn

Jest to dokładnie wartość \pi^2/6. Euler zwraca uwagę, że aby uzyskać tę dokładność z prostego sumowania odwrotności kwadratów, należałoby dodać ponad tysiąc wyrazów. 

W roku 1735 w pracy E47 Euler obliczył wartość \zeta(2) jeszcze dokładniej za pomocą odkrytego przez siebie wzoru (dziś zwanego wzorem Eulera-Maclaurina). Metoda jest subtelna i bardzo ogólna. Sumę wartości funkcji możemy w niej zastąpić całką oznaczoną z tej funkcji plus nieskończenie wiele wyrazów poprawkowych związanych z kolejnymi pochodnymi:

{\displaystyle \sum_{n=a+1}^{b} f(n)=\int_{a}^{b} F(t) dt+\frac{f(b)-f(a)}{2}+\frac{1}{6}\frac{f'(b)-f'(a)}{2!}-\frac{1}{30}\frac{f''(b)-f''(a)}{3!}+\frac{1}{42}\frac{f'''(b)-f'''(a)}{4!}+\ldots. }

Współczynniki po prawej stronie mają postać B_n/n!, gdzie B_n są to liczby Bernoulliego, nazwane tak przez Eulera, gdyż pojawiły się po raz pierwszy w wyrażeniach dla sumy n-tych potęg kolejnych liczb naturalnych rozpatrywanych przez Jakoba Bernoulliego. Możemy bez trudu zastosować ten wzór dla funkcji f(x)=1/x^2 i sumowania do nieskończoności. Euler otrzymuje

{\displaystyle \sum_{n=a}^{\infty}\frac{1}{n^2}=\int_{a}^{\infty} \frac{dt}{t^2}+\frac{1}{2a^2}-\frac{1}{3a^3}-\frac{1}{30a^5}+\frac{1}{42a^7}+\ldots+\frac{7}{6a^15}.}

Biorąc a=10, otrzymuje sumę 1,549767731166540, a dodając do niej wyrazy z powyższego wyrażenia:

\zeta(2)=1,64493406684822643647.

Wszystkie cyfry dziesiętne są tutaj dokładne. Stosowanie tej metody zawiera jednak istotną subtelność: szereg różnic pochodnych nie jest zbieżny, liczby Bernoulliego rosną coraz szybciej dla dużych indeksów i metodę należy stosować z wyczuciem. Jeśli weźmiemy niezby małe a oraz nie za dużo wyrazów z pochodnymi, otrzymamy wartościowy wynik. Euler zdawał sobie z tego sprawę. Stosując różne metody, mógł sprawdzić ich słuszność, jego matematyka była w znacznej mierze eksperymentalna, ówczesna analiza nie dysponowała ścisłymi dowodami, jakie pojawiły się w XIX wieku. Warto może dodać, że najdokładniejsze liczbowo wyniki fizyki, uzyskiwane w kwantowej teorii pola, też obliczane są za pomocą szeregów podobnego typu. Wiadomo, że nie są one zbieżne, lecz przy niewielu wyrazach sumowanych dokładność może być zdumiewająca: kilkanaście cyfr znaczących. Praca Eulera nie była więc jedynie sztuką dla sztuki, jak mogłoby się wydawać na pierwszy rzut oka.

Nie wiemy, czy powyższa analiza numeryczna poprzedzała dowód, że \zeta(2)=\pi^2/6. Niewątpliwie wzmacniała prawdopodobieństwo, że wynik jest prawidłowy. Podejrzewam, że Euler najpierw znał wynik liczbowy, a następnie szukał potwierdzenia innymi metodami. Zastosowanym w roku 1735 (E41) podejściem było spojrzenie na funkcję sinus jak na wielomian. Gdyby rzeczywiście sinus zachowywał się jak wielomian, powinien być równy

\sin x=x\left(1-\frac{x}{\pi}\right)\left(1+\frac{x}{\pi}\right)\left(1-\frac{x}{2\pi}\right)\left(1+\frac{x}{2\pi}\right)\ldots,

ponieważ jego miejsca zerowe to x= n\pi, gdzie n jest dowolną liczbą całkowitą.  Wszystkie pierwiastki są pojedyncze. Mielibyśmy wówczas

\frac{\sin x}{x}=\left(1-\frac{x^2}{\pi^2}\right)\left(1-\frac{x^2}{4\pi^2}\right)\ldots.

Korzystając z rozwinięcia funkcji sinus w szereg Maclaurina mamy też

\frac{\sin x}{x}=1-\frac{x^2}{3!}+\frac{x^4}{5!}+\ldots,.

Gdyby w iloczynie nieskończonym przemnożyć wyrazy, otrzymalibyśmy początek rozwinięcia

\frac{\sin x}{x}=1-\left(1+\frac{1}{4}+\frac{1}{9}+\ldots\right)\frac{x^2}{\pi^2}+\ldots

Z porównania wyrazów przy x^2 można od razu otrzymać wynik. Wyprowadzenie Eulera szybko stało się sławne, choć było też krytykowane jako ryzykowne. Dowód, iż sinus można w istocie przedstawić jako taki iloczyn nieskończony, przekraczał możliwości ówczesnej analizy. Korzystając z tego rozwinięcia można także znaleźć funkcje zeta dla parzystych argumentów, choć analiza staje się nieprzejrzysta.

Problem bazylejski pozostawił niedosyt także u Eulera, który wracał do niego kilkakrotnie. W roku 1743 podał bardzo zwyczajne wyprowadzenie wartości \zeta(2). Zaczynamy od rozwinięcia w szereg funkcji arcus sinus:

{\displaystyle t=\sin t+\sum_{n=1}^{\infty} \frac{1\cdot 3 \cdot \ldots (2n-1)}{2\cdot 4\cdot \ldots (2n)}\;\frac{\sin^{2n+1}t}{2n+1}.}

Następnie całkujemy obie strony w granicach od 0 do \pi/2. Mamy

{\displaystyle I_{2n+1}=\int_{0}^{\frac{\pi}{2}}\sin^{2n+1} t dt=\int_{0}^{\frac{\pi}{2}}\sin^{2n-1} t (1-\cos^2 t) dt=I_{2n-1}-\int_{0}^{\frac{\pi}{2}}[\sin^{2n-1} t \cos t]\cos t dt. }

Ostatnią całkę obliczamy przez części: \int v'u dt=vu-\int vu' dt w odpowiednich granicach. Wyrazy w nawiasie kwadratowym to v'=(\frac{1}{2n}\sin^{2n} t)', natomiast u=\sin t, w ten sposób \frac{2n+1}{2n}I_{2n+1}=I_{2n-1}. Ostatecznie

{\displaystyle \int_{0}^{\frac{\pi}{2}}\sin^{2n+1} t dt=\frac{2\cdot 4\cdot \ldots (2n)}{1\cdot 3 \cdot \ldots (2n+1)}}

Wracając do wyjściowego wyrażenia, dostajemy

{\displaystyle \frac{\pi^2}{8}=\sum_{n=0}^{\infty}\frac{1}{(2n+1)^2}=\dfrac{3}{4}\zeta(2).}

 

Wykorzystaną wyżej tożsamość dla dilogarytmów można wykazać rozbijając całkę po przedziale (0,1) na dwie całki po przedziałach (0,1-x) oraz (1-x,1). W tej drugiej zamieniamy zmienną 1-x=u i całkujemy przez części.

Liczby Bernoulliego. Dla naturalnego n \ge 2 definiujemy liczby Bernoulliego związkiem rekurencyjnym

(B+1)^n=B^{n},

który należy rozumieć w ten sposób, że wykładniki potęg B traktujemy jako indeksy. Razem z wartością B_0=1 związek ten określa ciąg liczb Bernoulliego. Stosując taki sam zapis wielomiany Bernoulliego B_n(x) (przy n\ge1) określamy następująco:

B_n(x)=(B+x)^n.

W zwykłym zapisie: 

{\displaystyle B_{n}(x)=\sum_{k=0}^{n}\binom{n}{k} B_{n-k} x^{k}. }

Wielomiany te począwszy od drugiego spełniają warunki

B_n(0)=B_n(1)=B_n \;\mbox{ oraz } B'_{n}(x)=nB_{n-1}(x).

Wzór Eulera-Maclaurina otrzymujemy w sposób rekurencyjny, całkując przez części:

{\displaystyle \int_{0}^{1}f(x)dx=\int_{0}^{1}B'_1(x)f(x)dx=B_1(x)f(x)\left.\right|_{0}^{1}-\int_{0}^{1}B_1(x)f'(x)dx.}

Następnie po prawej stronie zastępujemy B_1(x) przez B'_2(x) i znowu całkujemy przez części. Euler stosował tę procedurę ad infinitum, dziś raczej zatrzymujemy się na skończonej liczbie takich operacji i uzyskujemy wzór na resztę. Por. np. E. Hairer, G. Wanner, Analysis by Its History, Springer 2008.

Widmo wodoru i symetrie (2/2)

III. Wolfgang Pauli (1925)

Mechaniką kwantową nazywano z początku jedynie podejście macierzowe zapoczątkowane przez Wernera Heisenberga. Heisenberg nie potrafił jednak sobie poradzić z rachunkami dla atomu wodoru. Pierwsze kwantowe obliczenia energii stanów związanych elektronu w atomie wodoru przeprowadził Wolfgang Pauli. Wiemy z listu Heisenberga, że stało się to przed początkiem listopada 1925 r. Dopiero w połowie stycznia Pauli nadesłał tę pracę do „Zeitschrift für Physik”. Z kolei pierwsza praca Schrödingera w „Annalen der Physik” nosi datę wpłynięcia do wydawcy 27 I 1926 r. Obaj autorzy próbowali także rozwiązać zagadnienie relatywistyczne, ale im się to nie udało. Podejście Schrödingera omówiliśmy w poprzedniej części. Teraz zajmiemy się historycznie wcześniejszym, czysto algebraicznym podejściem Pauliego. 

Mamy do czynienia z hamiltonianem

H=\dfrac{{\bf p}^2}{2m}-\dfrac{e^2}{r}.

Rozwiązując zagadnienie klasyczne, należy znaleźć jak najwięcej całek ruchu, czyli wielkości zależnych od pędu i współrzędnych, które nie zmieniają się z czasem. Taką wielkością jest sam hamiltonian (zasada zachowania energii), a także moment pędu

L_i=\varepsilon_{ijk}x_jp_k,

gdzie sumujemy po powtarzających się indeksach, a \varepsilon_{123}=1, a poza tym jest antysymetryczne we wskaźnikach, tzn zmienia znak przy każdej zamianie pary wskaźników, np.

\varepsilon_{213}=-\varepsilon_{123}=-1;\;\; \varepsilon_{223}=-\varepsilon_{223}=0.

W prawej części zastosowaliśmy regułę antysymetrii do przestawienia wskaźników 22, co oczywiście nic nie zmienia i dlatego nasz symbol antysymetryczny znika. Pauli skorzystał z faktu, że w przypadku ruchu keplerowskiego, znana jest jeszcze inna całka ruchu – wektor Lagrange’a-Laplace’a-Rungego-Lenza, o którego zawiłych dziejach pisaliśmy wcześniej:

{\bf R}=-\dfrac{e^2 {\bf x}}{r}+\dfrac{{\bf p}\times {\bf L}}{m}.

W przypadku kwantowym operatory pędu i momentu pędu nie komutują ze sobą, więc ich kolejność w iloczynie wektorowym nie jest oczywista. Ponadto nasz wektor powinien mieć składowe hermitowskie, jeśli ma opisywać jakąś wielkość fizyczną. Pauli stwierdził, że odpowiednim wektorem będzie

{\bf R}=-\dfrac{e^2 {\bf x}}{r}+\dfrac{1}{2}\,\dfrac{{\bf p}\times {\bf L}-{\bf L}\times{\bf p} }{m}.

Korzystamy ze związków komutacyjnych pędu i współrzędnych znalezionych przez Heisenberga: [x_j,p_j]=i\hbar \delta_{ij}, gdzie symbol Kroneckera równy jest 1, gdy i=j i znika w pozostałych przypadkach. Okazuje się, że mamy wówczas następujące związki komutacyjne: 

gif

Trójka operatorów R_{i} komutuje też z hamiltonianem, czyli rzeczywiście jest to stała ruchu: [H, R_{i}] =0. Jeśli ograniczymy się do stanów o ustalonej energii E<0, możemy hamiltonian uważać za mnożenie przez tę energię:

png

Czynnik liczbowy po prawej stronie możemy uprościć, definiując nowy wektor

{\bf B}=\sqrt{\dfrac{m}{-2E}}{\bf R}.

Cała algebra upraszcza się, gdy zdefiniujemy nowe operatory:

{\bf A}_{\pm}=\dfrac{1}{2}\left({\bf L}\pm {\bf B}\right).

Mamy wtedy

[A_{\pm i}, A_{\pm j}]=i\hbar \varepsilon_{ijk} A_{\pm k},

dwie trójki operatorów zachowujące się dokładnie tak jak moment pędu:

[L_i,L_j]=i\hbar \varepsilon_{ijk} L_k.

Obie trójki operatorów komutują między sobą: [A_{+i},A_{-j}]=0. Możemy zastosować tutaj fakty znane w przypadku momentu pędu: dozwolone wartości kwadratu operatora to

\begin{array}{l} {\bf A}_{+}^2=\hbar^2 a_{-}(a_{-}+1), \\[10pt] {\bf A}_{-}^2=\hbar^2 a_{+}(a_{+}+1).\end{array}

Wektory {\bf R} oraz {\bf L} są prostopadłe: {\bf R}\cdot {\bf L}=0. Wobec tego

{\bf A}_{\pm}^2=\dfrac{1}{4}\left({\bf L}^2+\dfrac{m}{-2E}{\bf R}^2\right).

Oznacza to, że wartości obu kwadratów są jednakowe: a_{+}=a_{-}\equiv a. Obliczając kwadrat wektora LLRL, otrzymujemy:

{\bf R}^2=e^4+\dfrac{2H}{m}\,(L^2+\hbar^2)=e^4-\dfrac{-2E}{m}\,(L^2+\hbar^2).

Zatem

{\bf A}_{\pm}^2=\dfrac{1}{4}\left(\dfrac{me^4}{-2E}-\hbar^2\right),

skąd dozwolone energie stanów związanych E<0 są równe

E=-\dfrac{me^4}{2\hbar^2 (2a+1)^2}.

Wartości 2a+1 są równe liczbie dozwolonych rzutów operatora A_{\pm}3, czyli właśnie 2a+1=n. Ponieważ a przyjmować mogą wyłącznie wartości połowkowe: 0, 1/2,1, 3/2,\ldots, więc n=1,2,3,\ldots. Mamy n stanów o różnym rzucie A_{-3} i także n stanów o różnym rzucie A_{+3}, łącznie zatem n^2 stanów o tej samej energii.

Wolfgang Pauli w roku 1925 nie znał teorii grup i algebr Liego, ponieważ dotąd nie były to dziedziny przydatne w fizyce. Algebry operatorów z komutatorem nazywają się algebrami Liego. Obliczenia Pauliego wykorzystały fakt, że mamy tu do czynienia z sumą prostą dwóch algebr \mathfrak{so}(3) odpowiadających grupie obrotów w przestrzeni trójwymiarowej (operatory momentu pędu to generatory obrotów). Suma prosta jest w tym przypadku izomorficzna z algebrą obrotów w przestrzeni czterowymiarowej: \mathfrak{so}(4)=\mathfrak{so}(2)\bigoplus \mathfrak{so}(2). Pauli odkrył więc, że stany związane atomu wodoru podlegają symetrii obrotowej w czterech wymiarach i stąd bierze się degeneracja poziomów energetycznych. Rozważania teoriogrupowe pierwszy przedstawił w tym kontekście asystent Pauliego z Zurychu Valentin Bargmann, który niedługo potem pracował z Einsteinem w Princeton.

IV. Vladimir Fock (1935)

Bezpośrednie podejście do symetrii stanów związanych atomu wodoru zaprezentował Vladimir Fock na seminarium w swoim Instytucie Fizyki Uniwersytetu Leningradzkiego 8 lutego 1935 roku i w tym samym roku opublikował. W Związku Sowieckim rozkręcała się właśnie paranoja towarzysza Stalina znana jako Wielki Terror albo jeżowszczyzna – od nazwiska Nikołaja Jeżowa. To w tym właśnie roku Stalin stwierdził z trybuny: „Żyje się lepiej, żyje się weselej”. Trzydziestosześcioletni Fock, wybitny fizyk matematyczny, aresztowany został 8 marca 1935 roku, lecz tego samego dnia wypuszczony. Nocą 11 lutego 1937 roku znów został aresztowany (były to czasy, gdy wielu ludzi, jak kompozytor Dymitr Szostakowicz, czekało nocami ze spakowaną walizką, aż podjedzie czarny samochód NKWD). Terror stalinowski tym się różnił od nazistowskiego, że w Niemczech znane były z góry prześladowane grupy: Żydzi, komuniści, lewicowi artyści, reszta mogła spać w miarę spokojnie. W Rosji każdy mógł okazać się winny, choćby sam o tym nie wiedział. Fock został po kilku dniach zwolniony, ponieważ wstawił się za nim Piotr Kapica, mający dojście do ucha Stalina. Lata trzydzieste są bardzo twórczym okresem życia Vladimira Focka (metoda Hartree-Focka, przestrzeń Focka itd.), być może fizyka matematyczna była dla niego sposobem wymknięcia się z upiornej rzeczywistości.

Praca Focka wykorzystuje przestrzeń pędów. Funkcję falową można przedstawić jako transformatę Fouriera:

\psi({\bf x})={\displaystyle \int \exp{\left(\frac{i{\bf px}}{\hbar}\right)} \psi({\bf p})d^3{\bf p} }. 

Funkcja \psi({\bf p}) odgrywa jest gęstością prawdopodobieństwa w przestrzeni pędów. Transformacja taka jest, jak wiadomo, odwracalna i wzajemnie jednoznaczna. Równanie Schrödingera przyjmuje w przestrzeni pędów następującą postać:

\left( \dfrac{{\bf p}^2}{2m}-E \right)\psi({\bf p})=\dfrac{e^2}{2\pi^2\hbar}{\displaystyle \int \dfrac{ \psi({\bf q}) d^{3}{\bf q} }{|{\bf p}-{\bf q}|^2}}.

Uprościła się nam część z energią kinetyczną: teraz operator pędu to mnożenie przez pęd, ale nieco skomplikowała część z energią potencjalną: iloczyn funkcji przeszedł w splot transformat. Jeśli wprowadzimy oznaczenie:

E=-\dfrac{p^2_0}{2m},

możemy równanie Schrödingera zapisać w postaci quasi-czterowymiarowej:

\left( {\bf p}^2+p^2_0 \right)\psi({\bf p})=\dfrac{me^2}{\pi^2\hbar}{\displaystyle \int \dfrac{ \psi({\bf q}) d^{3}{\bf q} }{|{\bf p}-{\bf q}|^2}}.

Następnym krokiem jest zamiana zmiennych dana rzutem stereograficznym.

stereo

Trówymiarowy wektor {\bf p}/p_0 rzutujemy na punkt u leżący na 3-sferze tak, że linia łącząca końce wektorów przechodzi przez biegun północny 3-sfery. Nadal mamy trzy wymiary, ale teraz zanurzone w przestrzeni czterowymiarowej. Definiujemy nową funkcję

\hat{\psi}(u)=\dfrac{1}{\sqrt{p_0}}\left(\dfrac{p^2_0+{\bf p}^2}{2p_0} \right)^4 \psi({\bf p}).

Można obliczyć, że przy takiej definicji zachowane jest unormowanie funkcji:

CodeCogsEqn

Po lewej stronie całkujemy po powierzchni 3-sfery, po prawej po trójwymiarowej przestrzeni pędów. W nowych zmiennych równanie Schrödingera przybiera postać następującą:

\hat{\psi}(u)=\dfrac{me^2}{2\pi^2 p_0\hbar}{\displaystyle \int \dfrac{\hat{\psi}(v) dS}{|v-u|^2}}.

W tej postaci równanie jest jawnie symetryczne na obroty w przestrzeni czterowymiarowej (grupa SO(4)). Na 3-sferze zanurzonej w przestrzeni czterowymiarowej można określić harmoniki sferyczne podobnie jak na 2-sferze zanurzonej w przestrzeni trójwymiarowej. Rozpatrujemy w tym celu jednorodne wielomiany \mathcal{ Y} stopnia \lambda, które spełniają równanie Laplace’a w czterech wymiarach:

\Delta {\mathcal Y}_{\lambda\alpha}(u)=0,

gdzie \alpha numerują różne wielomiany spełniające ten warunek. Jest ich w przestrzeni czterowymiarowej (\lambda+1)^2. Gdy wyłączymy z tych wielomianów czynnik |u|^{\lambda}, otrzymamy harmoniki sferyczne w czterech wymiarach:

\Delta {\mathcal Y}_{\lambda\alpha}(u)=|u|^{\lambda}Y_{\lambda\alpha}(u/|u|).

Harmoniki (hiper-)sferyczne zależą tylko od współrzędnych kątowych na sferze. Okazuje się, że funkcje te spełniają równanie (dowód poniżej):

Y_{\lambda\alpha}(u)=\dfrac{\lambda+1}{2\pi^2}{\displaystyle \int \dfrac{Y_{\lambda\alpha}(v) dS}{|v-u|^2}}.

Porównując z równaniem Schrödingera, otrzymujemy

\dfrac{me^2}{p_0\hbar}=\lambda+1 \Rightarrow E=-\dfrac{me^4}{2\hbar^2 (\lambda+1)^2}.

Widać, że \lambda+1=n=1,2,3,\ldots, bo \lambda było stopniem wielomianu, a więc liczbą całkowitą nieujemną. Liczba różnych stanów kwantowych o tej samej energii jest równa liczbie harmonik hipersferycznych, czyli n^2. Zaiste, żyje się lepiej, żyje się weselej.

Całą tę procedurę można uugólnić na „atom wodoru” w \mathbb{R}^n dla n\ge 2, lecz oprócz ew. przypadku dwuwymiarowego, ma to znaczenie tzw. akademickie. Zmieniają się tylko różne współczynniki, w 1957 r. zrobił te obliczenia S.P. Alliluev.

Podejście Focka doczekało się później przeniesienia do mechaniki klasycznej. O jednej z prac tego rodzaju kiedyś tu wspominałem. 

Obliczenia

Podamy dowód równania całkowego dla harmonik sferycznych w czterech wymiarach elegancką metodą podaną przez M. Bandera, C. Itzyksona, Rev. Mod. Phys. 38 (1966), 330-345. Korzystamy z faktu, że f(v)=1/|u-v|^2 spełnia w \mathbb{R}^4 równanie Laplace’a. Bierzemy jeszcze drugą funkcję harmoniczną {\mathcal Y}(v) i korzystamy z tożsamości Greena:

{\displaystyle \int (f\Delta {\mathcal Y}-{\mathcal Y}\Delta f) d^4 v=\int \left(f\dfrac{ \partial {\mathcal Y} }{\partial n}-{\mathcal Y}    \dfrac{ \partial f}{\partial n}\right)dS,}

po obszarze zaznaczonym na rysunku: jest to 3-sfera o promieniu jednostkowym wklęśnięta małą 3-sferą o promieniu \varepsilon\rightarrow 0 wokół punktu u. Zwrot wektorów normalnych zaznaczony jest na czerwono.

wcieta sfera

Lewa strona równania równa się zero. Obliczamy prawą stronę. Z jednorodności {\mathcal Y} wynika, że 

\dfrac{ \partial {\mathcal Y} }{\partial n}=\lambda {\mathcal Y}.

Wkład do drugiego składnika obliczamy osobno dla dużej i małej sfery. Oznaczmy s=|u-v|. Gradient funkcji f(v)=s^{-2} ma kierunek do punktu u.

gradient

Wartość gradientu to pochodna (s^{-2})'=-2s^{-3}. Zatem składowa normalna pochodnej jest równa na dużej sferze

\dfrac{ \partial f}{\partial n}=-\dfrac{2\sin\alpha/2}{s^2\cdot 2\sin\alpha/2}=-\dfrac{1}{s^2}.

Została nam jeszcze całka po małej sferze. W miarę jak zbliżamy się do punktu u możemy z coraz lepszą dokładnością zastąpić {\mathcal Y}(v) przez wartość w środku małej sfery: {\mathcal Y}(u). Gradient f ma kierunek i zwrot taki, jak normalne zewnątrzne dla małej sfery, czyli zostaje nam całka po połowie małej sfery:

{\displaystyle {\mathcal Y}(u) \dfrac{2}{\varepsilon^3} \int dS={\mathcal Y}(u) 2\pi^2,}

gdzie skorzystaliśmy z faktu, że pole powierzchni 3-sfery to 2\pi^2 r^3. Łącząc otrzymane wyniki, dostajemy równanie całkowe na funkcję Y={\mathcal Y}|_{S^3}.

V. Jeszcze raz Erwin Schrödinger, czyli supersymetryczna mechanika kwantowa avant la lettre (1940)

Idea supersymetrii, zwanej pieszczotliwie SUSY, powstała w latach siedemdziesiątych XX w. W kwantowej teorii pola oznaczało to symetrię między bozonami i fermionami. Schrödinger nigdy nie słyszał o tym pojęciu, jednak z perspektywy czasu jego metoda, którą tu przedstawimy, znalazła swoje miejsce w supersymetrycznej mechanice kwantowej. Niezależnie od tego, czy w przyrodzie istnieje supersymetria, metody te znalazły swoje zastosowania w innych dziedzinach.

Schrödinger zajmował się zagadnieniem faktoryzacji hamiltonianu, tzn. przedstawienia operatora Hamiltona jako iloczynu innych operatorów. Pokażemy najpierw ideę tego podejścia, a potem zastosujemy je do atomu wodoru.

Załóżmy, że mamy rozwiązać jednowymiarowe zagadnienie własne dla operatora Hamiltona z pewnym potencjałem V(x):

H=-\dfrac{d^2}{dx^2}+V(x).

Tworzymy parę operatorów

{\mathcal A}=\dfrac{d}{dx}+{\mathcal W}(x),

{\mathcal A}^{\dag}=-\dfrac{d}{dx}+{\mathcal W}(x).

Za ich pomocą da się utworzyć dwa hamiltoniany:

H^{(1)}={\mathcal A}^{\dag}{\mathcal A}=-\dfrac{d^2}{dx^2}+{\mathcal W}^{2}(x)-{\mathcal W}'(x),

H^{(2)}={\mathcal A}{\mathcal A}^{\dag}=-\dfrac{d^2}{dx^2}+{\mathcal W}^{2}(x)+{\mathcal W}'(x).

Funkcję {\mathcal W}(x) nazywamy superpotencjałem, należy ją dobrać tak, żeby przydała się w rozwiązaniu wyjściowego zagadnienia.

Niech \psi będzie funkcją własną operatora H^{(1)}, tzn. H^{(1)}\psi=E\psi. Działając na obie strony tej równości z lewej strony operatorem {\mathcal A} otrzymamy:

{\mathcal AA}^{\dag}{\mathcal A}\psi=E{\mathcal A}\psi \,\, \Rightarrow H^{(2)}{\mathcal A}\psi=E{\mathcal A}\psi.

Znaczy to, że {\mathcal A}\psi jest funkcją własną operatora H^{(2)} o tej samej wartości własnej. Podobnie możemy pokazać, że startując od funkcji własnej operatora H^{(2)}\chi=E\chi, możemy skonstruować wektor własny operatora H^{(1)} jako {\mathcal A}^{\dag}\chi. Jedynym wyjątkiem jest sytuacja, gdy {\mathcal A}\psi=0 lub {\mathcal A}^{\dag}\chi=0. Można pokazać, że tylko jedna z tych funkcji o zerowej wartości własnej daje się unormować (jest całkowalna w kwadracie).

Zastosujemy metodę SUSY do równania dla radialnej funkcji falowej (por. część II):

-\dfrac{\hbar^2}{2m}\,\dfrac{\partial^2 u}{\partial r^2}+\left(\dfrac{\hbar^2 l(l+1)}{2m r^2}-\dfrac{e^2}{r}\right)u=Eu.

Zapiszemy je w wersji przeskalowanej, żeby mniej pisać:

H_{l}=-\dfrac{d^2}{dx^2}-\dfrac{1}{x}+\dfrac{l(l+1)}{x^2}.

Jako superpotencjał wybieramy funkcję

{\mathcal W}(x)=-\dfrac{l+1}{x}+\dfrac{1}{2(l+1)}.

Pomocnicze hamiltoniany są równe:

H_{l}^{(1)}=H_{l}+\dfrac{1}{4(l+1)^2}.

H_{l}^{(2)}=H_{l+1}+\dfrac{1}{4(l+1)^2}.

Widzimy, że operatory {\mathcal A, \mathcal A}^{\dag} pozwalają przechodzić między różnymi wartościami l bez zmiany energii. Zaczniemy od poszukania funkcji odpowiadającej energii zero:

{\mathcal A}\psi=\left(\dfrac{d}{dx}-\dfrac{l+1}{x}+\dfrac{1}{2(l+1)}\right)\psi=0.

Rozwiązaniem tego równania jest funkcja

\psi_{0l}(x)=\exp{(-\int_{0}^{x}{\mathcal W}(y)dy)}=x^{l+1}\exp{(-x/2(l+1))}.

Energia tego stanu jest równa

E=-\dfrac{1}{4(l+1)^2},

co w jednostkach fizycznych daje -me^2/(2\hbar^2 (l+1)^2).

Związek między operatorami pomocniczymi można zapisać jako

H_{l}^{(2)}=H_{l+1}^{(1)}+\dfrac{1}{4(l+1)^2}-\dfrac{1}{4(l+2)^2}.

Niech \psi_{0,l+1} będzie stanem zerowym operatora H_{l+1}^{(1)}. Mamy więc

H^{(2)}_{l} \psi_{0,l+1}=\left(\dfrac{1}{4(l+1)^2}-\dfrac{1}{4(l+2)^2}\right) \psi_{0,l+1}.

W takim razie stan \psi_{1,l+1}={\mathcal A}_{l}^{\dag}\psi_{0,l+1} jest także stanem własnym H^{(1)}_{l} o tej samej wartości własnej, czyli mamy

H^{(1)}_{l}\psi_{1,l+1}=\left(\dfrac{1}{4(l+1)^2}-\dfrac{1}{4(l+2)^2}\right) \psi_{1,l+1}.

Ale H_{l}^{(1)}=H_{l}+\dfrac{1}{4(l+1)^2}, zatem

H_{l}\psi_{1,l+1}=-\dfrac{1}{4(l+2)^2}\psi_{1,l+1}, 

energia stanu \psi_{1,l+1} jest równa -\frac{1}{4(l+2)^2}. Kontynuując tę procedurę, otrzymamy po \nu krokach stan \psi_{\nu l}={\mathcal A}_{l}^{\dag}{\mathcal A}_{l+1}^{\dag}\ldots {\mathcal A}_{l+\nu-1}^{\dag}\psi_{0,l+1} o energii

E_{\nu l}=-\dfrac{1}{4(l+\nu+1)^2}.

Zazwyczaj oznacza się l+\nu-1=n. Procedura ta pozwala także wyznaczyć funkcje falowe za pomocą działania operatorów {\mathcal A}^{\dag}

Tutaj kończymy niekompletny przegląd sposobów podejścia do problemu atomu wodoru w nierelatywistycznej mechanice kwantowej. Od samego początku, od 1925 roku, wiedziano, że potrzebne jest podejście relatywistyczne. Od strony rachunkowej zapewniło to równanie Diraca, choć strona pojęciowa – kwantowa teoria pola – utrwaliła się nieco później. Poprawki relatywistyczne obejmują strukturę subtelną oraz jeszcze mniejszy efekt: przesunięcie Lamba, które ekscytowało fizyków pod koniec lat czterdziestych ub. wieku. Wygląda to następująco od strony eksperymentalnej.

Widmo wodoru i symetrie (1/2)

I. Od Balmera do Bohra

Naszym bohaterem jest zbiór linii widmowych wodoru i proste wyrażenie, które go opisuje. Widmo składa się z serii, z których najbardziej znana jest seria Balmera przypadająca na obszar widzialny i bliski nadfiolet.

 

Długości fali w angstremach (1 {\rm \AA}=10^{-10} {\rm m}).

Jakob Balmer, znając długości czterech pierwszych linii, odgadł ukrytą w nich prawidłowość. Długości fal spełniają równanie

\lambda=h\,\dfrac{n^2}{n^2-4},\;\;n=3,4,5,6,

gdzie h jest stałą. Okazało się, że seria linii jest nieskończona, jeszcze za życia Balmera jego wzór potwierdził się dla kilkunastu linii. Okazało się też, że istnieją inne serie widmowe. Wszystkie można opisać wzorem

\dfrac{1}{\lambda}=R\left(\dfrac{1}{m^2}-\dfrac{1}{n^2}\right),\; n=m+1,\,m+2,\,\ldots,

gdzie m=1,2,3, \ldots, a stała R zwana jest stałą Rydberga. Co ważne, wzór Balmera, w tej wersji zwany najczęściej wzorem Rydberga, w przypadku wodoru spełniony jest bardzo dokładnie, choć jeszcze pod koniec XIX wieku zaobserwowano, że linie widmowe wodoru są naprawdę dubletami: parami bardzo blisko położonych linii. Tą tzw. strukturą subtelną nie będziemy się tu zajmować. Wyjaśnia ją równanie Diraca, a więc uwzględnienie efektów relatywistycznych oraz spinu elektronu. Efekty relatywistyczne są jednak poprawkami do energii rzędu \alpha^2, gdzie \alpha\approx\frac{1}{137} jest stałą struktury subtelnej, a więc pięć rzędów wielkości mniejszymi.

Postać wzoru Rydberga łatwo zrozumieć jako zapis zasady zachowania energii, jeśli posłużymy się pojęciem fotonu, wprowadzonym przez Alberta Einsteina w 1905 r. (określenie foton jest dużo późniejsze). Cząstki światła mają energię

E=h\nu=\dfrac{h c}{\lambda},

h, c, \nu oznaczają odpowiednio stałą Plancka, prędkość światła i częstość fotonu. Zatem wzór Rydberga oznacza, że poziomy energetyczne elektronu w atomie wodoru dane są równaniem

E_n=-\dfrac{hcR}{n^2},\,\, n=1,2,3,\ldots.

Dlaczego taka, a nie inna wartość R? Dlaczego pojawia się tu kwadrat liczby naturalnej? Tak proste wyrażenie powinno mieć jakieś uzasadnienie. 

Niels Bohr pierwszy podał teoretyczne wyjaśnienie wartości stałej Rydberga w swoim planetarnym modelu atomu. Energie elektronu na dozwolonych orbitach są w nim równe

E_n=-\dfrac{me^4}{2\hbar^2 n^2},

tutaj m oznacza masę elektronu, e^2=\frac{q_e^2}{4\pi\epsilon_0} to kwadrat ładunku elementarnego razy stała z prawa Coulomba, \hbar\equiv h/2\pi. Liczba naturalna n jest u niego po prostu numerem orbity i konsekwencją postulatu kwantowego:

L=mvr=n\hbar.

Słowami: moment pędu L elektronu na orbicie o promieniu r i prędkości v jest wielokrotnością stałej Plancka. Postulat ten nie wynikał z głębszych rozważań, trzeba go było przyjąć, aby otrzymać prawidłowe wyniki. Można powiedzieć, że Bohr przesunął zgadywankę Balmera z numerologii na teren fizyki.

Ogromnym sukcesem było powiązanie stałej Rydberga z wielkościami elementarnymi: masą i ładunkiem elektronu, stałą Plancka i siłą oddziaływań elektrostatycznych. Zawsze kiedy uda się tego rodzaju sztuka, znaczy, że jesteśmy blisko jakieś bardziej fundamentalnej prawdy. Jednak model Bohra od początku był prowizoryczny. W myśl klasycznej elektrodynamiki elektron krążący po orbicie z pewną częstością f powinien promieniować falę elektromagnetyczną o częstości f. Tymczasem w jego modelu do emisji promieniowania dochodzi, gdy elektron przeskakuje między dwiema orbitami, z których każda charakteryzuje się jakąś częstością krążenia f_n. Podobieństwo do fizyki klasycznej pojawia się dopiero, gdy weźmiemy dwie orbity o dużych numerach, wtedy

\nu_{n+1 n}\approx f_{n}\approx f_{n+1}.

Niels Bohr bardzo niechętnie pogodził się z ideą fotonu. Rozumiał oczywiście, że eksperyment potwierdza proste równanie h\nu=E_n-E_m, tajemnicą był jednak mechanizm fizyczny, jaki za tym stał. Nie znał go ani Einstein, ani Bohr, foton wszedł do fizyki na dobre dopiero w roku 1925. Teorią, która poprawnie przewiduje wartości energii w atomie wodoru, jest mechanika kwantowa. A w pełni konsekwentny opis emisji fotonu daje dopiero kwantowa teoria pola, w której foton jest kwantem pola elektromagnetycznego.

II. Erwin Schrödinger, 1925

W połowie roku 1925 Werner Heisenberg wpadł na pomysł, aby wprowadzić do fizyki wielkości, których mnożenie jest nieprzemienne: operatory albo macierze. W krótkim czasie powstały trzy na pozór niezależne formalizmy do opisania fizyki kwantowej: macierze Heisenberga (oraz Maksa Borna i Pascuala Jordana, którzy wraz z Heisenbergiem rozwinęli tę ideę), funkcje falowe Erwina Schrödingera oraz abstrakcyjny formalizm Paula Diraca.

Krótkie omówienie formalizmu mechaniki kwantowej znajduje się na końcu wpisu.

Wersja Schrödingera najbardziej przypominała klasyczną fizykę drgań. Aby znaleźć dozwolone energie elektronu należy rozwiązać równanie 

-\dfrac{\hbar^2}{2m}\Delta\psi-\dfrac{e^2}{r}\psi=E\psi,

gdzie r jest odległością od jądra, a \Delta to laplasjan, czyli suma drugich pochodnych:

\Delta\equiv \dfrac{\partial^2}{\partial x^2}+\dfrac{\partial^2}{\partial y^2}+\dfrac{\partial^2}{\partial z^2}.

Wyraz z laplasjanem odpowiada energii kinetycznej, drugi wyraz po lewej stronie odpowiada energii potencjalnej. Szukamy takich funkcji \psi(x,y,z), które wstawione po lewej stronie dadzą po prawej liczbę pomnożoną przez tę samą funkcję \psi. Funkcja taka to funkcja własna, a energia jest wartością własną. Otrzymujemy w ten sposób stany niezależne od czasu, stacjonarne, i tylko takimi będziemy się zajmować.

Funkcje falowe \psi powinny znikać w nieskończoności oraz nie mieć osobliwości. Warunki te prowadzą do skwantowanych poziomów energetycznych. Ponieważ problem jest sferycznie symetryczny (energia potencjalna zależy tylko od odległości elektronu od protonu r), więc można wprowadzić współrzędne sferyczne: odległość od początku układu r, dopełnienie szerokości geograficznej do 90^{\circ} oznaczane \vartheta oraz długość geograficzną oznaczaną \varphi.

spherical

Korzystamy z tożsamości

\Delta\equiv \dfrac{\partial^2}{\partial x^2}+\dfrac{\partial^2}{\partial y^2}+\dfrac{\partial^2}{\partial z^2}=\dfrac{1}{r^2}\dfrac{\partial}{\partial r}\left(r^2 \dfrac{\partial}{\partial r}\right)-\dfrac{L^2}{\hbar^2},

gdzie L^2 jest operatorem zależnym tylko od kątów, a nie od r. Możemy zapisać równanie Schrödingera w postaci

L^2 \psi=\hbar^2\dfrac{\partial}{\partial r}\left(r^2\dfrac{\partial\psi}{\partial r}\right)+2mr^2\left(E+\dfrac{e^2}{r}\right)\psi.

Sama funkcja falowa nie musi być jednak sferycznie symetryczna i można ją zapisać w postaci iloczynu funkcji zależnych od promienia i od kątów:

\psi(r,\vartheta,\varphi)=R(r)Y(\vartheta,\varphi).

Podstawiając tę funkcję do równania Schrödingera i dzieląc obustronnie przez \psi możemy doprowadzić je do postaci:

\dfrac{L^2 Y}{Y}=\lambda=\dfrac{1}{R}\, \hbar^2\dfrac{\partial}{\partial r}\left(r^2\dfrac{\partial R}{\partial r}\right)+2mr^2\left(E+\dfrac{e^2}{r}\right).

Po lewej stronie mamy funkcje zależne od kątów, po skrajnej prawej zależne od odległości. Rozseparowaliśmy zmienne, oba wyrażenia muszą równać się wspólnej stałej \lambda. Mamy więc dwa prostsze równania:

\begin{array}{c} -\dfrac{\hbar^2}{2m}\,\dfrac{1}{r^2}\dfrac{\partial}{\partial r}\left(r^2\dfrac{\partial R}{\partial r}\right)+\left(\dfrac{\lambda}{2m r^2}-\dfrac{e^2}{r}\right)R=ER \\[20pt] L^2 Y=\lambda Y. \end{array}

Drugie z tych równań nie zawiera potencjału i jest stałym punktem programu dla wszystkich sytuacji z symetrią sferyczną. Rozwiązaniami są tzw. harmoniki sferyczne Y_{lm}(\vartheta,\varphi), gdzie l=0,1,2,\ldots, a dla każdej wartości l mamy 2l+1 różnych wartości m=-l,-l+1,\ldots. l Dozwolone wartości własne równe są \lambda=\hbar^2 l(l+1). Kształt przestrzenny tych funkcji każdy widział jako obrazki orbitali s,p,d itd. Funkcje te przydają się zawsze, gdy mamy do czynienia z rozkładem jakiejś wielkości na sferze, np. mapy promieniowania tła w kosmologii albo szczegóły ziemskiego pola grawitacyjnego z uwzględnieniem niesferyczności Ziemi itp (Wtedy oczywiście nie pojawia się w tych wzorach stała Plancka, ale to szczegół techniczny).

Spójrzmy raz jeszcze na pierwsze równanie (radialne), w którym wprowadzamy nową funkcję radialną: u(r)\equiv rR(r):

-\dfrac{\hbar^2}{2m}\,\dfrac{\partial^2 u}{\partial r^2}+\left(\dfrac{\hbar^2 l(l+1)}{2m r^2}-\dfrac{e^2}{r}\right)u=Eu.

Jest to równanie Schrödingera jednowymiarowe. mamy teraz jeden wymiar: radialny, ale bardziej skomplikowany potencjał: do energii elektrostatycznej doszedł dodatni człon z l(l+1). Jego znaczenie fizyczne dość łatwo zidentyfikować przez analogię do mechaniki klasycznej. W ruchu w polu kulombowskim możemy w każdej chwili rozłożyć wektor pędu elektronu na składową radialną p_r i prostopadłą do niego składową styczną p_t. Zgodnie z tw. Pitagorasa energia kinetyczna ma postać

E_k=\dfrac{p_r^2}{2m}+\dfrac{p_t^2}{2m}=\dfrac{p_r^2}{2m}+\dfrac{L^2}{2mr^2},

w ostatniej równości skorzystaliśmy z faktu, że moment pędu elektronu L=rp_{t}. Gdybyśmy dla takiego radialnego problemu napisali równanie Schrödingera, byłoby to właśnie równanie, które uzyskaliśmy w wyniku separacji zmiennych. Zatem dozwolone kwantowe wartości kwadratu momentu pędu są równe L^2=\hbar^2 l(l+1). Nie jest to, rzecz jasna, dowód, lecz wskazanie prawdopodobnej (i prawdziwej) interpretacji fizycznej naszego równania. Mamy więc efektywne potencjały zależne od nieujemnej całkowitej liczby kwantowej l. Wyglądają one w przypadku atomu wodoru następująco:

tmp_iispvexy

Studnia potencjału tylko w przypadku l=0 jest nieskończenie głęboka, wraz z rosnącym l staje się ona coraz płytsza. Nie będziemy rozwiązywać do końca tego równania radialnego. Okazuje się, że aby uzyskać funkcje znikające w nieskończoności i nie wybuchające w pobliżu r=0, rozwiązania mają postać

R_{nl}(r)=W_{n-1 l}(r)e^{-r/na_0},

gdzie n jest tzw. główną liczbą kwantową, a_0 promieniem Bohra (promieniem pierwszej orbity w modelu Bohra), a W jest wielomianem stopnia n-1. Dozwolone wartości l=0,1,\ldots, n-1. Prawdopodobieństwa dane są kwadratami funkcji falowej. Np. dla stanu podstawowego wodoru wygląda to tak.

tmp_72yjso5t

Pionowa linia wskazuje granicę obszaru dozwolonego klasycznie, tzn. takiego, że energia całkowita jest większa od energii potencjalnej (poza tym obszarem energia kinetyczna powinna być ujemna). Falowy charakter równania przejawia się w tym, że nic nie dzieje się nagle, funkcja zanika płynnie w pewnym obszarze. Fizycznie oznacza to możliwość przenikania barier potencjału, czyli efekt tunelowy, odpowiedzialny m.in. za świecenie gwiazd.

Energie stanów równe są dokładnie temu, co obliczył Bohr. Zależą one tylko od n, a nie zależą od wartości l, mimo że potencjał efektywny jest zupełnie inny przy różnych l. Łącznie danej wartości n odpowiada n^2 różnych rozwiązań. Bezpośrednie rozwiązanie równania Schrödingera nie bardzo pozwala zrozumieć, skąd się bierze aż taka rozmaitość. Te same energie powinniśmy otrzymywać dla jednakowego l i różnych wartości m, bo oznaczają one różne wartości rzutu momentu pędu na oś z. Zatem symetria obrotowa wyjaśnia tylko część degeneracji stanów w atomie wodoru. Jeśli weźmiemy pod uwagę potencjał inny niż kulombowski, to ta dodatkowa degeneracja zniknie: stany o różnych l rozszczepią się energetycznie. Tak jest np. w atomie litu, gdzie elektron walencyjny porusza się w efektywnym polu jądra oraz dwóch pozostałych elektronów. Z daleka mamy więc tylko ładunek (3-2)q_e=q_e, tak jak w atomie wodoru, z bliska jednak potencjał jest inny, choć nadal sferycznie symetryczny.

lithlev

Nawet po rozwiązaniu zagadnienia atomu wodoru za pomocą równania Schrödingera nadal niezbyt dobrze rozumiemy, dlaczego stany są zdegenerowane: E_{2s}=E_{2p}, E_{3s}=E_{3p}=E_{3d}, itd. W przyszłości pokażemy, że stany związane atomu wodoru wykazują  dodatkową symetrię i że łącznie grupą symetrii jest tu grupa obrotów w przestrzeni czterowymiarowej. Dopiero ten fakt wyjaśnia głębiej wzór Balmera.

Poniżej przedstawiłem niektóre szczegóły matematyczne dla zainteresowanych.

Zasady mechaniki kwantowej w przypadku jednej cząstki

Stany cząstki

Stan elektronu w formalizmie Schrödingera opisujemy za pomocą pewnej funkcji (zespolonej) falowej \psi(x,y,z,t). Rozmaite dopuszczalne funkcje można traktować jak wektory: dodawanie funkcji i mnożenie przez liczbę (zespoloną) daje inną dopuszczalną funkcję. Zbiorem funkcji może być np. zbiór funkcji znikających dostatecznie szybko w nieskończoności:

{\displaystyle \int_{{\bf R}^3}}\; |\psi(x,y,z)|^2 \, dV<\infty.

Określamy także operację iloczynu skalarnego dwóch funkcji:

(\psi,\chi)={\displaystyle \int_{{\bf R}^3}}\; \psi^{\star}\chi\, dV.

Iloczyn wektora przez siebie jest kwadratem jego długości, czyli normy:

\lVert \psi \rVert^2=(\psi,\psi)={\displaystyle \int_{{\bf R}^3}}\; |\psi(x,y,z)|^2 \,dV.

Definiując odległość dwóch wektorów \psi, \chi jako \Vert \psi-\chi\rVert otrzymujemy przestrzeń Hilberta (do definicji należy jeszcze dodać warunek zupełności: żeby ciągi zbieżne w normie nie wyprowadzały poza naszą przestrzeń).

Wielkości fizyczne

Wielkościom fizycznym odpowiadają operatory, czyli przekształcenia liniowe określone na przestrzeni funkcji. Liniowość oparatora A oznacza, że dla dowolnych dwóch wektorów \psi,\chi i dowolnych dwóch liczb zespolonych \alpha,\beta, mamy

A(\alpha \psi+\beta\chi)=\alpha A\psi+\beta A\chi.

Łatwo to sprawdzić w poszczególnych przypadkach, np. dla składowej x pędu otrzymamy: p_x(\psi_1+\psi_2)=p_x\psi_1+p_x\psi_2, bo pochodna sumy funkcji, to suma pochodnych itd. Operatory odpowiadające wielkościom fizycznym muszą być hermitowskie, tzn. dla dowolnych wektorów mamy

(\chi, A\psi)=(A\chi,\psi).

Warunek ten zapewnia, że mierzone wartości wielkości fizycznych są rzeczywiste, mimo że cały formalizm oparty jest na liczbach zespolonych.

Operatory można składać, czyli mnożyć, wykonując po prostu jedną operację po drugiej. Składając więc operator B i następnie operator A otrzymujemy AB, który działa następująco na wektor:

(AB)\psi=A(B\psi).

Jasne jest, że tak określone mnożenie operatorów na ogół jest nieprzemienne, tzn. wynik zależy od kolejności. W fizyce kwantowej szczególne znaczenie mają tzw. komutatory operatorów, zdefiniowane jako różnica między pomnożeniem ich w odmiennej kolejności: [A,B]=AB-BA.

Komutatory tej samej składowej współrzędnej i pędu nie komutują i muszą spełniać warunek odkryty przez Heisenberga:

[x,p_x]=i\hbar,

ale [x,p_y]=[x,p_z]=0. Komutują też między sobą operatory różnych składowych współrzędnej albo pędu. Z operatorów pędu i współrzędnych budować możemy operatory innych wielkości fizycznych, np. momentu pędu badź energii (hamiltonian). Wszystkie one muszą być hermitowskie. Szczególną rolę odgrywa hamiltonian H({\bf x},{\bf p}), gdyż określa ewolucję czasową układu. Spełnione musi być w każdej chwili równanie Schrödingera

i\hbar\dfrac{\partial\psi}{\partial t}=H\psi.

Gdy hamiltonian nie zależy od czasu, możemy szukać funkcji spełniających równanie 

H\chi=E\chi,

tzw. równanie Schrödingera bez czasu. Wówczas 

\psi(t)= \exp{\left(-\dfrac{iEt}{\hbar}\right)}\chi,

jest rozwiązaniem ogólniejszego równania Schrödingera. Ewolucja w czasie polega wówczas tylko na zmianie fazy zespolonej, jest to stan kwantowy o ustalonej energii, stan stacjonarny.

Postulat interpretacyjny

Wartość oczekiwana wielkości fizycznej A w stanie \psi dana jest równaniem

\langle A\rangle=\dfrac{(\psi,A\psi)}{(\psi,\psi)}.

Gdy używamy funkcji unormowanej (\psi,\psi)=1 z wyrażenia tego zostaje tylko licznik. Widzimy, że zawsze można funkcję falową pomnożyć przez dowolny niezerowy czynnik, nie zmieniając wyników doświadczenia. Jeśli interesuje nas pytanie, czy cząstka znajduje się w obszarze V możemy za operator A_V wziąć mnożenie przez funkcję charakterystyczną tego obszaru (równą 1 dla {\bf x}\in V oraz 0 poza obszarem), wtedy prawdopodobieństwo znalezienia cząstki wenątrz V dane jest

Pr(V)={\displaystyle \int_V}|\psi|^2\, dV.

(Zakładamy unormowanie funkcji \psi.)

Widać też szczególną rolę wektorów i stanów własnych. Jeśli spełnione jest równanie 

A\psi=a\psi,

to mówimy, że funkcja \psi jest wektorem własnym, a wartość a wartością własną. Z postulatu interpretacyjnego wynika, że w wyniku pomiaru wielkości A otrzymamy wartość a. A więc w tym przypadku wielkość fizyczna przyjmuje ściśle określoną wartość, nie ma żadnego kwantowego rozmycia. Łatwo zauważyć, że tylko w takim przypadku możemy mówić o ściśle określonej wartości wielkości fizycznej. Tworząc operator (A-a)^2 widzimy, że

\langle (A-a)^2\rangle=0 \Leftrightarrow A\psi=a\psi.

W sytuacji takiej nie ma żadnego rozrzutu wyników, otrzymujemy zawsze tylko i wyłącznie wartość a.

Dwa fakty matematyczne

Gdy pewien stan \psi jest jednocześnie stanem własnym dwóch operatorów A\psi=a\psi oraz B\psi=b\psi, to operatory te komutują na tym stanie:

AB\psi=Ab\psi=ab\psi=ba\psi=BA\psi.

Z kolei stany należące do różnych wartości własnych danego operatora A są ortogonalne, tzn. gdy A\psi=a\psi oraz A\chi=b\chi, to mamy

a(\psi,\chi)=(A\psi,\chi)=(\psi, A\chi)=b(\psi,\chi) \Leftrightarrow (a-b)(\psi,\chi)=0.

Szczegóły matematyczne problemu atomu wodoru

Laplasjan

Dla laplasjanu mamy tożsamość:

\Delta\equiv \dfrac{\partial^2}{\partial x^2}+\dfrac{\partial^2}{\partial y^2}+\dfrac{\partial^2}{\partial z^2}=\dfrac{1}{r^2}\dfrac{\partial}{\partial r}\left(r^2 \dfrac{\partial}{\partial r}\right)-\dfrac{({\bf x}\times {\bf \nabla})^2}{\hbar^2},

Najłatwiej sprawdzić to we współrzędnych kartezjańskich, licząc operator ({\bf x}\times {\bf \nabla})^2 i wyrażając operator r\frac{\partial}{\partial r} przez pochodne kartezjańskie:

r\dfrac{\partial }{\partial r}=x\dfrac{\partial }{\partial x}+y\dfrac{\partial }{\partial y}+z\dfrac{\partial }{\partial z},

gdzie korzystamy wielokrotnie z równości r^2=x^2+y^2+z^2. Podobnie możemy obliczyć kwadrat operatora po lewej stronie.

Moment pędu

Procedura przejścia do mechaniki kwantowej polega na zastąpieniu każdej zmiennej fizycznej odpowiednim operatorem. Każdą ze współrzędnych x,y,z zastępujemy mnożeniem przez odpowiednią współrzędną. Działając na funkcję \psi dają one nowe funkcję, x\psi,y\psi, z\psi. Podobnie operatory składowych pędu działając na funkcję, dają pochodne, \frac{\hbar}{i}\frac{\partial\psi}{\partial x} itd. 

W przypadku atomu wodoru z punktowym protonem w początku układu dowolny obrót wokół początku układu nie powinien zmieniać fizyki. W fizyce klasycznej oznacza to, że moment pędu układu jest stały. Jest on zdefiniowany jako

{\bf L}={\bf x} \times {\bf p}, \, \Leftrightarrow L_x=y p_z-z p_y, \, L_y=z p_x-x p_z, \, L_z=x p_y-y p_x,

w ostatnich trzech równaniach możemy cyklicznie przestawiać wskaźniki x\rightarrow y\rightarrow\ z\rightarrow x \ldots. Krócej zapisać można te związki w postaci:

L_i=\varepsilon_{ijk}x_jp_k,

gdzie zamiast x,y,z piszemy x_i, a symbol całkowicie antysymetryczny \varepsilon_{123}=1 i zmienia znak przy każdym przestawieniu dwóch wskaźników oraz \varepsilon_{ijk}=0, gdy jakieś wskaźniki się powtarzają. Zakładamy sumowanie po każdej parze powtarzających się wskaźników.

W mechanice kwantowej operatory L_i tworzymy dokładnie tak samo, tyle że teraz musimy pamiętać, że kolejność operatorów może być istotna. Operatory momentu pędu komutują z hamiltonianem atomu wodoru:

[H,L_i]=0,

Także operator kwadratu momentu pędu L^2=L_1^2+L_2^2+L_3^2 komutuje z hamiltonianem, a także z poszczególnymi składowymi momentu pędu:

[L^2,H]=0,\;\; [L^2,L_i]=0, \,\, i=1,2,3.

Jednakże operatory L_i nie komutują ze sobą:

[L_i,L_j]=i\hbar\varepsilon_{ijk} L_k.

Maksymalnym zbiorem komutujących operatorów jest więc H, L^2 oraz jedna z trzech składowych momentu pędu. Standardowo wybiera się tu L_3\equiv L_z. Możemy więc szukać funkcji własnych hamiltonianu, które będą zarazem funkcjami własnymi L^2 oraz L_3.

Wprowadzimy współrzędne sferyczne punktu,  Łatwo sprawdzić, że operatory momentu pędu zależą tylko od kątów, nie od r  Np.

L_3=\dfrac{\hbar}{i} \dfrac{\partial}{\partial \varphi}.

Możemy to sprawdzić, korzystając z wyrażeń na współrzędne kartezjańskie:

\left\{ \begin{array}{l} x=r\sin\vartheta\cos\varphi \\ y=r\sin\vartheta\sin\varphi \\ z=r\cos\vartheta. \end{array}\right.

Obliczamy, stosując wzór na pochodną funkcji złożonej:

\dfrac{\partial}{\partial \varphi}=\dfrac{\partial x}{\partial \varphi}\dfrac{\partial}{\partial x}+\dfrac{\partial y}{\partial \varphi}\dfrac{\partial}{\partial y}=-y\dfrac{\partial}{\partial x}+x\dfrac{\partial}{\partial y}.

W pozostałych składowych momentu pędy odległość r pojawia się raz w liczniku, a drugi raz w mianowniku przy różniczkowaniu, ostatecznie zostają wyrażenia zależne wyłącznie od kątów \vartheta, \varphi. Wracając do naszego równania z głównego tekstu:

L^2 \psi=\hbar^2\dfrac{\partial}{\partial r}\left(r^2\dfrac{\partial\psi}{\partial r}\right)+2mr^2\left(E+\dfrac{e^2}{r}\right)\psi.

Funkcja falowa \psi powinna być w pobliżu początku układu analityczna, tzn. zachowywać się jak wielomian stopnia l (może być stała, wtedy l=0) plus wyrazy wyższego stopnia. Można ją w pobliżu r=0 zapisać jako \psi=r^{l}Y(\frac{ {\bf x}}{r}) – wyłączyliśmy przed funkcję wszystkie potęgi r, pozostała część jest funkcją wektora jednostkowego, tzn. zależy tylko od kierunku. Drugi składnik po prawej stronie zawiera r w potęgach wyższych niż l-2, jest więc do pominięcia blisko początku układu. Obliczając pierwszy składnik po prawej stronie, dostaniemy

L^2 Y \rightarrow \hbar l(l+1) Y.

Funkcje własne kwadratu momentu pędu to wielomiany jednorodne (wszystkie składniki są tego samego stopnia  l) zmiennych x,y,z. Łatwo sprawdzić, że spełniają one warunek

\Delta(r^l Y)=0.

Funkcje Y_{lm} nazywane są harmonikami sferycznymi. Drugi wskaźnik informuje o wartości L_3\equiv L_z. Dla l=1 mamy funkcje (nie wypisujemy stałych normalizacyjnych), tzw. orbitale p:

\left\{ \begin{array}{l} Y_{1\pm 1} \sim\dfrac{x\pm iy}{r}= \sin\vartheta e^{\pm i\varphi}\\[5pt] Y_{10} \sim\dfrac{z}{r}=\cos\vartheta.\end{array}\right.

Dla l=2 otrzymujemy pięć orbitali d:

\left\{ \begin{array}{l} Y_{2\pm 2} \sim\dfrac{(x\pm iy)^2}{r^2}= \sin^2\vartheta e^{\pm i2\varphi}\\[8pt]Y_{2\pm 1} \sim\dfrac{(x\pm iy)z}{r^2}=\sin\theta\cos\vartheta e^{\pm i\varphi}\\[8pt] Y_{20}\sim \dfrac{2z^2-x^2-y^2}{r^2}=3\cos^2\vartheta-1.\end{array}\right.

Czynnik e^{im\varphi} określa wartość składowej z momentu pędu:

\dfrac{\hbar}{i}(e^{im\varphi})=m\hbar e^{im\varphi}.

Dla każdej wartości l mamy 2l+1 dopuszczalnych wartości L_z. Stany te powinny mieć taką samą energię.

 

 

Dlaczego atomy są trwałe?

Atomów nie można opisać za pomocą dziewiętnastowiecznej fizyki klasycznej. W doświadczeniach Hansa Geigera i Ernesta Marsdena, prowadzonych pod kierunkiem Ernesta Rutherforda w Manchesterze w latach 1909-1913, okazało się, że praktycznie cała masa atomu mieści się w bardzo małym obszarze o promieniu pojedynczych femtometrów (1 {\rm fm}=10^{-15} {\rm m}). Przedtem sądzono (model J.J. Thomsona), że atom zawiera rozmyty ładunek dodatni, w którym znadują się, niczym rodzynki w cieście, lekkie punktowe elektrony. Przy bombardowaniu cienkiej złotej folii za pomocą cząstek α (jąder helu) zdarzało się jednak, że cząstki te rozpraszały się pod wielkimi kątami, niemal zawracały. Byłoby to niemożliwe, gdyby dodatni ładunek rozmyty był na znacznym obszarze. Tak silne pole elektryczne wymagało niemal punktowego ładunku – atom musi więc zawierać niewielkie jądro. Tak narodził się model planetarny Ernesta Rutherforda.

Na rysunku nie można oddać różnicy skali między modelami Thomsona i Rutherforda. Elektrony krążą w znacznie większym obszarze kilkudziesięciu pikometrów (1 {\rm pm}=10^{-12} {\rm m}): w przypadku wodoru objętość atomu jest 2\cdot 10^{14} razy większa od objętości protonu w centrum. Znaczy to, że atom jest praktycznie pusty. Analogia z planetami krążącymi wokół Słońca niezbyt się tu jednak stosuje, ponieważ poruszający się z  przyspieszeniem elektron powinien emitować energię w postaci fal elektromagnetycznych. Z teorii Maxwella wynika, że w czasie rzędu 10^{-11} \,{\rm s} elektron powinien spaść na jądro. Atomy nie są stabilne – do takiego wniosku prowadzi Newtonowska mechanika w połączeniu z elektrodynamiką Maxwella.

Prowizorycznym wyjściem z sytuacji był model Nielsa Bohra: wprowadzał on dozwolone orbity elektronów i jakimś cudem przewidywał prawidłowo długości fal w widmie wodoru. Postulat kwantowania orbit jest nie do pogodzenia z fizyką klasyczną: trzeba bowiem założyć, że elektrodynamika czasem działa, a czasem nie. Jej prawa są z jakiegoś powodu zawieszone w przypadku orbit Bohra.

 Problem rozwiązała dopiero mechanika kwantowa. Przyjrzymy się, jak objaśnia ona stabilność atomu wodoru. Dla uproszczenia będziemy mówić o ruchu elektronu w polu elektrostatycznym nieruchomego jądra (wprowadzane w ten sposób przybliżenie łatwo zastąpić dokładniejszymi rachunkami). Mamy więc elektron o energii składającej się z energii kinetycznej oraz elektrostatycznej energii potencjalnej:

E=\dfrac{{\mathbf p}^2}{2m}-\dfrac{e^2}{r},

gdzie {\mathbf p} oraz m są odpowiednio pędem i masą elektronu, r jest jego odległością od punktowego jądra, a stała e^2\equiv\frac{q_e^2}{4\pi\varepsilon_0}. Nasz problem stabilności łatwiej zrozumieć, patrząc na wykres energii potencjalnej. 

Energia potencjalna w funkcji odległości elektronu od protonu (zaznaczone są dwa najniższe poziomy energetyczne atomu wodoru)

Zaznaczone są dozwolone wartości energii całkowitej. Energia krążącego elektronu jest stała tylko pod warunkiem pominięcia promieniowania. Inaczej będzie ona szybko się zmniejszać, a więc jak widać z wykresu nasz elektron będzie coraz ciaśniej okrążał proton. Studnia potencjału jest nieskończenie głęboka, bez dna (w przybliżeniu punktowego protonu). 

Mechanika kwantowa opisuje stany elektronu za pomocą funkcji falowej \psi(x,y,z)=\psi({\mathbf r}). Jej znaczenie jest statystyczne, pozwala ona obliczać rozmaite wartości średnie: np. średnią wartość energii kinetycznej, albo potencjalnej. Prawdopodobieństwo znalezienia elektronu w danym obszarze przestrzeni V jest równe

Pr(V)={\displaystyle \int_{V} |\psi|^2 dV}.

Oznacza to, że całka po całej przestrzeni musi być równa 1, mówimy wtedy, że funkcja falowa jest unormowana. Aby otrzymać rozmaite wartości średnie, musimy mieć przepis na ich tworzenie. Jest on następujący: każdej wielkości fizycznej przypisuje się operator. Np. operatorem składowej x położenia jest mnożenie przez x. Znaczy to, że pod działaniem tego operatora funkcja \psi przechodzi w x\psi. Bardziej skomplikowanym przypadkiem jest pęd. Składowa x pędu zastępowana jest braniem pochodnej po x:

\psi \mapsto \dfrac{\hbar}{i} \dfrac{\partial\psi}{\partial x}.

Pojawia się tutaj stała Plancka \hbar znak niechybny, że mamy do czynienia z fizyką kwantową, i jest tu jednostką urojoną – nasza funkcja \psi ma wartości zespolone. Z początku budziło to pewne zdumienie ojców mechaniki kwantowej, dziś wiemy, że liczby zespolone są tu nieodzowne. 

Mając pęd i położenie, możemy zbudować operator energii, czyli hamiltonian: zastępujemy po prostu pędy i położenia ich operatorami.  W jednym wymiarze wyglądałoby to następująco

H=-\dfrac{\hbar^2}{2m}\dfrac{\partial ^2}{\partial x^2}- \dfrac{e^2}{x}.

Pierwszy składnik oznacza, że należy dea razy wziąć pochodną po x i pomnożyć przez odpwoednią stałą, drugi składnik jest zwykłym mnożeniem funkcji. W trzech wymiarach mamy trzy składowe pędu, czyli trzy pochodne składające się w symbol zwany laplasjanem (czyli operatorem Laplace’a):

\Delta=\dfrac{\partial ^2}{\partial x^2}+\dfrac{\partial ^2}{\partial y^2}+\dfrac{\partial ^2}{\partial z^2}.

Zapisany w ten sposób hamiltonian ma postać:

H=-\dfrac{\hbar^2}{2m}\Delta-\dfrac{e^2}{r}.

Ostatni potrzebny nam składnik formalizmu to przepis na znajdowanie wartości średnich. Jeśli operator przypisany szukanej zmiennej nazwiemy A, to wartość średnia zmiennej jest równa

\langle A \rangle={\bf \int }\psi^{\star}A\psi dV.

Pojawia się tu funkcja zespolona sprzężona \psi^{\star}. Operatory odpowiadające wielkościom mierzalnym fizycznie (obserwablom) to tzw. operatory hermitowskie, które dają w powyższym przepisie wynik rzeczywisty, tak jak tego oczekujemy w eksperymencie. Hermitowskie są w szczególności operatory pędu, położenia i hamiltonian.

W zasadzie tyle formalizmu wystarczy, bez rozwiązywania równań różniczkowych, by pokazać, że dla dowolnej rozsądnej funkcji falowej (normowalnej) energia ograniczona jest z dołu. Czyli nie możemy uzyskać w żadnym eksperymencie mniej niż owo dolne ograniczenie. Co więcej, w każdym stanie związanym prawdopodobieństwo, że elektron znajdzie się bardzo blisko jądra jest znikome. Formalizm mechaniki kwantowej osiąga to dzięki wprowadzeniu funkcji \psi, która skoncentrowana w małym obszarze wymusza dużą energię kinetyczną. Jakościowo odpowiada to zasadzie nieoznaczoności: mała nieoznaczoność położenia oznacza dużą nieoznaczoność pędu, a więc i energii kinetycznej. Jednak zasady nieoznaczoności nie możemy tu zastosować wprost. 

Rozpatrzmy operator {\bf A} dany równaniem

{\bf A}={\bf p}-i\beta \dfrac{{\bf r}}{r},

gdzie \beta jest dowolną liczbą rzeczywistą. Ponieważ całka z kwadratu modułu {\bf A}\psi nie może być ujemna, otrzymujemy nierówność

\langle {\bf p}^2\rangle-2\beta\hbar\left\langle\dfrac{1}{r}\right\rangle+\beta^2\ge 0,\mbox{(*)}

słuszną dla każdego \beta. Bierzemy najpierw \beta=\hbar\langle\frac{1}{r}\rangle. Dostajemy nierówność

\langle {\bf p}^2\rangle\ge \hbar^2\left\langle \dfrac{1}{r}\right\rangle^2.

Dla dowolnej wartości r_0>0 możemy ograniczyć wartość całki do obszaru r<r_0, gdzie 1/r>1/r_0, otrzymujemy w ten sposób nierówność

\langle {\bf p}^2\rangle^{\frac{1}{2}}\ge \dfrac{\hbar}{r_0} Pr(r<r_0). 

Wrócimy do niej za chwilę. Raz jeszcze korzystamy z (*), tym razem dla \beta=\frac{me^2}{\hbar}. Porządkując wyrazy, otrzymujemy wartość oczekiwaną energii:

\boxed{ \left\langle \dfrac{{\mathbf p}^2}{2m}-\dfrac{e^2}{r}\right\rangle\ge -\dfrac{me^4}{2\hbar^2.}}

Mechanika kwantowa przewiduje zatem dolną wartość energii, równą -13,6\, \rm{eV}.

Aby oszacować \langle{\mathbf p}^2\rangle , założymy, że mamy elektron w stanie związanym, a więc całkowita energia jest ujemna – klasycznie znaczy to, że elektron nie może uciec z pola elektrostatycznego protonu. 

Mamy

\left\langle \dfrac{{\mathbf p}^2}{2m}-\dfrac{e^2}{r}\right\rangle<0,

co można przepisać w postaci

\left\langle \dfrac{{\mathbf p}^2}{4m}\right\rangle<-\left\langle \dfrac{{\mathbf p}^2}{4m}-\dfrac{e^2}{r}\right\rangle.

Do prawej strony możemy zastosować nierówność z ramki przy masie cząstki równej 2m. Otrzymujemy stąd szacowanie dla

\left\langle {\mathbf p}^2\right\rangle \le \dfrac{2me^2}{\hbar}.

Ostatecznie, prawdopodobieństwo znalezienia elektronu nie dalej niż r_0 od jądra spełnia nierówność

\boxed{Pr(r<r_0)<\dfrac{2 r_0}{a_0},}

gdzie a_0\equiv \frac{\hbar}{me^2}\approx 53 \,{\rm pm} zwane jest promieniem Bohra. Jest to promień pierwszej orbity w modelu Bohra.

Widzimy więc, że formalizm mechaniki kwantowej dostarcza wyjaśnienia, czemu atomy są trwałe, co jest niezmiernie ważnym faktem. Uwzględnienie poprawek relatywistycznych itd. niewiele tu zmienia. Można udowodnić więcej: także w układzie wielu jąder i wielu oddziałujących ze sobą elektronów kolaps jest niemożliwy. W tym przypadku ważną rolę odgrywa także fakt, iż elektrony są fermionami, tzn. żadne dwa z nich nie mogą zajmować tych samych stanów (wliczając spin). Podstawowe wyniki w tym obszarze należą do Elliotta Lieba i Waltera Thirringa. Rozważania takie są interesujące ze względów poznawczych, ale także pomagają zrozumieć zachowanie dużych układów, dla których bezpośrednie rachunki bez żadnych przybliżeń są niemożliwe.

Korzystałem z książki E. B. Manoukian, 100 Years of Fundamental Theoretical Physics in the Palm of Your Hand.
Integrated Technical Treatment, Springer Nature 2020.

Satyendra Nath Bose i ostatnia wielka praca Alberta Einsteina (1925)

Einstein w latach dwudziestych zasypywany był listami. Pisali do niego tacy, którzy właśnie rozwiązali zagadkę świata, inni znaleźli błędy w teorii względności i żądali, by się do nich ustosunkował, ktoś prosił o wsparcie albo pomoc w dostaniu się na uczelnię. Pisali także oczywiście nieznani naukowcy. W czerwcu 1924 roku otrzymał list z Indii od Satyendry Bosego wraz z załączoną pracą. Autor pragnął ni mniej, ni więcej, tylko by Einstein przełożył jego pracę na niemiecki oraz posłał do druku w „Zeitschrift für Physik” (nie wspomniał przy tym, że praca została odrzucona przez „Philosophical Magazine”):

Wielce szanowny panie, ośmielam się przesłać panu załączony artykuł do przejrzenia i zaopiniowania. Chciałbym wiedzieć, co pan o nim sądzi. (…) Nie znam niemieckiego w stopniu wystarczającym, aby przetłumaczyć artykuł. Jeśli uważa pan, że artykuł wart jest publikacji, to będę wdzięczny, jeśli przekaże go pan do publikacji w «Zeitschrift für Physik». Choć zupełnie mnie pan nie zna, to bez wahania proszę pana o taką rzecz. Gdyż wszyscy jesteśmy pańskimi uczniami poprzez pańskie prace. Nie wiem, czy jeszcze pan pamięta, że ktoś z Kalkuty prosił o pozwolenie na przekład pańskich prac z teorii względności na angielski. Udzielił pan zgody. Książka została opublikowana. Ja przełożyłem pański artykuł na temat ogólnej względności.

Rzeczywiście, praca Bosego na początku lipca została posłana do druku, pod tekstem jest notka: „przełożone przez A. Einsteina” oraz uwaga tłumacza, iż praca stanowi „ważny postęp”. Warto zwrócić uwagę na pokorę Alberta Einsteina: był najsławniejszym uczonym świata, niedawno przyznano mu Nagrodę Nobla, lecz zdecydował się na przekład i zarekomendowanie pracy kogoś zupełnie nieznanego (w dodatku jego znajomość angielskiego nie była zbyt dobra, więc rzecz nastręczała kłopoty praktyczne, podejrzewam, że pomagała mu jego pasierbica Ilse albo sekretarka Betty Neumann). Niewątpliwie uczynił to w interesie nauki, ponieważ praca Bosego wydała mu się oryginalna. Trzydziestoletni Bose uczył fizyki na uniwersytecie w Dakce i przedstawił nowe wyprowadzenie wzoru Plancka dla promieniowania cieplnego. Wzór ten wyprowadzano wciąż na nowo, nie tylko dlatego, że był ważny, ale i dlatego że te wszystkie wyprowadzenia nie były do końca zadowalające. Praca Bosego zawierała istotny szczegół techniczny, który zainteresował Einsteina, a mianowicie inne liczenie stanów dla gazu fotonów. Najkrócej mówiąc, Bose obliczał liczbę stanów gazu tak, jakby fotony były nierozróżnialne. Wyobraźmy sobie rzut monetą: mamy dwa wyniki (stany monety): orzeł albo reszka. Rozważmy teraz jednoczesny rzut dwiema monetami. Jakie są możliwe stany? dwa orły; dwie reszki; orzeł i reszka. W przypadku monet zawsze możemy odróżnić od siebie dwa wyniki: reszka na pierwszej i orzeł na drugiej oraz orzeł na pierwszej i reszka na drugiej. Gdy obliczamy prawdopodobieństwa, mamy 4 stany. W przypadku fotonów należy liczyć tak, jakby był tylko jeden stan orzeł-reszka, bo nasze monety są z natury nierozróżnialne.

satyendra
Einstein przełożył na niemiecki jeszcze jedną pracę Bosego, choć się z nią nie zgadzał. Hinduski uczony na podstawie pocztówki od Einsteina uzyskał na uczelni dwuletnie stypendium do Europy oraz – na tej samej podstawie – bezpłatną wizę niemiecką. Przyjechał do Europy, ale nie zrobił już nic podobnej wagi.

Einstein natomiast zastosował podejście Bosego do gazu kwantowego, tzn. zwykłego gazu atomów, lecz potraktowanego kwantowo. Okazało się, że ma on pewną niezwykłą własność: w dostatecznie niskiej temperaturze pewien ułamek atomów zgromadzi się w stanie o najniższej energii, a reszta będzie nadal tworzyć gaz, czyli przyjmować rozmaite dostępne energie. Było to przejście fazowe, jak skraplanie pary albo pojawianie się namagnesowania w żelazie, gdy obniżamy temperaturę. Zjawisko znane jest pod nazwą kondensacji Bosego-Einsteina, choć Bose nie ma z nim zupełnie nic wspólnego(*).

Kondensacja Bosego-Einsteina zachodzi tylko z tego powodu, że atomy „chętnie” zajmują ten sam stan, nie muszą się wcale przyciągać. Praca Einsteina stanowiła pierwszy przykład teoretycznego opisu przejścia fazowego i z tego powodu była zamieszczana w podręcznikach. Wyjaśniło się później, że nie wszystkie atomy będą się tak zachowywać, bo cząstki kwantowe dzielą się na dwie grupy: bozony i fermiony. Pierwsze mogą obsadzać licznie ten sam stan, drugie – tylko pojedynczo – jak np. elektrony. Tylko bozony mogą podlegać kondensacji, chyba że fermiony połączą się np. w pary, które będą już bozonami.

W roku 1925 Einstein zajmował się głównie nie fizyką kwantową, lecz konstruowaniem jednolitej teorii grawitacji i pola elektromagnetycznego. Miał to robić bez powodzenia przez następne 30 lat. W lipcu 1925 zaczęła się kwantowa rewolucja – Werner Heisenberg wysłał pierwszą pracę nt. mechaniki kwantowej, w ciągu miesięcy rozpoczął się najważniejszy przewrót w fizyce XX wieku. Einstein obserwował go z bliska, lecz nie wziął w nim udziału. Nie podzielał entuzjazmu młodszych kolegów i Nielsa Bohra dla nowej fizyki. Dlatego ta praca o gazie kwantowym jest ostatnią, która ma znaczenie, by tak rzec, podręcznikowe.
W końcu roku 1924 Einstein zapisał równania dla takiego gazu nieoddziałujących bozonów i przewidział kondensację (praca została opublikowana w styczniu 1925 r.). W roku 1995, równo siedemdziesiąt lat później, udało się ten podręcznikowy przykład zrealizować doświadczalnie. Wygląda to tak:

640px-Bose_Einstein_condensate

Widzimy tu rozkład prędkości atomów rubidu dla kilku zmniejszających się temperatur. Temperatura kondensatu to 170 nK (nanokelwinów, czyli 10^{-9} K). Atomy kondensują w stanie podstawowym, który ma postać spłaszczonej górki: odzwierciedla to kształt pułapki, w jednym kierunku bardziej stromej niż w drugim (prędkości zachowują się odwrotnie: rozkład jest szerszy w tym kierunku, w którym pułapka jest bardziej stroma – jest to przejaw zasady nieoznaczoności).

Autorzy tych eksperymentów, Eric Cornell i Carl Wieman, kilka lat później dostali Nagrodę Nobla, jest to obecnie cała dziedzina badań eksperymentalnych i teoretycznych.

Przyjrzyjmy się bliżej efektowi odkrytemu przez Einsteina. Bose najprawdopodobniej nie zdawał sobie sprawy, że traktuje fotony jak cząstki nierozróżnialne. Einstein zastosował podejście Bosego do cząstek „zwykłego” gazu jednoatomowego (można wtedy nie zajmować się drganiami i obrotami, które ważne są w przypadku cząsteczek chemicznych). Otrzymał zmodyfikowane równanie stanu gazu doskonałego, w którym ciśnienie jest mniejsze niż wynikałoby z równania Clapeyrona (pV=nRT). Koledzy, m.in. Paul Ehrenfest i Erwin Schrödinger, zwrócili mu uwagę, że licząc stany gazu na sposób Bosego, odchodzi od przyjętych zasad mechaniki statystycznej Boltzmanna. Można to przedstawić na obrazku. Mamy tu dwa stany i dwie cząstki do rozmieszczenia.

W statystyce Bosego-Einsteina cząstki są nierozróżnialne. To nowa cecha mechaniki kwantowej (której, pamiętajmy, wciąż jeszcze nie ma). Wiadomo było, że atomy są jednakowe, ale fizyka klasyczna nie bardzo potrafiła sobie z tym faktem poradzić. James Clerk Maxwell porównywał atomy do standaryzowanych wytworów fabrycznych (fabrykantem byłby tu Bóg). W zasadzie jednak atomy klasyczne powinny być rozróżnialne, co na obrazku statystyki Boltzmanna zaznaczyłem kolorami. Klasyczna fizyka statystyczna Boltzmanna była tu nie do końca konsekwentna, ponieważ we wzorach na entropię, należało wprowadzić dodatkowy czynnik ad hoc (tzw. poprawne zliczanie boltzmannowskie). W roku 1926 pojawił się drugi rodzaj statystyki, obowiązujący dla fermionów. Paul Dirac zauważył, że chodzi o symetrię funkcji falowej, która w przypadku bozonów jest całkowicie symetryczna na przestawienia cząstek identycznych, a w przypadku fermionów – antysymetryczna. Zapełnianie powłok elektronowych i orbitali w chemii są konsekwencją faktu, że elektrony są fermionami.

W świecie kwantowym (czyli naszym) każda cząstka jest albo bozonem, albo fermionem. Jest to fakt fundamentalny. Einstein, idąc w ślady Bosego, wprowadził do fizyki cząstki identyczne. Sam Bose prawdopodobnie nie zdawał sobie sprawy z konsekwencji nowego sposobu liczenia stanów. Zdroworozsądkowe liczenie stanów jak u Boltzmanna nie odpowiada rzeczywistości i nie jest zgodne z doświadczeniem. 

Wróćmy do gazu atomowych bozonów. Różni się on od fotonów tym, że liczba cząstek powinna być zachowana: atomy w naczyniu nie znikają ani nie pojawiają się znienacka, podczas gdy fotony mogą być emitowane i pochłaniane przez ścianki naczynia. W danej temperaturze T średnie zapełnienie stanów o energii \varepsilon_i jest równe wg statystyki Boltzmanna

\overline{n}_i=\lambda g_i \exp{\left(-\dfrac{\varepsilon_i}{kT}\right)},

gdzie \lambda jest pewną stałą normalizacyjną, g_i – liczbą stanów o energii \varepsilon_i, a k – stałą Boltzmanna. Iloczyn kT jest temperaturą wyrażoną w jednostkach energii i co do rzędu wielkości jest równy średniej energii cząstek w danej temperaturze (np. w jednoatomowym gazie doskonałym średnia energia kinetyczna atomów jest równa \frac{3}{2}kT).

Wynik otrzymany przez Einsteina dla gazu bozonów miał postać następującą:

\overline{n}_i=\dfrac{g_i}{\lambda^{-1}\exp{\left(\dfrac{\varepsilon_i}{kT}\right)}-1}.

Łatwo zauważyć, że oba wyrażenia dadzą ten sam wynik, gdy wartość eksponenty jest dużo większa od 1 i można tę jedynkę w mianowniku pominąć. Na ogół średnia liczba obsadzonych stanów bozonowych jest większa, niż przewiduje to statystyka Boltzmanna. Podobne wyrażenie można też uzyskać dla fermionów, mamy wtedy do czynienia z gazem fermionów. Przykłady to gaz elektronów w metalu albo białym karle. Wyrażenie różni się znakiem jedynki w mianowniku, ale nie bedziemy tej kwestii rozwijać.

Einstein zastosował statystykę BE do gazu nieoddziałujących atomów zamkniętych w pudle. My zastosujemy ją do innej sytuacji, a mianowicie nieoddziałujących bozonów zamkniętych w parabolicznym potencjale. Jest to zwykły oscylator harmoniczny. Okazuje się, że sytuację taką można zrealizować eksperymentalnie, a w dodatku jest ona fizycznie przejrzysta i Einstein nie miałby żadnych trudności z zapisaniem wyrażeń, które rozpatrzymy niżej. Po prostu nikomu się wówczas nie śniło, że można będzie taki eksperyment zrealizować, więc nie miało sensu robić obliczenia dla tego przypadku. Choć mechaniki kwantowej ciągle jeszcze nie było, to wiadomo było, że energia oscylatora jest skwantowana i równa

E=h\nu(n_x+n_y+n_z),

gdzie h jest stałą Plancka, \nu – częstością oscylatora, a liczby kwantowe n_i są całkowite i nieujemne, przy czym . Kolejne dozwolone tworzą drabinę stanów oddalonych o h\nu. Inaczej mówiąc, dozwolone energie są równe

E=nh\nu,\,\,\, \mbox{gdzie}\,\,\, n=n_x+n_y+n_z.

Jak łatwo obliczyć, liczba stanów o takiej energii równa jest

g_n=\dfrac{(n+1)(n+2)}{2}.

Jeśli do takiego harmonicznego potencjału wprowadzimy N bozonów, to suma średnich liczb obsadzeń musi się równać N:

{\displaystyle N=\sum_{k=0}^{\infty}\overline{n}_k=\sum_{k=0}^{\infty}\dfrac{g_k}{\lambda^{-1}\exp{\left(\dfrac{k}{T}\right)}-1}.}

W ostatnim wyrażeniu wprowadziliśmy temperaturę mierzoną w jednostkach h\nu, tzn. nasze nowe T jest równe \frac{kT}{h\nu}. Jest to jedyny parametr teorii. Wartość \lambda musi być taka, żeby ostatnie równanie było spełnione. Ponadto mianownik z funkcją wykładniczą musi być dodatni, więc \lambda<1 (średnie liczby obsadzeń nie mogą być ujemne, tak samo jak np. średnia liczba brunetów w próbce ludzi).

Dalej niesie nas już formalizm, tak jak poniósł Einsteina w grudniu 1924 roku. Możemy z N wydzielić obsadzenie stanu postawowego N_0:

{\displaystyle N=N_0+ \sum_{k=1}^{\infty}\dfrac{g_k}{\lambda^{-1}\exp{\left(\dfrac{k}{T}\right)}-1}\equiv N_0+N_{exc}(T,\lambda).}

Suma N_{exc}(T,\lambda) osiąga maksymalną wartość przy \lambda=1:

{\displaystyle N_{max}(T)=\sum_{k=1}^{\infty}\dfrac{g_k}{\exp{\left(\dfrac{k}{T}\right)}-1}.}

Suma ta zależy wyłącznie od temperatury! Wykrzyknik oznacza nasze (i Einsteina) zdziwienie w tym miejscu. Zobaczmy, jak wygląda ta suma w funkcji temperatury.

Przedstawiliśmy tu obliczenia numeryczne (punkty) oraz przybliżenie analityczne:

N_{max}\approx 1.202 T^3\equiv 1.202 \left(\dfrac{kT}{h\nu}\right)^3.

Czemu ten wynik jest dziwny? Ano dlatego, że dla danej temperatury mamy pewną maksymalną liczbę cząstek, jakie można umieścić w danym potencjale. Tymczasem liczba N powinna być dowolnie duża. Ostatnie równanie oznacza, że obniżając temperaturę, osiągniemy w końcu sytuację, w której mamy mniej miejsc do obsadzenia niż cząstek. To oczywiście niemożliwe. Poniżej temperatury zadanej ostatnim równaniem, jakaś część atomów musi znajdować się w stanie podstawowym, i to część makroskopowo zauważalna. Inaczej mówiąc, atomy zaczną się kondensować w stanie o energii zerowej. W tym obszarze temperatur, parametr \lambda jest praktycznie równy 1. Mamy więc warunek

N\approx 1.202 T_{0}^3, \,\, \mbox{(**)}

określający temperaturę krytyczną T_0 przy danej liczbie atomów oraz liczbę atomów w stanach wzbudzonych poniżej temperatury krytycznej:

N_{exc}=N_{max}(T)=N \left(\dfrac{T}{T_0}\right)^3.

Atomy, które nie są wzbudzone, są w stanie podstawowym, zatem ich liczba równa się

N_0=N\left(1-\left(\dfrac{T}{T_0}\right)^3\right).

Funkcję tę przedstawiliśmy na wykresie.

Ważne jest, aby odróżniać kondensację Bosego-Einsteina od zwykłego wzrostu liczby obsadzeń stanu podstawowego wraz ze spadkiem temperatury. Tutaj mamy do czynienia z przejściem fazowym, pierwszym, jakie zostało opisane w fizyce statystycznej. Rozumowanie Einsteina było nieoczywiste dla kolegów. Nie było wcale jasne, czy formalizm fizyki statystycznej w ogóle może opisać przejścia fazowe. Tutaj w dodatku Einstein zaproponował nową statystykę, która mogła, ale wcale nie musiała okazać się prawdziwa. Ponadto model nieoddziałujących atomów jest nadmiernie uproszczony, co jest zarzutem technicznym, ale potencjalnie istotnym dla słuszności konkluzji. Sam Einstein nie był pewien i podkreślał, że tak może być, lecz nie ma co do tego pewności. Jednak jego dwudziestoletnie doświadczenie z fizyką statystyczną nie zawiodło. Statystyka okazała się prawdziwa (dla bozonów). Przejścia fazowe zaczęto na serio badać dopiero w latach trzydziestych (por. Lars Onsager i model Isinga). Jedna ze współpracowniczek Einsteina w latach czterdziestych Bruria Kaufman współpracowała z Larsem Onsagerem przy uproszczeniu jego monumentalnej pracy nt. modelu Isinga w dwóch wymiarach. Także Chen Ning Yang zajmował się modelem Isinga i nawet starał się zainteresować tym tematem Einsteina, gdy pracował w IAS w Princeton.

Ze współczesnego punktu widzenia faza skondensowana jest makroskopowo widocznym stanem kwantowym. Pewien odsetek atomów znajduje się w tym samym stanie, w przypadku pułapki harmonicznej gęstość atomów zarówno w przestrzeni położeń, jak i pędów, jest gaussowska, co odpowiada funkcji falowej stanu podstawowego oscylatora.

Wygląda to jak na obrazkach: w miarę obniżania temperatury pojawia się gaussowskie wąskie skupienie atomów, które rośnie w miarę zbliżania się do zera bezwzględnego. Czerwona linia pionowa obrazuje temperaturę. Widzimy też skok ciepła właściwego, co jest jednym ze wskaźników przejścia fazowego (Obrazki wg Bose-Einstein Condensation in a Harmonic Trap).

Atomy rubidu 87 użyte przez odkrywców kondensacji mają 37 elektronów i 87 nukleonów w jądrze, a więc parzystą liczbę fermionów, dlatego są bozonami. Pułapki stosowane w eksperymencie mają nieco odmienne częstości w różnych kierunkach, przez co rozkłady są iloczynami trzech funkcji Gaussa z róńymi szerokościami wzdłuż osi x,y,z.

(*) Obowiązują w historii nauki dwie zasady:
Zasada Arnolda: Jeśli jakieś pojęcie nazwano czyimś imieniem, to nie jest to imię odkrywcy.
Zasada Berry’ego: Zasada Arnolda stosuje się do samej siebie.
(Chodzi o Michaela Berry’ego i Vladimira Arnolda)

(**) W niskich temperaturach suma może być zastąpiona całką, ponieważ funkcja zmienia się bardzo wolno. Otrzymuje się wówczas

{\displaystyle N_{max}(T)\approx\dfrac{T^3}{2}\int_{0}^{\infty}\dfrac{x^2 dx}{e^{x}-1}= \dfrac{T^3}{2} \Gamma(3)\zeta(3),}

gdzie \Gamma i \zeta to funkcje Eulera i Riemanna.

Flaszki Kleista i butelki lejdejskie: elektryczny szok uczonej Europy (1745-1746)

Ważne odkrycia niemal zawsze są niespodziewane, bywają także niebezpieczne, gdyż odkrywcy zwykle są w roli ucznia czarnoksiężnika, rozpętując moce, nad którymi nie potrafią zapanować. Odkrycie butelki lejdejskiej stanowiło przełom w badaniach elektryczności. Do tej pory była ona jedynie źródłem interesujących i zabawnych pokazów. Elektron znaczy po grecku bursztyn, i to bursztyn był pierwszą substancją używaną do wywołania zjawisk przyciągania i odpychania lekkich drobnych przedmiotów w rodzaju skrawków papieru. Zauważono, że także inne materiały, jak siarka albo szkło, elektryzują się przez tarcie. Znane było doświadczenie Graya, pokazujące, że elektryczność może być przekazywana także przez ciało ludzkie.

0154.P.2.1612.1032

Stephen Gray, farbiarz, astronom i okazjonalnie demonstrator eksperymentów w Towarzystwie Królewskim, został pod koniec życia pensjonariuszem Charterhouse, czegoś w rodzaju szpitala z domem starców dla gentlemanów (pojęcie w Anglii bardzo rozciągliwe) połączonego z sierocińcem i szkołą. Do eksperymentów używał czterdziestosiedmiofuntowego chłopca zawieszonego na jedwabnych izolujących pasach. Na rysunku widzimy jeden z wariantów takiego doświadczenia. Osoba B obraca tu za pomocą przekładni szklaną kulę C, która jest pocierana ręką osoby D. Zawieszony w powietrzu chłopiec stopami dotyka kuli, podając rękę dziewczynce G (stojącej na izolacyjnej podkładce z żywicy albo smoły). Jej ręka przyciąga skrawki złotej folii leżące na gerydonie H. Na drugim rysunku mamy naelektryzowaną szklaną rurkę TT, która za pomocą brązowego drutu B połączona jest z dzwonkiem A. Młoteczek C zawieszony jest na jedwabnym sznurze i jest na przemian przyciągany oraz odpychany przez A, w rezultacie oscyluje między dzwonkami A i E, wywołując ich dzwonienie.

Georg Matthias Bose, profesor filozofii naturalnej z Wittenbergi i autor marnych francuskich wierszy, w swych eksperymentach przejawiał iście germańskie poczucie humoru. Jeden z nich, znany jako Venus electrificata, polegał na tym, by naelektryzować damę stojącą na izolowanej podkładce. Gdy następnie jakiś kawaler próbował ją pocałować, rażony był iskrą wybiegającą z warg wybranki. Innym jego popisowym doświadczeniem była „beatyfikacja”: delikwent wkładał na głowę specjalną koronę, która po naelektryzowaniu świeciła. Mimo tak bezceremonialnego podejścia do aureoli i świętości starał się Bose o uznanie wszędzie, nawet w Turcji i u Ojca Świętego Benedykta XIV. To ostatnie ściągnęło na niego represje na macierzystej uczelni, kolebce luteranizmu, spór musiał zażegnywać król Fryderyk.

bub_gb_FSJWAAAAcAAJ-xx

Jesienią 1745 roku eksperymentami elektrycznymi zajął się dziekan luterańskiej kapituły katedralnej w Kamieniu Pomorskim, Ewald Georg von Kleist. Dwadzieścia lat wcześniej studiował on w Lipsku i w Lejdzie i mógł się już wtedy zetknąć z elektrycznością, choć bezpośredniej inspiracji dostarczyły mu stosunkowo niedawne eksperymenty Bosego, m.in. uzyskiwanie iskry z wody oraz zapalanie spirytusu za pomocą elektryczności. Wyobrażano sobie wówczas elektryczność jako jakiś pewien rodzaj rodzaj subtelnej materii jakoś spowinowaconej z ogniem, mówiono nawet o ogniu elektrycznym. Eksperymenty z czerpaniem ognia z wody bądź zamianą iskry elektrycznej na rzeczywisty płomień zdawały się potwierdzać bliski związek obu tych tajemniczych substancji. Kleist pragnął naelektryzować wodę i udało mu się to w następujący sposób: butelkę napełniał częściowo wodą, rtęcią albo spirytusem, następnie zatykał korkiem, przez który przechodził drut albo gwóźdź. Jeśli trzymało się ten wynalazek w ręku, podczas gdy gwóźdź podłączony był do machiny elektrostatycznej, można było go bardzo mocno naelektryzować. Kolba średnicy czterech cali po naelektryzowaniu potrafiła powalić chłopca w wieku ośmiu bądź dziewięciu lat, jak starannie odnotował dobry dziekan (nie podając wszakże wagi chłopca). Po raz pierwszy wytworzona przez człowieka elektryczność przestała być niewinną salonową zabawą. Jak pisał Kleist, każdemu odechciałoby się całowania tak naelektryzowanej Wenus.

flasche-xx

Rysunek von Kleista z listu do Pawła Świetlickiego, diakona luterańskiego kościoła św. Jana w Gdańsku, przedstawiający jego urządzenie (z listu tego korzystał D. Gralath)

Odkrycie von Kleista było przypadkowe: nie rozumiał on, dlaczego musi trzymać swoje urządzenie w ręku, aby działało. Chcąc nagromadzić dużą ilość elektrycznego ognia, należałoby raczej izolować naczynie zamiast trzymać je w ręku i w ten sposób uziemiać. Dziś wiemy, że flaszka Kleista, jak nazywano ją czasem w Niemczech, była po prostu kondensatorem: ręka i woda z gwoździem stanowiły jego dwie okładki rozdzielone szkłem. Z punktu widzenia ówczesnej wiedzy działanie tego urządzenia było jednak niezrozumiałe. Spośród kilku uczonych, którzy otrzymali listowne doniesienia Kleista, eksperyment zdołał powtórzyć chyba tylko Daniel Gralath (a właściwie jego pomocnik Gottfried Reyger) w Gdańsku. Niedługo później, już w roku 1746, podobne doświadczenie przeprowadzono niezależnie w Lejdzie. Także i tu pierwszym odkrywcą był naukowy amator, Andreas Cunaeus, prawnik, zabawiający się eksperymentami w pracowni miejscowego profesora Pietera van Musshenbroeka. Przypadkowo zauważył on to samo co Kleist, jego eksperyment powtórzył później pomocnik profesora, Jean Nicolas Allamand, a na koniec i sam Musshenbroek, który był nim tak mocno wstrząśnięty, że, jak wyznał swemu paryskiemu koledze, nawet za całe królestwo Francji nie chciałby tego przeżyć po raz drugi.

leiden exp-x

Strach niebawem minął i elektrowstrząsy za pomocą butelek lejdejskich zaczęli wytwarzać wszyscy eksperymentatorzy, choć przez pewien czas do dobrego tonu należało informować o przypadkach konwulsji, paraliżu, zawrotów głowy itp. Żona profesora z Lipska, Johanna Heinricha Wincklera, po dwóch wyładowaniach poczuła się tak słabo, że ledwie mogła mówić. Tydzień później mąż zaaplikował jej jeszcze jedno wyładowanie, po którym krew się jej puściła z nosa. Profesor Winckler humanitarnie wstrzymał się jednak od przeprowadzania eksperymentów na ptakach, nie chcąc zadawać owym stworzeniom niepotrzebnych cierpień. Abbé Jean Antoine Nollet, mistrz pokazów fizycznych, utrzymujący się z produkcji naukowych urządzeń dla bogatych klientów, takich jak np. Voltaire i pani du Châtelet, zaprezentował w obecności króla Ludwika XV żywy łańcuch 180 grenadierów, poprzez który rozładowywała się butelka lejdejska. Wszyscy oni jednocześnie podskakiwali, co tak bardzo podobało się suwerenowi, że kazał sobie ten eksperyment powtarzać.

George Biddell Airy: Jak drobne szczegóły można dostrzec przez teleskop? (1834)

Widziałem jakiś czas temu reklamę, a w niej na zdjęciu – rzekomo satelitarnym – rozpoznawalne twarze jakichś celebrytów. Czy to możliwe technicznie? Nie bardzo. Wprawdzie w sprawach techniki lepiej nie twierdzić, że coś jest niemożliwe, ale tutaj trudności są dość zasadnicze i wynikają z falowej natury światła.

Do wyjaśnienia sprawy przyczynił się Airy, wtedy niedługo po trzydziestce, profesor katedry Plume’a w Cambridge, a niebawem 7. Astronom Królewski, ten ostatni urząd pełnił niemal pół wieku. Wyróżniał się jako zdolny młodzieniec, zanim skończył siedemnaście lat, znał dziewięć rozdziałów Matematycznych zasad filozofii przyrody Isaaca Newtona, a więc materiał matematycznie nietrywialny. Dostał się na studia do Trinity College w Cambridge jako sizar, czyli coś w rodzaju studenta służącego, ponieważ miał talent do matematyki, łaciny oraz greki. Ze zdecydowanie najlepszym wynikiem zdał Tripos, egzamin matematyczny, który bardzo ceniono. Potem przez dwa lata był profesorem katedry Lucasa – tak jak kiedyś Newton. Katedra ta nie przynosiła jednak wówczas dochodów, płacono 99 funtów rocznie, podczas gdy Airy jako młodszy tutor zarabiał 150. Namówiono go jednak, aby się o nią ubiegał ze względów wizerunkowo-prestiżowych. Szczerze mówiąc, katedra podupadła, Airy był pierwszym liczącym się profesorem na niej od czasów Newtona. Kiedy poinformowano go, że profesor katedry Plume’a („astronomia i filozofia eksperymentalna”) czuje się niezbyt dobrze i zapewne długo nie pociągnie, Airy zaczął się starać o tę posadę. Zdobył ją, kiedy się zwolniła drogą naturalną, przy okazji wydębiając od uniwersytetu podwyżkę z 300 do 500 funtów. W ten sposób został astronomem, do jego obowiązków bowiem należało kierowanie obserwatorium uniwersyteckim. Airy potrzebował pieniędzy: studia dawały mu możliwość awansu, nie upierał się, że musi być uczonym, ale skoro los tak chciał, to nim został. Pragnął też się ożenić, do czego również potrzebował pieniędzy. Był niezwykle pracowity, dobrze zorganizowany, sumienny, nie wyrzucał żadnych papierów, zszywał je, tworząc do nich system odnośników. Codziennie tłumaczył jakiś kawałek z angielskiego na łacinę. Optyką zajął się jako nauką pomocniczą astronomii. Odkrył we własnym wzroku wadę, zwaną dziś astygmatyzmem i jako pierwszy starał się ją skorygować specjalnymi soczewkami. Ogłosił drukiem 518 krótszych prac oraz kilka książek. Nie był wielkim uczonym, ale sporo osiągnął. Nie wszyscy muszą być twórczy i mieć szalone pomysły, nauka do codziennego funkcjonowania potrzebuje ludzi pracowitych i kompetentnych.

W 1834 roku Airy przedstawił w Cambridge Philosophical Society pracę na temat ugięcia światła na kołowym otworze. Sam chyba nie rozumiał wówczas, że rozstrzygnął fundamentalny problem astronomii: jakie najmniejsze kąty można rozróżnić posługując się przyrządem optycznym o danej średnicy – jego wynik dotyczy oka ludzkiego, aparatów fotograficznych, teleskopów, mikroskopów itd. Airy urodził się mniej więcej wtedy, gdy Thomas Young zaproponował falową teorię światła. Została ona rozwinięta niezależnie przez Augustine’a Fresnela. Fale mogą ze sobą interferować, to znaczy, gdy do jakiegoś obszaru docierają np. dwie niezależne fale, zaobserwujemy ich sumę. Fala wyjściowa może być silniejsza (interferencja konstruktywna)

constructive

Może też wystąpić interferencja destruktywna, w szczególnym przypadku, wypadkowa może być równa zeru.

destructive

Na obu rysunkach fala niebieska jest sumą zielonej i czerwonej. Oba rysunki możemy traktować albo jako zrobione w funkcji czasu w jednym miejscu, albo jako migawkowe zdjęcia fali w przestrzeni w pewnym określonym momencie. Ponieważ fala to przesuwające się z pewną prędkością drganie, zależności przestrzenne można przełożyć na czasowe i odwrotnie.

Rozważmy najpierw dyfrakcję na wąskiej długiej szczelinie. Z lewej strony dociera fala płaska, za szczeliną rozchodzi się fala nieco rozmyta pod względem kierunku (powierzchnie falowe są prostopadłe do kierunku rozchodzenia się fali).

Wave_Diffraction_4Lambda_Slit

Wikipedia: Diffraction

Jakie będzie kątowe rozmycie fali ugiętej? Mamy do dyspozycji dwie wielkości: \lambda – długość fali oraz d. Można z nich utworzyć kąt w radianach, które są bezwymiarowe (iloraz długości luku i promienia): \lambda/d. Prawdopodobnie nasz kąt będzie w przybliżeniu równy temu ilorazowi z dokładnością do jakegoś czynnika czysto liczbowego (odwrotny iloraz nie zachowywałby się dobrze przy \lambda\rightarrow 0, gdy dyfrakcja powinna być niewidoczna; gdyby fale miały zerową długość, wystarczyłaby do wszystkiego optyka geometryczna i wyobrażanie sobie światła jako promieni).

Właśnie to rozmycie w kierunkach ogranicza zdolność rozdzielczą. Soczewka teleskopu czy oka nie zmienia tego faktu. Bez dyfrakcji działanie soczewki wyglądałoby tak:

Lens_and_wavefronts

Wikipedia: Lens

Jeśli kierunki za soczewką (otworem) są rozmyte, to obraz w ognisku nie będzie punktowy, lecz będzie stanowił plamkę. Dlatego w dalszym ciągu zostawiamy soczewki, ponieważ nie one są tu istotne, lecz rozważamy szczelinę – w tym zjawisku liczy się fakt, że soczewka jest otworem, a nie np. z czego jest wykonana itp. Żeby obliczyć falę docierającą do jakiegoś punktu, można posłużyć się zasadą Huygensa: każdy punkt czoła fali jest źródłem kulistych fal. Należy wszystkie te fale dodać do siebie, co w przypadku szerokiej szczeliny oznacza całkowanie, ale obejdziemy się bez niego. W  przejściu przez szczelinę źródłami fal są wszystkie jej punkty. Jeśli punkt obserwacji znajduje się daleko, to fale cząstkowe będą biegły praktycznie równolegle do siebie. W kierunku prostopadłym do czoła fali padającej (kąt \theta=0) wszystkie fale cząstkowe mają tak samo daleko, więc będą się dodawać konstruktywnie: na wprost naszej szczeliny pojawi się maksimum natężenia fali. Jeśli nasz punkt obserwacji będzie nieco z boku, jedne fale będą miały dalej, drugie bliżej, więc w wyniku interferencji powstanie fala o nieco mniejszej amplitudzie: składowe fale nieco się „rozjeżdżają”, nie wszystkie drgają w tej samej fazie. Dla jakiego kąta \theta pojawi się pierwsze minimum natężenia? Sytuację przedstawia rysunek.

destruktywna

Skrajne fale elementarne z dwóch końców szczeliny mają teraz różnicę odległości równą \lambda – czyli długość fali. Te skrajne fale będą się więc wzmacniać, co jednak z resztą? Możemy naszą szczelinę podzielić w myślach na połowy i rozpatrywać pary fal, jak na rysunku. Różnica odległości między nimi to dokładnie \frac{1}{2} \lambda, a więc będą interferować destruktywnie, dając w wyniku zerowe natężenie. Ponieważ dla każdej fali z górnej połówki szczeliny możemy znaleźć drugą w dolnej połówce, która ją unicestwi, więc w efekcie dostaniemy zero: minimum natężenia. Kąt, dla którego wystąpi owo minimum spełnia warunek widoczny z rysunku:

\sin\theta=\dfrac{\lambda}{d}.\mbox{ (*)}

Dla małych kątów sinus można zamienić kątem (w radianach; 2\pi\, \mbox{rd}=360^{\circ}). Mamy więc

\theta \approx\dfrac{\lambda}{d}.

Natężenie za szczeliną przedstawia wykres.

sincsquared

Pierwsze minimum występuje dla kątów spełniających warunek (*). Większa cześć światła pojawi się jako jasny środkowy prążek, obok którego wystąpią mniej jasne prążki poboczne. Kiedy możemy rozróżnić dwie fale przybiegające z lewej strony pod różnymi kątami? Za graniczną sytuację uważa się taką, jak poniżej: główne maksimum jednej fali przypada na minimum drugiej (to tzw. kryterium Rayleigha).

rayleigh

Co się zmieni, gdy zamiast szczeliny weźmiemy okrągły otwór. To zadanie w sam raz dla Senior Wranglera (zwycięzcy Tripos). Wynik nie wyraża się przez funkcje elementarne, lecz przez funkcje Bessela. Airy obliczył je numerycznie, co w tamtych czasach – bez Wolfram Alpha, Mathematiki, Sage’a itd. – było niewyobrażalnie pracochłonne, a dziś można to liczyć w przeglądarce. Obraz jakościowo się nie zmienił. Oczywiście, będzie miał symetrię osiową, teraz będziemy mieli środkową jasną plamkę (plamkę Airy’ego), otoczoną pierścieniami.

283px-Airy-pattern.svg

Wikipedia: Airy disk

Kąt do pierwszego minimum wynosi dokładnie

\sin\theta=1,22 \, \dfrac{\lambda}{d}.

Możemy teraz obliczyć zdolność rozdzielczą fotografii satelitarnych. Oznaczmy przez x długość najmniejszego obiektu, który chcemy rozróżnić; niech nasz satelita krąży na wysokości h, wówczas kąt \theta będzie równy

\theta= \dfrac{x}{h}.

Podstawiając h=500 \mbox{ km}, d=2,5 \mbox{ m} (więcej niż teleskop Hubble’a!) oraz biorąc długość fali żółtego swiatła \lambda=0,6 μm, otrzymujemy

x=1,22 \, \dfrac{\lambda h}{d}\approx 0, 15 \mbox{ m}

Obliczyliśmy mniej więcej graniczną wartość „piksela” na zdjęciu satelitarnym. Rzeczywiste rozmiary piksela obecnych satelitów cywilnych są kilkukrotnie większe. Nie ma mowy o rozróżnianiu twarzy. Problem stanowi średnica naszego obiektywu. Większe wartości niż kilka metrów są zdecydowanie niepraktyczne. Można posłużyć się np. dwoma mniejszymi obiektywami, które będą dość daleko od siebie, np. w odległości 10 m albo i dużo więcej, i łączyć ich obrazy. Astronomowie używają czegoś takiego, więc pewnie i wojskowi mogą. Wciąż jednak mało prawdopodobne, aby stosować sprzęt tego rodzaju do sfotografowania paru celebrytów, których można bez problemu sfotografować z odległości kilku metrów.

Dyfrakcyjne ograniczenie zdolności rozdzielczej jest problemem w pewnych sytuacjach, choć astronomowie na Ziemi większy kłopot mają z ruchami atmosfery, które poruszają obrazem i zamazują go przy dłuższej ekspozycji. Rozumiejąc zjawiska dyfrakcyjne, można częściowo oczyścić z nich obraz za pomocą odpowiednich procedur matematycznych, ale niełatwo osiągnąć jakąś zdecydowaną poprawę.

Stanisław Ulam (2/2)

Wciąż jest dla mnie źródłem nieustającego zdziwienia, że kilka znaków nagryzmolonych na tablicy lub na kartce papieru może zmienić bieg ludzkich spraw. [S. Ulam]

Każdego roku, od 1936 aż do 1939, Stanisław Ulam spędzał lato w Polsce. Spotykał się ze swoimi matematycznymi przyjaciółmi, w tym Banachem i Mazurem, we Lwowie albo gdzieś w okolicach, gdzie spędzali wakacje. Jego dorobek matematyczny obejmował szereg dziedzin: teorię mnogości, teorię miary i rachunek prawdopodobieństwa, teorię transformacji, teorię grup. Były to na ogół niewielkie prace rozwiązujące lub stawiające jakiś problem. Na uniwersytecie Harvarda we współpracy z Johnem Oxtobym Ulam napisał swoją najdłuższą pracę, opublikowaną następnie w „Annals of Mathematics”, wysoko cenionym piśmie wydawanym w Princeton. Praca dotyczyła teorii ergodycznej. W mechanice klasycznej każdy nietrywialny układ fizyczny wędruje po swojej przestrzeni stanów (in. przestrzeni fazowej) w taki sposób, że wraca kiedyś w sąsiedztwo każdego punktu już odwiedzonego. Fakt ten jest podstawą fizyki statystycznej, w której zakłada się, że wszystkie stany o określonej energii są jednakowo prawdopodobne. Praca Ulama i Oxtoby’ego dowodziła, że przekształcenia spełniające warunek ergodyczności są w pewnym sensie typowe. Uzyskany przez nich wynik nie mógł być wprost zastosowany do fizyki, ale tak jest bardzo często: ścisłe potwierdzenie intuicji fizyków zazwyczaj nie jest łatwe.

Stanisław Ulam łatwo przywykł do amerykańskiego życia i z przyjemnością wracał do niego po wakacjach. Latem 1939 roku zabrał ze sobą młodszego brata, Adama. Na statek w Gdyni odprowadzili ich ojciec i stryj. Widmo wojny wisiało nad Polską, choć, jak zauważył Ulam, zagrożenie to wyraźniej dostrzegano w Stanach Zjednoczonych niż w Polsce, gdzie do ostatniej chwili łudzono się nadziejami na jakiś zwrot dyplomatyczny w zaostrzającym się napięciu. Różnice w sposobie oceny wynikały zapewne nie tylko z dystansu Amerykanów. Do Stanów Zjednoczonych dotarło w ostatnich latach wielu uchodźców z Niemiec, którzy lepiej niż inni rozumieli istotę nazistowskiego reżimu. W Polsce prasa, koła wojskowe i politycy zgodnie uprawiali propagandę w stylu „nie oddamy ani guzika”, co skończyło się klęską nie tylko militarną i polityczną, ale także klęską moralną – kraj był bowiem zupełnie nieprzygotowany do wojny i tysiące, może miliony ludzi, rzuciły się do panicznej i bezładnej ucieczki: jedni na wschód, inni na zachód. Dowódcy niemieccy zdumieni byli łatwością tego zwycięstwa, które po dwu tygodniach było już w zasadzie zupełne.

Dla Stanisława Ulama wojna oznaczała nie tylko lęk o najbliższych i przyjaciół pozostawionych w kraju, ale i obowiązek utrzymywania młodszego brata, który zaczął jesienią studia (z czasem został znanym sowietologiem). Znalezienie płatnej pracy akademickiej nie było łatwe, Ulam musiał zadowolić się uniwersytetem stanu Wisconsin w Madison. Po Harvardzie i Princeton nie było to wymarzonym rozwiązaniem, jednak uczelnia okazała się całkiem przyzwoita, Ulam zaprzyjaźnił się tam z wieloma wykładowcami, nie tylko zresztą z matematykami, ale i z fizykami, ekonomistami. Wygłosił kiedyś zaimprowizowany wykład na zjeździe astronomów (na temat wyboru układu odniesienia, w którym ruch ciał wygląda prościej – była to topologiczna wersja problemu kopernikańskiego). W tym okresie wielu wybitnych uczonych, zwłaszcza pochodzących z Europy, pracowało na mniejszych uczelniach, fala emigracji wywołała bowiem nadmiar szukających pracy akademików. W Madison pracował Eugene Wigner, fizyk i szkolny kolega von Neumanna, przyszły noblista. Na seminaria prowadzone przez Ulama przyjeżdżali do Madison matematycy tej klasy co André Weil, urodzony w Warszawie Samuel Eilenberg czy Paul Erdös, wszyscy oni stali się sławami światowego formatu. Erdös zaprzyjaźnił się z Ulamem i odwiedzał go czasami, rozmowy były jego ulubioną formą pracy matematycznej, z czasem opublikował wspólne prace z kilkuset innymi badaczami. Matematycy obliczają liczbę Erdösa: on sam ma liczbę zero; ci, którzy z nim pracowali, mają liczbę jeden; ci, którzy pracowali z posiadającymi liczbę jeden, mają liczbę dwa itd. Oczywiście, Ulam miał liczbę Erdösa równą jeden. Zabawa ta unaocznia, jak silną rolę odgrywa współpraca nawet w dziedzinie tak z pozoru indywidualnej jak matematyka (choć trzeba też dodać, że Erdös, podobnie jak Ulam, wyjątkowo lubił pracę w towarzystwie innych).

W 1941 roku Ulam otrzymał obywatelstwo amerykańskie i kiedy Stany Zjednoczone przystąpiły do wojny, chciał pracować na rzecz wojska. Dzięki rekomendacji von Neumanna trafił do Los Alamos i Projektu Manhattan jako jeden z niewielu matematyków. Spotkał tam i poznał osobiście wielu fizyków i chemików o głośnych nazwiskach, nigdy chyba w historii nie zgromadzono w jednym miejscu w pracy nad wspólnym projektem tak wielu wybitnych specjalistów. Wielu z nich było emigrantami, których dotychczasowe życie zburzył mniej lub bardziej nazizm. Wśród kierujących projektem byli dwaj znakomici fizycy jądrowi: Hans Bethe i Enrico Fermi. Pierwszy miał babkę Żydówkę, przez co stracił profesurę w Tybindze, drugi miał za żonę Żydówkę i w roku 1938 zmuszony był opuścić Włochy. Ulam obu uczonych bardzo szanował, lecz szczególny respekt budził w nim Fermi – ostatni chyba fizyk będący zarazem eksperymentatorem i teoretykiem. Nie rozstający się z suwakiem logarytmicznym Fermi, który umiał szybko obliczyć każdą potrzebną wielkość, miał też solidne przygotowanie matematyczne i okazało się, że zna np. pracę Oxtoby’ego i Ulama. Dzięki Projektowi Manhattan Stanisław Ulam zaczął pracować z fizykami i tak już miało zostać przez długie lata. Jego talent matematyczny niespodziewanie okazał się przydatny w zagadnieniach z pogranicza inżynierii. Taki przeskok z podstaw matematyki do zagadnień praktycznych byłby niewyobrażalny dla większości matematyków. Ulam trafił do grupy kierowanej przez Edwarda Tellera, jeszcze jednego emigranta z Węgier. Pierwszym zagadnieniem, którym się tam zajął, było oddziaływanie gazu elektronowego z promieniowaniem. Teller uzyskał z rozważań wymiarowych postać równania, chciał aby te rozważania uściślić. Ulam zaproponował własne dość elementarne rozwiązanie, z którego wynikało, że wzór Tellera trzeba uzupełnić współczynnikiem cztery. Niezadowolony Teller zlecił to samo zadanie komuś innemu, kto posługując się znacznie bardziej rozbudowanym aparatem matematycznym, uzyskał dla owego współczynnika liczbowego także wartość zbliżoną do czterech.

Ulam, Richard Feynman i John von Neumann w Los Alamos

Rodzaj talentu matematycznego Stanisława Ulama był nietypowy, jedyny w swoim rodzaju. Posiadał on dar formułowania problemów w sposób jak najprostszy, zachowując jedynie najistotniejsze ich cechy. Wyobrażał sobie przy tym zjawiska, a nie tylko równania, które je opisują. Łatwo też przychodziły mu oszacowania liczbowe, co w Los Alamos było niezwykle ważne – nie chodziło tam przecież o zrozumienie idealnej sytuacji laboratoryjnej, ale o skonstruowanie jak najefektywniejszej bomby. Należało więc wejść w świat rzeczywistych obiektów, kształtów, własności różnych materiałów, współwystępowania rozmaitych zjawisk. Zazwyczaj praca fizyków polega na czymś odwrotnym: szuka się najprostszych i „najczystszych” sytuacji, w których można zmierzyć dane zjawisko.

Po zakończeniu wojny i Projektu Manhattan Stanisław Ulam wrócił do pracy akademickiej. Został profesorem nadzwyczajnym na Uniwersytecie Południowej Kalifornii (USC). Uczelnia okazała się słaba, Los Angeles było miastem trudnym do mieszkania i poruszania się z powodu korków ulicznych. Pewnego dnia Ulam poważnie zachorował, zaczął mieć problemy z mówieniem. Przeprowadzono operację, otwierając czaszkę. Znaleziono ostry stan zapalny, który leczono nowymi wówczas antybiotykami, podawanymi bezpośrednio do wnętrza czaszki. Uczony po pewnym czasie doszedł do siebie, jednak z obawą myślał, czy po tym wszystkim jego umysł wróci do dawnej sprawności. Przekonał się o tym, kiedy odwiedził go Paul Erdös. Zagrali w szachy i Ulam wygrał. Zaczął podejrzewać, że może przyjaciel pozwolił mu wygrać dla podtrzymania go na duchu. Zagrali więc jeszcze raz. Uspokoił się dopiero, kiedy wygrał po raz drugi, a Erdös wyraźnie się tym zirytował.

Nie pozostał na USC długo, tym bardziej że po chorobie wpadł w długi. Otrzymał propozycję pracy w Los Alamos dla armii amerykańskiej. Wprawdzie sławni i wielcy po zakończeniu Projektu Manhattan rozjechali się po różnych ośrodkach, ale laboratorium w Los Alamos zostało i nieoczekiwanie dawało Ulamowi możliwość ciekawej i względnie niezależnej pracy. Problemy, nad którymi tam pracowano, były konkretne, co zdaniem Ulama bardzo się liczyło. Sądził on bowiem, że naprawdę ważne problemy wywodzą się z praktyki, a nie filozoficznych rozważań. Mógł dobierać sobie współpracowników, co było szczególnie ważne wobec jego metody pracy. Polegała ona na tym, że Ulam szkicował możliwości rozwiązania danego zagadnienia, a współpracownicy starali się te pomysły zrealizować. Niewykluczone, że przebyta choroba odebrała Ulamowi czysto techniczną sprawność dokonywania obliczeń czy prowadzenia jakiegoś długiego dowodu. Starał się tego po sobie nie pokazywać. Pozostała mu jednak wyobraźnia i umiejętność dostrzegania bez dowodu, czy twierdzenie jest prawdziwe, czy nie, i w jaki sposób można dążyć do wytyczonego celu. Toteż pracował przede wszystkim nad wytyczaniem kierunków i formułowaniem problemów – co w sumie jest może ważniejsze niż szczegółowe rozwiązania. Przypominał swoim stylem pracy pracującego po przeciwnej stronie Atlantyku Jakowa Zeldowicza.

Dzięki pracy dla armii Ulam należał do pionierów stosowania komputerów. Układając pewien trudny pasjans w okresie rekonwalescencji, zdał sobie sprawę, że bardzo trudno byłoby obliczyć, jakie jest prawdopodobieństwo ułożenia tego pasjansa, łatwo natomiast można by go było modelować za pomocą komputera, który mógłby przeprowadzić wiele prób, dzięki czemu można by empirycznie stwierdzić, jakie jest szukane prawdopodobieństwo. Rozwinięciem tej idei opracowanym we współpracy z von Neumannem i Nickiem Metropolisem są metody Monte Carlo (nazwa zaczerpnięta ze skojarzenia z wujem Ulama, który pożyczał od krewnych pieniądze i następnie przepuszczał je w Monte Carlo). Zamiast np. rozwiązywać równanie różniczkowe, opisujące dyfuzję neutronów z pewnego stanu początkowego, możemy prześledzić losy wielu neutronów i zobaczyć, jakie są charakterystyczne cechy ich rozkładu. Dla pięćdziesięciu cząstek startujących z punktu x=0 tory w błądzeniu przypadkowym mogą być np. takie jak na wykresie.

Po zebraniu pewnej statystyki można znaleźć kształt rozkładu końcowego. Im więcej wykonamy losowań, tym dokładniej będziemy znali rozkład cząstek po danym czasie.

Rozkład uzyskany w tym przypadku jest łatwy do obliczenia analitycznego (jest rozkładem normalnym). Wystarczy jednak nieco zmodyfikować zagadnienie: dodać dwa wymiary, różne kształty i materiały, a problem dyfuzji stanie się bardzo trudny do rozwiązania metodami analitycznymi, choć symulacja komputerowa nadal będzie stosunkowo prosta. Pionierzy tej metody musieli zaczynać kompletnie od zera, rozwiązując np. zagadnienie, jak komputer, który prowadzi obliczenia arytmetyczne na liczbach – a więc otrzymując zawsze ściśle określony i jednoznaczny wynik, może generować liczby losowe. Jak sprawić, aby liczby te podlegały określonemu prawu statystycznemu? Jak sprawdzać uzyskane wyniki itd itp. Metoda Monte Carlo używana jest dziś w wielu dziedzinach od fizyki do finansów i stała się zespołem wyspecjalizowanych praktyk.

Stanisław Ulam odegrał istotną rolę w projekcie bomby wodorowej. Była to idée fixe Tellera: zbudować bombę opartą na procesie syntezy lekkich pierwiastków w cięższe. W przyrodzie procesy takie odbywają się we wnętrzu gwiazd, gdzie panują ogromne temperatury i materia jest bardzo gęsta. Warunki tak ekstremalne potrzebne są do tego, by dodatnio naładowane jądra mogły zbliżyć się do siebie, pokonując odpychanie elektrostatyczne. Dopiero bowiem w odległościach rzędu 10^{-15} m możliwe jest przegrupowanie nukleonów, wskutek czego wyzwala się energia.

Synteza helu z dwóch izotopów wodoru: deuteru i trytu; bomby wykorzystują głównie deuter (rys. Wikipedia)

Warunki takie można by wytworzyć za pomocą wstępnego wybuchu zwykłej bomby atomowej. Edward Teller (jeszcze jeden żydowski emigrant z Węgier) pracował nad pomysłem „superbomby” już w trakcie Projektu Manhattan. Nie zrezygnował z niego także i później. W roku 1950 prezydent Harry Truman podjął decyzję o pracach nad superbombą. Okazało się jednak szybko, że początkowy pomysł Tellera nie nadaje się do realizacji. Udowodnił to Stanisław Ulam ze współpracownikami, potwierdziły zaś obliczenia Ulama i Enrico Fermiego. Także obliczenia komputerowe von Neumanna dawały ten sam wynik. Sytuacja stała się trudna dla Tellera, którego oskarżano, że nakłonił władze polityczne do decyzji, nie mając w ręku żadnej rozsądnej teorii działania superbomby. Koszt przedsięwzięcia był ogromny, rywalizacja z Rosją zawzięta, a więc i stawka projektu bardzo wysoka. Impas przełamał Stanisław Ulam, który zaproponował implozyjny mechanizm działania superbomby. Razem z Tellerem napisali raport, który stał się podstawą amerykańskiego projektu. Bomba została zbudowana, lecz stosunki miedzy Tellerem a Ulamem gwałtownie się oziębiły. Teller nie potrafił prawdopodobnie wybaczyć Ulamowi dwukrotnej porażki prestiżowej. Ulam natomiast uważał, że zainteresowani i tak wiedzą, ile kto jest wart.

Raport Tellera i Ulama został po latach odtajniony, lecz większość z kilkunastu jego stron jest kompletnie pusta. Armia amerykańska najwyraźniej uznała, że wciąż jest za wcześnie na publiczne informowanie o technologii bomb wodorowych. Może to być zresztą także przykład nadmiernej ostrożności wojskowych w kwestiach tajemnic, militarne znaczenie bomb wodorowych nie jest bowiem aż tak wielkie, jak sądzono na początku. Dalsze prace szły raczej nad zmniejszaniem siły rażenia, bo co po wygranej wojnie, skoro zwycięzcy zostaną w niej zabici powiedzmy dziesięć razy, a pokonani – dwadzieścia. Angielszczyzna ma na to zgrabne słówko: overkill (*).

Gian-Carlo Rota charakteryzuje Ulama następująco:

Dopiero po kilku latach zdałem sobie sprawę z tego, co jest prawdziwą profesją Stana Ulama. Wielu z nas, pracujących w Laboratorium i mających z nim styczność, wiedziało, jak bardzo nie lubi on zostawać sam, że wzywa nas o zaskakujących porach, by wybawić go od samotności hotelowego pokoju albo czterech ścian swego gabinetu, kiedy już skończył codzienną rundę rozmów międzymiastowych.

Pewnego dnia zebrałem się na odwagę i zapytałem, czemu stale potrzebuje towarzystwa; odpowiedź, jakiej udzielił była wielce znamienna. „Kiedy jestem sam – zwierzył się – zmuszony jestem przemyśleć różne rzeczy i widzę ich tak wiele, że wolę nie myśleć”. Ujrzałem go wtedy w prawdziwym świetle: ten człowiek, mający na koncie największą liczbę trafnych przypuszczeń w matematyce, który potrafi pokonać inżynierów na ich własnym polu, który w jednej chwili ocenia zdarzenia i ludzi, należy do niemal już doszczętnie wymarłej profesji proroków.

Z mężami Starego Testamentu i wyrocznią delficką dźwigał on ciężkie brzemię natychmiastowego widzenia. I jak wszyscy zawodowi prorocy cierpiał na coś, co Sigmund Freud nazwałby „kompleksem Proteusza”. Wielka szkoda, że wśród pacjentów Freuda nie było żadnych proroków.

W dawnych czasach ciemne orzeczenia Sybilli interpretowane były przez wyszkolonych specjalistów, tak zwanych hermeneutów, których zadaniem było przełożenie kryptycznych fraz na greckie zdania. W przypadku Ulama laboratorium w Los Alamos wynajmowało konsultantów, których zadaniem było wyrażenie jego kryptycznych komunikatów w popsutym żargonie współczesnej matematyki.

Stanisław Ulam zmarł niespodziewanie w wieku 75 lat na atak serca. Jak pisze Françoise Ulam:

mawiał, że „najlepszym rodzajem śmierci jest nagły atak serca lub zastrzelenie przez zazdrosnego męża”. Miał szczęście umrzeć w ten pierwszy sposób, choć myślę, że chyba wolałby ten drugi.

(*) Ulam komentował w roku 1965: „Mam wrażenie, iż to interesujące pojęcie, jakim jest overkill, przez lewicę atakowane jest z powodu marnotrawstwa – jako nieekonomiczne, podczas gdy skrajna prawica popiera je z przyczyn psychologicznych: gdyż daje im poczucie męskości, której brak odczuwają.”

Toczyła się wówczas debata, czy Stany Zjednoczone powinny zgodzić się na zakaz prób jądrowych. Ulam i Teller stali na odmiennych stanowiskach, ilustruje to rysunek Herblocka: „Mądry ojciec zna swoje dziecko”.