Kopenhaga 1941: spotkanie Wernera Heisenberga z Nielsem Bohrem

Czy obłąkańcze ideologie zawsze są samoniszczące? I jakie są ich koszty społeczne? Gdzie kończy się patriotyzm, a zaczyna oportunizm i łajdactwo? Czy uczonym wolno zamykać się w wieży z kości słoniowej? Jacy naprawdę są ludzie, których znamy? Czy historia jest w ogóle możliwa inaczej niż jako rozmowa duchów na Polach Elizejskich?
Sztuka Michaela Frayna Copenhagen jest dialogiem trzech duchów: Wernera Heisenberga, Nielsa Bohra i jego żony Margharete. Chyba nie wystawiona nigdy w Polsce, odniosła wielki sukces w Londynie, Nowym Jorku i w innych miejscach świata.

Spotkanie owych trzech duchów poprzedzone było wieloma latami ziemskiej znajomości. Bohr pierwszy raz zetknął się z Heisenbergiem, gdy wygłaszał w Getyndze w czerwcu 1922 roku swe słynne wykłady, zwane potem Festiwalem Bohra. Dwudziestolatek o chłopięcym wyglądzie zwrócił publicznie uwagę na pomyłkę Bohra i tym go zaintrygował. Trzeba rozumieć kontekst: Niels Bohr był wtedy najbardziej znanym fizykiem atomowym, w listopadzie miano ogłosić, że otrzymuje Nagrodę Nobla. Tak się złożyło, że Bohr otrzymał ją jednocześnie z Albertem Einsteinem, który został laureatem za rok 1921. W grudniu 1922 Svante Arrhenius, przewodniczący Komitetu Noblowskiego z fizyki zaprezentował osiągnięcia obu uczonych: w ten sposób Einstein, najwybitniejszy fizyk pierwszej ćwierci wieku XX, został symbolicznie złączony z Bohrem, patronem intelektualnym nurtu, który za kilka lat miał przynieść mechanikę kwantową. Sytuacja niecodzienna nawet jak na uroczystości noblowskie (nie spotkali się jednak przy tej okazji, ponieważ Einstein był w Japonii). Teoria względności i mechanika kwantowa do dziś są dwoma najważniejszymi osiągnięciami ostatniego stulecia. Rok 1922 stanowił też początek powojennego przełamywania lodów w nauce: wizyta Bohra w Getyndze i Einsteina w Paryżu były pierwszymi zapowiedziami powrotu do międzynarodowej współpracy po latach pierwszej wojny światowej, o której dziś rzadko mówimy, bo niebawem wybuchła następna wojna, jeszcze bardziej brutalna i bezwzględna.

Heisenberg był asystentem Maksa Borna i okazał się najzdolniejszym spośród tamtych chłopaków, ich fizykę nazywano czasem Knabenphysik – fizyką chłopców. Rewolucje robią ludzie młodzi: zarówno Einstein, jak i twórcy mechaniki kwantowej, zaczynali jako dwudziestoparolatkowie, a po trzydziestce już raczej kontynuowali poprzednie osiągnięcia (czasem tak wielkie jak teoria grawitacji). Bohr zaczął wkrótce współpracować z Heisenbergiem, i to podczas stażu w Danii wiosną roku 1925 powstała pierwsza przełomowa praca z mechaniki kwantowej. Max Born, pełen wątpliwości, pisał do Einsteina: „Moi młodzi ludzie: [Werner] Heisenberg, [Pascual] Jordan, [Friedrich] Hund są znakomici. Muszę się czasem poważnie wysilić, aby nadążyć za ich rozważaniami. Wprost bajecznie opanowali tak zwaną zoologię termów [chodzi o termy atomowe, pojęcie z dziedziny spektroskopii, widma pierwiastków są skomplikowane, lecz ich szczegółowa znajomość okazała się kluczem do fizyki mikroświata]. Najnowsza praca Heisenberga, która się niebawem ukaże, wygląda bardzo mistycznie, ale jest prawdziwa i głęboka”. Praca Heisenberga była zupełnie samodzielna, miał on silną osobowość i umiał się przeciwstawić apodyktycznemu Bohrowi. Duński uczony był wprawdzie kimś w rodzaju duchowego ojca mechaniki kwantowej, ale jego wpływ na młodszych bywał szkodliwy: kilku naukowców miało za złe Bohrowi, że odwiódł ich od słusznych myśli, przez co przeszło im koło nosa jakieś odkrycie. Jednocześnie jednak Bohr troszczył się o wszystkich swoich pupilów i z nimi przyjaźnił, wspólnie pływali żaglówką, jeździli na nartach albo odbywali długie, nawet kilkudniowe spacery.

Gdy Hitler został kanclerzem Niemiec, Werner Heisenberg był już sławny. W grudniu tego roku otrzymał Nagrodę Nobla za rok 1932 razem ze swoimi dwoma konkurentami w tworzeniu mechaniki kwantowej: Erwinem Schrödingerem i Paulem Dirakiem, którzy podzieli się Nagrodą za rok 1933. Trzydziestodwuletni profesor był wielką nadzieją nauki niemieckiej, nie miał Żydów w rodzinie i czuł się gorącym patriotą, choć może z lekka brzydził go NSDAP-owski sztafaż. Orszak studentów z pochodniami przeszedł ulicami Lipska pod dom laureata. Heisenberg zdecydowany był nie wyjeżdżać z Niemiec, chciał też pracować dla ojczyzny, kultywując swoją dziedzinę, czyli fizykę teoretyczną. Okazało się to nieproste. W 1937 roku został publicznie zaatakowany w organie prasowym SS jako „biały Żyd”, tzn. ktoś, kto głosi idee fizyki żydowskiej wśród niemieckiej młodzieży. Porównano go nawet do Carla von Ossietzky’ego, działacza pokojowego i laureata pokojowej Nagrody Nobla, niebawem zamęczonego w Dachau. Do fizyki żydowskiej zaliczano oczywiście teorię względności, ale także mechanikę kwantową. W tym drugim przypadku kryterium było całkowicie polityczne (to ja decyduję, kto jest Żydem): akurat ani Heisenberg, ani Schrödinger, ani Dirac nie byli Żydami. Pół-Żydem był Niels Bohr, co wkrótce zaczęło mieć znaczenie. Przez następny rok Heisenberg starał się „oczyścić” z zarzutów, jego list dotarł do samego Heinricha Himmlera, który zarządził śledztwo. Badano w nim życie fizyka, sprawdzano m.in. czy aby nie jest homoseksualistą (ożenił się bowiem niedawno i dotąd miał raczej przyjaciół mężczyzn, choć homoseksualistą nie był) i dlaczego nie wykazywał entuzjazmu wobec nazistów. Przesłuchiwano go też w podziemiach SS w Berlinie naprzeciwko napisu: „Oddychaj głęboko i spokojnie”. W końcu dano mu spokój i uznano, że jest nieszkodliwym profesorem, trzymającym się swojej dziedziny i być może przydatnym reżimowi. Zaczęto go potrzebować szybciej, niż ktokolwiek sądził. Podjęto bowiem w Niemczech prace nad projektem uranowym, który miał prowadzić do zbudowania reaktora, a może także bomby nuklearnej. Najważniejszym uczonym pracującym nad tym projektem został w naturalny sposób Werner Heisenberg.

Niels Bohr między Elisabeth i Wernerem Heisenbergiem, z tyłu Victor Weisskopf (1937, pewnie przy okazji ślubu Heisenberga)

I właśnie jako szef prac nad uzyskaniem energii z uranu Heisenberg pojawił się w Kopenhadze. W zasadzie pracowano nad reaktorem, który mógłby wytwarzać w dalekiej przyszłości pluton. Ale możliwość bomby rysowała się nad horyzontem i, jak się zdaje, Heisenberg ciężko pracował, aby wykazać swoją przydatność dla ojczyzny. Nie przejawiał zbyt wiele inteligencji emocjonalnej: pojawił się w Kopenhadze jako przedstawiciel nauki niemieckiej, miał wygłosić wykład w Instytucie Kulturalnym Niemiec. Duńczycy, poddani okupacji (wprawdzie stosunkowo łagodnej) dużego sąsiada, niezbyt garnęli się do kontaktów z Niemcami, zwłaszcza że w praktyce chodziło o propagandę III Rzeszy. Na wykładzie nie pojawili się najważniejsi naukowcy duńscy. Heisenberg spotkał się natomiast z Bohrem prywatnie, odbyli też wspólny spacer, aby porozmawiać (obaj, słusznie, obawiali się podsłuchów). O swojej wizycie Heisenberg pisał do swej żony, Elisabeth:

Moja droga Li,
oto znowu jestem w tym tak dobrze mi znanym mieście, gdzie pozostała cząstka mego serca od tamtego czasu sprzed piętnastu lat. Kiedy usłyszałem znowu kuranty z wieży ratuszowej, zamknąłem okno mego hotelowego pokoju i coś ścisnęło mnie mocno w środku: wszystko było tak samo, jakby nic się na świecie nie zmieniło. To takie dziwne, napotkać własną przeszłość, to tak jakby spotkało się samego siebie. (…) Późnym wieczorem poszedłem pieszo pod jasnym rozgwieżdżonym niebem przez zaciemnione miasto do Bohra.
Bohr i jego rodzina mają się dobrze; on sam się trochę postarzał, jego synowie są już całkiem dorośli. Rozmowa szybko zeszła na ludzkie zmartwienia i nieszczęsne wypadki ostatnich czasów; w sprawach ludzkich konsensus jest oczywisty; w kwestiach politycznych stwierdziłem, że nawet tak wielki człowiek jak Bohr nie potrafi całkowicie rozdzielić myślenia, odczuwania oraz nienawiści. Ale może nie powinno się ich nigdy rozdzielać. (…)
Wczoraj znowu spędziłem cały wieczór z Bohrem; oprócz pani Bohr i dzieci była też młoda Angielka, która mieszka u nich, ponieważ nie może wrócić do Anglii. Trochę dziwnie jest rozmawiać teraz z Angielką. Podczas nieuniknionych rozmów politycznych, podczas których ja broniłem naturalnie i automatycznie naszego systemu, wyszła i pomyślałem, że w sumie to całkiem miłe z jej strony. – Dziś rano byłem na molo z [Carlem Friedrichem] Weizsäckerem, wiesz, tam przy porcie, gdzie znajduje się Langelinie. Teraz stoją tam na kotwicy niemieckie okręty wojenne, kutry torpedowe, krążowniki pomocnicze i tym podobne. Był pierwszy ciepły dzień, port i niebo ponad nim zabarwione bardzo jasnym lekkim błękitem. Dwa duże frachtowce odpłynęły w stronę Elsynoru; przypłynął węglowiec, prawdopodobnie z Niemiec, dwie łodzie żaglowe, pewnie takiej wielkości, jak ta, którą pływaliśmy dawniej wypływały z portu, pewnie na popołudniową wycieczkę. W pawilonie na Langelinie zjedliśmy obiad, wszędzie dokoła byli sami szczęśliwi i radośni ludzie, a przynajmniej takie robili na nas wrażenie. W ogóle ludzie tu wyglądają na szczęśliwych. Wieczorem na ulicach widzi się promieniejące szczęściem młode pary, idące na dancing, nie myślące o niczym innym. Trudno o coś bardziej odmiennego niż życie na ulicach tutaj i w Lipsku.
(…) Pierwszy oficjalny wykład jest mój, jutro wieczorem. Niestety, członkowie Instytutu Bohra nie przyjdą z powodów politycznych. Jeśli wziąć pod uwagę, że Duńczycy żyją bez jakichkolwiek restrykcji i żyją wyjątkowo dobrze, to zadziwiające jest, że wzbudzone tu zostało tak wiele nienawiści i strachu, iż nawet współpraca w dziedzinie kultury, kiedyś tak oczywista, teraz stała się prawie niemożliwa. (list z końca września 1941 roku)

Bohra doszły słuchy, jak Heisenberg opowiada, że okupacja Danii i Norwegii to przykra konieczność, w odróżnieniu od okupacji wschodniej Europy, która jest niezbędna, gdyż kraje te nie potrafią same się rządzić (było to przed Stalingradem). Z perspektywy Danii wyglądało to oczywiście inaczej, tym bardziej że należało się spodziewać dalszych kroków niemieckich władz okupacyjnych. Dotąd aresztowali oni komunistów, dwa lata później przyszła kolej na Żydów i Bohr sam musiał się ratować przeprawą przez Bałtyk (na szczęście znalazł się w niemieckiej ambasadzie przyzwoity człowiek, Georg Ferdinand Duckwitz, który uprzedził o zamiarach nazistów i praktycznie wszyscy Żydzi duńscy zostali w porę przetransportowani łodziami rybackimi do Szwecji). Heisenberg wspomniał Bohrowi, że pracuje nad energią z uranu i nawet spytał go, co należy zrobić z moralnego punktu widzenia. Nie chciał chyba jednak słuchać odpowiedzi. Elisabeth Heisenberg opowiadała, że mąż bardzo się bał, iż alianci zbudują broń nuklearną wcześniej niż Niemcy. Oczywiście reszta świata obawiała się czegoś dokładnie odwrotnego. Rozmowa zostawiła nieprzyjemny osad w pamięci Bohra. Ich dawna przyjaźń z Heisenbergiem nigdy już się nie odrodziła, choć po wojnie spotykali się czasem.

„Był tu Werner Heisenberg, fizyk teoretyczny z Niemiec, kiedyś wielki nazista. Z niego jest wielki uczony, lecz niezbyt przyjemny człowiek” – stwierdził Einstein w 1954 roku. Einstein najprawdopodobniej uważał za nazistów tych, którzy pracowali dla reżimu Hitlera bez względu na to, czy należeli do NSDAP albo innych organizacji nazistowskich.

Po wojnie uczeni niemieccy starali się przekuć swoje niepowodzenie w sukces moralny, lecz wydaje się, że po prostu (i na całe szczęście) zabrakło im wizji i możliwości technicznych.
David C. Cassidy wyliczył techniczne powody niepowodzenia ekipy Heisenberga:

  • Nie obliczyli masy krytycznej uranu 235: nie sądzili, że wystarczą kilogramy, nie tony
  • Nie umieli przeprowadzić separacji izotopów: metodę separacji gazów znał w Niemczech Gustav Hertz, ale jako nieczysty rasowo pracował w prywatnym laboratorium
  • Moderator: ekipa Heisenberga nie wiedziała, że nadaje się do tego grafit, ale musi zostać oczyszczony z domieszek boru, co zauważył Leo Szilard, Żyd oczywiście i emigrant. Z kolei ciężka woda z Norwegii nie docierała dzięki sabotażowi.
  • Reaktor Heisenberga składał się z płaskich płyt uranu w zbiorniku z ciężką wodą, co było wygodne do obliczeń teoretycznych, lecz marne jako rozwiązanie inżynierskie.
  • Projekt wymagał połączonej wiedzy i znakomitej organizacji: amerykańskie zasoby i poziom techniki oraz europejscy uczeni, przeważnie Żydzi albo ofiary antysemityzmu: Bohr, Oppenheimer, Feynman, Bethe, Wigner, von Neumann, Fermi, Peierls, Compton, Ulam, praktycznie jest to słownik wielkich fizyków
  • Przebieg wojny: po początkowych sukcesach zaczęły się niemieckie porażki i coraz trudniej było zmobilizować zasoby na projekt nierokujący natychmiastowych sukcesów

W sumie po stronie naukowo-inżynierskiej zemściła się na nazistach ich obłąkańcza ideologia antysemicka, rządy idiotów, którzy przez rok sprawdzali, czy Heisenberg się nadaje na profesora w ich Rzeszy.

Jak Bóg gra w kości: Czemu wzbudzony atom promieniuje? (1927-1930)

Stany elektronu związanego w atomie są w mechanice kwantowej dyskretne, tzn. energia przyjmuje ciąg ściśle określonych wartości. Np. w atomie wodoru jest to ciąg

E=-\dfrac{13,6\;{\rm eV}}{n^2},\;\; \mbox{gdzie}\;\; n=1,2,\ldots.

Konsekwencją tego faktu są linie widmowe: atom wysyła promieniowanie o energii ściśle odpowiadającej różnicy dwóch poziomów energetycznych. Może też pochłaniać promieniowanie o takiej energii. W roku 1916 Albert Einstein, zastanawiając się nad oddziaływaniem światła z materią, odkrył, że mamy tu do czynienia z trzema możliwymi procesami: gdy oświetlimy grupę atomów promieniowaniem o odpowiedniej energii, możemy wywołać przejścia między wyższym i niższym poziomem energetycznym w obie strony, tzw. przejścia wymuszone. Jeśli atom był w stanie podstawowym, może przejść do stanu wzbudzonego i odwrotnie: jeśli początkowo był w stanie wzbudzonym, może przejść do stanu podstawowego. Znaczy to, że jeśli początkowo większość atomów była w stanie o niższej energii (typowa sytuacja), to pod wpływem promieniowania pewna ich część przejdzie do stanu wzbudzonego, a część promieniowania zostanie pochłonięta. Oba procesy: absorpcji i emisji zachodzą z jednakową intensywnością, co Einstein odkrył (jednakowe są współczynniki wymuszonej emisji i absorpcji: B_{1\rightarrow 2}=B_{2\rightarrow 1}.) Czasem mówi się, że w ten sposób pojawiła się teoretyczna możliwość zbudowania lasera. Chodzi o to, że jeśli wytworzymy sytuację, w której większość atomów znajduje się w stanie wzbudzonym, to pod wpływem światła o ustalonej energii atomy zaczną wysyłać jeszcze więcej takiego samego światła. Tak właśnie działa laser, oczywiście wytworzenie i podtrzymanie tej specyficznej sytuacji, gdy stan wzbudzony obsadzony jest liczniej niż stan podstawowy, wymaga dostarczania energii z zewnątrz.

Trzeci proces odkryty przez Einsteina to emisja spontaniczna. Jeśli atom znajduje się w stanie wzbudzonym, to prędzej czy później wyemituje on spontanicznie foton i elektron przejdzie do stanu podstawowego. Spontanicznie, znaczy tu bez żadnego oddziaływania z zewnątrz. Żadnego promieniowania, żadnych pól zewnętrznych itd. itp. W przypadkowo wybranej chwili nasz atom wysyła foton. Dokładnie takie samo zjawisko zachodzi w rozpadzie promieniotwórczym np. radu. Jądro radu jest niestabilne i w przypadkowo wybranej chwili ulega rozpadowi z wysłaniem cząstki alfa, czyli jądra helu. Prawdopodobieństwo, że wybrany atom (jądro) nie ulegnie rozpadowi przez czas t jest równe

p(t)=e^{-\gamma t},

gdzie \gamma jest pewną stałą. Jest to prawo rozpadu promieniotwórczego albo prawdopodobieństwo przeżycia czasu t w rosyjskiej ruletce. Przypadek atomu i jądra różni się tylko rodzajem obiektu i sił oddziaływania, ale fizyka kwantowa jest taka sama. Einstein oznaczał stałą emisji spontanicznej literą A zamiast \gamma. Emisja spontaniczna odpowiada za większość promieniowania obserwowanego wokół nas, np. większość fotonów ze Słońca powstaje w emisji spontanicznej. Zjawisko to odpowiada za fakt, że każdy układ fizyczny z czasem przechodzi do stanu o niższej energii. Tylko stan o najniższej energii jest stabilny.

Einstein w roku 1916 nie zdawał sobie zapewne sprawy, jak niebezpieczny proces zapoczątkował. Szukał bowiem fizyki deterministycznej, w które skutek zawsze jest poprzedzony przyczyną. A tu mamy do czynienia z czymś, co nie ma żadnej określonej przyczyny. Jakby w przypadku wzbudzonego atomu czy jądra natura sama grała bezustannie w rodzaj rosyjskiej ruletki aż do skutku, tzn. aż do chwili gdy nasz układ przejdzie do stanu podstawowego. Co jest przyczyną emisji spontanicznej (rozpadu promieniotwórczego)? Nie ma tu zewnętrznego oddziaływania, tzn. musimy przyjąć, że nawet gdy nie ma zewnętrznych pól, „coś” zostaje: próżnia kwantowa. W roku 1927 Paul Dirac uzyskał teoretyczne wartości współczynników A, B Einsteina, stosując mechanikę kwantową, a właściwie zapoczątkowując kwantową elektrodynamikę.

Atom nigdy nie jest izolowany, istnieje bowiem pole elektromagnetyczne, które może zostać wzbudzone, nawet jeśli z początku nie było. Przyjmiemy, że stan wzbudzony ma energię E=0, a stan podstawowy energię E=-\hbar\omega_0 (istotna jest tylko różnica obu energii, a nie ich wartości z osobna). Znaczy to, że oczekujemy wyemitowania fotonu o częstości (kołowej) \omega_0. Oprócz atomu mamy też pole elektromagnetyczne, możemy je sobie wyobrażać np. jako fale stojące w wielkim pudle (technicznie: wnęce rezonansowej). Jeśli pole elektryczne znika na ściankach wnęki, fale stojące wyglądają następująco: 

tmp_44l2z5nv

Przedstawiliśmy cztery mody o najdłuższych falach i najniższych częstościach. Będą one dane funkcjami sinus: \sin kx, gdzie

kL=m\pi,\;\;\mbox{gdzie}\;\; m=1,2,3,\ldots

Częstości odpowiadające kolejnym wartościom m będą równe \omega_k =ck, gdzie c jest prędkością światła. Ciąg dopuszczalnych częstości jest nieograniczony z góry. Dowolne pole elektryczne w pustym pudle możemy przedstawić jako szereg takich sinusów, jest to matematycznie rzecz biorąc rozwinięcie w szereg Fouriera. Analogiczne rozwinięcie można przeprowadzić w pudle trójwymiarowym, szczegóły nie są nam potrzebne. Skwantowanie pola elektromagnetycznego polega na zastąpieniu zbioru dozwolonych modów fal przez zbiór oscylatorów kwantowych. Energia własna każdego oscylatora jest równa

E_n=\hbar\omega_k n, \;\;\mbox{gdzie}\;\; n=0,1,2,3,\ldots.

Matematyka oscylatorów jest bardzo prosta i omawialiśmy ją już kiedyś. Każdy stan o energii E_n możemy uważać za stan, w którym mamy n fotonów o energii \hbar\omega_k każdy. Przestrzeń stanów oscylatora możemy sobie wyobrażać jako liniowe kombinacje stanów |n\rangle odpowiadających energiom n \hbar\omega_k , czyli stanów różnych liczbach fotonów:

|\psi\rangle={\displaystyle \sum_{n=0}^{\infty}c_n|n\rangle.}

Stan kwantowy pola w pudle podamy określając stan każdego oscylatora-modu z osobna. Stanem o najniższej energii będzie zbiór stanów podstawowych każdego z oscylatorów. Oznacza to w języku kwantowym, że żaden oscylator nie jest wzbudzony albo inaczej: mamy zero fotonów każdego modu. Taki jest stan wyjściowy pola elektromagnetycznego w naszym pudle.

Gdyby pole elektromagnetyczne nie oddziaływało z żadnym elektronem, nie byłoby powodu, aby opuściło ono stan próżni. Podobnie, gdyby atom w stanie wzbudzonym nie oddziaływał z polem elektromagnetycznym, tkwiłby w tym stanie na wieczność. Wiemy jednak, że elektron ma ładunek, a ładunki oddziałują z polem elektromagnetycznym. Oznacza to, że w równaniu Schrödingera musimy uwzględnić dodatkowe wyrazy sprzęgające oba układy: atom i pole. Nie będziemy zajmować się tu konkretną postacią tego oddziaływania, wystarczy nam, by sprzęgało ono oba układy. Najpierw zapiszemy sytuację bez oddziaływania. Stan kwantowy naszego połączonego układu można opisać jako iloczyn stanu atomowego: wzbudzonego |1\rangle (energia E=0) bądź podstawowego |2\rangle (energia E=-\hbar\omega_0) oraz stanu próżni pola elektromagnetycznego |\Phi_0\rangle (energia pola E=0) bądź stanu jednofotonowego |k\rangle (energia pola E=\hbar\omega_k):

|\Psi\rangle=a(t)| 1\rangle | \Phi_0\rangle+{\displaystyle \sum_{k}b_k(t) | 2\rangle | k\rangle},

gdzie stanowi wzbudzonemu towarzyszą próżniowe stany fotonowe, a stanowi podstawowemu – stany  z jednym fotonem o energii \hbar\omega_k. Kwadraty modułu współczynników a, b_k są proporcjonalne do prawdopodobieństwa znalezienia układu odpowiednio w stanie wzbudzonym oraz podstawowym po wypromieniowaniu konkretnego fotonu o wektorze falowym k. Jeśli ograniczymy się tylko do takich stanów (to pierwsze z naszych przybliżeń), równanie Schrödingera sprowadza się do układu równań liniowych:

\dfrac{da}{dt}=-\dfrac{i}{\hbar}{\displaystyle \sum_{k}H_{1k}b_k, }

\dfrac{db_k}{dt}=-i(\omega_k-\omega_0)b_k-\dfrac{i}{\hbar}H_{k1}a.

Bez wyrazów sprzęgających atom z polem elektromagnetycznym, mielibyśmy a(t)=const jako rozwiązanie pierwszego równania, rozwiązanie drugiego miałoby zaś postać

b_k(t)=Ce^{-i(\omega_k-\omega_0)t}.

Oznaczałoby to stan stacjonarny, prawdopodobieństwo nie zmienia się z czasem. Szukamy rozwiązań, dla których a(0)=1 oraz b_k(0)=0. Łatwo jest znaleźć rozwiązanie drugiego równania w takiej sytuacji: ma ono postać pewnej funkcji czasu razy powyższy czynnik eksponencjalny:

b_k(t)=-\dfrac{i}{\hbar} e^{-i(\omega_k-\omega_0)t} {\displaystyle \int_{0}^{t} dt' H_{k1}a(t')e^{i(\omega_k-\omega_0)t'},}

co łatwo sprawdzić różniczkowaniem po t. Wstawiając to rozwiązanie do pierwszego równania otrzymujemy

\dfrac{da}{dt}=-\dfrac{1}{\hbar^2}{\displaystyle \sum_{k}|H_{1k}|^2  \int_{0}^{t} dt' a(t')e^{i(\omega_k-\omega_0)(t'-t)}}.

Skorzystaliśmy z faktu, że H_{1k}=H_{k1}^{\star}. Wyrażenie podcałkowe gwałtownie oscyluje i rozsądnie jest oczekiwać, że największy wkład wniosą wyrazy z t\approx t', wobec tego możemy przyjąć przybliżenie: a(t')=a(t) i wyraz zawierający a(t) wyłączyć przed całkę (przybliżenie Weisskopffa-Wignera, 1930). Zostaje wtedy

\dfrac{da}{dt}=-a(t)\dfrac{1}{\hbar^2}{\displaystyle \sum_{k}|H_{1k}|^2  \int_{0}^{t} dt' e^{i(\omega_k-\omega_0)(t'-t)}}.

Chcielibyśmy mieć

\dfrac{da}{dt}=-\dfrac{\gamma}{2}a,

bo wtedy prawdopodobieństwo przetrwania atomu w stanie wzbudzonym jest równe |a(t)|^2=\exp{(-\gamma t)}. Sumę po dozwolonych wartościach k możemy zapisać za pomocą funkcji gęstości stanów fotonowych. Liczba stanów w przedziale energii dE jest z definicji równa \rho(E)dE=\rho(\hbar\omega)\hbar d\omega. Dostajemy następujące wyrażenie dla stałej \gamma:

\gamma=\dfrac{2}{\hbar} {\displaystyle \int_{0}^{\infty} d\omega \rho(\hbar \omega) |H(\omega)|^2 \;\dfrac{ \sin(\omega-\omega_0)t }{\omega-\omega_0 }}.

Dla dużych wartości t funkcja podcałkowa jest iloczynem potęgowo zmieniającej się funkcji oraz ilorazu z funkcją sinus, który gwałtownie oscyluje. Wkład wnoszą tylko wyrazy \omega\approx \omega_0.

tmp_6gawvumr

Ostatecznie

\gamma=\dfrac{2\pi}{\hbar} |H(\hbar\omega_0)|^2\rho(\hbar\omega_0).

Jest to wynik uzyskany po raz pierwszy przez Diraca, ale zwany zwykle złotą regułą Fermiego. Liczba \pi pojawiła się jako całka 

{\displaystyle \int_{-\infty}^{\infty}dx\; \dfrac{\sin x}{x}=\pi.}

Można też obliczyć współczynniki b_k(t) w granicy dużych czasów. Okazuje się, że

|b(\omega)|^2\sim \dfrac{1}{(\omega-\omega_0)^2+\frac{\gamma^2}{4}}.

Daje to tzw. krzywą Lorentza na obrazku. Jest to naturalny kształt linii widmowej emitowanej przez nasz atom. Szerokość rozkładu równa jest \gamma.

tmp_540sr5iv

Wartość \gamma jest odwrotnością średniego czasu życia \tau stanu wzbudzonego:

\gamma=\dfrac{1}{\tau}.

Z obserwacyjnego punktu widzenia stan wzbudzony ma energię rozmytą z szerokością \Delta E= \hbar\gamma. Otrzymujemy zasadę nieoznaczoności dla energii: \Delta E\,\tau=\hbar. W przypadku cząstek elementarnych, które rozpadają się na jakieś inne cząstki będzie to znaczyć, że ich masa nie jest ściśle określona (bo E=mc^2). Ściśle określoną energię może mieć tylko stan podstawowy danego układu.

Kwantowa teoria pola stanowi odpowiedź na pytania stawiane przez Einsteina od roku 1905: Jak zmodyfikować teorię Maxwella, żeby uwzględniała ona efekty kwantowe. Fotony, zjawisko fotoelektryczne, oddziaływanie promieniowania z atomami itd. – wszystkie te kwestie zostały stopniowo rozstrzygnięte w sposób zgodny z obserwacjami. Postęp był tu pełen wahań i pojawiających się trudności natury zarówno fizycznej, jak matematycznej. W naszym przykładzie milcząco przyjęliśmy, że \gamma jest liczbą rzeczywistą, tzn. wzięliśmy część rzeczywistą całki. Jeśli obliczymy jej część urojoną, okaże się ona nieskończona w przypadku emisji w pustym pudle. Fizycznie część urojona współczynnika \gamma oznacza przesunięcie w energii wywołane oddziaływaniem z polem elektromagnetycznym. Takie przesunięcie zostało zaobserwowane w roku 1947 przez Willisa Lamba i zwane przesunięciem Lamba. Jest ono w rzeczywistości niewielkie i dopiero po wojnie udało się je obliczyć teoretycznie. Najpierw zrobił to Hans Bethe, potem inni twórcy elektrodynamiki kwantowej: Julian Schwinger, Sin-Itiro Tomonaga, Richard Feynman i inni. Albert Einstein wyłączył się z rozwijania fizyki kwantowej na początku lat trzydziestych i nie śledził jej kolejnych osiągnięć. Einstein nie zgadzał się z odrzuceniem przyczynowości, właśnie takim jak w emisji spontanicznej. Na jego usprawiedliwienie można dodać, że nie wszyscy fizycy młodszego – „kwantowego” – pokolenia wierzyli w prawdziwość elektrodynamiki kwantowej. Nawet Paul Dirac, który zapoczątkował tę drogę, nie wierzył, by znaleziono zadowalającą odpowiedź. Ostatecznie elektrodynamika kwantowa okazała się najdokładniejszą teorią, jaką stworzono w historii fizyki.

Prawdopodobieństwo wyemitowania fotonu w czasie (t,t+dt) jest równe \exp{(-\gamma t)}\gamma dt (prawdopodobieństwo dotrwania do chwili t razy prawdopodobieństwo rozpadu w przedziale czasu o długości dt, czyli \gamma dt), wobec tego średni czas życia atomu/cząstki jest równy

\tau={\displaystyle \int_{0}^{\infty} t \exp{(-\gamma t)} \gamma dt}=\dfrac{1}{\gamma}.

Najważniejsza chwila w naukowym życiu Alberta Einsteina: wyjaśnienie anomalii Merkurego (18 XI 1915)

Jeszcze latem 1915 roku Einstein sądził, że od dwóch lat jest autorem prawidłowej teorii grawitacji. Chodziło o pracę napisaną wspólnie z Marcelem Grossmannem, dziś zwaną jako teoria Entwurf. Miała ona pewne wady, przede wszystkim była nieelegancka i nie dopuszczała stosowania dowolnych układów współrzędnych, wbrew pierwotnym zamysłom Einsteina. Autor przekonywał jednak swoich korespondentów, że nic lepszego nie można sformułować, choć jak się zdaje, sam był nie do końca przekonany. W czerwcu 1913 roku zastosował teorię Entwurf do obliczeń znanej i od lat niewyjaśnionej anomalii w ruchu Merkurego. Gdyby Merkury podlegał jedynie przyciąganiu grawitacyjnemu Słońca, jego orbita byłaby dokładnie eliptyczna i oś owej elipsy nie zmieniałaby położenia względem gwiazd. Wiemy od czasów Newtona, że inne planety także mają pewien wpływ na ruch Merkurego. Jednym ze skutków ich łącznego oddziaływania jest powolny obrót osi elipsy Merkurego w płaszczyźnie orbity. Stosując prawo powszechnego ciążenia wyjaśniono niemal całkowicie obserwowany obrót osi elipsy (in. obrót peryhelium). W połowie XIX wieku Urbain Le Verrier, współodkrywca planety Neptun, stwierdził, że pozostaje niewielki obrót, którego nie daje się wyjaśnić na podstawie praw Newtona. Różnica 43 sekund kątowych na stulecie nie poddawała się żadnym rachunkom. Znaczyło to, że choć efekt jest drobny, to musi kryć się za nim jakaś nieznana dotąd przyczyna: albo nie zaobserwowaliśmy jeszcze wszystkich planet (hipoteza planety Wulkan), albo newtonowskie prawo ciążenia należy w jakiś sposób zmodyfikować dla małych odległości (dlatego anomalia widoczna była najlepiej w przypadku planety najbliższej Słońca). Obu tych dróg próbowano bez skutku. Toteż w 1913 roku Einstein zastosował znalezioną przez siebie teorię Entwurf do tego problemu. Ponieważ często mylił się w rachunkach, więc poprosił o pomoc Michele Bessa. Otrzymali odchylenie od teorii Newtona, ale równe było tylko 18” i Einstein stracił zapał do tej kwestii. Obserwowana anomalia w ruchu Merkurego była jednak na tyle niewielka, że nie było pewności, czy nawet prawidłowa teoria zdoła ją wyjaśnić. Zanim dojdzie się do owych 43”, trzeba uwzględnić wiele rozmaitych efektów w sumie dających 5600” – istniała więc możliwość, że astronomowie czegoś nie uwzględnili, np. możliwości nieznacznego spłaszczenia Słońca. Na razie teoria Entwurf wydawała się całkiem dobra, sprawę Merkurego Einstein odłożył ad acta.

Dopiero jesienią 1915 roku uświadomił sobie, że teoria Entwurf nie zachowuje się tak, jak tego oczekiwał w obracających się układach współrzędnych. Ten brak, który Einstein przeoczył dzięki elementarnym pomyłkom w rachunkach, zapoczątkował powrót do punktu wyjścia pracy z Grossmannem. I tak, jak rok 1905 był cudownym rokiem Einsteina (kiedyś tego określenia: annus mirabilis użyto w odniesieniu do prac Newtona w roku 1666), listopad 1915 roku okazał się jego mensis mirabilis: w cztery kolejne czwartki tego miesiąca przedstawiał on Królewsko-Pruskiej Akademii Nauk prace rozwiązujące ostatecznie problem równań pola w teorii grawitacji. Były one sukcesywnie publikowane w „Sitzungsberichte” Akademii z tygodniowym opóźnieniem. W pierwszej, drugiej i czwartej przedstawione zostały kolejne propozycje równań pola – dopiero ostatnia była całkowicie poprawna. Sam ich autor napisał pod koniec miesiąca:
„Niestety, unieśmiertelniłem w sprawozdaniach Akademii (…) końcowe błędy popełnione w tej walce”. Praca trzecia zawierała obliczenie ruchu perihelium Merkurego; tym razem Einstein otrzymał 43″ na stulecie, wynik, który trafił do podręczników fizyki. Wyjaśnił też, już na zawsze, iż odchylenie promienia świetlnego w pobliżu Słońca powinno być dwa razy większe, niż sądził do tej pory. Przyczyną było  zakrzywienie przestrzeni trójwymiarowej, które należy wziąć pod uwagę także przy słabym polu grawitacyjnym – coś, o czym wcześniej nie pomyślał.

Szybkie postępy pracy Einsteina w tych  gorączkowych tygodniach wynikały także częściowo z presji, jaką odczuwał: wiedział bowiem, że tym samym problemem zajął się David Hilbert w Getyndze.  Korespondowali nawet trochę w tym czasie, ale  żaden z nich nie znał dokładnie wyników uzyskanych  przez drugiego. Hilbert zapisał tzw. równanie  wariacyjne dla teorii względności – w wielu dzisiejszych  podręcznikach tak właśnie wprowadza się  równania pola Einsteina. Jak się jednak zdaje, Hilbert nie  przeprowadził obliczeń i nie uzyskał w tym czasie równań wynikających z zasady wariacyjnej (w dodatku  jego teoria nie była ogólnie kowariantna). Einstein  zwrócił mu uwagę, że trudność leży nie w napisaniu  równań, lecz w ich fizycznej interpretacji: „Trudno było dostrzec, że równania te są uogólnieniem, tzn. prostym i naturalnym uogólnieniem prawa Newtona”.

Poinformował też kolegę z Getyngi, iż trzy lata wcześniej rozważali już z Grossmannem takie równania.  Była to ścisła informacja, w Notatniku zuryskim znajdujemy tensor, który pojawił się w pierwszej  listopadowej pracy z roku 1915. Cudowna szybkość, z jaką teraz mógł się posuwać, związana była z tym,  że po pierwsze, korzystał z różnych wyników cząstkowych uzyskanych wcześniej, a po drugie, w ciągu  trzech lat nauczył się skutecznie używać geometrii różniczkowej.

Dowiadując się o sukcesie Einsteina w sprawie peryhelium Merkurego, Hilbert zauważył z pewną  zazdrością (i chyba z lekkim poczuciem wyższości): „Gdybym potrafił liczyć tak szybko jak pan, elektron  skapitulowałby w obliczu mojego równania, a atom wodoru musiałby jakoś się wytłumaczyć, dlaczego nie  promieniuje”. Także i tym razem nie chodziło o szybkość prowadzenia obliczeń, Einstein nie był jakimś  szczególnie sprawnym rachmistrzem, po prostu obliczenia ruchu peryhelium Merkurego już wcześniej  przeprowadzał, teraz musiał w nich to i owo zmienić, ale nie był to zupełnie nowy problem. Druga część  cytowanego wyżej zdania Hilberta wskazuje także na inny brak jego pracy: chciał on zbudować za jednym  zamachem teorię wszystkiego, w szczególności miał chyba nadzieję na uzyskanie widma wodoru –  zaledwie dwa lata wcześniej Niels Bohr po raz pierwszy otrzymał na drodze teoretycznej prawidłowe  długości linii widma. Jego teoria nie była całkowicie poprawna z dzisiejszego punktu widzenia, stanowiła  jednak krok ku mechanice kwantowej. David Hilbert próbował alternatywnego podejścia, które nie  okazało się udane.

Obaj uczeni zmagali się też z dość prostymi dziś trudnościami matematycznymi: nie znali np. tzw. zwężonych tożsamości Bianchiego, które automatycznie zapewniają, że zasada zachowania pędu-energii jest spełniona. Tożsamości te znane były w literaturze matematycznej, lecz nie od razu nauczono się ich używać w tym kontekście. Wiele kwestii matematycznych miało być w nadchodzących latach wyjaśnione w ślad za powstaniem teorii Einsteina, co przyciągnęło uwagę zarówno fizyków, jak i może nawet częściej
matematyków. Dziś geometria różniczkowa przestała być wiedzą tajemną, uczą jej setki książek, co świadczy o postępie nauki. Jak napisał kiedyś antropolog społeczny Max Gluckman: „Nauką jest każda dyscyplina, w której głupiec obecnego pokolenia może pójść dalej niż geniusz pokolenia poprzedniego” (nb. napisał to jako wprowadzenie do swojej krytyki poglądów Bronisława Malinowskiego).

Sprawa priorytetu uzyskania równań pola wywołała przejściowe napięcie w  stosunkach Einsteina z Hilbertem, jednak matematyk ostatecznie pogodził się z faktem, że choć wniósł pewien wkład w powstanie teorii grawitacji, to nie on jest jej twórcą.

Anomalia Merkurego była pierwszym wielkim sukcesem nowej teorii. On sam wspominał chwilę, gdy uzyskał zgodny z obserwacjami wynik jako kulminacyjny punkt swego życia naukowego. Pomyślmy tylko: przez osiem lat starał się zbudować teorię, która byłaby logicznym rozwinięciem szczególnej teorii względności. Przez ten czas zajmował się tylko kwestiami warunków fizycznych i matematycznych, jakie nowa teoria powinna spełniać. Nie korzystał z żadnych danych eksperymentalnych. I po tej całej pracy zawieszonej gdzieś w świecie abstrakcyjnych spekulacji okazuje się, że wynik pasuje do superdokładnych obserwacji i obliczeń astronomów poprzednich pokoleń, rozwiązuje problem postawiony jeszcze przez Le Verriera. „Przez kilka dni nie posiadałem się z radosnego podniecenia” – pisał do Paula Ehrenfesta. Innemu koledze zwierzał się: „Coś we mnie wtedy pękło”. Kolejny sukces teorii: zmierzenie w roku 1919 ugięcia światła w pobliżu Słońca, zapoczątkował wprawdzie ogromną sławę uczonego, lecz nie miał już takiego znaczenia w jego życiu wewnętrznym. Od jesieni 1915 roku Einstein wierzył niezachwianie w swoją teorię.

Przyjrzymy się obliczeniu precesji peryhelium Merkurego. Najpierw pokażemy, czemu w teorii Newtona elipsa planety się nie obraca.

Będziemy stosować zasadę zachowania energii i opisywać ruch planety we współrzędnych biegunowych (r,\varphi).

Jak widać z rysunku kwadrat prędkości możemy za pomocą twierdzenia Pitagorasa zapisać w postaci

v^2=\dfrac{\Delta r^2+r\Delta\varphi^2}{\Delta t^2}=\dot{r}^2+r^2\dot{\varphi}^2,

gdzie kropki oznaczają pochodne po czasie. Jeśli planeta o jednostkowej masie znajduje się w odległości r od Słońca o masie M, to jej całkowita energia równa jest

E=\dfrac{1}{2}(\dot{r}^2+r^2\dot{\varphi}^2)-\dfrac{GM}{r},

G jest stałą grawitacyjną, a masa planety jest nieistotna, o ile interesuje nas jedynie ruch względny planety wokół Słońca. Oprócz energii zachowany jest także moment pędu równy

L=r^2\dot{\varphi}.\;\; \mbox{(*)}

Matematycznie równanie to jest równoważne prawu pól Keplera. Wyznaczamy stąd prędkość kątową planety i wstawiamy do równania zachowania energii:

\dot{r}^2=2\left(E+\dfrac{GM}{r}-\dfrac{L^2}{2r^2}\right).\;\;\mbox{(**)}

Otrzymaliśmy problem jednowymiarowy dla funkcji r(t). W nawiasie mamy różnicę całkowitej energii i efektywnej energii potencjalnej

V_{eff}=-\dfrac{GM}{r}+\dfrac{L^2}{2r^2}.

Jest to suma funkcji -1/r oraz 1/r^2 z pewnymi współczynnikami liczbowymi. Dla małych r dominuje człon drugi, odpychający. Dla dużych r – pierwszy, przyciągający. Cały potencjał efektywny wygląda następująco:

Gdy całkowita energia odpowiada minimum potencjału, możliwa jest tylko jedna wartość r, co odpowiada ruchowi po okręgu. Gdy energia jest nieco większa, dozwolony pozostaje ograniczony przedział promieni wodzących r\in(r_{-},r_{+}). Dla jeszcze większej energii planeta odleci do nieskończoności.

Aby wyznaczyć kształt toru należy zrobić dwie rzeczy: zastosować nową zmienną u=1/r oraz różniczkowanie po czasie zastąpić różniczkowaniem po kącie \varphi. Korzystamy z (*) i (**)

\dfrac{du}{d\varphi}=-\dfrac{1}{r^2}\dfrac{dr}{d\varphi}=-\dfrac{1}{r^2}\dfrac{\dot{r}}{\dot{\varphi}}=-\dfrac{\dot{r}}{L}. \;\;\mbox{(***)}

Równanie toru przybiera postać

\dfrac{du}{d\varphi}=\pm \sqrt{\dfrac{2E}{L^2}+\dfrac{2GMu}{L^2}-u^2}\equiv\pm\sqrt{P(u)}.

Wyrażenie podpierwiastkowe musi być nieujemne. Znak przed pierwiastkiem zależy od kierunku ruchu, dalej wybieramy znak plus. Wyrażenie podpierwiastkowe w przypadku planety będzie wyglądało jak na rysunku

Wobec tego kąt zakreślony przed planetę między aphelium i peryhelium będzie równy

\Delta\varphi={\displaystyle \int_{u_{-}}^{u_{+}}\dfrac{du}{\sqrt{P(u)}}=\pi.}

Szczegóły rachunku przytaczam poniżej, idea jest taka, że całka jest typu \int\frac{dx}{\sqrt{1-x^2}}, co daje arcus sinus, którego całkowita zmienność to właśnie \pi. Ponieważ planeta oscyluje w promieniu wodzącym od aphelium do peryhelium i z powrotem, całkowity kąt między dwoma apheliami albo dwoma peryheliami równy jest 2\pi. Oznacza to, że tor jest krzywą zamkniętą. Fakt ten znał już Isaac Newton i nieruchomość osi orbit planet przytaczał jako argument świadczący o tym, że siła przyciągania Słońca zmienia się jak 1/r^2. Twierdzenie udowodnione pod koniec XIX wieku przez Bertranda głosi, że tylko siła grawitacji 1/r^2 i siła proporcjonalna do odległości r prowadzą do zamkniętych torów wokół centrum (różnych od okręgu). Oczywiście, jeśli uwzględnimy także siły pochodzące od pozostałych planet, ten prosty obraz zostanie zaburzony: nadal przybliżenie eliptyczne jest dobrym punktem wyjścia, ale elipsy ulegają powolnej precesji, szczególnie wyraźnej w przypadku Merkurego.

Przejdźmy teraz do przypadku rozważanego przez Einsteina. Metryka czasoprzestrzeni wokół Słońca dana jest rozwiązaniem Schwarzschilda:

ds^2= A(r) dt^2-B(r) dr^2-r^2 d\varphi^2,

gdzie zostawiliśmy tylko ruch w płaszczyźnie, postać funkcji A,B podamy później. Równania ruchu cząstki otrzymujemy z warunku maksymalnego czasu własnego

\delta \int ds =0.

Okazuje się, że zasada ta jest równoważna zasadzie wariacyjnej

\delta\int {\cal L} d\tau, \;\;\mbox{gdzie}\; {\cal L}(t,r,\varphi,\dot{t},\dot{r},\dot{\varphi})= A(r) \left(\dfrac{dt}{d\tau}\right)^2-B(r)\left(\dfrac{dr}{d\tau}\right)^2-r^2\left(\dfrac{d\varphi}{d\tau}\right)^2.

Inaczej mówiąc spełnione są równania Lagrange’a z powyższym lagranżianem, kropka oznacza teraz całkowanie po czasie własnym \tau, trójka (t(\tau), r(\tau), \varphi(\tau)) opisuje ruch cząstki. Ponieważ metryka (i lagranżian) nie zależy jawnie od czasu t oraz kąta \varphi, więc dwa równania wyglądają szczególnie prosto:

\dfrac{d}{d\tau}(A\dot{t})=0 \;\; \Rightarrow A\dot{t}=E,

gdzie E jest pewną stałą podczas ruchu cząstki. Drugie równanie ma postać

\dfrac{d}{d\tau}(r^2\dot{\varphi})=0 \;\;\Rightarrow r^2\dot{\varphi}=L,

gdzie L jest inną stałą ruchu. Oba te równania odpowiadają zasadzie zachowania energii oraz momentu pędu u Newtona i wynikają z podobnych powodów fizycznych: zasada zachowania energii jest spełniona, gdy translacja w czasie jest symetrią układu, zasada zachowania momentu pędu jest spełniona, gdy obrót wokół osi (u nas prostopadłej do płaszczyzny orbity) jest symetrią układu.

Zamiast rozważać równanie Lagrange’a dla zmiennej r możemy skorzystać z faktu, że podczas ruchu cząstki masywnej {\cal L}=1:

{\cal L}= A\left(\dfrac{E}{A}\right)^2-B\dot{r}^2-\dfrac{L^2}{r^2}=1 .

Wyznaczajmy stąd kwadrat prędkości radialnej

\dot{r}^2=\dfrac{E^2}{AB}-\dfrac{1}{B} -\dfrac{1}{B}\dfrac{L^2}{r^2}.

Funkcje A, B dane są w przypadku rozwiązania Schwarzschilda równaniami

A=B^{-1}=1-\dfrac{r_{S}}{r},\;\;\mbox{gdzie} \; r_S=\dfrac{2GM}{c^2}

 jest promieniem Schwarzschilda. Tak jak w przypadku newtonowskim wprowadzamy zmienną u=1/r i korzystamy ponownie ze związku (***). W wyniku dostajemy

\dfrac{du}{d\varphi}=\pm\sqrt{\dfrac{E^2-1}{L^2}+\dfrac{r_S}{L^2}u-u^2+r_S u^3}=\pm\sqrt{P'(u)}.

Porównując to wyrażenie z newtonowskim, widzimy, że pomijając inną definicję stałej energii (wyraz wolny pod pierwiastkiem), mamy dwa wyrazy z u oraz u^2 takie, jak poprzednio, doszedł teraz wyraz trzeciego stopnia. Wyrażenie podcałkowe ma teraz trzy pierwiastki rzeczywiste i wykres jak poniżej.

Szukamy niewielkiej poprawki do ruchu newtonowskiego, wobec tego pierwiastki u_{\pm} powinny leżeć tak jak poprzednio, a trzeci pierwiastek u_0 powinien być znacznie od tamtych większy. Całkę

\Delta\varphi ={\displaystyle \int_{u_{-}}^{u_{+}}\dfrac{du}{\sqrt{P'(u)}}}

można obliczyć jako całkę eliptyczną. Przejrzystsza jest tu jednak metoda przybliżona. Zapisujemy wielomian P'(u) w postaci

P'(u)=r_S(u-u_{-})(u_{+}-u)(u_0-u)\approx r_S u_0\left(1-\dfrac{u}{u_0}\right)(u-u_{-})(u_{+}-u).

Mamy w tym przybliżeniu ponownie do czynienia z całką zawierającą pierwiastek z trójmianu kwadratowego, jaką obliczaliśmy już wcześniej.

\Delta\varphi=\dfrac{1}{\sqrt{r_S u_0}}{\displaystyle \int_{u_{-}}^{u_{+}}\dfrac{du}{\sqrt{(u-u_{-})(u_{+}-u)}}\left(1+\dfrac{u}{2u_0}\right).}

Całkując, dostajemy

\Delta\varphi=\dfrac{\pi}{\sqrt{r_S u_0}}\left(1+\dfrac{u_{-}+u_{+}}{4u_0}\right).

Aby obliczyć wielkość au_0 porównujemy wyrazy zawierające u^2 w wyrażeniu P'(u). Otrzymamy

r_S(u_0+u_{-}+u_{+})=1, \;\;\Rightarrow r_Su_0=1-r_S(u_{-}+u_{+})\approx 1,

możemy więc w przybliżeniu napisać

\dfrac{1}{\sqrt{r_s u_0}}\approx 1+r_S\dfrac{u_{-}+u_{+}}{2}.

Kąt między aphelium a perihelium planety równa się łącznie

\Delta\varphi=\pi\left[1+\dfrac{3}{4} r_S(u_{-}+u_{+})\right]=\pi \left[1+\dfrac{3}{2}\dfrac{GM}{c^2}\left(\dfrac{1}{r_{+}}+\dfrac{1}{r_{-}}\right)\right].

Precesja peryhelium przypadająca na jeden obieg planety będzie dwa razy większa

\Delta\varphi=2\pi+\dfrac{3GM\pi}{c^2}\left(\dfrac{1}{r_{+}}+\dfrac{1}{r_{-}}\right)\equiv 2\pi+\dfrac{3\pi}{2}r_S\left(\dfrac{1}{r_{+}}+\dfrac{1}{r_{-}}\right)\equiv 2\pi+\dfrac{3r_S\pi}{2a(1-e^2)}.

W ostatnim wyrażeniu a,e oznaczają odpowienio dużą półoś i mimośród orbity planety. Jak widać, metoda obliczeń zastosowana przez Einsteina była całkiem elementarna. Poprzednio w teorii Entwurf, w pracy z 1913 roku, którą  pod względem rachunkowym sprawdzał Besso, otrzymywało się wartość dodatkowej precesji na obieg równą

\Delta\varphi=\dfrac{5}{4}\dfrac{GM\pi}{c^2}\left(\dfrac{1}{r_{+}}+\dfrac{1}{r_{-}}\right),

stąd owe nieszczęsne 18” na stulecie.

Całki, które pojawiają się w tym zagadnieniu, oblicza się za pomocą podstawienia

u=\dfrac{u_{-}+u_{+}}{2}+\dfrac{u_{+}-u_{-}}{2}\cos t.

Przedział całkowania (u_{-},u_{+}) przechodzi w przedział (\pi,0). Bardziej wymyślna metoda to użycie konturu na płaszczyźnie zespolonej wokół cięcia (u_{-},u_{+}), choć w tym przypadku jest to trochę overkill. Einstein we wcześniejszej pracy na temat peryhelium z roku 1913 stosuje metodę zespoloną do całej rodziny całek podobnego typu (można to zobaczyć w t. 4 Einstein Papers).

W każdym razie obliczenie ruchu peryhelium nie było bynajmniej czymś wyrafinowanym, co mogłoby sprawić trudność Hilbertowi albo Einsteinowi. Istotny był nowy punkt wyjścia, nowe spojrzenie na czasoprzestrzeń.

Leonhard Euler: wahadło (1777)

Pisałem o początkach kariery Leonharda Eulera. Później przez całe długie życie, dzień po dniu niestrudzenie prowadził obliczenia, tworząc setki prac, jakby na potwierdzenie kalwińskiej doktryny predestynacji: to Stwórca wybiera, a jego wybrani właściwie nawet nie odczuwają rozterek, jak postępować, bo muszą czynić dobrze. W naszych sceptycznych oczach był człowiekiem ambitnym, który wciąż musiał rozwiązywać zagadki i mało kto potrafił mu w tym dorównać. Czasem d’Alembert i Clairaut we Francji potrafili z nim konkurować. Pomysłowość metod łączył Euler z nadzwyczajną sumiennością w rachunkach. Spis prac Eulera liczy ponad 800 pozycji. Pisał, później raczej dyktował, ponieważ niemal całkiem stracił wzrok, co nie tylko nie zahamowało tempa jego pracy, lecz nawet je przyspieszyło, gdyż mniej spraw go rozpraszało, a rachunki i tak robił w pamięci. My zajmiemy się pracą E503, poświęconą ruchowi wahadła o dużej amplitudzie (wydrukowaną w roku 1780). Pojawia się w niej całka eliptyczna pierwszego rodzaju. To niejako zapowiedź wielkiego tematu matematyki w XIX wieku, a mianowicie funkcji eliptycznych, rozwijanych później przez Legendre’a, Abela, Jacobiego, Weierstrassa i Riemanna.

Pokażemy, jak okres oscylacji wahadła zależy od amplitudy. I pokażemy, jak zrobić o jeden krok dalej niż Euler, bo nauka to jedyny może obszar ludzkiej działalności, gdzie postęp jest rzeczywisty, co oznacza, że niemal każdy później urodzony może sięgać dalej niż dawni mistrzowie.

W czasach Eulera zegary wahadłowe wciąż były najdokładnieszym przyrządem do mierzenia czasu, teoria wahadła miała więc pewne znaczenie praktyczne. Euler zajmował się także wcześniej ruchami brył sztywnych, potrafił więc wykazać, że wahadłem może być jakakolwiek bryła o dowolnym kształcie. Jej ruch zawsze jest taki sam jak wahadła matematycznego o pewnej długości. Dlatego wystarczy rozważać wahadło matematyczne. Możemy sobie wyobrażać takie wahadło jako czerwony koralik o masie m=1 ślizgający się bez tarcia po okręgu o promieniu L. II zasada dynamiki daje wtedy

\ddot{\varphi}=-\dfrac{g}{L}\sin\varphi,

kropki oznaczają różniczkowanie po czasie. Możemy też zacząć nie od II zasady dynamiki, lecz od zasady zachowania energii (technicznie biorąc mamy wtedy o jedną całkę mniej). Ponieważ prędkość koralika to \dot{\varphi}L (\dot{\varphi} jest prędkością kątową), otrzymujemy równanie

\dfrac{L^2\dot{\varphi}^2}{2}+gL(1-\cos\varphi)=gL(1-\cos\varphi_m),

gdzie g jest przyspieszeniem ziemskim, a \varphi_m – kątem maksymalnego wychylenia. Nie rozpatrujemy przypadku energii na tyle dużej, by nasz koralik obiegał okrąg, nie jest to przypadek szczególnie interesujący. Możliwe ruchy wahadła przedstawia portret fazowy, wykres rozmaitych ruchów we współrzędnych (\varphi,\dot{varphi}).

Energia potencjalna ma kształt sinusoidy. Dla niewielkich energii ruch jest oscylacyjny w przedziale [-\vartheta,\vartheta], dla dużych energii prędkość kątowa \dot{\varphi} nie zmienia znaku. Jest wreszcie energia graniczna pozwalająca dotrzeć koralikowi do punktu \varphi=\pi, tym przypadkiem zajmiemy się osobno, bo jest ciekawy. Zasadę zachowania energii możemy przekształcić do postaci

\dot{\varphi}^2+4\omega^2\sin^2{\dfrac{\varphi}{2}}=4\omega^2\sin^2{\dfrac{\varphi_m}{2}},

wprowadziliśmy tu oznaczenie \omega=\sqrt{g/L} – jest to zwykła częstość kołowa wahadła przy małych wychyleniach. Możemy to sprawdzić. Przy małych wychyleniach \varphi\approx\sin\varphi. Mamy więc

\dot{\varphi}^2=\omega^2(\varphi_m^2-\varphi^2), \mbox{(*)}

i przekształcając

{\displaystyle  \int\dfrac{d\varphi}{\sqrt{\varphi_m^2-\varphi^2}}=\omega t+C \;\; \Rightarrow \arcsin{\dfrac{\varphi}{\varphi_m}}=\omega t+C,}

otrzymujemy zatem znane rozwiązanie oscylacyjne \varphi=\varphi_m\sin (\omega t+C).

Ruch przy małych wychyleniach ma własność izochronizmu, którą zaobserwował według legendy młody Galileusz w katedrze w Pizie, gdy zamiast skupiać się na przesłaniu duchowym, obserwował kołyszący się kandelabr. Amplituda wahań malała z czasem, ale okres się nie zmieniał. Widzimy, że wniosek ten jest słuszny, póki wychylenia są niewielkie. Gdybyśmy chcieli zbudować wahadło ściśle izochroniczne, zamiast łuku okręgu należy wziąć łuk cykloidy, co odkrył Christiaan Huygens.

W dalszym ciągu przyjmiemy \omega=1, czyli okresem wahadła przy małych wychyleniach bedzie okres sinusa, jaki przyjmują matematycy, tzn. 2\pi. Przy dużych wychyleniach okres będzie większy. Wygląda to następująco.

Można uzyskać takie krzywe numerycznie (por. Dziewiąty wykład Feynmana: Co mówi druga zasada dynamiki?), można je także wyrazić przez funkcje eliptyczne, znane każdemu programowi matematycznemu, jak darmowy SageMath albo kosztowna i ciężka Mathematica). Euler nie znał takich krzywych, choć musiał zdawać sobie sprawę z ich jakościowego przebiegu.

Wracając do równania (*), wprowadzamy podstawienie Eulera: k\sin\psi=\sin\varphi/2, gdzie k=\sin\varphi_m/2. Ma ono taką zaletę, że \psi może rosnąć monotonicznie, podczas gdy \varphi oscyluje. Równanie przyjmuje postać:

\left(\dfrac{d\psi}{dt}\right)^2=1-k^2\sin^2\psi.

Okres ruchu wahadła jest cztery razy większy niż czas potrzebny na zmianę \psi od 0 do do \pi/2:

{\displaystyle T=4\int_{0}^{\frac{\pi}{2}}\dfrac{d \psi}{\sqrt{1-k^2\sin^2\psi}}\equiv 4 K(k)}.

Wprowadziliśmy standardowe oznaczenie: K(k) nazywa się całką eliptyczną zupełną pierwszego rodzaju. Euler zastosował do jej obliczenia rozwinięcie funkcji podcałkowej w szereg dwumianowy. Otrzymuje się wówczas rozwinięcie

{\displaystyle K(k)=\dfrac{\pi}{2}\sum_{m=0}^{\infty}\left[\dfrac{(2m-1)!!}{(2m)!!}\right]^2 k^{2m}. }

Podwójna silnia to iloczyn kolejnych liczb parzystych bądź nieparzystych aż do największej. Zapis jest współczesny. Po drodze potrzebna jest całka \int_{0}^{\pi/2} \sin^{2m}\psi d\psi, którą Euler oczywiście znał. Szereg ten jest zbieżny dla k<1, choć jego praktyczna przydatność ogranicza się do niezbyt wielkich amplitud. Okres wahadła jest więc w przybliżeniu równy

T=2\pi\sqrt{\dfrac{L}{g}}\left(1+\dfrac{1}{4}\sin^2{\dfrac{\vartheta}{2}}+\dfrac{9 }{64}\sin^4 {\dfrac{\vartheta}{2}}+\ldots\right).

Na wykresie mamy stosunek okresu wahadła przy danej amplitudzie do okresu dla niewielkich amplitud. Widzimy, skąd się wziął obserwowany izochronizm: trzeba mocno wychylić wahadło, żeby dostrzec wydłużenie okresu. Jednak przy amplitudach bliskich \pi=180^{\circ} wydłużenie staje się duże, całka K(k)\rightarrow \infty.

Zajmiemy się teraz przypadkiem, gdy amplituda \varphi_m=\pi-\alpha_m, gdzie \alpha_m\ll 1. Korzystamy tu z poglądowego podejścia z pracy E. Butikova, Oscillations of a simple pendulum with extremely large amplitudes. Asymptotyczna postać całki eliptycznej przy wartościach k bliskich 1 jest dobrze znana (por. np. F. Bowman, Introduction to elliptic functions with applications), ale podejście Butikova pozwala nam lepiej zrozumieć ruch przy dużych amplitudach.

Najpierw zajmijmy się ruchem wahadła dla przypadku \varphi_m=\pi. Mamy wtedy

\dot{\varphi}=\cos\dfrac{\phi}{2}.

Rozwiązanie, w którym \varphi(0)=0, jest postaci

\varphi=\pi-4\;\mbox{arctg }(e^{-\omega t}).

Na wykresie kąty wyrażone są w stopniach. Widzimy, że położenie \varphi=\pi=190^{\circ} koralik osiąga po nieskończenie długim ruchu. Większość tego ruchu odbywa się w okolicach t=0, gdzie wykres stromo się wznosi. Jednak takie przybliżenie nie wystarczy do tego, aby znaleźć skończony okres odpowiadający \alpha_m\ne 0. Możemy zastosować je aż do pewnego kąta 1 \gg\alpha_c>0 i drugi odcinek ruchu od \alpha_c do maksymalnego wychylenia \alpha_m obliczyć w przybliżeniu małych kątów. Najłatwiej o tym myśleć jako o czasie potrzebnym do tego, by koralik znajdujący się początkowo w punkcie \alpha_m ześliznął się do punktu \alpha_c. Przyjmujemy, że oba te punkty leżą blisko najwyższego punktu okręgu. II zasada dynamiki przybiera postać (kąt \alpha liczony jest od szczytu okręgu)

\ddot{\alpha}=\omega^2 \sin \alpha\approx \omega^2\alpha \;\Rightarrow \alpha=\alpha_m \cosh \omega t.

Stąd znajdujemy czas t_1 potrzebny na osiągnięcie punktu \alpha_c:

\omega t_1=\ln \dfrac{2\alpha_c}{\alpha_m}.

Korzystając z poprzedniego rozwiązania, znajdujemy czas t_2 potrzebny na dotarcie od \varphi=0 do \varphi=\pi-\alpha_c:

\omega t_2=\ln\dfrac{4}{\alpha_c}.

Ćwierć okresu wahadła to t_1+t_2, otrzymujemy więc

T=\dfrac{2}{\pi}T_0 \ln\dfrac{8}{\alpha_m},

gdzie T_0 jest okresem przy niewielkich wychyleniach. Z równań wypadło pośrednie położenie \alpha_c. Okres wahadła jest więc logarytmicznie rozbieżny gdy \alpha_m\rightarrow 0.

I tutaj Euler zawiódł. Wiedział, że graniczne rozwiązanie ma postać, której użyliśmy powyżej. Próbował obliczyć czas, pisząc równanie

{\displaystyle \int\dfrac{d\alpha}{2 \sqrt{ \sin^2\dfrac{\alpha}{2}-\sin^2\dfrac{\alpha_m}{2}}}=\omega t+C}

i rozwijając je w szereg, a następnie sumując ten szereg. Niestety, jego wyrażenie asymptotyczne okazało się błędne. W czasach Eulera nie przywiązywano nadmiernej wagi do zbieżności szeregów, prawdopodobnie w tym tkwi problem. Bo rachunki wydają się prawidłowe.

Arnold Sommerfeld i zagadka widma wodoru (1916)

Miał historycznego pecha: był 81 razy nominowany do Nagrody Nobla z fizyki, ale nigdy jej nie dostał. „Planck był autorytetem, Einstein – geniuszem, a Sommerfeld – nauczycielem”, jak ujął to historyk Armin Hermann. Nauczycielem noblistów, trzeba dodać. Czterech jego doktorantów i trzech postdoków zostało później laureatami Nobla, a do tego dochodzi mnóstwo nazwisk uczniów i współpracowników, które i dziś znane są fizykowi. Jego ośrodek w Monachium obok Getyngi Maksa Borna i Kopenhagi Nielsa Bohra wychował całe pokolenie genialnych chłopców lat dwudziestych (osobny był tylko Paul Dirac, ale on był zawsze osobny). Sommerfelda wyjaśnienie struktury subtelnej widma wodoru było eleganckie i niezwykle dokładne. Jednak osiągnięcia Sommerfelda nie stanowiły zamkniętej teorii, było jeszcze za wcześnie na mechanikę kwantową. Trudno czynić mu z tego zarzut: ani Planck, ani Einstein nie posunęli się dalej.

Sommerfeld był właściwie matematykiem zajmującym się zagadnieniami fizyki matematycznej. Gdy w 1906 r. objął katedrę fizyki teoretycznej w Monachium nie było jeszcze fizyki kwantowej oprócz pionierskich prac Plancka i Einsteina. Dopiero podczas wojny Sommerfeld zainteresował się serio zagadnieniami kwantowymi. 

Czterdziestopięcioletni profesor nie został powołany do wojska ze względu na wiek, zresztą pomimo swego patriotyzmu nie był entuzjastą wojny, jak większość jego rodaków. Wkrótce jednak i jemu udzieliła się nieuchronna atmosfera paranoi i oblężonej twierdzy, podpisał np. antybrytyjski apel Wilhelma Wiena wzywający, by niemieccy uczeni nie publikowali w angielskich czasopismach i odrzucali „nieuzasadnione wpływy naukowe Anglików”. Było więcej tego rodzaju wstydliwych wystąpień, zresztą po obu stronach konfliktu. Zaledwie rok wcześniej, w roku 1913, zarówno Wien, jak Sommerfeld brali udział w drugim Kongresie Solvaya, gdzie spotykała się elita ówczesnych fizyków i mogło się wydawać, że nauki ścisłe nie mają narodowości.

855px-Solvay_conference_1913

Sommerfeld znany był z otwartości i bliskich kontaktów ze swymi studentami. Chodził z nimi na piwo i jeździli wspólnie na narty, w tamtych czasach taka postawa była rzadkością. Einstein, kiedy poznał Sommerfelda, obiecywał sobie, że będzie miał podobne podejście do studentów. Podczas wojny Sommerfeld prowadził wprawdzie nadal wykłady, ale wielu studentów i młodszych kolegów było na froncie. Chętnie jednak w miarę możliwości korespondowali na tematy naukowe, pozwalało im to na chwilę zapomnieć o toczącej się wciąż wojnie.

Sommerfeld stosował metodę, którą później wielokrotnie stosował Steven Weinberg: jeśli chcesz nauczyć się jakiegoś przedmiotu, wygłoś na ten temat cykl wykładów. W przypadku Sommerfelda wynikiem jest wielotomowy kurs fizyki teoretycznej, a także monografia Atombau und Spektrallinien („Budowa atomu i linie widmowe”), biblia pierwszych lat fizyki kwantowej. W przypadku Weinberga to seria znakomitych solidnych podręczników na różnym poziomie, a także zarys historii fizyki.

W lutym 1915 roku Sommerfeld pisał do Wiena: „W tym semestrze prowadziłem wykłady na temat [modelu] Bohra i interesuję się tą kwestią, na ile wojna pozwala. Dzisiejsze 100 000 Rosjan to z pewnością piękniejsza wiadomość niż wyjaśnienie serii Balmera przez Bohra. Mam jednak piękne nowe wyniki na ten temat.” Owe 100 000 Rosjan to jeńcy po bitwie nad jeziorami mazurskimi. Przez cały rok 1915 Sommerfeld pracował, choć z przerwami, nad zagadnieniem atomu. Udało mu się uogólnić warunki kwantowania Bohra, a następnie zastosował do elektronu mechanikę szczególnej teorii względności (którą także w owym czasie wykładał). Model relatywistyczny pozwolił wyjaśnić rozszczepienie optycznych linii widmowych wodoru, a także optycznych i rentgenowskich linii cięższych pierwiastków. Wyjaśniła się w ten sposób kwestia znana od wielu lat: linie widmowe pierwiastków mają często kilka blisko położonych składowych widocznych przy dużej zdolności rozdzielczej (np. żółta linia sodu świecąca w lampach sodowych jest dubletem). Tę strukturę subtelną wodoru odkryli Albert Michelson i Edward Morley jeszcze w roku 1887. Dzięki Sommerfeldowi wyjaśniło się, że odgrywa tu rolę szczególna teoria względności, w latach 1915-1916 jej słuszność wcale nie była jeszcze oczywista, obie teorie względności jeszcze długo później uchodziły za „kontrowersyjne”, pamiętajmy, że Nagrodę Nobla przyznano Einsteinowi z wyraźnym zastrzeżeniem, iż nie jest nagrodą za teorię względności. Wspominany w tym blogu kilkukrotnie Ernst Gehrcke, zaciekły przeciwnik teorii Einsteina, był specjalistą od pomiarów widmowych. Przez lata spierał się z Friedrichem Paschenem, który zmierzył wielkość rozszczepienia linii zgodną z wynikami Sommerfelda. Gehrcke otrzymywał wciąż nieco inną wartość. I to z pozornie obiektywnych pomiarów, w których widmo było rejestrowane przez przyrząd. Nienawiść zaślepia. 

Wynik Sommerfelda niemal pokrywa się z tym, co uzyskano później z równania Diraca. Eleganckie i zgodne z obserwacjami wyniki Sommerfelda stały się największym sukcesem tzw. starej teorii kwantów, czyli fizyki sprzed powstania mechaniki kwantowej. Co ciekawe, twórcy mechaniki kwantowej, Schrödinger i Pauli, publikując rozwiązania dla atomu wodoru w styczniu 1926 roku, nie do końca byli usatysfakcjonowani. Obaj bowiem, zupełnie niezależnie, próbowali osiągnąć wynik Sommerfelda i im się to nie udało. Musieli zadowolić się podejściem nierelatywistycznym, bez struktury subtelnej. Mieli więc świadomość, że górują pod względem metody, ale nie dorównują wynikom Sommerfelda. Relatywistyczną mechanikę kwantową zapoczątkował w 1928 r. Paul Dirac, lecz okazało się dość szybko, jeszcze w latach trzydziestych, że potrzebna jest tu kwantowa teoria pola. Obliczenia w ramach teorii pola szybko doprowadziły do impasu: niektóre wyniki okazywały się nieskończone. Wyjście z tego impasu znaleziono dopiero po II wojnie światowej: było nim sformułowanie elektrodynamiki kwantowej przez Juliana Schwingera, Shin’ichirō Tomonagę i Richarda Feynmana. Dopiero wtedy dokładność teorii (a także pomiarów) wyprzedziła wyniki Sommerfelda i Diraca.

W modelu Bohra dozwolone są orbity kołowe, które spełniają warunek

L=mrv=n\dfrac{h}{2\pi},

gdzie L,r,m,v,h to odpowiednio moment pędu, promień orbity, masa i prędkość elektronu oraz stała Plancka, a n jest dodatnią liczbą całkowitą. Max Planck interesował się zagadnieniem oscylatora harmonicznego – oscylatory takie emitują bądź pochłaniają fale elektromagnetyczne. Można opisać je w przestrzeni fazowej, gdzie współrzędnymi są położenie q oraz pęd p. Jeśli położenie w zależności od czasu opisane jest równaniem q=A \sin 2\pi\nu t (\nu jest częstością), to pęd elektronu jest równy p=m2\pi\nu A \cos 2\pi\nu t i łatwo sprawdzić, że tor w przestrzeni fazowej jest elipsą (wystarczy skorzystać z jedynki trygonometrycznej). Warunek kwantowania Plancka ma postać następującą:

quantum action

Pole zakreślane w przestrzeni fazowej przez elektron jest wielokrotnością stałej h. Można ten warunek zapisać w postaci

W={\displaystyle \int dp dq =nh.}

Zastanawiano się także nad dodaniem jakiejś stałej w rodzaju 1/2 do n, ale na razie zostawmy to bez stałej. Dla eliptycznego toru w przestrzeni fazowej, mamy więc W=\pi A (m\omega A)=nh. Obliczając energię oscylatora, otrzymamy

E=\dfrac{p_{max}^2}{2m}= nh\nu.

Jest to zgodne z tym, co na temat oscylatorów twierdzili Planck i Einstein.

Warunek kwantowania można zapisać także w postaci:

W={\displaystyle \int (p_{+}-p_{-})dq=\oint p dq=nh.}

Druga całka jest po zamkniętym konturze, jej sens geometryczny jest taki sam.

quantum_action_3

quantum_action_2

Sommerfeld zastosował warunki kwantowania w tej drugiej postaci do ruchu elektronu w polu kulombowskim. Ruch klasyczny jest płaski, mamy więc dwa stopnie swobody. Położenie elektronu określają np. współrzędne biegunowe: odległość od jądra r oraz kąt \varphi z ustalonym kierunkiem. Odpowiadają tym zmiennym dwa pędy: składowa radialna p_r oraz składowa styczna p_{\varphi}. W naszym przypadku element odległości ds w zmiennych biegunowych ma postać

ds^2=dr^2+r^2 d\varphi^2.

polar coordinates

Iloczyn p dq w przypadku składowej radialnej przyjmuje postać m\frac{dr}{dt} dr=p_r dr, a w przypadku składowej stycznej p_{\perp}r d\varphi = p_{\varphi} d\varphi \equiv L d\varphi, pędem skojarzonym z kątem jest po prostu moment pędu. Można to uzasadnić ściślej, istnieje w mechanice precyzyjny przepis, jak dowolnej zmiennej uogólnionej przypisać odpowiedni pęd, por. niżej (*).

Przestrzeń fazowa jest teraz czterowymiarowa. Mamy dwa warunki kwantowania dla obu par zmiennych. Dla kąta \varphi i L warunek jest trywialny i pokrywa się z warunkiem Bohra:

{\displaystyle \oint L d\varphi=L2\pi=n_{\varphi}h.}

Dla zmiennych radialnych otrzymujemy coś nowego:

{\displaystyle \oint p_r dr=n_{\varphi} h}

gdzie liczby kwantowe n_r, n_{\varphi} mogą się różnić. Ponieważ dopuszczamy teraz zmiany odległości od jądra, należy się spodziewać, że podobnie jak w przypadku ruchu planet wokół Słońca dopuszczalne ruchy elektronu będą zachodzić po elipsach (mówimy tylko o stanach związanych, warunki kwantowania dotyczą tylko takiej sytuacji). 

Energia kinetyczna elektronu jest zatem równa

E_k=\dfrac{m}{2}\dfrac{ds^2}{dt^2}=\dfrac{m}{2}(\dot{r}^2+r^2\dot{\varphi}^2)=\dfrac{p_r^2}{2m}+\dfrac{p_{\varphi}^2}{2mr^2}.

Całkowita energia elektronu w atomie wodoru (pomijamy ruch jądra) dana jest wyrażeniem

E=\dfrac{p_r^2}{2m}+\dfrac{p_{\varphi}^2}{2mr^2}-\dfrac{e^2}{r},

gdzie piszemy e^2\equiv\dfrac{q_e^2}{4\pi\varepsilon_0} (q_e, \varepsilon_0 to ładunek elementarny i przenikalność dielektryczna próżni). Możemy wyznaczyć p_r z równania energii i wstawić do warunku kwantowania. Obliczając całkę (**) i wyznaczając E dostajemy wynik Bohra:

E=-\dfrac{me^4}{2\hbar^2 (n_r+n_{\varphi})^2}\equiv-mc^2\dfrac{\alpha^2}{2n^2}.

Zamiast jednej liczby kwantowej, mamy teraz sumę dwóch liczb kwantowych: n=n_r+n_{\varphi}. Stała \alpha jest bezwymiarowa i równa

\alpha=\dfrac{e^2}{\hbar c}\approx 1/137.

Stała ta zwana stałą struktury subtelnej nabiera znaczenia w teorii relatywistycznej, jak zobaczymy niżej. Istnieje więc pewna liczba stanów o tej samej energii: wszystkie odpowiadają orbitom o tej samej dużej osi i różnym spłaszczeniu. Łatwo pokazać, że stosunek długości osi małej b i dużej a jest równy

\dfrac{b}{a}=\dfrac{n_{\varphi}}{n_r+n_{\varphi}}.

Sommerfeld wykluczył stany o zerowym momencie pędu, gdy tor elektronu jest odcinkiem o końcu w jądrze atomu. W ten sposób zamiast trzeciej orbity Bohra mamy zestaw okręgu i dwóch elips (jądro jest zawsze w ognisku elipsy). Mamy więc w ogólności wiele stanów o tej samej energii: zdegenerowanych.

sommerfeld 3

Nietrudno procedurę Sommerfelda uogólnić na przypadek relatywistyczny. Klasyczne elipsy ulegają teraz precesji. Nie jest to precesja Einsteina z ogólnej teorii względności, Sommerfeld, śledzący na bieżąco postępy Einsteina, doskonale wiedział o różnicy. Obliczył nawet, że w przypadku Merkurego precesja byłaby równa 7 sekund kątowych na stulecie.

p0347-sel

Rysunek z Atombau Sommerfelda

Wystarczy wstawić mc^2+E=\sqrt{p^2c^2+m^2c^4} do równania na energię, E jest ujemną energią wiązania. Ponownie wyznaczając p_r i całkując warunek kwantowy, otrzymamy

E+mc^2=mc^2\left\{ 1+\dfrac{\alpha^2}{\left( n_r+\sqrt{n_{\varphi}^2-\alpha^2}\right)^2} \right\}^{-\frac{1}{2}}.

W bardziej przejrzystym przybliżeniu w postaci szeregu w stałej struktury subtelnej:

E\approx -mc^2\dfrac{\alpha^2}{2n^2}-mc^2\dfrac{\alpha^4}{2n^4}\left( \dfrac{n_r+n_\varphi}{n_{\varphi}}-\dfrac{3}{4}\right).

Wyniki te niewiele zmieniają się w teorii Diraca, należy tylko zastąpić n_{\varphi} przez j+\frac{1}{2}, gdzie j jest liczbą kwantową całkowitego momentu pędu z uwzględnieniem spinu. Oczywiście w roku 1916 o spinie jeszcze nikt nie słyszał. W elektrodynamice kwantowej wyniki uzyskuje się w postaci szeregu potęgowego względem \alpha. Dzięki takim rozwinięciom można elektrodynamikę potwierdzić z dokładnością kilkunastu cyfr znaczących.

 

(*) W przypadku współrzędnych uogólnionych pędy zdefiniowane są jako

p_i=\dfrac{\partial E_k}{\partial \dot{q_i}},

gdzie E_k jest energią kinetyczną, a \dot{q_i} pochodną czasową zmiennej q_i.

(**) Całki występujące w obu wersjach kwantowania Sommerfelda są postaci

{\displaystyle \oint \dfrac{dx}{x}\sqrt{-Ax^2+2Bx-C}=2\pi\left(\dfrac{B}{\sqrt{A}}-\sqrt{C}\right) }.

Współczynniki A,B,C są dodatnie i wyrażenie podcałkowe ma dwa miejsca zerowe. Można w tym przypadku znaleźć całkę nieoznaczoną i wziąć ją w odpowiednich granicach. Metoda elegancka to scałkowanie wyrażenia na płaszczyźnie zespolonej z rozcięciem wzdłuż osi rzeczywistej między dwoma pierwiastkami. Można też użyć pakietu Sagemath, Maxima albo Mathematica.

Leonhard Euler i problem bazylejski (1735)

Ścisłe sumowanie szeregów nieskończonych ma często coś z magii. Takim szeregiem słynnym w XVII wieku był szereg Leibniza:

\frac{\pi}{4}=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\ldots.

Problem bazylejski polegał na znalezieniu sumy szeregu

\zeta(2)=1+\frac{1}{2^2}+\frac{1}{3^2}+\frac{1}{4^2}+\ldots.

Oznaczyliśmy tę sumę \zeta(2), można bowiem rozważać także sumy odwrotności innych potęg liczb naturalnych. Wiadomo, że przy wartościach wykładnika s>1 szereg jest zbieżny. Tak określona funkcja to zeta Riemanna, funkcja, którą wprowadził już Euler, lecz stała się sławna dużo później i jest jedną z najważniejszych funkcji w matematyce. W roku 1735 dwudziestoośmioletni Leonhard Euler, profesor matematyki z Bazylei, pracujący w Sankt Petersburgu, udowodnił, że

\zeta(2)=\frac{\pi^2}{6}.

Niedługo później podał wyrażenia dla wartości \zeta(2n) przy całkowitych dodatnich wartościach n. Był to przełomowy moment w karierze młodego matematyka, który szybko uznany został za najwybitniejszego nie tylko w swoim pokoleniu i w swojej epoce, lecz jednego z najbardziej twórczych uczonych w całej historii matematyki i fizyki.

Odkrycie było przełomowe, ponieważ wynik jest elegancki i do pewnego stopnia zaskakujący. Piszę – do pewnego stopnia – gdyż można by się go spodziewać jako czegoś w rodzaju kwadratu szeregu Leibniza. Suma odwrotności kwadratów liczb nieparzystych wystarczy, by znaleźć \zeta(2):

\zeta(2)=1+\frac{1}{3^2}+\frac{1}{5^2}+\ldots+\frac{1}{4}\left(1+\frac{1}{2^2}+\frac{1}{3^2}+\ldots\right),

a więc mamy

\frac{3}{4}\zeta(2)=1+\frac{1}{3^2}+\frac{1}{5^2}+\ldots.

Rzeczywiście, istnieje dowód korzystający z szeregu Leibniza (por. np. M. Aigner, G.M. Ziegler, Proofs from the Book), lecz jest znacznie późniejszy.

Problem bazylejski okazał się za trudny dla Jakoba i Johanna Bernoullich, braci i dwóch najważniejszychych matematyków wywodzących się z tego miasta. Euler był o pokolenie młodszy, przyjaźnił się z synami Johanna, Danielem i Nicolasem II. Leonhard jako student filozofii i teologii  uczęszczał na sobotnie lekcje matematyki do Johanna, podczas których mógł prosić o wyjaśnienie trudnych miejsc z czytanych samodzielnie dzieł matematycznych. Łatwo wpadający w gniew Johann nie był zapewne idealnym pedagogiem, ale dla kogoś takiego jak Euler, któremu nie trzeba było objaśniać zbyt wiele, była to nauka bezcenna – bezpośrednio u najwybitniejszego żyjącego mistrza analizy matematycznej. W Sankt Petersburgu Euler mieszkał początkowo u Daniela Bernoulliego, przyjaźnił się też z Christianem Goldbachem (tym od hipotezy Goldbacha w teorii liczb). Wkrótce Euler usamodzielnił się życiowo i naukowo i nie potrzebował mentorów, choć jak wszyscy uczeni epoki chętnie korespondował z innymi matematykami.

Pierwszą trudnością w rozwiązaniu problemu bazylejskiego było znalezienie wartości liczbowej wyniku. Bezpośrednie sumowanie szeregu bez komputera jest niewykonalne. Toteż jedną z pierwszych prac Eulera poświęconych temu problemowi było znalezienie szeregu, który jest szybciej zbieżny.

W pracy tej z 1731 roku (E20) Euler rozważa następujący szereg funkcyjny:

{\displaystyle {\rm Li_2}(x)=\sum_{n=1}^{\infty}\frac{x^n}{n^2}=-\int_{0}^{x}\frac{\ln(1-t)}{t}dt.}

Funkcję tę nazywamy dziś dilogarytmem, jest ona oczywistym uogólnieniem naszego wyjściowego problemu. Mamy równość {\displaystyle {\rm Li_2}(1)=\zeta(2)}. Dla dowolnego x\in [0,1] zachodzi tożsamość

{\displaystyle {\rm Li_2}(1)={\rm Li_2}(1-x)+{\rm Li_2}(x)+\ln x\ln (1-x).}

Wystarczy teraz wziąć x=\frac{1}{2} i otrzymujemy szybko zbieżny szereg

CodeCogsEqn

Jest to dokładnie wartość \pi^2/6. Euler zwraca uwagę, że aby uzyskać tę dokładność z prostego sumowania odwrotności kwadratów, należałoby dodać ponad tysiąc wyrazów. 

W roku 1735 w pracy E47 Euler obliczył wartość \zeta(2) jeszcze dokładniej za pomocą odkrytego przez siebie wzoru (dziś zwanego wzorem Eulera-Maclaurina). Metoda jest subtelna i bardzo ogólna. Sumę wartości funkcji możemy w niej zastąpić całką oznaczoną z tej funkcji plus nieskończenie wiele wyrazów poprawkowych związanych z kolejnymi pochodnymi:

{\displaystyle \sum_{n=a+1}^{b} f(n)=\int_{a}^{b} F(t) dt+\frac{f(b)-f(a)}{2}+\frac{1}{6}\frac{f'(b)-f'(a)}{2!}-\frac{1}{30}\frac{f''(b)-f''(a)}{3!}+\frac{1}{42}\frac{f'''(b)-f'''(a)}{4!}+\ldots. }

Współczynniki po prawej stronie mają postać B_n/n!, gdzie B_n są to liczby Bernoulliego, nazwane tak przez Eulera, gdyż pojawiły się po raz pierwszy w wyrażeniach dla sumy n-tych potęg kolejnych liczb naturalnych rozpatrywanych przez Jakoba Bernoulliego. Możemy bez trudu zastosować ten wzór dla funkcji f(x)=1/x^2 i sumowania do nieskończoności. Euler otrzymuje

{\displaystyle \sum_{n=a}^{\infty}\frac{1}{n^2}=\int_{a}^{\infty} \frac{dt}{t^2}+\frac{1}{2a^2}-\frac{1}{3a^3}-\frac{1}{30a^5}+\frac{1}{42a^7}+\ldots+\frac{7}{6a^15}.}

Biorąc a=10, otrzymuje sumę 1,549767731166540, a dodając do niej wyrazy z powyższego wyrażenia:

\zeta(2)=1,64493406684822643647.

Wszystkie cyfry dziesiętne są tutaj dokładne. Stosowanie tej metody zawiera jednak istotną subtelność: szereg różnic pochodnych nie jest zbieżny, liczby Bernoulliego rosną coraz szybciej dla dużych indeksów i metodę należy stosować z wyczuciem. Jeśli weźmiemy niezby małe a oraz nie za dużo wyrazów z pochodnymi, otrzymamy wartościowy wynik. Euler zdawał sobie z tego sprawę. Stosując różne metody, mógł sprawdzić ich słuszność, jego matematyka była w znacznej mierze eksperymentalna, ówczesna analiza nie dysponowała ścisłymi dowodami, jakie pojawiły się w XIX wieku. Warto może dodać, że najdokładniejsze liczbowo wyniki fizyki, uzyskiwane w kwantowej teorii pola, też obliczane są za pomocą szeregów podobnego typu. Wiadomo, że nie są one zbieżne, lecz przy niewielu wyrazach sumowanych dokładność może być zdumiewająca: kilkanaście cyfr znaczących. Praca Eulera nie była więc jedynie sztuką dla sztuki, jak mogłoby się wydawać na pierwszy rzut oka.

Nie wiemy, czy powyższa analiza numeryczna poprzedzała dowód, że \zeta(2)=\pi^2/6. Niewątpliwie wzmacniała prawdopodobieństwo, że wynik jest prawidłowy. Podejrzewam, że Euler najpierw znał wynik liczbowy, a następnie szukał potwierdzenia innymi metodami. Zastosowanym w roku 1735 (E41) podejściem było spojrzenie na funkcję sinus jak na wielomian. Gdyby rzeczywiście sinus zachowywał się jak wielomian, powinien być równy

\sin x=x\left(1-\frac{x}{\pi}\right)\left(1+\frac{x}{\pi}\right)\left(1-\frac{x}{2\pi}\right)\left(1+\frac{x}{2\pi}\right)\ldots,

ponieważ jego miejsca zerowe to x= n\pi, gdzie n jest dowolną liczbą całkowitą.  Wszystkie pierwiastki są pojedyncze. Mielibyśmy wówczas

\frac{\sin x}{x}=\left(1-\frac{x^2}{\pi^2}\right)\left(1-\frac{x^2}{4\pi^2}\right)\ldots.

Korzystając z rozwinięcia funkcji sinus w szereg Maclaurina mamy też

\frac{\sin x}{x}=1-\frac{x^2}{3!}+\frac{x^4}{5!}+\ldots,.

Gdyby w iloczynie nieskończonym przemnożyć wyrazy, otrzymalibyśmy początek rozwinięcia

\frac{\sin x}{x}=1-\left(1+\frac{1}{4}+\frac{1}{9}+\ldots\right)\frac{x^2}{\pi^2}+\ldots

Z porównania wyrazów przy x^2 można od razu otrzymać wynik. Wyprowadzenie Eulera szybko stało się sławne, choć było też krytykowane jako ryzykowne. Dowód, iż sinus można w istocie przedstawić jako taki iloczyn nieskończony, przekraczał możliwości ówczesnej analizy. Korzystając z tego rozwinięcia można także znaleźć funkcje zeta dla parzystych argumentów, choć analiza staje się nieprzejrzysta.

Problem bazylejski pozostawił niedosyt także u Eulera, który wracał do niego kilkakrotnie. W roku 1743 podał bardzo zwyczajne wyprowadzenie wartości \zeta(2). Zaczynamy od rozwinięcia w szereg funkcji arcus sinus:

{\displaystyle t=\sin t+\sum_{n=1}^{\infty} \frac{1\cdot 3 \cdot \ldots (2n-1)}{2\cdot 4\cdot \ldots (2n)}\;\frac{\sin^{2n+1}t}{2n+1}.}

Następnie całkujemy obie strony w granicach od 0 do \pi/2. Mamy

{\displaystyle I_{2n+1}=\int_{0}^{\frac{\pi}{2}}\sin^{2n+1} t dt=\int_{0}^{\frac{\pi}{2}}\sin^{2n-1} t (1-\cos^2 t) dt=I_{2n-1}-\int_{0}^{\frac{\pi}{2}}[\sin^{2n-1} t \cos t]\cos t dt. }

Ostatnią całkę obliczamy przez części: \int v'u dt=vu-\int vu' dt w odpowiednich granicach. Wyrazy w nawiasie kwadratowym to v'=(\frac{1}{2n}\sin^{2n} t)', natomiast u=\sin t, w ten sposób \frac{2n+1}{2n}I_{2n+1}=I_{2n-1}. Ostatecznie

{\displaystyle \int_{0}^{\frac{\pi}{2}}\sin^{2n+1} t dt=\frac{2\cdot 4\cdot \ldots (2n)}{1\cdot 3 \cdot \ldots (2n+1)}}

Wracając do wyjściowego wyrażenia, dostajemy

{\displaystyle \frac{\pi^2}{8}=\sum_{n=0}^{\infty}\frac{1}{(2n+1)^2}=\dfrac{3}{4}\zeta(2).}

 

Wykorzystaną wyżej tożsamość dla dilogarytmów można wykazać rozbijając całkę po przedziale (0,1) na dwie całki po przedziałach (0,1-x) oraz (1-x,1). W tej drugiej zamieniamy zmienną 1-x=u i całkujemy przez części.

Liczby Bernoulliego. Dla naturalnego n \ge 2 definiujemy liczby Bernoulliego związkiem rekurencyjnym

(B+1)^n=B^{n},

który należy rozumieć w ten sposób, że wykładniki potęg B traktujemy jako indeksy. Razem z wartością B_0=1 związek ten określa ciąg liczb Bernoulliego. Stosując taki sam zapis wielomiany Bernoulliego B_n(x) (przy n\ge1) określamy następująco:

B_n(x)=(B+x)^n.

W zwykłym zapisie: 

{\displaystyle B_{n}(x)=\sum_{k=0}^{n}\binom{n}{k} B_{n-k} x^{k}. }

Wielomiany te począwszy od drugiego spełniają warunki

B_n(0)=B_n(1)=B_n \;\mbox{ oraz } B'_{n}(x)=nB_{n-1}(x).

Wzór Eulera-Maclaurina otrzymujemy w sposób rekurencyjny, całkując przez części:

{\displaystyle \int_{0}^{1}f(x)dx=\int_{0}^{1}B'_1(x)f(x)dx=B_1(x)f(x)\left.\right|_{0}^{1}-\int_{0}^{1}B_1(x)f'(x)dx.}

Następnie po prawej stronie zastępujemy B_1(x) przez B'_2(x) i znowu całkujemy przez części. Euler stosował tę procedurę ad infinitum, dziś raczej zatrzymujemy się na skończonej liczbie takich operacji i uzyskujemy wzór na resztę. Por. np. E. Hairer, G. Wanner, Analysis by Its History, Springer 2008.

Widmo wodoru i symetrie (2/2)

III. Wolfgang Pauli (1925)

Mechaniką kwantową nazywano z początku jedynie podejście macierzowe zapoczątkowane przez Wernera Heisenberga. Heisenberg nie potrafił jednak sobie poradzić z rachunkami dla atomu wodoru. Pierwsze kwantowe obliczenia energii stanów związanych elektronu w atomie wodoru przeprowadził Wolfgang Pauli. Wiemy z listu Heisenberga, że stało się to przed początkiem listopada 1925 r. Dopiero w połowie stycznia Pauli nadesłał tę pracę do „Zeitschrift für Physik”. Z kolei pierwsza praca Schrödingera w „Annalen der Physik” nosi datę wpłynięcia do wydawcy 27 I 1926 r. Obaj autorzy próbowali także rozwiązać zagadnienie relatywistyczne, ale im się to nie udało. Podejście Schrödingera omówiliśmy w poprzedniej części. Teraz zajmiemy się historycznie wcześniejszym, czysto algebraicznym podejściem Pauliego. 

Mamy do czynienia z hamiltonianem

H=\dfrac{{\bf p}^2}{2m}-\dfrac{e^2}{r}.

Rozwiązując zagadnienie klasyczne, należy znaleźć jak najwięcej całek ruchu, czyli wielkości zależnych od pędu i współrzędnych, które nie zmieniają się z czasem. Taką wielkością jest sam hamiltonian (zasada zachowania energii), a także moment pędu

L_i=\varepsilon_{ijk}x_jp_k,

gdzie sumujemy po powtarzających się indeksach, a \varepsilon_{123}=1, a poza tym jest antysymetryczne we wskaźnikach, tzn zmienia znak przy każdej zamianie pary wskaźników, np.

\varepsilon_{213}=-\varepsilon_{123}=-1;\;\; \varepsilon_{223}=-\varepsilon_{223}=0.

W prawej części zastosowaliśmy regułę antysymetrii do przestawienia wskaźników 22, co oczywiście nic nie zmienia i dlatego nasz symbol antysymetryczny znika. Pauli skorzystał z faktu, że w przypadku ruchu keplerowskiego, znana jest jeszcze inna całka ruchu – wektor Lagrange’a-Laplace’a-Rungego-Lenza, o którego zawiłych dziejach pisaliśmy wcześniej:

{\bf R}=-\dfrac{e^2 {\bf x}}{r}+\dfrac{{\bf p}\times {\bf L}}{m}.

W przypadku kwantowym operatory pędu i momentu pędu nie komutują ze sobą, więc ich kolejność w iloczynie wektorowym nie jest oczywista. Ponadto nasz wektor powinien mieć składowe hermitowskie, jeśli ma opisywać jakąś wielkość fizyczną. Pauli stwierdził, że odpowiednim wektorem będzie

{\bf R}=-\dfrac{e^2 {\bf x}}{r}+\dfrac{1}{2}\,\dfrac{{\bf p}\times {\bf L}-{\bf L}\times{\bf p} }{m}.

Korzystamy ze związków komutacyjnych pędu i współrzędnych znalezionych przez Heisenberga: [x_j,p_j]=i\hbar \delta_{ij}, gdzie symbol Kroneckera równy jest 1, gdy i=j i znika w pozostałych przypadkach. Okazuje się, że mamy wówczas następujące związki komutacyjne: 

gif

Trójka operatorów R_{i} komutuje też z hamiltonianem, czyli rzeczywiście jest to stała ruchu: [H, R_{i}] =0. Jeśli ograniczymy się do stanów o ustalonej energii E<0, możemy hamiltonian uważać za mnożenie przez tę energię:

png

Czynnik liczbowy po prawej stronie możemy uprościć, definiując nowy wektor

{\bf B}=\sqrt{\dfrac{m}{-2E}}{\bf R}.

Cała algebra upraszcza się, gdy zdefiniujemy nowe operatory:

{\bf A}_{\pm}=\dfrac{1}{2}\left({\bf L}\pm {\bf B}\right).

Mamy wtedy

[A_{\pm i}, A_{\pm j}]=i\hbar \varepsilon_{ijk} A_{\pm k},

dwie trójki operatorów zachowujące się dokładnie tak jak moment pędu:

[L_i,L_j]=i\hbar \varepsilon_{ijk} L_k.

Obie trójki operatorów komutują między sobą: [A_{+i},A_{-j}]=0. Możemy zastosować tutaj fakty znane w przypadku momentu pędu: dozwolone wartości kwadratu operatora to

\begin{array}{l} {\bf A}_{+}^2=\hbar^2 a_{-}(a_{-}+1), \\[10pt] {\bf A}_{-}^2=\hbar^2 a_{+}(a_{+}+1).\end{array}

Wektory {\bf R} oraz {\bf L} są prostopadłe: {\bf R}\cdot {\bf L}=0. Wobec tego

{\bf A}_{\pm}^2=\dfrac{1}{4}\left({\bf L}^2+\dfrac{m}{-2E}{\bf R}^2\right).

Oznacza to, że wartości obu kwadratów są jednakowe: a_{+}=a_{-}\equiv a. Obliczając kwadrat wektora LLRL, otrzymujemy:

{\bf R}^2=e^4+\dfrac{2H}{m}\,(L^2+\hbar^2)=e^4-\dfrac{-2E}{m}\,(L^2+\hbar^2).

Zatem

{\bf A}_{\pm}^2=\dfrac{1}{4}\left(\dfrac{me^4}{-2E}-\hbar^2\right),

skąd dozwolone energie stanów związanych E<0 są równe

E=-\dfrac{me^4}{2\hbar^2 (2a+1)^2}.

Wartości 2a+1 są równe liczbie dozwolonych rzutów operatora A_{\pm}3, czyli właśnie 2a+1=n. Ponieważ a przyjmować mogą wyłącznie wartości połowkowe: 0, 1/2,1, 3/2,\ldots, więc n=1,2,3,\ldots. Mamy n stanów o różnym rzucie A_{-3} i także n stanów o różnym rzucie A_{+3}, łącznie zatem n^2 stanów o tej samej energii.

Wolfgang Pauli w roku 1925 nie znał teorii grup i algebr Liego, ponieważ dotąd nie były to dziedziny przydatne w fizyce. Algebry operatorów z komutatorem nazywają się algebrami Liego. Obliczenia Pauliego wykorzystały fakt, że mamy tu do czynienia z sumą prostą dwóch algebr \mathfrak{so}(3) odpowiadających grupie obrotów w przestrzeni trójwymiarowej (operatory momentu pędu to generatory obrotów). Suma prosta jest w tym przypadku izomorficzna z algebrą obrotów w przestrzeni czterowymiarowej: \mathfrak{so}(4)=\mathfrak{so}(2)\bigoplus \mathfrak{so}(2). Pauli odkrył więc, że stany związane atomu wodoru podlegają symetrii obrotowej w czterech wymiarach i stąd bierze się degeneracja poziomów energetycznych. Rozważania teoriogrupowe pierwszy przedstawił w tym kontekście asystent Pauliego z Zurychu Valentin Bargmann, który niedługo potem pracował z Einsteinem w Princeton.

IV. Vladimir Fock (1935)

Bezpośrednie podejście do symetrii stanów związanych atomu wodoru zaprezentował Vladimir Fock na seminarium w swoim Instytucie Fizyki Uniwersytetu Leningradzkiego 8 lutego 1935 roku i w tym samym roku opublikował. W Związku Sowieckim rozkręcała się właśnie paranoja towarzysza Stalina znana jako Wielki Terror albo jeżowszczyzna – od nazwiska Nikołaja Jeżowa. To w tym właśnie roku Stalin stwierdził z trybuny: „Żyje się lepiej, żyje się weselej”. Trzydziestosześcioletni Fock, wybitny fizyk matematyczny, aresztowany został 8 marca 1935 roku, lecz tego samego dnia wypuszczony. Nocą 11 lutego 1937 roku znów został aresztowany (były to czasy, gdy wielu ludzi, jak kompozytor Dymitr Szostakowicz, czekało nocami ze spakowaną walizką, aż podjedzie czarny samochód NKWD). Terror stalinowski tym się różnił od nazistowskiego, że w Niemczech znane były z góry prześladowane grupy: Żydzi, komuniści, lewicowi artyści, reszta mogła spać w miarę spokojnie. W Rosji każdy mógł okazać się winny, choćby sam o tym nie wiedział. Fock został po kilku dniach zwolniony, ponieważ wstawił się za nim Piotr Kapica, mający dojście do ucha Stalina. Lata trzydzieste są bardzo twórczym okresem życia Vladimira Focka (metoda Hartree-Focka, przestrzeń Focka itd.), być może fizyka matematyczna była dla niego sposobem wymknięcia się z upiornej rzeczywistości.

Praca Focka wykorzystuje przestrzeń pędów. Funkcję falową można przedstawić jako transformatę Fouriera:

\psi({\bf x})={\displaystyle \int \exp{\left(\frac{i{\bf px}}{\hbar}\right)} \psi({\bf p})d^3{\bf p} }. 

Funkcja \psi({\bf p}) odgrywa jest gęstością prawdopodobieństwa w przestrzeni pędów. Transformacja taka jest, jak wiadomo, odwracalna i wzajemnie jednoznaczna. Równanie Schrödingera przyjmuje w przestrzeni pędów następującą postać:

\left( \dfrac{{\bf p}^2}{2m}-E \right)\psi({\bf p})=\dfrac{e^2}{2\pi^2\hbar}{\displaystyle \int \dfrac{ \psi({\bf q}) d^{3}{\bf q} }{|{\bf p}-{\bf q}|^2}}.

Uprościła się nam część z energią kinetyczną: teraz operator pędu to mnożenie przez pęd, ale nieco skomplikowała część z energią potencjalną: iloczyn funkcji przeszedł w splot transformat. Jeśli wprowadzimy oznaczenie:

E=-\dfrac{p^2_0}{2m},

możemy równanie Schrödingera zapisać w postaci quasi-czterowymiarowej:

\left( {\bf p}^2+p^2_0 \right)\psi({\bf p})=\dfrac{me^2}{\pi^2\hbar}{\displaystyle \int \dfrac{ \psi({\bf q}) d^{3}{\bf q} }{|{\bf p}-{\bf q}|^2}}.

Następnym krokiem jest zamiana zmiennych dana rzutem stereograficznym.

stereo

Trówymiarowy wektor {\bf p}/p_0 rzutujemy na punkt u leżący na 3-sferze tak, że linia łącząca końce wektorów przechodzi przez biegun północny 3-sfery. Nadal mamy trzy wymiary, ale teraz zanurzone w przestrzeni czterowymiarowej. Definiujemy nową funkcję

\hat{\psi}(u)=\dfrac{1}{\sqrt{p_0}}\left(\dfrac{p^2_0+{\bf p}^2}{2p_0} \right)^4 \psi({\bf p}).

Można obliczyć, że przy takiej definicji zachowane jest unormowanie funkcji:

CodeCogsEqn

Po lewej stronie całkujemy po powierzchni 3-sfery, po prawej po trójwymiarowej przestrzeni pędów. W nowych zmiennych równanie Schrödingera przybiera postać następującą:

\hat{\psi}(u)=\dfrac{me^2}{2\pi^2 p_0\hbar}{\displaystyle \int \dfrac{\hat{\psi}(v) dS}{|v-u|^2}}.

W tej postaci równanie jest jawnie symetryczne na obroty w przestrzeni czterowymiarowej (grupa SO(4)). Na 3-sferze zanurzonej w przestrzeni czterowymiarowej można określić harmoniki sferyczne podobnie jak na 2-sferze zanurzonej w przestrzeni trójwymiarowej. Rozpatrujemy w tym celu jednorodne wielomiany \mathcal{ Y} stopnia \lambda, które spełniają równanie Laplace’a w czterech wymiarach:

\Delta {\mathcal Y}_{\lambda\alpha}(u)=0,

gdzie \alpha numerują różne wielomiany spełniające ten warunek. Jest ich w przestrzeni czterowymiarowej (\lambda+1)^2. Gdy wyłączymy z tych wielomianów czynnik |u|^{\lambda}, otrzymamy harmoniki sferyczne w czterech wymiarach:

\Delta {\mathcal Y}_{\lambda\alpha}(u)=|u|^{\lambda}Y_{\lambda\alpha}(u/|u|).

Harmoniki (hiper-)sferyczne zależą tylko od współrzędnych kątowych na sferze. Okazuje się, że funkcje te spełniają równanie (dowód poniżej):

Y_{\lambda\alpha}(u)=\dfrac{\lambda+1}{2\pi^2}{\displaystyle \int \dfrac{Y_{\lambda\alpha}(v) dS}{|v-u|^2}}.

Porównując z równaniem Schrödingera, otrzymujemy

\dfrac{me^2}{p_0\hbar}=\lambda+1 \Rightarrow E=-\dfrac{me^4}{2\hbar^2 (\lambda+1)^2}.

Widać, że \lambda+1=n=1,2,3,\ldots, bo \lambda było stopniem wielomianu, a więc liczbą całkowitą nieujemną. Liczba różnych stanów kwantowych o tej samej energii jest równa liczbie harmonik hipersferycznych, czyli n^2. Zaiste, żyje się lepiej, żyje się weselej.

Całą tę procedurę można uugólnić na „atom wodoru” w \mathbb{R}^n dla n\ge 2, lecz oprócz ew. przypadku dwuwymiarowego, ma to znaczenie tzw. akademickie. Zmieniają się tylko różne współczynniki, w 1957 r. zrobił te obliczenia S.P. Alliluev.

Podejście Focka doczekało się później przeniesienia do mechaniki klasycznej. O jednej z prac tego rodzaju kiedyś tu wspominałem. 

Obliczenia

Podamy dowód równania całkowego dla harmonik sferycznych w czterech wymiarach elegancką metodą podaną przez M. Bandera, C. Itzyksona, Rev. Mod. Phys. 38 (1966), 330-345. Korzystamy z faktu, że f(v)=1/|u-v|^2 spełnia w \mathbb{R}^4 równanie Laplace’a. Bierzemy jeszcze drugą funkcję harmoniczną {\mathcal Y}(v) i korzystamy z tożsamości Greena:

{\displaystyle \int (f\Delta {\mathcal Y}-{\mathcal Y}\Delta f) d^4 v=\int \left(f\dfrac{ \partial {\mathcal Y} }{\partial n}-{\mathcal Y}    \dfrac{ \partial f}{\partial n}\right)dS,}

po obszarze zaznaczonym na rysunku: jest to 3-sfera o promieniu jednostkowym wklęśnięta małą 3-sferą o promieniu \varepsilon\rightarrow 0 wokół punktu u. Zwrot wektorów normalnych zaznaczony jest na czerwono.

wcieta sfera

Lewa strona równania równa się zero. Obliczamy prawą stronę. Z jednorodności {\mathcal Y} wynika, że 

\dfrac{ \partial {\mathcal Y} }{\partial n}=\lambda {\mathcal Y}.

Wkład do drugiego składnika obliczamy osobno dla dużej i małej sfery. Oznaczmy s=|u-v|. Gradient funkcji f(v)=s^{-2} ma kierunek do punktu u.

gradient

Wartość gradientu to pochodna (s^{-2})'=-2s^{-3}. Zatem składowa normalna pochodnej jest równa na dużej sferze

\dfrac{ \partial f}{\partial n}=-\dfrac{2\sin\alpha/2}{s^2\cdot 2\sin\alpha/2}=-\dfrac{1}{s^2}.

Została nam jeszcze całka po małej sferze. W miarę jak zbliżamy się do punktu u możemy z coraz lepszą dokładnością zastąpić {\mathcal Y}(v) przez wartość w środku małej sfery: {\mathcal Y}(u). Gradient f ma kierunek i zwrot taki, jak normalne zewnątrzne dla małej sfery, czyli zostaje nam całka po połowie małej sfery:

{\displaystyle {\mathcal Y}(u) \dfrac{2}{\varepsilon^3} \int dS={\mathcal Y}(u) 2\pi^2,}

gdzie skorzystaliśmy z faktu, że pole powierzchni 3-sfery to 2\pi^2 r^3. Łącząc otrzymane wyniki, dostajemy równanie całkowe na funkcję Y={\mathcal Y}|_{S^3}.

V. Jeszcze raz Erwin Schrödinger, czyli supersymetryczna mechanika kwantowa avant la lettre (1940)

Idea supersymetrii, zwanej pieszczotliwie SUSY, powstała w latach siedemdziesiątych XX w. W kwantowej teorii pola oznaczało to symetrię między bozonami i fermionami. Schrödinger nigdy nie słyszał o tym pojęciu, jednak z perspektywy czasu jego metoda, którą tu przedstawimy, znalazła swoje miejsce w supersymetrycznej mechanice kwantowej. Niezależnie od tego, czy w przyrodzie istnieje supersymetria, metody te znalazły swoje zastosowania w innych dziedzinach.

Schrödinger zajmował się zagadnieniem faktoryzacji hamiltonianu, tzn. przedstawienia operatora Hamiltona jako iloczynu innych operatorów. Pokażemy najpierw ideę tego podejścia, a potem zastosujemy je do atomu wodoru.

Załóżmy, że mamy rozwiązać jednowymiarowe zagadnienie własne dla operatora Hamiltona z pewnym potencjałem V(x):

H=-\dfrac{d^2}{dx^2}+V(x).

Tworzymy parę operatorów

{\mathcal A}=\dfrac{d}{dx}+{\mathcal W}(x),

{\mathcal A}^{\dag}=-\dfrac{d}{dx}+{\mathcal W}(x).

Za ich pomocą da się utworzyć dwa hamiltoniany:

H^{(1)}={\mathcal A}^{\dag}{\mathcal A}=-\dfrac{d^2}{dx^2}+{\mathcal W}^{2}(x)-{\mathcal W}'(x),

H^{(2)}={\mathcal A}{\mathcal A}^{\dag}=-\dfrac{d^2}{dx^2}+{\mathcal W}^{2}(x)+{\mathcal W}'(x).

Funkcję {\mathcal W}(x) nazywamy superpotencjałem, należy ją dobrać tak, żeby przydała się w rozwiązaniu wyjściowego zagadnienia.

Niech \psi będzie funkcją własną operatora H^{(1)}, tzn. H^{(1)}\psi=E\psi. Działając na obie strony tej równości z lewej strony operatorem {\mathcal A} otrzymamy:

{\mathcal AA}^{\dag}{\mathcal A}\psi=E{\mathcal A}\psi \,\, \Rightarrow H^{(2)}{\mathcal A}\psi=E{\mathcal A}\psi.

Znaczy to, że {\mathcal A}\psi jest funkcją własną operatora H^{(2)} o tej samej wartości własnej. Podobnie możemy pokazać, że startując od funkcji własnej operatora H^{(2)}\chi=E\chi, możemy skonstruować wektor własny operatora H^{(1)} jako {\mathcal A}^{\dag}\chi. Jedynym wyjątkiem jest sytuacja, gdy {\mathcal A}\psi=0 lub {\mathcal A}^{\dag}\chi=0. Można pokazać, że tylko jedna z tych funkcji o zerowej wartości własnej daje się unormować (jest całkowalna w kwadracie).

Zastosujemy metodę SUSY do równania dla radialnej funkcji falowej (por. część II):

-\dfrac{\hbar^2}{2m}\,\dfrac{\partial^2 u}{\partial r^2}+\left(\dfrac{\hbar^2 l(l+1)}{2m r^2}-\dfrac{e^2}{r}\right)u=Eu.

Zapiszemy je w wersji przeskalowanej, żeby mniej pisać:

H_{l}=-\dfrac{d^2}{dx^2}-\dfrac{1}{x}+\dfrac{l(l+1)}{x^2}.

Jako superpotencjał wybieramy funkcję

{\mathcal W}(x)=-\dfrac{l+1}{x}+\dfrac{1}{2(l+1)}.

Pomocnicze hamiltoniany są równe:

H_{l}^{(1)}=H_{l}+\dfrac{1}{4(l+1)^2}.

H_{l}^{(2)}=H_{l+1}+\dfrac{1}{4(l+1)^2}.

Widzimy, że operatory {\mathcal A, \mathcal A}^{\dag} pozwalają przechodzić między różnymi wartościami l bez zmiany energii. Zaczniemy od poszukania funkcji odpowiadającej energii zero:

{\mathcal A}\psi=\left(\dfrac{d}{dx}-\dfrac{l+1}{x}+\dfrac{1}{2(l+1)}\right)\psi=0.

Rozwiązaniem tego równania jest funkcja

\psi_{0l}(x)=\exp{(-\int_{0}^{x}{\mathcal W}(y)dy)}=x^{l+1}\exp{(-x/2(l+1))}.

Energia tego stanu jest równa

E=-\dfrac{1}{4(l+1)^2},

co w jednostkach fizycznych daje -me^2/(2\hbar^2 (l+1)^2).

Związek między operatorami pomocniczymi można zapisać jako

H_{l}^{(2)}=H_{l+1}^{(1)}+\dfrac{1}{4(l+1)^2}-\dfrac{1}{4(l+2)^2}.

Niech \psi_{0,l+1} będzie stanem zerowym operatora H_{l+1}^{(1)}. Mamy więc

H^{(2)}_{l} \psi_{0,l+1}=\left(\dfrac{1}{4(l+1)^2}-\dfrac{1}{4(l+2)^2}\right) \psi_{0,l+1}.

W takim razie stan \psi_{1,l+1}={\mathcal A}_{l}^{\dag}\psi_{0,l+1} jest także stanem własnym H^{(1)}_{l} o tej samej wartości własnej, czyli mamy

H^{(1)}_{l}\psi_{1,l+1}=\left(\dfrac{1}{4(l+1)^2}-\dfrac{1}{4(l+2)^2}\right) \psi_{1,l+1}.

Ale H_{l}^{(1)}=H_{l}+\dfrac{1}{4(l+1)^2}, zatem

H_{l}\psi_{1,l+1}=-\dfrac{1}{4(l+2)^2}\psi_{1,l+1}, 

energia stanu \psi_{1,l+1} jest równa -\frac{1}{4(l+2)^2}. Kontynuując tę procedurę, otrzymamy po \nu krokach stan \psi_{\nu l}={\mathcal A}_{l}^{\dag}{\mathcal A}_{l+1}^{\dag}\ldots {\mathcal A}_{l+\nu-1}^{\dag}\psi_{0,l+1} o energii

E_{\nu l}=-\dfrac{1}{4(l+\nu+1)^2}.

Zazwyczaj oznacza się l+\nu-1=n. Procedura ta pozwala także wyznaczyć funkcje falowe za pomocą działania operatorów {\mathcal A}^{\dag}

Tutaj kończymy niekompletny przegląd sposobów podejścia do problemu atomu wodoru w nierelatywistycznej mechanice kwantowej. Od samego początku, od 1925 roku, wiedziano, że potrzebne jest podejście relatywistyczne. Od strony rachunkowej zapewniło to równanie Diraca, choć strona pojęciowa – kwantowa teoria pola – utrwaliła się nieco później. Poprawki relatywistyczne obejmują strukturę subtelną oraz jeszcze mniejszy efekt: przesunięcie Lamba, które ekscytowało fizyków pod koniec lat czterdziestych ub. wieku. Wygląda to następująco od strony eksperymentalnej.

Dlaczego atomy są trwałe?

Atomów nie można opisać za pomocą dziewiętnastowiecznej fizyki klasycznej. W doświadczeniach Hansa Geigera i Ernesta Marsdena, prowadzonych pod kierunkiem Ernesta Rutherforda w Manchesterze w latach 1909-1913, okazało się, że praktycznie cała masa atomu mieści się w bardzo małym obszarze o promieniu pojedynczych femtometrów (1 {\rm fm}=10^{-15} {\rm m}). Przedtem sądzono (model J.J. Thomsona), że atom zawiera rozmyty ładunek dodatni, w którym znadują się, niczym rodzynki w cieście, lekkie punktowe elektrony. Przy bombardowaniu cienkiej złotej folii za pomocą cząstek α (jąder helu) zdarzało się jednak, że cząstki te rozpraszały się pod wielkimi kątami, niemal zawracały. Byłoby to niemożliwe, gdyby dodatni ładunek rozmyty był na znacznym obszarze. Tak silne pole elektryczne wymagało niemal punktowego ładunku – atom musi więc zawierać niewielkie jądro. Tak narodził się model planetarny Ernesta Rutherforda.

Na rysunku nie można oddać różnicy skali między modelami Thomsona i Rutherforda. Elektrony krążą w znacznie większym obszarze kilkudziesięciu pikometrów (1 {\rm pm}=10^{-12} {\rm m}): w przypadku wodoru objętość atomu jest 2\cdot 10^{14} razy większa od objętości protonu w centrum. Znaczy to, że atom jest praktycznie pusty. Analogia z planetami krążącymi wokół Słońca niezbyt się tu jednak stosuje, ponieważ poruszający się z  przyspieszeniem elektron powinien emitować energię w postaci fal elektromagnetycznych. Z teorii Maxwella wynika, że w czasie rzędu 10^{-11} \,{\rm s} elektron powinien spaść na jądro. Atomy nie są stabilne – do takiego wniosku prowadzi Newtonowska mechanika w połączeniu z elektrodynamiką Maxwella.

Prowizorycznym wyjściem z sytuacji był model Nielsa Bohra: wprowadzał on dozwolone orbity elektronów i jakimś cudem przewidywał prawidłowo długości fal w widmie wodoru. Postulat kwantowania orbit jest nie do pogodzenia z fizyką klasyczną: trzeba bowiem założyć, że elektrodynamika czasem działa, a czasem nie. Jej prawa są z jakiegoś powodu zawieszone w przypadku orbit Bohra.

 Problem rozwiązała dopiero mechanika kwantowa. Przyjrzymy się, jak objaśnia ona stabilność atomu wodoru. Dla uproszczenia będziemy mówić o ruchu elektronu w polu elektrostatycznym nieruchomego jądra (wprowadzane w ten sposób przybliżenie łatwo zastąpić dokładniejszymi rachunkami). Mamy więc elektron o energii składającej się z energii kinetycznej oraz elektrostatycznej energii potencjalnej:

E=\dfrac{{\mathbf p}^2}{2m}-\dfrac{e^2}{r},

gdzie {\mathbf p} oraz m są odpowiednio pędem i masą elektronu, r jest jego odległością od punktowego jądra, a stała e^2\equiv\frac{q_e^2}{4\pi\varepsilon_0}. Nasz problem stabilności łatwiej zrozumieć, patrząc na wykres energii potencjalnej. 

Energia potencjalna w funkcji odległości elektronu od protonu (zaznaczone są dwa najniższe poziomy energetyczne atomu wodoru)

Zaznaczone są dozwolone wartości energii całkowitej. Energia krążącego elektronu jest stała tylko pod warunkiem pominięcia promieniowania. Inaczej będzie ona szybko się zmniejszać, a więc jak widać z wykresu nasz elektron będzie coraz ciaśniej okrążał proton. Studnia potencjału jest nieskończenie głęboka, bez dna (w przybliżeniu punktowego protonu). 

Mechanika kwantowa opisuje stany elektronu za pomocą funkcji falowej \psi(x,y,z)=\psi({\mathbf r}). Jej znaczenie jest statystyczne, pozwala ona obliczać rozmaite wartości średnie: np. średnią wartość energii kinetycznej, albo potencjalnej. Prawdopodobieństwo znalezienia elektronu w danym obszarze przestrzeni V jest równe

Pr(V)={\displaystyle \int_{V} |\psi|^2 dV}.

Oznacza to, że całka po całej przestrzeni musi być równa 1, mówimy wtedy, że funkcja falowa jest unormowana. Aby otrzymać rozmaite wartości średnie, musimy mieć przepis na ich tworzenie. Jest on następujący: każdej wielkości fizycznej przypisuje się operator. Np. operatorem składowej x położenia jest mnożenie przez x. Znaczy to, że pod działaniem tego operatora funkcja \psi przechodzi w x\psi. Bardziej skomplikowanym przypadkiem jest pęd. Składowa x pędu zastępowana jest braniem pochodnej po x:

\psi \mapsto \dfrac{\hbar}{i} \dfrac{\partial\psi}{\partial x}.

Pojawia się tutaj stała Plancka \hbar znak niechybny, że mamy do czynienia z fizyką kwantową, i jest tu jednostką urojoną – nasza funkcja \psi ma wartości zespolone. Z początku budziło to pewne zdumienie ojców mechaniki kwantowej, dziś wiemy, że liczby zespolone są tu nieodzowne. 

Mając pęd i położenie, możemy zbudować operator energii, czyli hamiltonian: zastępujemy po prostu pędy i położenia ich operatorami.  W jednym wymiarze wyglądałoby to następująco

H=-\dfrac{\hbar^2}{2m}\dfrac{\partial ^2}{\partial x^2}- \dfrac{e^2}{x}.

Pierwszy składnik oznacza, że należy dea razy wziąć pochodną po x i pomnożyć przez odpwoednią stałą, drugi składnik jest zwykłym mnożeniem funkcji. W trzech wymiarach mamy trzy składowe pędu, czyli trzy pochodne składające się w symbol zwany laplasjanem (czyli operatorem Laplace’a):

\Delta=\dfrac{\partial ^2}{\partial x^2}+\dfrac{\partial ^2}{\partial y^2}+\dfrac{\partial ^2}{\partial z^2}.

Zapisany w ten sposób hamiltonian ma postać:

H=-\dfrac{\hbar^2}{2m}\Delta-\dfrac{e^2}{r}.

Ostatni potrzebny nam składnik formalizmu to przepis na znajdowanie wartości średnich. Jeśli operator przypisany szukanej zmiennej nazwiemy A, to wartość średnia zmiennej jest równa

\langle A \rangle={\bf \int }\psi^{\star}A\psi dV.

Pojawia się tu funkcja zespolona sprzężona \psi^{\star}. Operatory odpowiadające wielkościom mierzalnym fizycznie (obserwablom) to tzw. operatory hermitowskie, które dają w powyższym przepisie wynik rzeczywisty, tak jak tego oczekujemy w eksperymencie. Hermitowskie są w szczególności operatory pędu, położenia i hamiltonian.

W zasadzie tyle formalizmu wystarczy, bez rozwiązywania równań różniczkowych, by pokazać, że dla dowolnej rozsądnej funkcji falowej (normowalnej) energia ograniczona jest z dołu. Czyli nie możemy uzyskać w żadnym eksperymencie mniej niż owo dolne ograniczenie. Co więcej, w każdym stanie związanym prawdopodobieństwo, że elektron znajdzie się bardzo blisko jądra jest znikome. Formalizm mechaniki kwantowej osiąga to dzięki wprowadzeniu funkcji \psi, która skoncentrowana w małym obszarze wymusza dużą energię kinetyczną. Jakościowo odpowiada to zasadzie nieoznaczoności: mała nieoznaczoność położenia oznacza dużą nieoznaczoność pędu, a więc i energii kinetycznej. Jednak zasady nieoznaczoności nie możemy tu zastosować wprost. 

Rozpatrzmy operator {\bf A} dany równaniem

{\bf A}={\bf p}-i\beta \dfrac{{\bf r}}{r},

gdzie \beta jest dowolną liczbą rzeczywistą. Ponieważ całka z kwadratu modułu {\bf A}\psi nie może być ujemna, otrzymujemy nierówność

\langle {\bf p}^2\rangle-2\beta\hbar\left\langle\dfrac{1}{r}\right\rangle+\beta^2\ge 0,\mbox{(*)}

słuszną dla każdego \beta. Bierzemy najpierw \beta=\hbar\langle\frac{1}{r}\rangle. Dostajemy nierówność

\langle {\bf p}^2\rangle\ge \hbar^2\left\langle \dfrac{1}{r}\right\rangle^2.

Dla dowolnej wartości r_0>0 możemy ograniczyć wartość całki do obszaru r<r_0, gdzie 1/r>1/r_0, otrzymujemy w ten sposób nierówność

\langle {\bf p}^2\rangle^{\frac{1}{2}}\ge \dfrac{\hbar}{r_0} Pr(r<r_0). 

Wrócimy do niej za chwilę. Raz jeszcze korzystamy z (*), tym razem dla \beta=\frac{me^2}{\hbar}. Porządkując wyrazy, otrzymujemy wartość oczekiwaną energii:

\boxed{ \left\langle \dfrac{{\mathbf p}^2}{2m}-\dfrac{e^2}{r}\right\rangle\ge -\dfrac{me^4}{2\hbar^2.}}

Mechanika kwantowa przewiduje zatem dolną wartość energii, równą -13,6\, \rm{eV}.

Aby oszacować \langle{\mathbf p}^2\rangle , założymy, że mamy elektron w stanie związanym, a więc całkowita energia jest ujemna – klasycznie znaczy to, że elektron nie może uciec z pola elektrostatycznego protonu. 

Mamy

\left\langle \dfrac{{\mathbf p}^2}{2m}-\dfrac{e^2}{r}\right\rangle<0,

co można przepisać w postaci

\left\langle \dfrac{{\mathbf p}^2}{4m}\right\rangle<-\left\langle \dfrac{{\mathbf p}^2}{4m}-\dfrac{e^2}{r}\right\rangle.

Do prawej strony możemy zastosować nierówność z ramki przy masie cząstki równej 2m. Otrzymujemy stąd szacowanie dla

\left\langle {\mathbf p}^2\right\rangle \le \dfrac{2me^2}{\hbar}.

Ostatecznie, prawdopodobieństwo znalezienia elektronu nie dalej niż r_0 od jądra spełnia nierówność

\boxed{Pr(r<r_0)<\dfrac{2 r_0}{a_0},}

gdzie a_0\equiv \frac{\hbar}{me^2}\approx 53 \,{\rm pm} zwane jest promieniem Bohra. Jest to promień pierwszej orbity w modelu Bohra.

Widzimy więc, że formalizm mechaniki kwantowej dostarcza wyjaśnienia, czemu atomy są trwałe, co jest niezmiernie ważnym faktem. Uwzględnienie poprawek relatywistycznych itd. niewiele tu zmienia. Można udowodnić więcej: także w układzie wielu jąder i wielu oddziałujących ze sobą elektronów kolaps jest niemożliwy. W tym przypadku ważną rolę odgrywa także fakt, iż elektrony są fermionami, tzn. żadne dwa z nich nie mogą zajmować tych samych stanów (wliczając spin). Podstawowe wyniki w tym obszarze należą do Elliotta Lieba i Waltera Thirringa. Rozważania takie są interesujące ze względów poznawczych, ale także pomagają zrozumieć zachowanie dużych układów, dla których bezpośrednie rachunki bez żadnych przybliżeń są niemożliwe.

Korzystałem z książki E. B. Manoukian, 100 Years of Fundamental Theoretical Physics in the Palm of Your Hand.
Integrated Technical Treatment, Springer Nature 2020.