Fizyka dla mieszkańców Syriusza: stałe fizyczne (Max Planck, 1899-Matvei Bronstein, 1935)

Max Planck, profesor fizyki w Berlinie, najwybitniejszy niemiecki fizyk teoretyczny przełomu wieku XIX i XX, przez lata badał własności promieniowania termicznego. Idealnym obiektem badań jest tu tzw. ciało doskonale czarne, czyli takie, które pochłania całe padające nań promieniowanie. Można wykazać, że każde ciało doskonale czarne emituje promieniowanie o rozkładzie widmowym zależnym wyłącznie od temperatury. Np. Słońce jest w dobrym przybliżeniu ciałem doskonale czarnym.

Widzimy tu (szary) teoretyczny rozkład widmowy promieniowania ciała doskonale czarnego o temperaturze T=5777 K zestawiony z rzeczywistym promieniowaniem docierającym ze Słońca. Ciało doskonale czarne nie jest czarne, jego barwa zależy od temperatury. (obrazek: Wikimedia)

Znalezienie postaci krzywej widmowej tego promieniowania stało się największym osiągnięciem Maksa Plancka. Otrzymana przez niego zależność ma następującą postać

I(\lambda)=\dfrac{2hc^2}{\lambda^5}\,\dfrac{1}{\exp{(\frac{hc}{\lambda kT})}-1},

gdzie stałe k,c, h oznaczają odpowiednio stałą Boltzmanna (nazwa wprowadzona przez Plancka), prędkość światła w próżni i stałą Plancka. Mamy tu trzy stałe fizyczne, które ze względu na uniwersalność promieniowania powinny mieć fundamentalne znaczenie.

Max Planck zauważył (w roku 1899, zanim jeszcze wyprowadził swój słynny wzór), że stałe k, c,h w połączeniu ze stałą grawitacyjną G pozwalają wprowadzić jednostki niezależne od zaszłości ludzkiej historii czy w ogóle niezależne od naszych ludzkich parametrów: „pojawia się możliwość ustanowienia jednostek długości, masy, czasu i temperatury niezależnych od szczególnych ciał czy substancji, których znaczenie dla wszystkich czasów i wszystkich kultur, także pozaziemskich i pozaludzkich, pozostanie w konieczny sposób takie same”.

Stała Plancka to h=6,7\cdot 10^{-34} kg\cdot m^2/s , stała grawitacyjna to G=6,7\cdot 10^{-11} m^3/(kg\cdot s^2). Mamy więc dla ich iloczynu i ilorazu jednostki:

[hG]=\dfrac{\mbox{kg}\cdot \mbox{m}^2}{\mbox{s}}\,\dfrac{\mbox{m}^3}{\mbox{kg}\cdot \mbox{s}^2}=\dfrac{\mbox{m}^3}{\mbox{s}^3}\mbox{m}^2=[c^3]\mbox{m}^2,

[h/G]=\dfrac{\mbox{kg}\cdot \mbox{m}^2}{\mbox{s}}\,\dfrac{\mbox{kg}\cdot \mbox{s}^2}{\mbox{m}^3}=\mbox{kg}^2\cdot \dfrac{\mbox{s}}{\mbox{m}}=\mbox{kg}^2 [c^{-1}].

Zatem wielkości l_P, m_P będą nowymi „pozaziemskimi” jednostkami długości oraz masy:

l_P=\sqrt{\dfrac{hG}{c^3}}=4\cdot 10^{-35}\mbox{ m} ,

m_P=\sqrt{\dfrac{hc}{G}}=5,5\cdot 10^{-8}\mbox{ kg}.

Jednostkę czasu otrzymamy, dzieląc odległość przez prędkość światła:

t_P=\sqrt{\dfrac{hG}{c^5}}=1,3\cdot 10^{-43}\mbox { s}.

Te „pozaziemskie” jednostki Planck nazwał naturalnymi, a my dziś nazywamy układem jednostek Plancka. Podstawowe stałe fizyki mają w nim wartości równe 1: h=c=G=1. W roku 1899 interesująca wydawała się sama możliwość wprowadzenia jednostek, umożliwiających porozumiewanie się z fizykiem z Syriusza, który ma – jak to dobrze wiemy – postać  świecącego zielono dodekahedronu zanurzonego w inteligentnym oceanie (oni tam szybciej weszli w fazę AI).

Jednostki długości i czasu w układzie Plancka są skrajnie małe: nie tylko w porównaniu z nami, ale nawet z protonem i czasem potrzebnym światłu na przebycie jego wnętrza. Sens fizyczny tych jednostek stał się jasny znacznie później.

Najpierw powiedzmy, jak interpretuje się dziś stałe użyte przez Plancka.

Stała Boltzmanna jest w zasadzie przelicznikiem temperatury w kelwinach T na wartości energii kT – byłoby logiczniej z punktu widzenia fizyki mierzyć temperatury w jednostkach energii, a skoro tego nie robimy, potrzebujemy stałej Boltzmanna. Według najnowszych ustaleń od roku 2019 stała Boltzmanna równa jest dokładnie k=1,380649\cdot 10^{-13} J/K. Jest to tym samym nowa definicja kelwina (bo dżul zdefiniowany jest na podstawie kilograma, metra i sekundy).

Prędkość światła, czy ogólniej: każdego promieniowania elektromagnetycznego, w próżni wydawała się już około roku 1900 wielkością bardzo ważną. Dzięki teorii względności z roku 1905 wiemy, że jest to coś więcej niż pewna charakterystyczna prędkość w przyrodzie. Jest to bowiem naturalna granica prędkości ciał. Z punktu widzenia teorii względności prędkość światła jest właściwie przelicznikiem między odległościami a czasem. W fizyce poeinsteinowskiej odległości i czas należałoby mierzyć tymi samymi jednostkami. Inaczej mówiąc, stała c wyraża stosunek jednostek odległości do jednostek czasu. Jej wartość w dzisiejszej fizyce jest na mocy konwencji równa dokładnie c=299\,792\, 458 m/s$. Ta dziwna wartość wynika z potrzeby ciągłości dawnych i nowych jednostek.

Trzecia stałą, pojawiającą się we wzorze Plancka, jest oznaczana przez niego literą h wielkość, dziś zwana stałą Plancka. Pojawia się ona wszędzie tam, gdzie występują zjawiska kwantowe. Podstawowe równanie fizyki kwantowej, równanie Schrödingera, można zawsze zapisać w postaci

i\hbar \dfrac{\partial\psi}{\partial t}=H\psi,

gdzie i to jednostka urojona, a \hbar\equiv \dfrac{h}{2\pi}, \psi jest funkcją falową, a H – hamiltonianem, czyli matematycznym zapisem energii układu. Planck z początku nie wiedział, jak ogromne znaczenie ma jego stała wprowadzona dla promieniowania. Obecnie (od roku 2019) wartość stałej Plancka jest określona raz na zawsze jako h=6,67607015\cdot 10^{-34} J·s. W istocie, jest to nowa definicja kilograma, słynny wzorzec z Sèvres jest już niepotrzebny (kilogram pojawia się w jednostce energii: 1\mbox{J}=1 \mbox{kg}\cdot \dfrac{\mbox{m}^2}{\mbox{s}^2}.).

Stałe h,c,G określają możliwe teorie fundamentalne fizyki. Sytuację tę można przedstawić za pomocą sześcianu Bronsteina (sam obrazek jest późniejszy):

 

W początku układu mamy mechanikę klasyczną bez grawitacji. Odpowiada to wartościom \hbar=G=1/c=0. Szczególna teoria względności odpowiada przyjęciu 1/c<\infty, mechanika kwantowa przyjęciu niezerowej stałej Plancka \hbar\neq 0. Kwantowa teoria pola, czyli Model Standardowy cząstek odpowiada \hbar\neq 0 oraz c<\infty. Ogólna teoria względności zawiera stałą grawitacji G oraz prędkość światła c. Kwantowa teoria grawitacji byłaby „teorią wszystkiego” w tym sensie, że zawierałaby zarówno efekty kwantowe, jak i grawitacyjne. Wszystkie trzy stałe byłyby w niej niezerowe.

Matvei Bronstein, dwudziestoparolatek, już w roku 1933 zaczął się zastanawiać nad kwantowaniem grawitacji. Pięć lat później już nie żył, aresztowany i skazany na śmierć podczas wielkiego terroru w Związku Sowieckim. Także Lew Landau, największy rosyjski teoretyk, był wówczas aresztowany. W jego przypadku pomogła interwencja Piotra Kapicy.

Sześcian Bronsteina jest tylko prostą ilustracją jednego z aspektów poszukiwanej kwantowej teorii grawitacji: wszystkie trzy fundamentalne stałe miałyby w niej skończoną wartość. Wszystkie te stałe (wraz ze stałą Boltzmanna) pojawiają się w we wzorze Hawkinga na temperaturę czarnej dziury. Układ Plancka byłby w kwantowej grawitacji naturalnym układem jednostek. Znaczy to, że zjawisk kwantowych związanych z grawitacją należy oczekiwać w skali długości Plancka, czyli znacznie poniżej dostępnych dziś w badaniach. Masa Plancka jest niemal porównywalna z naszymi jednostkami. Znaczy to jednak, że odpowiadająca jej energia równa będzie E_P=m_P c^2=4,9\cdot 10^{9} J. W teorii fundamentalnej jest to energia olbrzymia, widać to, gdy wyrazimy ją w elektronowoltach:  E_P=3,07\cdot 10^{28} eV. Dla porównania najdroższy akcelerator w dziejach fizyki, LHC w CERN-ie, może maksymalnie osiągnąć energię 14 TeV, czyli 14\cdot 10^{12} eV – jest to piętnaście rzędów wielkości poniżej energii Plancka.

Wartości stałych fundamentalnych stanowią rodzaj przelicznika pomiędzy naszymi zwykłymi jednostkami, jak metry, sekundy, kilogramy, a jednostkami, jakich używa przyroda, zrozumiałymi dla kolegi z Syriusza. Nb. matematyka jest zapewne jedynym językiem, w którym moglibyśmy się z owym dodekaedrem porozumieć. Może należy zwrócić na to uwagę w dyskusji dotyczącej matury z matematyki: matematyka to jedyny język, w którym możemy się porozumiewać z mieszkańcami Syriusza czy szerzej: ze wszechświatem. Zastosowania są chyba oczywiste.

Niezależne od jednostek są stałe bezwymiarowe. Np. kwadrat ładunku elektronu można wyrazić następująco:

\alpha=\dfrac{q_e^2}{4\pi\varepsilon_0 \hbar c}=\dfrac{1}{137,036}.

Mając jeszcze do dyspozycji masę elektronu m_e, można wyrazić wszystkie wielkości atomowe. Energia wiązania elektronu w atomie wodoru to

E_j=\alpha^2 m_e c^2=13,6 \mbox{ eV},

a promień atomu (tzw. promień Bohra):

r=\dfrac{\hbar}{\alpha m_e c}=0,5\cdot 10^{-10}\mbox{ m}.

Wielkości te określają skalę zjawisk atomowych i cząsteczkowych. W  fundamentalnej teorii wszystkiego powinniśmy masę elektronu wyrazić w masach Plancka, a promień Bohra w długościach Plancka.

Ilu różnych bezwymiarowych stałych potrzebujemy do opisu świata? Używamy jednostek Plancka. Zatem grawitacja kwantowa nie zawiera żadnych dowolnych stałych. Model Standardowy potrzebuje trzech stałych określających siłę oddziaływań: oprócz \alpha dla oddziaływań elektromagnetycznych, potrzeba jeszcze stałych dla oddziaływań słabych i silnych. W sumie mamy 3 stałe. Dalej, potrzebujemy mas: sześciu kwarków, trzech leptonów i trzech neutrin oraz bozonu Higgsa (wszystko wyrażamy w masach Plancka, więc są to wielkości bezwymiarowe). Dotąd mamy 16 stałych. Potrzebna jest jeszcze wartość oczekiwana pola Higgsa: stała nr 17. Kolejnych 8 stałych bierze się z różnych macierzy mieszania. Daje to 25 parametrów, przy czym większość wynika z Modelu Standardowego. Wielkość ciemnej energii jest parametrem nr 26 (jeśli ciemna energia to stała kosmologiczna). Z jednej strony jest tych stałych za wiele jak na fundamentalną teorię, z drugiej strony jednak od czterdziestu lat nikt nie potrafi wskazać teorii bardziej ekonomicznej, a te stałe nie są jakimiś kaprysami teoretyków, lecz potwierdzane są w eksperymentach (tutaj LHC ma jak najbardziej zastosowanie).

Więcej szczegółów nt. stałych w artykule Johna Baeza.

 

Richarda Feynmana droga do równania Schrödingera (1941)

Jeszcze w trakcie swoich studiów pierwszego stopnia w MIT (ukończył je w 1939 r.) Feynman dowiedział się o trudnościach elektrodynamiki kwantowej. Teoria taka była niezbędna do opisania oddziaływań przy większych energiach: kiedy mogą tworzyć się albo anihilować pary elektron-pozyton. Obliczenia prowadziły jednak do całek rozbieżnych, teoria wymagała nowego podejścia.

W swoim wykładzie noblowskim Richard Feynman opowiada o kilku ideach, które starał się rozwijać w trakcie swoich dalszych studiów w Princeton (na egzaminach wstępnych z fizyki uzyskał tam komplet punktów, co zdarzyło się po raz pierwszy). W roku 1942 r uzyskał doktorat pod kierunkiem Johna Archibalda Wheelera i niebawem zaczął pracę w Projekcie Manhattan.

Jednym z pomysłów Feynmana było nowe sformułowanie mechaniki kwantowej. Poszukiwał podejścia, w którym można by opisać, co dzieje się z cząstkami w czasoprzestrzeni. Chodziło mu o teorię relatywistyczną, w której opis taki wydaje się naturalny. Należało się spodziewać, że zamiast hamiltonianu pojawi się tu lagranżian cząstek (sformułowanie Lagrange’a mechaniki daje się łatwo zapisać w postaci jawnie kowariantnej, w której zgodność z teorią względności jest punktem wyjścia, a nie dodatkowym założeniem). Na początek udało mu się sformułować w nowy sposób „starą” mechanikę kwantową, która liczyła wprawdzie dopiero piętnaście lat, lecz dla młodego człowieka była to już prehistoria. Właśnie to sformułowanie znalazło się w doktoracie.

Punktem wyjścia była rozmowa z Herbertem Jehle w „Nassau Inn” w Princeton któregoś wieczoru. Jehle, Niemiec, syn generała, był kwakrem i pacyfistą, wyemigrował z nazistowskiej ojczyzny, pracował w Brukseli, w końcu trafił do obozu internowania w Gurs w Pirenejach w republice Vichy, skąd trafił do Stanów Zjednoczonych. Jehle znał pewną pracę Paula Diraca, w której pojawiał się lagranżian. Nazajutrz wybrali się obaj do biblioteki, aby odszukać tę pracę z 1933 roku. Była ona opublikowana w dość nieprawdopodobnym miejscu, bo w rosyjskim czasopiśmie „Physikalische Zeitschrift der Sowjetunion”.

Dirac pisze, jak znaleźć funkcję falową w chwili późniejszej t+\varepsilon z funkcji falowej w chwili t, korzystając z zasady Huygensa:

\psi(x,t+\varepsilon)={\displaystyle \int G(x,y)\psi(y,t)dy}.

Funkcja G(x,y) jest dziś zwana propagatorem cząstki. Funkcja falowa w późniejszym czasie jest więc sumą funkcji falowych w czasie wcześniejszym wziętą z odpowiednimi wagami – wagi te opisuje propagator. Angielski uczony stwierdził też, że propagator dla krótkich czasów „odpowiada” (corresponds to) wyrażeniu

e^{iL \varepsilon /\hbar},

gdzie L jest lagranżianem, \hbar – stałą Plancka. W wykładniku mamy tu działanie dla bardzo krótkiego czasu \varepsilon. Feynman spróbował natychmiast ustalić, co oznacza owa odpowiedniość. Jeśli wziąć dwa punkty x i y, to średnia prędkość cząstki powinna się równać

v=\frac{x-y}{\varepsilon},

a energia potencjalna powinna być także jakąś wartością średnią:

V=V(\frac{x+y}{2}).

Lagranżian to różnica energii kinetycznej i potencjalnej, a więc wyrażenie wykładnicze Diraca jest równe:

\exp\left(\frac{im(x-y)^2}{2\hbar\varepsilon}-\frac{i}{\hbar}V(\frac{x+y}{2})\varepsilon\right).

Dla niewielkich \varepsilon pierwszy składnik wykładnika będzie gwałtownie oscylował, drugi natomiast staje się coraz mniejszy i może być zastąpiony przybliżeniem liniowym. Oznaczając x-y=\xi i przyjmując, że „odpowiada” u Diraca znaczy „jest proporcjonalny”, mielibyśmy

\psi(x,t+\varepsilon) =A(\varepsilon) {\displaystyle \int \exp\left(\dfrac{im\xi^2}{2\varepsilon\hbar}\right)\left\{ 1-\dfrac{i\varepsilon}{\hbar}V(x-{\xi}/{2})\right\}\psi(x-\xi)d\xi}.

Ponieważ pierwszy czynnik pod całką gwałtownie oscyluje, więc możemy funkcję falową pod całką przybliżyć jej rozwinięciem Taylora wokół x:

\psi(x-\xi)\approx \psi(x)-\xi \dfrac{\partial \psi}{\partial x}+\dfrac{\xi^2}{2}\dfrac{\partial^2\psi}{\partial x^2}.

Także energię potencjalną możemy zamienić jej wartością w punkcie x. Całki po prawej stronie dają się w tym przybliżeniu bez trudu obliczyć i otrzymujemy:

\psi(x,t+\varepsilon)=\psi(x,t)-\dfrac{i\varepsilon }{\hbar}V(x)\psi(x,t)+\dfrac{i\hbar \varepsilon}{2m}\,\dfrac{\partial^2\psi}{\partial x^2}.

Możemy to równanie przekształcić do postaci

i\hbar \dfrac{\psi(x,t+\varepsilon)-\psi(x,t)}{\varepsilon}=-\dfrac{\hbar^2}{2m}\dfrac{\partial^2\psi}{\partial x^2}+V(x)\psi(x,t),

co w granicy \varepsilon\rightarrow 0 przechodzi w równanie Schrödingera.

Jak opowiada Feynman, obliczenie to wykonał od razu w obecności Jehlego, który pilnie notował kolejne kroki.
Był to punkt wyjścia do całek Feynmana po trajektoriach (albo po historiach cząstki – jak nazwał to John Wheeler). Wyobraźmy sobie bowiem, że dany przedział czasu (0,T) dzielimy na N+1 podprzedziałów o długości \varepsilon każdy.

Propagator cząstki przyjmuje postać:

G(x,y)=A^{N+1}{\displaystyle \int\ldots\int \exp(\frac{i\varepsilon}{\hbar}(L(y,x_1)+L(x_1,x_2)+\ldots+L(x_N,x))dx_1\ldots dx_N}\mbox{(*)}.

Jeśli wyobrazimy sobie, że N\rightarrow\infty, to wykładnik w funkcji wykładniczej będzie dążył do całki działania pomnożonej przez czynnik i/\hbar:

\dfrac{i}{\hbar}S={\displaystyle \frac{i}{\hbar}\int_0^T L\left(x,\frac{dx}{dt}\right)dt}.

Mamy więc procedurę obliczania wartości G(x,y) za pomocą sumy po różnych możliwych trajektoriach. G można zinterpretować fizycznie: kwadrat modułu tej zespolonej wartości jest prawdopodobieństwem, że cząstka z punktu czasoprzestrzeni (y,0) przemieści się do punktu (x,T). Po drodze „próbuje” ona niejako wszelkich możliwych trajektorii i każda z nich daje wkład proporcjonalny do wartości działania:

G(x,T|y,0) \sim {\displaystyle \sum_{trajektorie}e^{iS[trajektoria]/\hbar}}.

Zapisujemy to następująco:

G(x,T|y,0)= {\displaystyle \int e^{iS[x(t)]/\hbar}{\mathcal D}[x(t)]}.

Całka Feynmana jest w istocie granicą wyrażeń (*) i w celu obliczenia jej wartości musimy wracać do tej definicji. Okazuje się jednak, że sformułowanie to pozwala nie tylko spojrzeć inaczej na znaną fizykę, ale także umożliwia konkretne numeryczne obliczenia metodą Monte Carlo. Pozwala też łatwo zrozumieć, czemu przechodząc od fizyki kwantowej do klasycznej, otrzymujemy zasadę najmniejszego działania.

Wartości potrzebnych całek wynikają ze znanego wzoru:

{\displaystyle \int_{-\infty}^{\infty}e^{-\alpha x^2}dx=\sqrt{\dfrac{\pi}{\alpha}} }.

Jest on słuszny także dla czysto urojonych wartości \alpha. Różniczkowanie tego wzoru po \alpha generuje nam także całkę \int x^2 e^{-\alpha x^2} dx. Stała A równa jest

A=\sqrt{\dfrac{m}{2\pi i\hbar \varepsilon}}.

Kiedyś napiszę może trochę więcej na temat obliczania całek przez Feynmana, nieprzypadkowo zajmował się on w Los Alamos nadzorowaniem praktycznych obliczeń numerycznych – jak mało kto potrafił bowiem szybko obliczyć niemal wszystko, co daje się obliczyć metodami klasycznej analizy.

 

Szczęśliwy rok Erwina Schrödingera (1926)

W listopadzie 1926 roku seria sześciu ostatnich prac Schrödingera ukazała się w wydaniu książkowym. Jak sam pisał we wstępie do tego przedruku:

Młoda przyjaciółka powiedziała o nich niedawno: „Popatrz, kiedy je zaczynałeś, nie myślałeś w ogóle pojęcia, że wyjdzie z nich tak wiele sensownych rzeczy”. Powiedzenie to, z którym (prócz pochlebnego przymiotnika) w pełni się zgadzam, podkreśla fakt, że prace zebrane w tym tomie powstawały jedna po drugiej. Ich autor, pisząc wcześniejsze części, nie znał jeszcze części późniejszych.

Erwin Schrödinger stał się dzięki nim sławny i choć także wcześniej i później tworzył prace interesujące bądź nawet wybitne, żadna z nich nie dorównywała tej złotej serii.

Ową przyjaciółką była czternastoletnia Itha Junger („Ithi”). Ich dziadek Georg Junger był bogatym obywatelem Salzburga, właścicielem firmy zajmującej się handlem hurtowym. Interes prowadzili nadal jego dwaj synowie, to jeden z nich, Hans, był ojcem dwóch niejednakowych bliźniaczek: Ithy i Roswithy, uczęszczających do szkoły klasztornej. Mówiło się, że matka żony Schrödingera Anny była nieślubną córką Georga Jungera. W każdym razie obie rodziny były blisko i żona Hansa była matką chrzestną Anny. Itha miała kłopoty z matematyki, Anny zaproponowała, że Erwin mógłby pomóc, bliźniaczki przeniesiono do klasztoru blisko Zurychu, żeby mogły korzystać z korepetycji. Erwin bardzo się z nimi zaprzyjaźnił, a wkrótce i zakochał w Ithi. Ich osobliwy, nawet w tych swobodnych czasach, romans trwał wiele lat, związek został skonsumowany wkrótce po siedemnastych urodzinach Ithi.

Mechanika kwantowa Heisenberga i jego kolegów z Getyngi przyjmowana była z mieszanymi uczuciami przez środowisko fizyków. Przeskoki kwantowe, abstrakcyjny formalizm macierzowy, filozofia ograniczenia się tylko do wielkości bezpośrednio obserwowalnych i porzucenia raz na zawsze poglądowych wyobrażeń atomu – wszystko to traktowane było z rezerwą. Podejście Schrödingera wydawało się nie tylko bardziej zrozumiałe matematycznie, ale także umożliwiało wyobrażenie sobie, co właściwie dzieje się wewnątrz układów o skali atomowej. Schrödinger wykazał także, że przynajmniej w prostych sytuacjach oba podejścia są równoważne. Mimo to, Heisenberg wykazywał wobec „mechaniki falowej” postawę wrogą i nieprzejednaną. Jego mentor, Niels Bohr, zaprosił Schrödingera do Kopenhagi, gdzie zadręczał wręcz swojego gościa, atakując jego sposób myślenia.

Dla zwolenników Bohra elektron był punktową cząstką, a prawa kwantowe dotyczyły tylko prawdopodobieństw. Historia przyznała im rację, choć pewne problemy interpretacyjne mechaniki kwantowej pozostały do dziś. Trzeba jednak wyraźnie powiedzieć, że jak dotąd żaden eksperyment nie zaprzeczył prawom mechaniki kwantowej, „szara strefa” dotyczy raczej filozoficznego samopoczucia. Wciąż nie znamy wszystkich szczegółów przejścia z poziomu mikroświata do makroświata, w którym żyjemy i w którym powstała fizyka klasyczna.

Błyskawiczna kariera Schrödingera wiązała się z tym, że dla konserwatywnie nastawionych fizyków, jego podejście wydawało się łatwiejszą do przyjęcia wersją teorii kwantowej. Schrödinger został zasypany listami i zaproszeniami od luminarzy ówczesnej fizyki: od sędziwego Hednrika Lorentza, przez Maksa Plancka, Alberta Einsteina aż do Wilhelma Wiena i Arnolda Sommerfelda. Został członkiem bardzo elitarnego grona: Planck gościł go w swoim domu podczas wizyty w Berlinie. Dobiegający siedemdziesiątki i wieku emerytalnego Planck niewątpliwie myślał przy tym o przyszłości swojej katedry w Berlinie, najbardziej prestiżowego stanowiska w dziedzinie fizyki teoretycznej na świecie. Niedługo później Schrödinger trafił na krótką listę kandydatów i uzyskał to stanowisko. Uznano przy tym, że Werner Heisenberg, choć niewątpliwie genialny, jest po prostu jeszcze za młody na katedrę. Schrödinger odbył też podróż do Stanów Zjednoczonych, stając się jednym z długiego szeregu wizytujących sław europejskich. Amerykanie nie byli jeszcze potęgą w fizyce teoretycznej, ale starali się kusić wysokimi honorariami, uzyskując przynajmniej tyle, że odwiedzali Stany Zjednoczone wszyscy właściwie wybitni fizycy i matematycy. Schrödinger też dostał oferty pracy w USA, ale nie rozpatrywał ich poważnie. Ameryka mu się nie podobała, duch purytański, przejawiający się w owych latach, m.in. w prohibicji, wydawał mu się barbarzyństwem. Na widok Statui Wolności miał powiedzieć, że brakuje jej tylko zegarka na ręku.

William F. Meggers Gallery of Nobel Laureates

Erwin Schrödinger bronił w roku 1926 i później stanowiska, że elektron nie jest punktową cząstką, lecz raczej pewnym rozmytym obiektem. Stanowisko to nie dało się obronić. Przedstawimy jeden z argumentów Schrödingera. Jest on prawdziwy, lecz sytuacja, której dotyczy, okazała się nietypowa. Nie można było tego jednak wiedzieć latem 1926 roku.

Rozpatrzmy oscylator harmoniczny, czyli cząstkę oscylującą wokół minimum energii potencjalnej. Ponieważ każdą funkcję wokół minimum można w przybliżeniu uważać za parabolę, więc jest sens rozważać przypadek kwadratowej, czyli parabolicznej, energii potencjalnej. Rozwiązanie równania Schrödingera daje nam wówczas następujące funkcje falowe.

skrypt Sagemath do generowania obrazka

Są to drgania o różnych dopuszczalnych energiach (nieparzyste wielokrotności wielkości \frac{1}{2}\hbar \omega, gdzie \omega jest częstością kołową naszego oscylatora). Klasycznie biorąc, obszar położony poza przecięciem potencjału z poziomą prostą danej energii całkowitej jest niedostępny; cząstka nie może się tam znaleźć, ponieważ musiałaby mieć ujemną energię kinetyczną. W fizyce kwantowej funkcja falowa rozlewa się poza ten klasycznie dostępny obszar, co jest tzw. zjawiskiem tunelowym. Każdy z tych stanów stacjonarnych ma bardzo prostą zależność od czasu. Należy funkcję z wykresu pomnożyć przez czynnik

\exp(-i\frac{Et}{\hbar})=\exp(-i\omega(n+\frac{1}{2})t).

Znaczy to, że zależność od czasu jest trywialna, nic się w naszej funkcji falowej nie porusza, opisane stany są falami stojącymi. Schrödinger zauważył, jak ze stanów o ustalonej energii zbudować rozwiązanie równania, które opisuje drgania w czasie. W gruncie rzeczy jest to bardzo proste. Chcąc zapoczątkować drgania oscylatora, wystarczy wychylić jego masę z położenia równowagi, a następnie puścić ciężarek, który zacznie wykonywać oscylacje.

Można analogicznie, wziąć funkcję falową stanu podstawowego oscylatora

\Psi_0(x)=C\exp(-\frac{x^2}{2}),

a następnie przesunąć ją do jakiegoś nowego położenia x_0:

\Psi(x)=C\exp(-\frac{(x-x_0)^2}{2}),

Jeśli tę ostatnią funkcję potraktujemy jako warunek początkowy w równaniu Schrödingera, to otrzymamy funkcje opisujące paczkę falową poruszającą się oscylacyjnie wokół położenia równowagi. W pracy Schrödingera („Naturwissenschaften”, 1926) przedstawiona została jej część rzeczywista:

Jest to zdjęcie migawkowe, paczka falowa będzie bowiem oscylować wokół położenia równowagi. Zdaniem Schrödingera ta właśnie fala jest elektronem. Ponieważ ciągle traktował on liczby zespolone jako wypadek przy pracy, więc wziął cząść rzeczywistą rozwiązania.

Wiemy jednak, że rację miał tu Max Born: należy obliczyć kwadrat zespolonego modułu funkcji falowej i jego wielkość określa rozkład prawdopodobieństwa. Otrzymamy wówczas klasyczne drgania rozmytej funkcji falowej.

Wikimedia Commons

Nie jest to jednak elektron, lecz prawdopodobieństwo jego znalezienia w danym miejscu i czasie. Dziś stany takie znane są jako stany koherentne. Przypadek oscylatora jest wyjątkowy: na ogół taka zlokalizowana funkcja falowa rozmywa się w czasie, choć w niektórych przypadkach może się później odbudowywać, jak na poniższym obrazku (chodzi tu o wysokowzbudzone stany atomu wodoru: mogą one przez chwilę przypominać klasyczny elektron na orbicie Bohra, potem ten obraz się rozmywa.

Mamy tu trzydzieści keplerowskich obiegów elektronu zbudowanych ze stanów wokół n=180

Erwin Schrödinger nie pogodził się z kopenhaską interpretacją mechaniki kwantowej, stał się jednym z jej krytyków, podobnie jak Einstein poszukujących innej drogi. Romans z Ithi kontyuowany był w latach berlińskich, w jakimś momencie uczony chciał się nawet z nią ożenić, ale do tego nie doszło. Po roku 1933 nie chciał zostać w nazistowskich Niemczech (co było dość wyjątkowe, ponieważ nie był Żydem i nie musiał rezygnować), wrócił na trochę do Austrii, ale wskutek Anschlussu także Austria stała się brunatna. Jego późniejsze afery uczuciowo-erotyczne stanowiły przeszkodę w objęciu katedr w Oxfordzie i Princeton, ostatecznie znalazł sobie miejsce w katolickiej Irlandii.

Erwin Schrödinger: trzeci początek mechaniki kwantowej (1926)

Równanie Schrödingera zasługuje na swoją sławę: dzięki niemu znamy nie tylko budowę atomów, ale i cząsteczek chemicznych czy ciał skondensowanych. Wynikają z niego najprzeróżniejsze własności materii, która nas otacza, a także materii we wszechświecie. Jest więc równaniem niezwykle istotnym tak dla fundamentów fizyki, jak i dla zastosowań.

Autor najsłynniejszego równania dwudziestowiecznej fizyki aż do roku 1926 nie należał do ścisłej czołówki fizyków teoretycznych. Zaledwie osiem lat młodszy od Einsteina, dopiero od 1921 roku zajmował katedrę na uniwersytecie w Zurychu. Studiował w Wiedniu, zbyt późno by zetknąć się osobiście z Ludwigiem Boltzmannem czy Ernstem Machem, choć wpływ obu tych uczonych wciąż dawał się tam odczuć. Fizyki teoretycznej uczył się u Friedricha Hasenöhrla, bliskiego przyjaciela Mariana Smoluchowskiego. Do tej pory niewiele zajmował się teorią kwantową, ponieważ opierała się ona wciąż na bardzo grząskich podstawach, korzystając po trosze z fizyki klasycznej, a po trosze z postulatów kwantowania, wyraźnie z nią sprzecznych. Zwrócił jednak uwagę na pracę Louisa de Broglie na temat fal materii. Postulowała ona, że zarówno fotony, jak i inne cząstki mikroświata mają dualną naturę: zachowują się czasem jak cząstki, a czasem jak fale. Obowiązywał przy tym jeden uniwersalny przelicznik własności cząstkowych: energii E i pędu p na wielkości falowe: częstość (kołową) \omega i liczbę falową k\equiv\frac{2\pi}{\lambda} (\lambda jest długością fali). Współczynnikiem proporcjonalności w obu przypadakch miała być stała Plancka \hbar:

E=\hbar\omega,\,p=\hbar k.

Felix Bloch, wówczas początkujący fizyk, tak wspomina wspólne kolokwia (dziś powiedzielibyśmy raczej seminaria) fizyków z uniwersytetu w Zurychu i z ETH, gdzie najważniejszą postacią był Peter Debye.

Pewnego razu pod koniec kolokwium Debye powiedział coś w tym rodzaju: „Schrödinger nie zajmujesz się teraz żadnym ważnym tematem. Może opowiedziałbyś nam któregoś dnia o tym doktoracie de Broglie’a, który, zdaje się, przyciągnął sporo uwagi”. Więc na jednym z następnych kolokwiów Schrödinger przedstawił cudownie przejrzysty wykład o tym, jak de Broglie wiąże fale z cząstkami i w jaki sposób zdołał on uzyskać reguły kwantyzacji Bohra i Sommerfelda (…) Kiedy skończył, Debye stwierdził od niechcenia, że taki sposób ujęcia jest raczej dziecinny. Jako student Sommerfelda nauczył się, że właściwy sposób podejścia do fal wiedzie przez równanie falowe. Brzmiało to dość trywialnie i na pozór nie zrobiło głębszego wrażenia, ale Schrödinger najwyraźniej wrócił później do tego pomysłu. Zaledwie kilka tygodni później dał następne kolokwium, zaczynając od słów: „Kolega Debye zasugerował, że należy mieć równanie falowe, toteż je znalazłem”. [„Physics Today”, t. 29 (1976), nr 12, s. 23-24]

Najwyraźniej w pierwszej chwili obaj nie zdawali sobie sprawy z wagi tych badań. Erwin Schrödinger dzięki pracom z końca roku 1925 i roku 1926 stał się błyskawicznie jednym z najgłośniejszych fizyków świata. Seria jego artykułów natychmiast zyskała uznanie. Chwalili je Albert Einstein i Arnold Sommerfeld, który wraz ze swymi uczniami rozwijał od lat fizykę kwantową. Napisał do niego sędziwy Hendrik Lorentz, który uważnie śledził nowości i miał parę istotnych uwag. Surowy i poważny Max Planck, profesor najbardziej prestiżowej katedry w Niemczech (co wtedy znaczyło: najbardziej prestiżowej na świecie) – na uniwersytecie w Berlinie, pisał entuzjastycznie do Schrödingera:

Czytam pański artykuł tak, jak ciekawe dziecko, słuchające w napięciu rozwiązania zagadki, nad którą się długo głowiło, i cieszę się bardzo wszystkimi pięknościami, jakie tam dostrzegam, choć muszę go jeszcze dokładniej przestudiować, by wszystko z niego pojąć.

Kiedy w grudniu 1925 roku Schrödinger znalazł swe równanie, był to trzeci początek mechaniki kwantowej albo – jak wolał o tym mówić autor odkrycia – mechaniki falowej. Na pierwszy rzut oka nie miało to nic wspólnego z teorią Heisenberga, Borna, Jordana i Diraca. U Schrödingera nie było żadnych skoków kwantowych, żadnych wielkości macierzowych, nieprzemiennych iloczynów. Język był całkowicie klasyczny – była to matematyka drgań, dobrze już wówczas opracowana. W roku 1924 wyszła dwutomowa monografia Methoden der mathematischen Physik („Metody fizyki matematycznej”) zredagowana przez Richarda Couranta i innych matematyków z Getyngi na podstawie wykładów Davida Hilberta. Zawierała ona wiele materiału, który miał się okazać potrzebny fizykom za kilka lat. Jak na ironię metody Hilberta zastosowali pierwsi nie fizycy z grupy Maksa Borna, pracujący przecież głównie pod bokiem Hilberta w Getyndze, ale Erwin Schrödinger, outsider i naukowy samotnik. Fizycy z Getyngi zlekceważyli nawet wyraźną sugestię Hilberta w jednej z rozmów, że powinni poszukać równania różniczkowego, które opisuje skwantowane wartości energii. Nie próbowali iść tym tropem, przekonani, że ich mechanika kwantowa jest czymś całkowicie nowym i nie może się zawierać w książce sprzed paru lat. Źle przyjęli też pracę Schrödingera, która wydawała się recydywą fizyki klasycznej, odwrotem od kwantowej rewolucji spod sztandaru Heisenberga.

Fizycy klasyczni znali wiele przypadków drgań układów rozciągłych, czyli fal stojących. Są one np. podstawą wytwarzania dźwięku w instrumentach muzycznych takich, jak organy, flet, trąbka czy skrzypce. Wiadomo, że zamocowana na końcach struna drgać może tylko z określonymi ściśle częstościami: podstawową oraz jej wielokrotnościami. Rozważano różne bardziej skomplikowane możliwości, pisaliśmy tu o rówieśniku Einsteina, fizyku z Getyngi, Waltherze Ritzu. Idea Schrödingera polegała na tym, by wartości energii w atomie potraktować analogicznie do częstości dźwięku w pudle rezonansowym, stosując równanie falowe. Ma ono w przypadku trójwymiarowym postać:

\dfrac{\partial^2\psi}{\partial x^2}+\dfrac{\partial^2\psi}{\partial y^2}+\dfrac{\partial^2\psi}{\partial z^2}-\dfrac{1}{v^2}\dfrac{\partial^2 \psi}{\partial t^2}\equiv \Delta\psi-\dfrac{1}{v^2}\dfrac{\partial^2 \psi}{\partial t^2}=0,

gdzie v jest prędkością fal. Jeśli przyjmiemy, że nasze fale są okresowe i mają częstość \omega, możemy rozwiązania zapisać jako

\psi(x,y,z, t)=\psi(x,y,z)e^{\pm i\omega t}.

Drugą pochodna po czasie jest ta sama funkcja wykładnicza pomnożona przez stałą. Wstawiając to do równania falowego, otrzymujemy tzw. równanie Helmholtza (który pod koniec XIX wieku był profesorem w Berlinie):

\Delta \psi+k^2 \psi=0.

W równaniu tym skorzystaliśmy z tego, że \dfrac{\omega}{v}=k. Droga Schrödingera do odkrycia była dość zawikłana. Związki de Broglie’a są relatywistyczne, naturalne wydawało się więc zapisanie równania relatywistycznego. Jednak kiedy spróbujemy je rozwiązać w najprostszym przypadku atomu wodoru, okazuje się, że dopuszczalne energie nie zgadzają się z tym, co wcześniej, w starej teorii kwantów obliczył Sommerfeld i co zgadzało się z doświadczeniem (szczegóły można znaleźć u L. Schiffa, Mechanika kwantowa, s. 409 i n.). Dwa lata później sytuacja się wyjaśniła: potrzebne tu jest równanie Diraca. Dwa lata w tamtej chwili rozwoju fizyki to było więcej niż epoka, Schrödinger znajdował się dopiero u początków tej drogi i nie mógł wiedzieć, co stanie się dalej. Rozsądnie zdecydował się więc na przybliżenie nierelatywistyczne, robiąc niejako krok wstecz w porównaniu do de Broglie’a. Nie pójdziemy tu jego drogą, a właściwie kilkoma różnymi drogami, jakimi próbował uzasadnić swe równanie. Wybierzemy podejście najprostsze zaproponowane pół roku później przez Maksa Borna – musimy jednak pamiętać, że nie jest to wyprowadzenie. Nie można bowiem wyprowadzić praw mechaniki kwantowej z praw klasycznych. Dla cząstki o masie m i całkowitej energii E możemy napisać równanie zachowania energii:

E=\dfrac{\hbar^2 k^2}{2m}+V(x,y,z),

gdzie V jest energią potencjalną (pierwszy składnik to zwykła energia kinetyczna). Jeśli wyznaczymy k^2 z ostatniego równania i wstawimy do równania Helmholtza, otrzymamy tzw. równanie Schrödingera bez czasu:

-\dfrac{\hbar^2}{2m}\Delta\psi+V\psi=E\psi.

Chcąc np. opisać ruch elektronu wokół nieruchomego jądra atomowego o ładunku Ze, należy wstawić do równania Schrödingera energię potencjalną postaci

V(r)=-\dfrac{Ze^2}{4\pi \epsilon_0 r},

czyli zwykłą energię potencjalną przyciągania elektrostatycznego dwóch ładunków Ze oraz -e w odległości r. Szukamy takich funkcji \psi(x,y,z), które daleko od jądra zanikają. Okazuje się, że rozwiązania takie są możliwe tylko dla dyskretnych wartości energii równych

E_n=-\dfrac{me^4}{2(4\pi\epsilon_0)^2 \hbar^2}\dfrac{1}{n^2}, \mbox{ gdzie } n=1,2, 3, \ldots.

 Jest to wynik uzyskany w roku 1913 przez Bohra z założeń, które od początku wydawały się aktem rozpaczy, a nie solidną nauką. Równanie Schrödingera miało więc sens, choć nadal brakowało pewnych elementów do kompletnej teorii. Jednym z najważniejszych było znaczenie samej funkcji \psi. Kiedy w piszczałce organowej czy w rurce fletu wytwarzany jest dźwięk, wiemy, co drga – jest to powietrze, które ściśnięte się rozpręża, a rozprężone wraca do początkowej gęstości. Co drga w atomie wodoru? Jakie jest znaczenie funkcji \psi? Co gorsza, okazało się, że powinna ona mieć wartości zespolone, z pewnością nie było to żadne proste drganie klasyczne. Geniusz Schrödingera ujawnił się i w tym, że nie próbował odpowiedzieć na wszystkie pytania naraz i pozwolił swoim ideom rozwijać się w czasie. Publikacje uczonego z pierwszego półrocza 1926 roku wystarczyły na Nagrodę Nobla i objęcie w roku 1927 katedry w Berlinie po odchodzącym na emeryturę Maksie Plancku.

Erwin Schrödinger, człowiek wszechstronnie wykształcony, o szerokich zainteresowaniach, całkowicie zaprzecza ascetycznej wizji uczonego, który nie ma czasu na nic oprócz nauki. Wydaje się wręcz, że jego pomysłowość przy stworzeniu słynnego równania szła w parze z gorączką miłosną. Praca ta powstała w uzdrowisku Arosa, gdzie wybrał się w towarzystwie do dziś nie znanej flamy. Jego małżeństwo należało do nowoczesnych i partnerzy pozostawiali sobie bardzo wielką swobodę. Były przecież lata dwudzieste: kobiety odsłoniły nogi, tańczono charlestona, wszyscy chcieli zapomnieć o koszmarze niedawnej wielkiej wojny.

 

 

 

 

 

Oscylator kwantowy: Paul Dirac i inni (1929-1930)

Mechanika kwantowa wprowadziła rewolucyjnie nowe pojęcie stanu układu fizycznego. Klasycznie stan układu znamy, gdy dane są jego położenie i pęd w pewnej chwili. Na tej podstawie możemy obliczyć przyszłe położenia i pędy (albo i przeszłe – mechanika jest symetryczna wobec zmiany strzałki czasu). Np. znając dziesiejsze położenie i pęd planety, możemy obliczyć, gdzie znajdzie się ona za sto lat albo gdzie była, powiedzmy, w czasach Keplera. Stan układu to punkt w przestrzeni polożeń q i pędów p. Ewolucja w czasie to ruch tego punktu w owej przestrzeni fazowej.

Mechanika kwantowa zastępuje klasyczną na poziomie mikroświata. Zupełnie jednak zmienia się pojęcie stanu układu. Stanem jest teraz nie punkt, lecz wektor, a właściwie cały promień, to znaczy wektor pomnożony przez dowoloną liczbę. Przestrzeń stanów (wektorów) umożliwia dodawanie dwóch stanów. Operacja taka nie miałaby sensu w mechanice klasycznej: bo niby jak mamy dodać do siebie położenie Marsa i położenie Jowisza? Co taka suma miałaby oznaczać? W mechanice kwantowej obowiązuje zasada superpozycji, czyli dodawania stanów.

Wikipedia: Double-slit experiment

Kiedy np. przepuszczamy elektron przez przesłonę z dwiema szczelinami, jego stan kwantowy będzie sumą stanu elektronu, który przeszedł przez szczelinę nr 1 oraz stanu elektronu, który przeszedł przez szczelinę nr 2. Stosując zapis wprowadzony przez Paula Diraca w 1939 roku, możemy to zapisać jako

|\varphi\rangle=| \varphi_1\rangle+| \varphi_2\rangle.

Fizycznie znaczy to, że nasz elektron trochę przeszedł przez szczelinę nr 1, a trochę przez szczelinę nr 2. Jego stan jest superpozycją dwóch stanów. Gdybyśmy chcieli wyznaczyć prawdopodobieństwo, że w jakimś punkcie ekranu x zarejestrujemy nasz elektron, należałoby obliczyć iloczyn skalarny z wektorem przedstawiającym elektron w x:

\langle x | \varphi \rangle=\langle x| \varphi_1\rangle+ \langle x| \varphi_2\rangle.

Zapis Diraca wziął się z rozłożenia nawiasu kątowego na dwie części: nazywa się je wektorem bra i ket (od angielskiego: bracket). Z pomnożenia skalarnego dwóch wektorów otrzymujemy liczbę (prędzej czy później będziemy potrzebowali liczb, jeśli teoria ma coś przewidywać ilościowo). Powyższy zapis Diraca można też zastąpić bardziej konwencjonalnym sumowaniem funkcji:

\varphi(x)=\varphi_1(x)+\varphi_2(x).

Wartość funkcji falowej w danym punkcie x można traktować jako składową wektora \varphi. Zapis Diraca \langle a|b\rangle pozwala nam patrzeć na funkcję jako iloczyn skalarny dwóch wektorów, jeszcze wygodniej jest często operować samymi wektorami stanu: nie precyzujemy wówczas, co chcielibyśmy mierzyć (może np. zamiast położenia, wolelibyśmy pędy – pierwsza forma zapisu  tego nie przesądza.

Mamy zatem abstrakcyjne wektory stanu i iloczyn skalarny. Wartości tego iloczynu skalarnego są na ogół zespolone, inaczej mówiąc, funkcje falowe są zespolone (*). Nie mogą one mieć bezpośredniego sensu fizycznego. Sens taki mają natomiast kwadraty ich modułów: |\varphi(x)|^2 daje nam prawdopodobieństwo zarejestrowania elektronu w punkcie x (dokładniej: gęstość prawdopodobieństwa, bo współrzędna przyjmuje dowolne wartości rzeczywiste). Tam gdzie prawdopodobieństwo jest duże, elektrony będą częściej trafiały, gdy zbierze się dostateczna statystyka, będziemy mogli zaobserwować, że „trafienia” układają się w prążki interferencyjne. Wynik jest taki, jakby dwie fale nakładały się na siebie.

Obrazki powyżej pochodzą z rzeczywistego doświadczenia Akira Tonomury, Proc. Natl. Acad. Sci. U.S.A. 102 (2005) 14952-14959. Liczba elektronów wzrasta od 10 do 140 000, widzimy, jak uwidaczniają się prążki interferencyjne. W doświadczeniu tym elektrony przepuszczane były pojedynczo, wiemy więc, że każdy elektron interferuje niejako sam z sobą, nie jest to skutek jakichś oddziaływań między nimi. Ze względów technicznych doświadczenie to przeprowadzone było stosunkowo niedawno, ale że wynik musi być właśnie taki, zdawali sobie sprawę już pierwsi badacze mechaniki kwantowej: Heisenberg, Born, Jordan, Dirac. W 1927 r. Lester Germer i Clinton Davisson oraz niezależnie George Paget Thomson zaobserwowali dyfrakcję elektronów, za co otrzymali Nagrodę Nobla (G.P. Thomson był synem J.J. Thomsona, który odkrył elektron, mówiono, że ojciec dostał Nagrodę Nobla za odkrycie, iż elektron jest cząstką, a syn – za odkrycie, że elektron jest falą). Oczywiście, elektron (podobnie jak np. foton) jest cząstką, do opisu której musimy stosować mechanikę kwantową.

Tak więc choć dodawanie stanów wydaje się abstrakcyjne, to w istocie jest obserwowane w eksperymentach. Skoro stany są wektorami i można je dodawać oraz mnożyć przez liczbę, to naturalnym rodzajem przekształceń takiej przestrzeni są operatory liniowe, czyli odwzorowania przypisujące każdemu wektorowi |\varphi \rangle jakiś inny wektor: A |\varphi \rangle, przy czym

A(\lambda_1 | \varphi_1\rangle+\lambda_2 |\varphi_2\rangle)=\lambda_1 A |\varphi_1\rangle+\lambda_2 A |\varphi_2\rangle,

gdzie \lambda_1,\lambda_2 są dowolnymi liczbami. Operatory takie w mechanice kwantowej zastępują wielkości fizyczne, które można mierzyć: mamy więc operatory pędu, położenia, energii itd. W jaki sposób formalizm ten pozwala otrzymywać w pewnych sytuacjach skwantowane wartości np. energii? Operator wielkości A działając na pewne odpowiednio wybrane wektory daje bardzo prosty wynik: mnoży wektor wyjściowy przez liczbę. Np.

A |\varphi_a\rangle=a|\varphi_a\rangle,

co zwykle zapisuje się krócej:

A|a\rangle =a|a\rangle.

Litera a oznacza wartość wielkości fizycznej, a więc powinna to być liczba rzeczywista, a przynależny jej stan |a\rangle jest wektorem. Mówi się, że jest to wektor własny, a wartość nazywamy wartością własną. Z doświadczalnego punktu widzenia, gdy układ jest w stanie własnym, to wynikiem pomiaru owej wielkości jest na pewno a. Przestrzeń stanów jest nieskończenie wymiarowa i może zawierać wiele różnych wektorów odpowiadających różnym wartościom własnym. Może się np. okazać, że tylko pewien dyskretny zbiór wartości jest dopuszczalny – i wtedy właśnie wielkość fizyczna się kwantuje.

Pokażemy, jak formalizm ten działa w przypadku oscylatora harmonicznego. Jest to najprostszy niecałkiem trywialny układ, mający zresztą liczne zastosowania: wszystko, co gdzieś drga, można w pierwszym przybliżeniu opisać jako oscylator harmoniczny albo ich zbiór – mogą to być drgania kryształów, atomów w cząsteczkach chemicznych, a nawet fale elektromagnetyczne, które matematycznie są podobne do oscylatorów.

W jednowymiarowym przypadku, gdy masa cząstki oraz częstość oscylatora są jednostkowe, energia ma postać:

E=\frac{1}{2}(p^2+x^2),

jest to więc suma kwadratów pędu i współrzędnej (kwadratowy potencjał odpowiada sile proporcjonalnej do wychylenia z położenia równowagi, jak w przypadku masy na sprężynie). W mechanice kwantowej zastępujemy tę funkcję operatorem Hamiltona (hamiltonianem), który ma postać taką samą, jak klasyczna:

H=\frac{1}{2}(p^2+x^2),

teraz jednak po prawej stronie mamy operatory pędu i położenia. Wiemy o nich od czasów Borna i Jordana oraz Diraca, że są nieprzemienne i spełniają regułę komutacji:

xp-px=i\hbar.

Okazuje się, że wystarczy to do znalezienia wartości energii oscylatora (dla uproszczenia przyjmiemy jednostki \hbar=1). Metoda, którą zastosujemy, przypisywana jest zwykle Paulowi Diracowi, choć w druku pojawiła się po raz pierwszy w książce Maksa Borna i Pascuala Jordana z roku 1930.

Hamiltonian jest sumą kwadratów, możemy więc spróbować rozłożyć go na czynniki. Wprowadzamy dwa nowe operatory:

a=\frac{1}{\sqrt{2}}(x+ip), \; a^{\dag}=\frac{1}{\sqrt{2}}(x-ip).

Gdyby x, p były liczbami rzeczywistymi, iloczyn obu naszych operatorów byłby równy hamiltonianowi. Musimy jednak uwzględnić nieprzemienność mnożenia operatorów:

a^{\dag}a=\frac{1}{2}(x^2+p^2+ixp-ipx)=H-\frac{1}{2}.

W podobny sposób możemy obliczyć iloczyn wzięty w odwrotnej kolejności:

aa^{\dag}=\frac{1}{2}(x^2+p^2-ixp+ipx)=H+\frac{1}{2}.

Odejmując ostatnie dwie równości stronami, otrzymamy

a^{\dag}a-aa^{\dag}=1.

Zbadajmy teraz wartości własne operatora N=a^{\dag}a – muszą one być o \frac{1}{2} mniejsze niż wartości własne operatora H. Jeśli |\lambda\rangle jest wektorem własnym N o wartości \lambda, to mamy

Na|\lambda \rangle=(a^{\dag}a)a|\lambda\rangle=(aa^{\dag}-1)a|\lambda\rangle=(\lambda-1)a|\lambda\rangle.

Oznacza to, że wektor a|\lambda\rangle też jest wektorem własnym N o wartości o 1 mniejszej. Działając kolejny raz operatorem a na tak uzyskany wektor, otrzymamy wektor o wartości własnej mniejszej o 2 itd. Procedura ta musi się jednak zakończyć po skończonej liczbie kroków, ponieważ operator N, tak jak i H, jest ograniczony od dołu. Hamiltonian jest sumą kwadratów i nie może mieć ujemnych wartości własnych, energia każdego układu ograniczona jest od dołu, gdyby tak nie było świat by się zapadł w stany o ujemnej energii. Znaczy to, że istnieje taki wektor |0\rangle, że

a  |0\rangle=0.

Po prawej stronie mamy wektor zerowy, czyli brak jakiegokolwiek stanu. Oczywiście, N |0\rangle=0, czyli wektorowi temu odpowiada zerowa wartość własna. Możemy teraz do tego wektora zastosować operator a^{\dag}, otrzymamy

Na^{\dag}|0\rangle=a^{\dag}aa^{\dag}|0\rangle=a^{\dag}(a^{\dag}a+1)|0\rangle=a^{\dag}|0\rangle,

czyli wektor a^{\dag}|0\rangle ma wartość własną 1. Powtarzając ten zabieg stosowania operatora a^{\dag} wykreujemy stany o wartościach własnych równych kolejnym liczbom naturalnym. Z tego powodu operator a^{\dag} nazywa się operatorem kreacji, a a – operatorem anihilacji. Generują one stany o większej bądź mniejszej wartości N. Zatem wartości własne naszego hamiltonianu równe są

E_n=n+\frac{1}{2}, \mbox{ gdzie  } n=0,1, 2,\ldots.

W zwykłych jednostkach energie wyrażają się przez częstość oscylatora \omega=\sqrt{\frac{k}{m}}:

E_n=\hbar\omega(n+\frac{1}{2}).

Wynik ten znany był od lat, po raz pierwszy jednak powstał w latach 1925-1926 spójny formalizm pozwalający otrzymać ten i wiele innych rezultatów.

Na obrazku widzimy rezultat zastosowania formalizmu: niebieska linia to kształt potencjału (parabola x^2), linie poziome oznaczają dozwolone wartości energii. Nawet najmniejsza energia musi być dodatnia: oznacza to, że kwantowy oscylator nigdy nie może spoczywać. Gdybyśmy zrobili kwantowe wahadło, musiałoby ono zawsze drgać. Z tego powodu nawet w temperaturze zera bezwględnego atomy w kryształach czy cząsteczkach chemicznych drgają – są to tzw. drgania zerowe.

Wynik dla oscylatora ma konsekwencje fizyczne: już w 1900 r. Max Planck zauważył, że energie te powinny przybierać skwantowane wartości, jeśli chcemy prawidłowo opisać promieniowanie ceieplne. Kilka lat później Albert Einstein wyjaśnił eksperymentalne wyniki dotyczące diamentu właśnie za pomocą tego kwantowania.

Prosty formalizm operatorów kreacji i anihilacji odegrał niezmiernie ważną rolę w rozwoju mechaniki kwantowej, pozwalając zbudować kwantową teorię pola. O jej początkach innym razem.

(*) Iloczyn skalarny dwóch wektorów przypisuje parze wektorów liczbę zespoloną i spełnia następujące aksjomaty:

\langle a| b\rangle=\langle b|a\rangle^{\star}.

\langle a| \lambda b+c\rangle=\langle a| b\rangle+\lambda\langle a| c\rangle.

Iloczyn wektora z samym sobą jest liczbą rzeczywistą nieujemną – kwadratem jego długości, zwanym też normą:

||{a}||^2:=\langle a|a\rangle.

 

 

Paul Dirac – drugi początek mechaniki kwantowej (1925)

Latem 1925 roku Werner Heisenberg wystąpił w Cambridge z odczytem w Klubie Kapicy. Było to nieformalne stowarzyszenie powołane do życia przez pełnego temperamentu rosyjskiego fizyka Piotra Kapicę, coś w rodzaju klubu naukowego doktorantów i studentów. Chwila była ważna: Heisenberg zaczął właśnie budować pierwsze zręby nowej mechaniki kwantowej. Sam jeszcze nie był pewny, co z tego wyjdzie, nikt pewnie nie przypuszczał, że chodzi o największe odkrycie XX wieku (obok teorii względności). W swoim wystąpieniu Heisenberg omówił swoją pracę na temat efektu Zeemana, a pod koniec wspomniał o nowych rewolucyjnych pomysłach.

Jednym ze słuchaczy był Paul Dirac. Wydawałoby się zatem, że wtedy właśnie dowiedział się, i to wprost od samego autora o koncepcji mechaniki kwantowej. Jeśli A mówił na temat X, a B tego słuchał, to zapewne B zapoznał się w ten sposób z X. Nie zawsze to prawda, podobnie jak z obecności na wykładzie niekoniecznie wynika, że student się czegoś dowiedział. W tym przypadku mamy świadectwo samego Diraca. Twierdził on, że zupełnie zapomniał o tej części wystąpienia Heisenberga i nawet był przekonany, że niemiecki uczony nic nie wpomniał o swej ostatniej pracy. Nie ma powodu nie wierzyć Diracowi, który był prawdomówny do bólu. Pracę Heisenberga otrzymał we wrześniu 1925 roku w postaci korekty drukarskiej. Heisenberg wysłał ją do Ralpha Fowlera, ten zaś napisał na odbitce: „Co o tym myślisz?” i przesłał ją swemu doktorantowi Diracowi do Bristolu. Nie był to przypadek, Fowler poznał się na zdolnościach swego milczącego i niezbyt towarzyskiego studenta. Jednak i we wrześniu Dirac nie zrozumiał od razu znaczenia pracy Heisenberga. Stało się tak dopiero po kilku tygodniach. Zaczął wówczas rozmyślać nad tym zagadnieniem i zaproponował własną wersję podejścia do problemu. Werner Heisenberg należał do wąskiej grupy uczonych zajmujących się zagadnieniem budowy atomu, orientował się nie tylko w opublikowanych osiągnięciach, ale brał udział w dyskusjach, wiedział, kto nad czym pracuje – słowem, korzystał w pełni z przynależności do czołówki ówczesnych fizyków. Dirac pracował sam, korzystając jedynie z tego, że Ralph Fowler był dobrze poinformowany w aktualnej sytuacji fizyki kwantowej na kontynencie. Zadziwiające, że potrafił w takich warunkach bardzo wiele osiągnąć w tej i w następnych pracach. Zresztą i później pracował sam, prawdopodobnie inaczej nie potrafił. Niektórzy twierdzą, że Paul Dirac był największym fizykiem XX wieku. Jego prace nigdy wszakże nie były popularne, nie mogły stać się nagłówkami w gazetach, był uczonym budzącym respekt wśród znających się na rzeczy, nie mógł też podobać się dziennikarzom – potrzebującym paru chwytliwych słów i nie mającym czasu, by zgłębić jakąkolwiek sprawę (*).

W pracy Heisenberga Dirac zwrócił przede wszystkim na fakt, że wielkości fizyczne, takie jak pęd czy współrzędna mogą nie być zwykłymi funkcjami czasu, lecz wielkościami, których mnożenie jest nieprzemienne: xy\neq yx. Fizycy wcześniej nie posługiwali się podobnymi pojęciami. Dirac miał naturalną łatwość operowania abstrakcyjnymi pojęciami, nie zaprzątał też sobie zbytnio głowy kwestią interpretacji formalizmu. Zaczął się zastanawiać nad sensem nieprzemienności, czym jest wyrażenie xy-yx? (Obecnie nazywa się ono komutatorem i oznaczane jest [x,y].)
Pewnej październikowej niedzieli, podczas cotygodniowej pieszej wycieczki, Dirac przypomniał sobie, że widział już wyrażenie podobne do komutatora w podręcznikach mechaniki klasycznej. Komutatory przypominały tzw. nawiasy Poissona. Nie był jednak pewien, czy dobrze pamięta. W żadnej z książek, które miał u siebie w pokoju, nie było definicji nawiasów Poissona. Ponieważ w niedzielę biblioteka była zamknięta, nie mógł od razu sprawdzić, czy skojarzenie jest prawidłowe. Wspominał później:

„Noc przeszła mi w męczącym oczekiwaniu, wciąż nie wiedziałem, czy mój pomysł ma jakąkolwiek wartość, ale stopniowo moje przekonanie rosło. Rankiem wybrałem się do biblioteki od razu po jej otwarciu i kiedy znalazłem w Mechanice analitycznej [E.T.] Whittakera definicję nawiasu Poissona, stwierdziłem, że jest dokładnie to, czego mi potrzeba. Był on całkowicie analogiczny do komutatora.

Nawiasy Poissona są zaawansowanym sposobem zapisu równań mechaniki w formalizmie Hamiltona. Stan układu określony jest przez podanie położenia q oraz pędu p (w razie potrzeby wprowadzamy większą liczbę współrzędnych i odpowiadających im pędów). Dynamikę układu, czyli jego ewolucję w czasie, określa funkcja zwana hamiltonianem H. W najprostszym przypadku cząstki o masie m w polu zewnętrznym V(q) hamiltonian jest po prostu sumą energii kinetycznej i potencjalnej:

H(q,p)=\dfrac{p^2}{2m}+V(q).

Znając hamiltonian, możemy napisać równania na pochodne czasowe położenia oraz pędu:

\dot{q}=-\dfrac{\partial H}{\partial q}, \: \dot{p}=\dfrac{\partial H}{\partial p}.

Łatwo zobaczyć, że w najprostszym przypadku równania te są równoważne II zasadzie dynamiki Newtona. Ich zaletą jest ogólność: możemy w rozmaity sposób definiować nowe współrzędne i pędy tak, by postać równań Hamiltona została zachowana. Hamiltonian będzie się przy tym zmieniać, w szczególnie prostych przypadkach może on się nawet redukować do jakiejś bardzo prostej funkcji, np. liniowej w pędzie i w ogóle nie zawierającej współrzędnych. Wtedy rozwiązanie układu równań jest trywialne (oczywiście, nie zawsze łatwo odgadnąć postać takich współrzędnych, które niejako wykonają pracę za nas).

Jeśli f(q,p), g(q,p) są dowolnymi funkcjami położeń i pędów, to ich nawias Poissona ma postać:

\left\{f,g\right\}=\dfrac{\partial f}{\partial q}\dfrac{\partial g}{\partial p}-\dfrac{\partial f}{\partial p}\dfrac{\partial g}{\partial q}.

Łatwo sprawdzić, że nawiasy Poissona są antysymetryczne (zmieniają znak przy przestawieniu funkcji), liniowe, spełniają dla dowolnych trzech funkcji f,g,h warunek Leibniza:

\left\{fg,h\right\}=f\left\{g,h\right\}+\left\{f,h\right\}g.

oraz tożsamość Jacobiego:

\left\{f,\left\{g,h\right\}\right\}+\left\{g,\left\{h,f\right\}\right\}+\left\{h,\left\{f,g\right\}\right\}.

Łatwo sprawdzić, że komutator dwóch wielkości będzie także spełniał powyższe warunki, jeśli tylko mnożenie jest łączne oraz rozdzielne względem dodawania. Analogię tę zauważył Dirac. A więc komutator w mechanice kwantowej odgrywałby rolę analogiczną do nawiasów Poissona.

Definicja Poissona nie była przypadkowa, pochodną każdej funkcji f położenia i pędu po czasie możemy zapisać jako

\dot{f}=\left\{f,H\right\}.

W szczególności, wstawiając f=q oraz f=p, dostaniemy równania ruchu w postaci Hamiltona. Najbardziej podstawowe nawiasy Poissona mają postać:

\left\{ q,q\right\}=\left\{ p,p\right\}=0, \; \left\{q,p\right\}=1.

Znając te podstawowe nawiasy oraz zakładając wyliczone wyżej własności ogólne nawiasów, można łatwo znaleźć nawiasy dla wielomianów zmiennych q,p, a stąd w zasadzie dla każdej rozsądnej funkcji tych zmiennych.

Praca Diraca była czymś więcej niż tylko trafnym zgadywaniem. Obliczył on, że w granicy dużych liczb kwantowych komutator powinien przechodzić w nawias Poissona pomnożony przez stałą:

[f,g] \approx i\hbar \left\{f,g\right\}.

Przyjmując więc odpowiednie wartości komutatorów, mamy pewność, że formalizm kwantowy redukuje się do klasycznej mechaniki. Dirac otrzymał w ten sposób reguły komutacyjne, które stanowią podstawę nowej teorii. W tym samym czasie w Getyndze Born i Jordan otrzymali je także, o czym jednak Dirac nie wiedział. Odpowiedniość nie jest do końca automatyczna, ponieważ gdy zmienne q,p nie komutują, ich kolejność ma znaczenie i temu samemu wyrażeniu klasycznemu odpowiadają rozmaite wyrażenia kwantowe.

Był to debiut Diraca w dziedzinie mechaniki kwantowej. To ta praca wprawiła w osłupienie Maxa Borna: nikomu nieznany student zrobił to samo, co najznakomitsi uczeni z Getyngi i wykazał przy tym samodzielność i dojrzałość. Dopiero w czerwcu następnego roku miał zrobić doktorat.

(*) Ostatnim przykładem takiej dziennikarskiej hucpy jest doniesienie o udowodnieniu hipotezy Riemanna przez sir Michaela Atiyaha. Pisałem o hipotezie Riemanna, jest to największy otwarty problem matematyki. Atiyah był genialnym matematykiem, który zdobył w swoim czasie wszelkie możliwe nagrody, ale obecnie ma 90 lat i od paru lat zasypuje świat niepotwierdzonymi rewelacjami. W dodatku hipoteza Riemanna miałaby być udowodniona wraz z rozważaniami na temat stałej struktury subtelnej – problem w tym, że stała ta bynajmniej nie jest stałą i nic sensownego na jej temat chyba się nie da powiedzieć. Niegdyś Arthur Eddington twierdził, że zna fundamentalne powody, dla których stała ta równa jest dokładnie 1/137. Jednak w rzeczywistości nie jest ona dokładnie równa tej wartości, więc całe to wyjaśnienie nie ma sensu. Obawiam się, że podobnie jest z dowodem Atiyah. Dziennikarze obwieszczają teraz wiadomość o dowodzie, potem będą mieli drugą okazję, aby to sprostować. Jest skrajnie nieprawdopodobne, aby hipotezę Riemanna udowodnić w paru linijkach – jak twierdzi Atiyah. To tak nie działa.

 

 

Werner Heisenberg: pierwsza praca z mechaniki kwantowej (1925)

Dwudziestotrzyletni Heisenberg już od kilku lat był aktywnym uczonym zajmującym się fizyką teoretyczną atomu. Dwa lata wcześniej, po trzech latach studiów, zrobił doktorat w Monachium u Arnolda Sommerfelda, który pierwszy zwrócił uwagę na jego talent. Sommerfeld, aktywny uczestnik w rozwoju nowej dziedziny, miał dar przyciągania zdolnych studentów: czterech jego doktorantów otrzymało Nagrody Nobla, a wielu studentów i stażystów przewijających się przez jego instytut zyskało międzynarodową sławę. W latach dwudziestych Monachium traciło pomału pozycję na rzecz Getyngi, gdzie teoretykom przewodził Max Born. Mechanika kwantowa powstała w Getyndze, a także w Kopenhadze, dokąd Niels Bohr stale zapraszał młodych naukowców z całego świata. Heisenberg zdążył już spędzić długi staż u Bohra, wiosną roku 1925 pracowali tam intensywnie wraz ze starszym o półtora roku Wolfgangiem Paulim, który już wtedy stał się dla Heisenberga punktem odniesienia. Pauli zaczął pracę naukową zaraz po maturze publikacją na temat ogólnej teorii względności. Doktorat u Sommerfelda zrobił także po trzech latach studiów – w najkrótszym prawnie dopuszczalnym terminie. Napisał też w tym czasie długi, ponaddwustustronicowy artykuł przeglądowy na temat teorii względności, w którym omówiona została krytycznie cała literatura przedmiotu. Niezwykle utalentowany, Pauli znany był też z bezwzględnego atakowania prac, które uważał za bezwartościowe. W późniejszych latach słynne było jego powiedzenie o jakiejś słabej pracy: „to nawet nie jest błędne”.

Heisenberg w 1924 roku, podczas wykładu habilitacyjnego w Getyndze.

Chłopięco wyglądający Heisenberg zaangażowany był w ruch skautingowy, spędzał sporo czasu na wycieczkach z młodymi ludźmi. Panowała tam beztroska atmosfera braterstwa i wspólnego przeżywania przygód. Była to jednak organizacja stawiająca sobie cele paramilitarne. Werner Heisenberg wraz z kolegami odwiedzali np. regiony zamieszkane przez Niemców, a pozostające poza granicami Rzeszy, jak np. Górny Tyrol, Finlandia, gdzie było trochę niemieckich emigrantów, a także niektóre tereny Węgier i Polski. W przypadku Heisenberga chodziło chyba raczej o młodzieńczą przygodę, a także odskocznię od intensywnej pracy naukowej. Nie był zwolennikiem skrajnej prawicy, starał się być apolityczny, choć można o nim chyba powiedzieć, że był nacjonalistą. Podczas II wojny światowej nie widział nic niewłaściwego w wizytach w okupowanej Kopenhadze czy Krakowie. Zamiłowanie Heisenberga do spędzania czasu  wyłącznie w męskim towarzystwie wydało się potem podejrzane, gdy jego biografii zaczęło przyglądać się SS. Nie doszukali się jednak niczego nieobyczajnego, do tej pory zresztą uczony miał już żonę i powiększającą się gromadkę dzieci.

Niels Bohr stał się dla młodego Wernera nie tylko mentorem, ale także wzorem i duchowym ojcem. Z prawdziwym ojcem Augustem Heisenbergiem, profesorem bizantynistyki w Monachium, Werner miał stosunki dość napięte. Jak się zdaje, ojciec nie wierzył w jego talent, a może w ogóle w fizykę teoretyczną, która wciąż uchodziła za coś mniej solidnego niż prowadzenie eksperymentów. Werner jako nastolatek chciał zostać pianistą, fizykę wybrał dość późno. August źle reagował na złe wieści o synu, kiedy np. dowiedział się, że Werner ledwo zdał egzamin doktorski. Egzaminatorów było dwóch: teoretyk Sommerfeld oraz eksperymentator Willy Wien. Ten drugi szybko wykrył braki w wiedzy młodego człowieka, który nie potrafił obliczyć zdolności rozdzielczej mikroskopu ani powiedzieć, jak działa ogniwo elektryczne (cztery lata później mikroskop pojawi się w pracy Heisenberga na temat zasady nieoznaczoności). Wien dopiero po dyskusji z Sommerfeldem zgodził się przepuścić Heisenberga, ale jego ocena końcowa była słaba: cum laude (można było otrzymać doktorat summa cum laude, magno cum laude, cum laude i bez żadnego dodatkowego określenia). Wien w senacie uniwersytetu spotykał się z profesorem Heisenbergiem i nie omieszkał się poskarżyć. Werner potrzebował pomocy finansowej, ponieważ nie od razu uzyskał płatną posadę. Ojciec napisał do Borna, pytając o perspektywy naukowe syna. Prosił też Jamesa Francka, eksperymentatora z Getyngi, przyszłego noblistę, aby umożliwił Wernerowi pracę w swoim laboratorium. Franck się zgodził, ale niewiele z tego wyszło i Werner wrócił do pracy teoretyka. Bohr, skracający dystans, biorący udział we wspólnych wycieczkach z młodymi ludźmi, a także zapraszający ich do domu, stał się Heisenbergowi bardzo bliski zarówno pod względem naukowym, jak i prywatnym.

Co ciekawe, najważniejszą swą pracę naukową Heisenberg napisał z dala od Bohra i Pauliego, nie zwierzając się także Maksowi Bornowi. Jak się zdaje, Bohr przy całej swej życzliwości wywierał silną presję na otoczenie, co nie zawsze służyło młodszym, mniej asertywnym uczonym. W kwietniu 1925 roku Heisenberg dostał silnego ataku kataru siennego i wyjechał na wyspę Helgoland, gdzie nie było roślin i w związku z tym pyłku w powietrzu. Tam zdał sobie sprawę, że jedna z ostatnich prac Bohra jest błędna (chodziło w niej o podważenie zasady zachowania energii, tzw. praca BKS). Odbyło się to w scenerii godnej obrazów Caspara Friedricha, Werner spędził noc duchowych zmagań na skalistym wybrzeżu, czekając na wschód słońca. Udało mu się znaleźć nową metodę postępowania, zastosował ją do prostych przypadków. Nie był jednak pewny, czy jest na dobrym tropie. Po powrocie z Helgolandu wręczył gotową pracę Bornowi, pytając o opinię. Do ojca pisał w tym czasie: „Moja własna praca nie idzie w tej chwili najlepiej. Nie uzyskuję zbyt wielu rezultatów i nie wiem, czy w tym semestrze wyjdzie z tego następny artykuł”.

Max Born zadecydował, że pracę trzeba opublikować, mimo że nie rozumiał jej do końca. Pisał w lipcu 1925 roku do Alberta Einsteina: „Moi młodzi ludzie: [Werner] Heisenberg, [Pascual] Jordan, [Friedrich] Hund są znakomici. Muszę się czasem poważnie wysilić, aby nadążyć za ich rozważaniami. Wprost bajecznie opanowali tak zwaną zoologię termów. Najnowsza praca Heisenberga, która się niebawem ukaże, wygląda bardzo mistycznie, ale jest prawdziwa i głęboka”. Heisenberg po jej napisaniu wyjechał do Cambridge, a później do Kopenhagi. W tym czasie Born wraz z Jordanem starali się zrozumieć, co właściwie Heisenberg zaproponował. Okazało się, że jest to decydujący krok w oderwaniu się od tzw. starej teorii kwantów, czyli fizyki klasycznej z kwantowymi dodatkami, jak model atomu Bohra – gdzie orbity elektronów są obliczane klasycznie, tak jak orbity planet, a do tego dokłada się warunek kwantowania, mówiący, jakie orbity są dozwolone. Problemem tego modelu i jego późniejszych coraz bardziej wyrafinowanych matematycznie ulepszeń była wewnętrzna sprzeczność: w fizyce klasycznej niemożliwe są stabilne orbity elektronów. Cały obraz atomu jako kłębowiska orbit elektronowych jest fałszywy. Stawało się to coraz bardziej widoczne przed rokiem 1925.

Heisenberg postanowił z konieczności zrobić cnotę: Nie powinniśmy w ogóle wyobrażać sobie żadnych orbit, nikt nie zaobserwował elektronu na orbicie i nie ma sensu mówić tutaj o ruchu w sposób klasyczny. Należy ograniczyć się do wielkości, które są możliwe do zaobserwowania w doświadczeniach, porzucając spekulacje na temat ruchu elektronu w atomie. Trzeba zmienić fizykę na poziomie kinematyki: nie można opisywać ruchu elektronu tak, jak ruchu kamienia czy innego obiektu makroskopowego. Powoływał się przy tym na podejście Einsteina, który zwracał w teorii względności uwagę, że aby np. mówić o równoczesności, należy podać metodę eksperymentalnego rozstrzygnięcia, czy dane zdarzenia są równoczesne. Metodologia tego rodzaju niekoniecznie sprawdza się w budowaniu teorii fizycznych, ale Heisenbergowi w tamtym momencie pomogła.

Podstawową informacją na temat atomów były linie widmowe. Atom promieniuje fale elektromagnetyczne o pewnych określonych częstościach. Najprostszym układem, który wysyła taką falę, jest drgający elektron. Aby mieć układ drgający należy wyobrazić sobie, że na elektron działa siła zależna od wychylenia, tak jakby nasz elektron był na sprężynie. Jednowymiarowy układ tego rodzaju jest najprostszym oscylatorem (masa na sprężynie, innym przykładem jest wahadło). Do opisania fal emitowanych przez oscylatory atomowe w przypadku klasycznym możemy zastosować analizę Fouriera. Współrzędna naszego oscylatora (o częstości kołowej \omega) jest funkcją okresową, można ją więc przedstawić jako sumę sinusów i cosinusów:

{\displaystyle x(t)=\sum_{n=0}^{\infty}(A_n\cos n\omega t+B_n \sin\omega t)}.

Dwa ciągi liczb rzeczywistych A_n, B_n określają jednoznacznie funkcję. Możemy także zapisać tę sumę krócej w postaci zespolonej:

{\displaystyle x(t)=\sum_{n=-\infty}^{+\infty}x(n) e^{i\omega n t}, \mbox{ (*)}}

gdzie korzystamy ze wzoru Eulera: e^{iz}=\cos z+i\sin z. Z punktu widzenia fizyki ważna jest nie tylko częstość, ale także amplituda drgań. Wypromieniowywana przez oscylator moc jest proporcjonalna do kwadratu amplitudy, czyli sumy |x(n)|^2.

Heisenberg uznał, że zamiast budować model atomu, w którym elektron jakoś się porusza, należy skupić się na wielkościach możliwych do zaobserwowania, czyli częstościach i kwadratach amplitudy.

Przeanalizował następnie, w jaki sposób buduje się kwadrat x(t). Zgodnie z naszym rozwinięciem w szereg Fouriera kwadrat funkcji będzie równy

x^2(t)=\sum_{n}\sum_{m}x(n)x(m)e^{i\omega(n+m)t}.

Wyrażenie to ma postać rozwinięcia Fouriera, jeśli wprowadzimy nową nazwę indeksu p=n+m, to nasz kwadrat można zapisać następująco:

x^2=\sum_{p} e^{i\omega pt}\left(\sum_{n}x(n)x(p-n)\right).

Wyrażenie w nawiasie mówi nam, jak otrzymać rozwinięcie fourierowskie kwadratu funkcji:

x^2(p)=\sum_{n}x(n)x(p-n).

Inaczej mówiąc, aby otrzymać wyraz o częstości \omega p, musimy wysumować wszystkie iloczyny x(n), w których suma częstości jest równa \omega p.

Następnie, i to był najważniejszy pomysł pracy, zastanowił się Heisenberg nad tym, co powinno zastąpić rozwinięcie fourierowskie w sytuacji kwantowej. Pojawia się wtedy oczywiście wiele różnych częstości, nie można przyjąć, że są one wielokrotnością jednej tylko częstości \omega. Co więcej, częstości zależą teraz od dwóch wskaźników:

\omega_{mn}=\dfrac{E_{m}-E_{n}}{\hbar}, \mbox{  (**)}

jest to warunek Bohra, będący w istocie zasadą zachowania energii (\hbar jest stałą Plancka podzieloną przez 2\pi). Można więc uznać, że teraz potrzebujemy także amplitud zależnych od dwóch wskaźników. Współrzędna x naszego oscylatora powinna być jakoś reprezentowana przez zbiór owych amplitud:

x \rightarrow \left\{ x_{mn}e^{i\omega_{mn} t} \right\} .

Nie powinniśmy teraz liczyć na to, że x(t) jest sumą takich wyrazów, raczej mówimy o pewnym zbiorze, który reprezentuje współrzędną w mechanice kwantowej, Heisenberg był tu nieprecyzyjny, bo prawdopodobnie nie potrafił lepiej tego wyrazić.

Czym będzie w takim razie kwadrat współrzędnej albo – co ciekawsze – iloczyn dwóch współrzędnych x oraz y? Mówimy o tym samym układzie, którego zestaw energii, a więc i częstości, jest ustalony. Jeśli także y dane będzie podobnym zestawem co x powyżej, to iloczynowi powinien odpowiadać zbiór

xy \rightarrow \left\{ (xy)_{mp}e^{i\omega_{mp}t} \right\},

gdzie

\boxed{(xy)_{mp}=\sum_{n} x_{mn}y_{np}.}

Zauważmy, że definicja ta daje prawidłowy czynnik wykładniczy:

e^{i\omega_{mp}t}=e^{i\omega_{mn}t}e^{i\omega_{np}t},

gdyż korzystając z (**), otrzymujemy:

\omega_{mp}=\omega_{mn}+\omega_{np}.

Definicja z ramki okazała się najważniejszym wynikiem tej przełomowej pracy Heisenberga. Zauważył on natychmiast, że przy takiej definicji xy\neq yx, czyli mnożenie dwóch wielkości będzie na ogół nieprzemienne.

Potrzebował jeszcze warunku kwantowania, uzyskał go w dość skomplikowanej postaci. Następnie zastosował wynaleziony formalizm do przypadku oscylatora anharmonicznego, tzn. gdy siła oprócz składnika proporcjonalnego do wychylenia zawiera także poprawkę kwadratową w wychyleniu. Nie będziemy powtarzać jego rachunków, pokażemy tylko, co stało się w następnym miesiącu.

Otóż w czasie gdy Heisenberg wojażował, Born wraz z Jordanem (młodszym o rok od Heisenberga, a więc mającym dwadzieścia dwa lata!) przyjrzeli się jego pracy z bardziej matematycznego punktu widzenia. Max Born skojarzył po kilku dniach, że widział już kiedyś takie mnożenie jak w ramce. Było to jeszcze na studiach we Wrocławiu, a chodziło o mnożenie macierzy. Wielkości Heisenberga były po prostu macierzami. Zauważyli też obaj, że ów skomplikowany warunek Heisenberga można macierzowo zapisać jako

\boxed{xp-px=i\hbar \mathbf{I},}

gdzie x,p były macierzami położenia i pędu, a \mathbf{I} macierzą jednostkową. Wielkości kwantowomechaniczne były więc macierzami i to takimi, które nie komutują. Od komutowania dzieli je niewiele, bo tylko stała Plancka – znaczy to, że w wielu sytuacjach różnica ta będzie nie do wykrycia, gdyż stała Plancka jest mała w zwykłych jednostkach (ujmując to inaczej, to nasze, dostosowane do ludzkiego ciała, jednostki są ogromne w skali atomowej, bo my sami składamy się z ogromnej liczby atomów).

Trudno dziś uwierzyć, że Max Born, matematyk z wykształcenia, dawny asystent Hermanna Minkowskiego, musiał wygrzebywać z zakamarków pamięci definicję mnożenia macierzy. Algebra liniowa przez ostatnie sto lat stała się dziedziną bardzo podstawową i uczy się jej powszechnie, nie tylko ze względu na mechanikę kwantową, ale także różne bardziej przyziemne zastosowania, np. w statystyce.

Najprostszym zastosowaniem mechaniki macierzowej jest oscylator harmoniczny. Jego energia ma postać:

H=\dfrac{1}{2}m\dot{x}^2+\dfrac{1}{2}m\omega^2 x^2,

(gdzie m to masa oscylatora), a równanie ruchu (odpowiednik równania Newtona):

\ddot{x}+\omega^2 x=0.

Wyrażenia mają tę samą postać co w mechanice klasycznej (kropki oznaczają pochodną po czasie), ale wszystkie wielkości x,\dot{x},\ddot{x} są teraz macierzami. Nietrudno znaleźć postać macierzy x_{mn}. Można wybrać ją jako macierz symetryczną: x_{mn}=x_{nm} i jedyne nieznikające wyrazy równe są

x_{n,n-1}=x_{n-1,n}=\sqrt{\dfrac{n\hbar}{2m\omega}}.

Macierz energii (zwana hamiltonianem) staje się diagonalna, tzn. nie znikają jedynie wyrazy z jednakowymi wskaźnikami:

H_{nn}=\hbar\omega\left(n+\dfrac{1}{2}\right), \mbox{ gdzie }\, n=0,1,2,\ldots.

Nasze macierze są nieskończone, gdyż oscylator ma nieskończenie wiele stanów wzbudzonych. Całe obliczenie znaleźć można w klasycznej książce L.D. Landaua i E.M. Lifszyca, Mechanika kwantowa.

Mechanikę kwantową rozwijali ludzie młodzi pod kierunkiem starszych oraz Erwin Schrödinger. Isnieje dość zabawne zdjęcie z uroczystości noblowskich w roku 1933, gdy twórcy mechaniki kwantowej odbierali swoje nagrody. Mamy tam Diraca i Heisenberga z matkami oraz Schrödingera z żoną. Ten ostatni, już po czterdziestce, mógł być niemalże ojcem młodszych laureatów.

Warto dodać może parę słów o Pacualu Jordanie. Był potomkiem hiszpańskiego oficera wojsk napoleońskich i zawziętym nacjonalistą, a także nazistą. W roku 1933 Born z racji żydowskiego pochodzenia był już na emigracji, Getynga wyglądała zupełnie inaczej. Jordan, który brał od początku udział w powstaniu mechaniki kwantowej, współtworzył także równolegle do Paula Diraca kwantową teorię pola, czyli relatywistyczną mechanikę kwantową. Gdyby nie nazistowskie sympatie, z pewnością zostałby laureatem Nagrody Nobla. Z czysto naukowego punktu widzenia należała mu się ona, choć trudno nie podzielać wątpliwości szwedzkiego komitetu, że przyznanie nagrody w takich okolicznościach byłoby złym sygnałem dla świata.

 

 

P.A.M. Dirac i jego równanie (1927-1928)

Paul Dirac znany był z powściągliwej małomówności i z tego, że nie wdaje się w grzecznościowe pogaduszki. Richard Feynman opowiadał, że kiedy spotkał po raz pierwszy Paula Diraca na jakiejś konferencji, to po długiej chwili milczenia starszy uczony rzekł: „Mam równanie. Czy pan także?”

Rozmaite wypowiedzi Diraca cytowane są często jako żarty, gdyż brzmią z pozoru absurdalnie. Paul Adrien Maurice Dirac sprawiał wrażenie postaci beckettowskiej: chudy, z długimi kończynami i wielkimi stopami, nie okazujący emocji, porozumiewający się pełnymi zdaniami (ponieważ nie wolno zacząć zdania, jeśli się nie wie, jak je zakończyć), myślący w kategoriach logicznych i matematycznych, a nie emocjonalnych czy etycznych. Jego przyjaciel Charles Galton Darwin, fizyk, wnuk twórcy teorii ewolucji, dopiero po kilku latach znajomości z Dirakiem odważył się zapytać, co właściwie znaczą inicjały P.A.M. przed jego nazwiskiem. Po przeczytaniu Zbrodni i kary Dostojewskiego Dirac miał tylko jedną uwagę, i to raczej techniczną niż etyczną czy psychologiczną: otóż w książce słońce wschodzi dwukrotnie tego samego dnia.

Anegdota z równaniem mówi sporo o obu rozmówcach. Dirac cenił konkrety, lubił np. słuchać wielogodzinnych monologów Nielsa Bohra, ale wątpił, czy coś z nich wyniósł, ponieważ prawie wcale nie było w nich równań. Toteż cenił sobie niewątpliwie fakt, iż odkrył jedno z fundamentalnych równań przyrody, które stosuje się do wszystkich cząstek o spinie ½: a więc elektronów, protonów, nieodkrytych jeszcze wtedy neutronów oraz kwarków, z których nukleony się składają. Feynman pozostawił po sobie wprawdzie całki Feynmana, diagramy Feynmana i wiele innych osiągnięć, nie odkrył jednak nigdy żadnego fundamentalnego prawa przyrody i jak się zdaje jego ambicja cierpiała z tego powodu.

Jesienią 1927 roku Paul Dirac, młodzieniec zaledwie dwudziestopięcioletni, zaproszony został na Kongres Solvaya do Brukseli. Była to konferencja bardzo elitarna, gromadząca obecne i przyszłe znakomitości naukowe. Na pamiątkowym zdjęciu siedzi w samym środku za Einsteinem, wiemy, że bardzo był dumny z tej fotografii i posłał ją na swój macierzysty uniwersytet w Bristolu. Niewykluczone, że specjalnie usiadł za Einsteinem, jego teorię względności podziwiał bowiem od lat i poznał, zanim jeszcze zajął się fizyką atomową – jak to wtedy mówiono, czyli fizyką mikroświata. Najważniejsze postacie na tym zdjęciu to Niels Bohr i Max Born, przywódcy i patroni całego ruchu kwantowej odnowy w fizyce. W Kopenhadze i Getyndze tworzyły się zasady nowej mechaniki. Zaczęła ją praca Wernera Heisenberga z 1925 roku. Niedługo później dołączyli Born i Pascual Jordan.

Od jesieni 1925 roku mechanikę kwantową współtworzył też Paul Dirac. Był studentem Ralpha Fowlera w Cambridge. Fowler rozpoznał jego niebywały talent: młody inżynier elektryk i absolwent studiów drugiego stopnia z matematyki na uniwersytecie w Bristolu dostał stypendium do Cambridge i błyskawicznie uzupełnił braki z fizyki, nie tylko najnowszej, nie znał np. dotąd równań Maxwella. Fowler miał znakomite kontakty i chyba one przydały się Diracowi najbardziej. Młody uczony otrzymał od niego jeszcze przed drukiem korekty artykułu Heisenberga i zrozumiał ich znaczenie. Kiedy niedługo później opublikował swoją pierwszą pracę na temat mechaniki kwantowej, Max Born zdumiony był, że pojawił się ktoś spoza wąskiej grupy znanych mu ludzi pracujących w tej dziedzinie i w dodatku jego osiągnięcia są porównywalne do tego, co udało się stworzyć w Getyndze i Kopenhadze. Dirac, równieśnik Jordana, miał dwadzieścia trzy lata, pół roku mniej niż Heisenberg i dwa lata mniej niż Wolfgang Pauli. Pracował nad doktoratem. Dzięki Fowlerowi jego prace szybko się ukazywały w „Proceedings of the Royal Society”, a czas bardzo się wtedy liczył. Dirac zaczął korespondować z Hiesenbergiem, który od razu poczuł ogromny respekt do brytyjskiego kolegi. Po doktoracie wyjechał do Kopenhagi i Getyngi. Poznał wielu fizyków, ale nie zmienił swej metody pracy: przez sześć dni w tygodniu intensywne myślenie od rana do obiadu, w niedziele piesze wycieczki. Nie współpracował też z nikim, przez całe życie pracował sam, uważając, że tak jest najlepiej, bo ważne idee są zawsze dziełem konkretnego człowieka, nie zespołu.

Tak więc po dwóch latach swej naukowej kariery Dirac znalazł się w elitarnym gronie na Konferencji Solvaya. Przeszła ona do historii za sprawą dyskusji Bohra z Einsteinem, który nie potrafił się pogodzić z probabilistycznym charakterem nowej mechaniki – można w niej obliczać i przewidywać jedynie prawdopodobieństwa zdarzeń. To w trakcie jednej z takich dyskusji padły słynne słowa: „Bóg nie gra w kości”. W mechanice kwantowej zrezygnować trzeba także z pełnej wiedzy o zjawiskach w mikroświecie: im dokładniej zmierzymy położenie elektronu, tym mniej będziemy wiedzieli na temat jego pędu. Dirac zupełnie nie interesował się sporami filozoficznymi na temat podstaw mechaniki kwantowej. Dla niego była to piękna teoria, do której zbudowania się przyczynił, fascynowała go matematyczna elegancja całego obrazu, napisał zresztą niedługo później słynną książkę The Principles of Quantum Mechanics, przedstawiającą całą tę konstrukcję w niezrównany klarowny, choć też niezwykle zwięzły sposób.

Jesienią 1927 roku Paul Dirac pragnął odkryć swoje równanie. Chodziło o rozwiązanie zagadnienia elektronu w sposób zgodny z teorią względności Einsteina. Z problemem tym pierwszy zetknął się w roku 1925 Erwin Schrödinger, drugi outsider fizyki kwantowej, pracujący w Zurychu. Wiadomo było, że cząstki takie jak elektron związane są z pewnymi wielkościami falowymi. Schrödinger przyjął, że stan elektronu opisywany jest pewną funkcją położenia i czasu \psi(\vec{r},t). Funkcja ta spełniać musi równanie o postaci

i\hbar \dfrac{\partial\psi}{\partial t}=H\psi \mbox{ (*)},

gdzie H jest pewnym operatorem działającym na funkcję. Najłatwiej wyjaśnić to na przykładach. Operatorem takim jest np. mnożenie \psi przez którąś ze współrzędnych, np. x. Wynikiem działania tego operatora jest nowa funkcja równa x\psi. Innym operatorem jest różniczkowanie, np. po zmiennej x. Wynikiem działania tego operatora jest wówczas \frac{\partial \psi}{\partial x}. Innym przykładem operatora jest pochodna po czasie z lewej strony równania Schrödingera. Za każdym razem tworzymy z wyjściowej funkcji \psi jakąś nową funkcję. Operator H zwany hamiltonianem (albo operatorem Hamiltona) jest kwantową wersją wyrażenia na energię cząstki. Jeśli np. energia cząstki o masie m składa się z energii kinetycznej i potencjalnej V(\vec{x}), to możemy ją zapisać w postaci

E=\dfrac{{\vec{p}\,}^2}{2m}+V(\vec{x}).

Kwantowy operator Hamiltona będzie wówczas równy

H=-\dfrac{\hbar^2}{2m}\left(\dfrac{\partial^2}{\partial x^2}+\dfrac{\partial^2}{\partial y^2}+\dfrac{\partial^2}{\partial z^2}\right)+V(\vec{r})\equiv -\dfrac{\hbar^2}{2m}\Delta+V(\vec{r}).

Operator V(\vec{r}) jest po prostu operatorem mnożenia, energię kinetyczną konstruujemy z pędu za pomocą podstawienia

p_x\rightarrow -i\hbar\dfrac{\partial}{\partial x}

i analogicznie dla pozostałych współrzędnych. Równanie Schrödingera (*) jest podstawowym prawem mechaniki kwantowej. Rozwiązując je, dowiadujemy się, w jaki spośob zmienia się funkcja falowa, a więc stan naszego elektronu. Najprostszym możliwym rozwiązaniem tego równania w przypadku cząstki swobodnej (tzn. gdy V=0) jest funkcja opisującą falę:

\psi=A \exp{\frac{i}{\hbar}(\vec{p}\,\vec{r}-Et)}, \mbox{ (**)}

gdzie p_x, p_y, p_x oraz E są parametrami liczbowymi. Łatwo sprawdzić, że różniczkowanie tej funkcji sprowadza się do mnożenia przez odpowiedni czynnik i ostatecznie równanie Schrödingera da nam warunek:

E=\dfrac{\vec{p}\,^2}{2m},

jak powinno być dla cząstki swobodnej i parametry są składowymi pędu oraz energią cząstki. Zbudowaliśmy stan o określonej energii i jednocześnie określonym pędzie. Jasne jest, że przyjmujemy tu energię kinetyczną w postaci newtonowskiej, a więc nierelatywistycznej.

Erwin Schrödinger początkowo poszukiwał równania relatywistycznego dla swojej funkcji \psi i nawet takie równanie znalazł. Ma ono następującą postać w przypadku swobodnym:

\dfrac{1}{c^2}\dfrac{\partial^2 \psi}{\partial {t}^2}-\Delta \psi+\left(\dfrac{mc}{\hbar}\right)^2 \psi=0.

Podstawiając do niego funkcję (**), otrzymamy równanie

E^2-p^2c^2=m^2c^4,

a więc prawidłowy związek energii i pędu dla cząstki o masie m w teorii względności. Oczywiście równanie dla cząstki swobodnej niewiele znaczy, interesujące są przypadki, gdy mamy pewien potencjał V(\vec{r}), np. gdy elektron porusza się w polu elektrostatycznym nieruchomego protonu. Jest to prawie atom wodoru (prawie – ponieważ w prawdziwym atomie wodoru proton, choć znacznie masywniejszy, może też się poruszać). Nietrudno równanie Kleina-Gordona rozszerzyć tak, aby zawierało zewnętrzne pole elektromagnetyczne. Wiadomo było jednak, że elektron ma spin, co sprawia, że jego stany są podwojone i np. w polu magnetycznym ta różnica się ujawnia jako rozszczepienie linii widmowych (efekt Zeemana). Czemu więc Schrödinger nie opublikował tego równania, które dziś nazywa się równaniem Kleina-Gordona? Schrödinger uznał, że trzeba ograniczyć się na początek do równania nierelatywistycznego i opublikował równanie (*) zastosowane m.in. do atomu wodoru. Nie jest jasne, czy chodziło mu o brak spinu, czy może dostrzegł inne trudności z rozwiązaniami równania Kleina-Gordona.

Z punktu widzenia Diraca równanie Kleina-Gordona nie było rozwiązaniem problemu elektronu. Owszem, relatywistyczny związek między energią i pędem cząstki był spełniony, ale równanie zawierało drugą pochodną czasową, a nie pierwszą jak równanie Schrödingera. Zdaniem Diraca równanie podstawowe powinno być pierwszego rzędu w czasie, tak aby wartości funkcji falowej w danej chwili determinowały jej wartości w przyszłości (w przypadku równania drugiego rzędu należy znać jeszcze wartości pochodnych czasowych). Jak pogodzić to z relatywistyczną postacią energii? Hamiltonian powinien mieć postać:

H=\sqrt{-c^2\hbar^2 \Delta+m^2c^4},

Oczywiście, wyciąganie pierwiastka kwadratowego z laplasjanu nie jest operacją standardową. Inżyniersko nastawiony do matematyki Paul Dirac, nieodrodny spadkobierca Olivera Heaviside’a, nie zamierzał się poddawać z tak trywialnego powodu. Równanie dla cząstki swobodnej powinno być pierwszego rzędu w czasie, w teorii względności znaczy to, że powinno być także pierwszego rzędu w pochodnych przestrzennych – poniważ przestrzeń i czas są symetryczne u Einsteina. Należy więc szukać równania postaci

i\hbar \gamma^{\mu}\dfrac{\partial \psi}{\partial x^{\mu}}=mc\psi, \mbox{ (***)}

gdzie sumujemy po wskaźnikach czasoprzestrzennych \mu=0,1,2,3 oraz x^0=ct. Żądamy, aby \gamma^{\mu} nie zależały od czasu ani współrzędnych przestrzennych, a także aby dwukrotne zastosowanie operatora po lewej stronie dało nam m^2, jak w równaniu Kleina-Gordona – wtedy relatywistyczny związek energii i pędu będzie spełniony. Łatwo zauważyć, że stanie się tak, jeśli

\gamma^{\mu}\gamma^{\nu}+\gamma^{\nu}\gamma^{\mu}=2g^{\mu\nu}=2\cdot diag(1,-1-1-1),

gdzie g^{\mu\nu} jest metryką czasoprzestrzeni Minkowskiego. Jakimi obiektami muszą być owe cztery \gamma^{\mu}? Mają one antykomutować ze sobą, czyli ich iloczyn zmienia znak przy przestawieniu, a kwadraty mają być równe \pm 1. Dirac odkrył, że \gamma^{\mu} muszą być macierzami 4×4, a więc funkcja \psi musi zawierać cztery składowe:

\psi=\begin{pmatrix} \psi_1\\ \psi_2 \\ \psi_3 \\ \psi_4 \end{pmatrix}.

Inaczej mówiąc, równanie (***) jest układem czterech równań liniowych o stałych współczynnikach. Zaraz po Nowym Roku 1928 Ralph Fowler przekazał pracę do druku i miesiąc później się ukazała. Po miesiącu Dirac uzupełnił ją o drugą część. Mógł być teraz pewien: miał swoje równanie.

Dirac zaczął sprawdzać konsekwencje odkrytego równania. Okazało się, że zawiera ono informację o stanach spinowych elektronu. Co więcej, spinowy moment pędu okazywał się równy \hbar/2, a moment magnetyczny równy dokładnie magnetonowi Bohra. Znaczyło to, że w tym przypadku stosunek momentu magnetycznego do momentu pędu jest dwukrotnie większy niż dla orbitalnego momentu pędu, co potwierdzały eksperymenty (Nb. w roku 1915 Albert Einstein i Wander de Haas, zięć Hendrika Lorentza, przegapili okazję do pierwszorzędnego odkrycia doświadczalnego, zmierzyli bowiem ten stosunek i wyszedł im taki, jak oczekiwali, ale dwa razy mniejszy niż w rzeczywistości). Równanie elektronu Diraca w polu kulombowskim odtwarzało znane wyniki dla energii uzyskane wcześniej przez Arnolda Sommerfelda za pomocą relatywistycznej wersji modelu Bohra (model Bohra-Sommerfelda).

Co z czterema składowymi funkcji falowej? Potrzebne były dwie składowe do opisania spinu, ale cztery? Równanie Diraca zawiera rozwiązania zarówno dla energii dodatniej +\sqrt{p^2c^2+m^2c^4}, jak i -\sqrt{p^2c^2+m^2c^4}. Paul Dirac zauważył też, że rozwiązania te stwarzają realny problem: energia elektronu nie jest bowiem ograniczona z dołu, a to w przypadku układu kwantowego znaczy, że prędzej czy później powinien on przejść do stanu o niższej energii. W mechanice kwantowej panuje skrajny liberalizm: wszystko, co nie jest zabronione, jest dozwolone i się kiedyś zdarzy. Jedynym wyjściem wydawało się znaleźć jakiś zakaz, który musiałby być naruszany podczas takiego przejścia. Dwa lata później Dirac zaproponował, że stany o ujemnej energii są zajęte, więc ponieważ elektrony podlegają zakazowi Pauliego, zwykle nie ma takich przejść. Możliwe jest wzbudzenie elektronu z ujemną energią do stanu z energią dodatnią, pozostawi on dziurę, która będzie się zachowywać jak cząstka o takiej samej masie, lecz dodatnia. Otrzymujemy w ten sposób parę elektron i antyelektron. W 1932 roku cząstka taka została odkryta i nazwana pozytonem. Nic więc dziwnego, że już w roku następnym P.A.M. Dirac otrzymał Nagrodę Nobla (po połowie ze Schrödingerem). Inne wyjaśnienie dla rozwiązań o energii ujemnej podał później Richard Feynman: u niego pozytony są elektronami, które poruszają się wstecz w czasie, zamiast energii zmienia się znak czasu. Współczesna kwantowa teoria pola nie potrzebuje takich obrazów, wprowadza się w niej przestrzeń stanów bogatszą niż w mechanice kwantowej, gdyż pojawia się możliwość procesów kreacji oraz anihliacji par. Równanie Diraca obowiązuje nadal, lecz zamiast funkcji falowej mamy operator pola, obiekt jeszcze nieco bardziej abstrakcyjny.

Znakomitą biografię Diraca napisał Graham Farmelo, została ona jednak całkiem popsuta w polskim przekładzie, który językowo jest poniżej wszelkiej krytyki. Szkoda, bo pewnie nieprędko pojawi się drugie wydanie.

Jak gęsta może być materia? Białe karły, Stoner i Chandrasekhar (1930-1931)

31 lipca 1930 roku z Mumbaju odpłynął parowiec „Lloyd Triestino”. Wśród pasażerów znajdował się dziewiętnastoletni Subrahmanyan Chandrasekhar, udający się do Anglii stypendysta rządu indyjskiego. Zdążył on opublikować już pierwszą pracę na temat statystyk kwantowych, dwa lata wcześniej dowiedział się od przebywającego gościnnie w Indiach Arnolda Sommerfelda, że całej fizyki mikroświata należy nauczyć się na nowo i wszystkie podręczniki sprzed kilku lat są już nieaktualne. Zaczął więc z zapałem czytać artykuły dotyczące mechaniki kwantowej i pierwszą swą pracę wysłał do Anglii do Ralpha Fowlera z Cambridge. Wiedział o nim tylko tyle, że uczony ten zaproponował kwantowe wyjaśnienie problemu tzw. białych karłów – niewielkich gwiazd zbudowanych z niezwykle gęstej materii nawet 100 000 razy gęstszej od wody. Astronomowie, którzy uzyskiwali tak wysokie szacowania gęstości, nie potrafili zrazu w nie uwierzyć, sądząc, że w obliczenia musiał wkraść się jakiś niezidentyfikowany błąd. W astronomii dość często się zdarza, że trzeba rewidować dotychczasowe założenia i wyniki. Podczas podróży Chandrasekhar unikał balów i wieczorków organizowanych na statku, był zresztą wegetarianinem i nie brał do ust wielu podawanych potraw. Pracował. Jego obliczenia wskazywały, że białe karły nie mogą być zbyt masywne, gdyż nie będą stabilne. Wynik ten stał w sprzeczności z dotychczasową wiedzą i Chandrasekhar miał stoczyć trudną wieloletnią walkę o uznanie prawdziwości jego obliczeń. Białe karły są ostatnim stadium ewolucji gwiazd i nie mogą być bardziej masywne niż 1,4 masy Słońca. Co w takim razie dzieje się z gwiazdami pięcio-, dziesięcio- i dwudziestokrotnie bardziej masywnymi? Czy jest możliwe, że pozbywają się one w jakiś sposób niemal całej swej masy, aby osiągnąć w końcu stadium białego karła? Jeśli tak, to czy może się to odbywać w długim czasie w sposób spokojny, czy też należy spodziewać się eksplozji? Wynik Chandrasekhara miał przełomowe znaczenie, bo wskazywał, że grawitacja może stać się siłą, która dosłownie kruszy materię. O jego wadze świadczy fakt, iż pół wieku później za tę pracę indyjski uczony otrzymał Nagrodę Nobla. Spędził długie i twórcze życie naukowe, stając się jednym z najbardziej znanych astrofizyków dwudziestego wieku, a jednak właśnie to młodzieńcze osiągnięcie wydawało się godne uhonorowania najważniejszą nagrodą.

W Londynie pierwszą książką, którą kupił Chandrasekhar, były Principles of Quantum Mechanics, fundamentalne, pomnikowe dzieło dwudziestoośmioletniego Paula Diraca, który zdążył już stać się klasykiem tej młodej dziedziny. W istocie były to lata zupełnie wyjątkowe w dziejach fizyki: niemal każda nowa praca miała szanse przejść do historii. Odkrywano bowiem kolejne zastosowania nowego formalizmu: w fizyce, w chemii, w astrofizyce. Zasady wprowadzone dla wyjaśnienia zjawisk atomowych okazały się w zasadniczym zrębie słuszne także w fizyce jąder atomowych, cząstek elementarnych, pozwalały też zrozumieć, jak przebiegają zjawiska we wszechświecie: od źródeł energii gwiazd, przez ich budowę oraz rodzaje wysyłanego promieniowania. Był to okres pionierski, gdy wyznaczano dopiero granice nowego terytorium i wciąż przesuwały się one dalej. Coś takiego zdarza się niezwykle rzadko, a w życiu uczonego najwyżej raz. Chandrasekhar znalazł się też w znakomitym miejscu: Trinity College w Cambridge, gdzie pracowali Fowler i jego niedawny doktorant Dirac, a także Arthur Stanley Eddington, astrofizyk, autor książki The Internal Constitution of the Stars, którą starannie przestudiował i z której korzystał podczas pracy na statku.

Na czym polegał problem białych karłów? W dostępnych nam eksperymentalnie warunkach materii nie można zbyt mocno ścisnąć. Atomy zachowują się bowiem jak sztywne kulki i nawet pod wielkim ciśnieniem gęstość ciał stałych niemal się nie zmniejsza się, ledwie przekraczając – w przypadku najcięższych metali – dwudziestokrotność gęstości wody. Większą gęstość – ponad sto gęstości wody – osiąga materia blisko centrum Słońca. Składa się ona głównie z produktów jonizacji wodoru: protonów i elektronów o bardzo wysokiej temperaturze. Mimo tak wielkich gęstości plazmę tę wciąż można traktować jak gaz doskonały. Przeskok do gęstości milion razy większych od gęstości wody nie wydawał się fizycznie możliwy bez temperatur sięgających miliony stopni, powierzchnia białego karła świeciła w zakresie widzialnym jak gwiazda, musiała więc mieć temperaturę liczoną w tysiącach stopni.

Kwantowe wyjaśnienie zaproponował Ralph Fowler, pod którego patronatem, lecz zupełnie samodzielnie, pracował Paul Dirac. Elektrony są, jak dziś mówimy, fermionami, tzn. podlegają szczególnemu ograniczeniu: w jednym stanie kwantowym może znajdować się jeden elektron (a jeśli ignorujemy stany spinowe, to dwa różniące się rzutem spinu). Właśnie Paul Dirac obok Enrico Fermiego pierwszy zaproponował kwantowomechaniczny opis takich cząstek (nazwa fermiony, a nie np. dirakiony, nie ma głębszego uzasadnienia historycznego, a prawdopodobnie jedynie fonetyczne). Samą zasadę jeden stan – jeden elektron zaproponował zresztą nieco wcześniej Wolfgang Pauli, jeszcze jeden z dwudziestoparolatków wywracających wtedy fizykę do góry nogami. Zasada ta wyjaśnia sposób zapełniania się powłok i podpowłok w atomach. Fowler wyobraził sobie, że biały karzeł cały jest jedną wielką cząsteczką, w której elektrony tworzą coś w rodzaju gazu. Było to pierwsze zastosowanie tej idei, nieco później Arnold Sommerfeld zastosował ją do elektronów w metalach.

W atomie stan określają liczby kwantowe. W przypadku elektronów zamkniętych w gwieździe niczym w pudle skwantowane są ich wartości pędu. Dozwolone wartości tworzą sieć punktów kratowych w przestrzeni pędu (bez początku, ponieważ pęd całkowity równy zeru jest zabroniony przez zasadę nieoznaczoności). Rysunek przedstawia takie  pudło w 2D. Elektrony będą stopniowo zapełniać dozwolone stany aż do pewnej maksymalnej wartości pędu p_F, zwanej pędem Fermiego.

Jest to tzw. zdegenerowany gaz elektronowy. W pierwszym przybliżeniu można ograniczyć się do temperatury zerowej, ponieważ energia elektronów w tej sytuacji wynika nie z wysokiej temperatury, ale stąd, że wszystkie niższe stany energetyczne są zajęte. Objętość komórki w przestrzeni pędów przypadająca na dwa elektrony o różnym spinie równa jest

\Delta p_x\Delta p_y\Delta p_z=\dfrac{h^3}{V},

gdzie h jest stałą Plancka, a V objętością gwiazdy/pudła z elektronami. Widzimy, że gdy objętość pudła maleje, komórki w przestrzeni pędu rosną i przy tej samej liczbie elektronów pęd Fermiego wzrośnie. Oznacza to, że wraz z gęstością gwiazdy rośnie energia kinetyczna elektronów (równa \frac{mv^2}{2}=\frac{p^2}{2m}). Gwiazda utrzymywana jest siłami grawitacyjnymi. Energia grawitacyjna kuli o masie M i promieniu R równa jest

E_p=-\alpha \dfrac{GM^2}{R},

gdzie \alpha jest współczynnikiem zależnym od rozkładu gęstości i równym \frac{3}{5} dla kuli jednorodnej. Grawitacja jest siłą przyciągającą, więc energia rośnie tu, gdy zwiększa się promień: gdyby działała jedynie grawitacja, materia skurczyłaby się do punktu. Można znaleźć punkt równowagi, gdy suma energii kinetycznej elektronów oraz energii potencjalnej grawitacji jest najmniejsza. Promień gwiazdy jest wówczas równy

R\approx 1,15 a_B \lambda \dfrac{1}{N_n^{1/3}},

gdzie a_B=0,5\cdot 10^{-10} m jest promieniem Bohra, \lambda=1,25\cdot 10^{36} to stosunek sił elektrostatycznych do sił grawitacyjnych między protonami, a N_n jest łączną liczbą nukleonów w gwieździe. Widzimy, że im większa gwiazda, tym mniejszy promień, a więc gęstość gwiazdy rośnie jak kwadrat masy, co jest zachowaniem dość osobliwym. Promień obliczony z powyższego wzoru okazuje się dla gwiazdy o masie Słońca tego samego rzędu co promień Ziemi: a więc ogromna masa Słońca skupiłaby się w objętości zbliżonej do Ziemi. Znaczy to, że materia gwiazdy osiąga ogromne gęstości. Rzeczywiste gęstości są jeszcze większe, niż sądzono w latach trzydziestych i przekraczają milion gęstości wody. Gaz elektronowy pozwalał też objaśnić, czemu biały karzeł nie skurczy się już więcej: w istocie temperatura ma niewielki wpływ na konfigurację elektronów i struktura taka jest stabilna nawet w zerze absolutnym.

Praca Fowlera uchodzi za najwybitniejszą pozycję w jego dorobku: była w zasadzie rzuceniem idei, ale idei znakomitej, podjętej potem nie tylko w astrofizyce, ale i w fizyce ciała stałego. Jedna tak płodna idea i jeden doktorant tej klasy co Dirac, to zdecydowanie wystarczy na spełnioną karierę naukową.

Obliczenia takie, jak zarysowane powyżej, wykonał Edmund Stoner w 1929 roku. Interesowało go pytanie, czy istnieje maksymalna gęstość materii? Stoner także należał do ludzi Cambridge, jednak jego doktorat był eksperymentalny i nie odebrał on matematycznego wykształcenia, które zawsze było mocną stroną tamtejszych absolwentów. Mimo to zajął się teorią i to z powodzeniem. Jego praca The distribution of electrons among atomic energy levels z 1924 roku zainspirowała Wolfganga Pauliego do sformułowania słynnej zasady wykluczania. W reakcji na artykuł Stonera mało znany fizyk Wilhelm Anderson, pracujący w Tartu w Estonii, zwrócił uwagę, że przy dużych gęstościach, duży będzie pęd Fermiego i nie można używać newtonowskiego wyrażenia na energię kinetyczną (\frac{1}{2}mv^2), lecz należy zastosować wyrażenie relatywistyczne

E=\sqrt{(pc)^2+(mc^2)^2}\approx pc.

W przypadku skrajnie relatywistycznym obowiązuje przybliżenie zapisane powyżej. Okazuje się, że teraz nie dla każdej masy istnieje rozwiązanie i biały karzeł musi mieć masę nieprzekraczającą pewnej wartości granicznej. Anderson wyznaczył tę granicę, choć jego praca nie była całkowicie poprawna. Stoner w następnym artykule uwzględnił relatywistyczne wyrażenie na energię elektronów i prawidłowo wyznaczył maksymalną liczbę nukleonów, a więc i masę białego karła:

N_n =0,77 \left(\dfrac{c\hbar}{Gm_n^2}\right)^{\frac{3}{2}} \sim \left(\dfrac{m_{P}}{m_n}\right)^3.

Po prawej stronie wyraziliśmy tę wielkość przez masę Plancka m_P: jest to kombinacja trzech fundamentalnych stałych fizycznych – stałej Plancka, prędkości światła i stałej grawitacyjnej. Maksymalna masa zwana jest granicą Chandrasekhara i po uwzględnieniu współczynników liczbowych równa jest 1,4 masy Słońca. Przyjmujemy, że na każdy elektron przypadają dwa nukleony.

Zależność promienia białego karła od masy (https://en.wikipedia.org/wiki/Chandrasekhar_limit)

Naszkicowane przez nas podejście zakłada minimalizację energii w jednorodnym gazie elektronowym. Tak właśnie obliczył to Stoner. Subrahmanyan Chandrasekhar wybrał podejście bardziej szczegółowe, w którym analizuje się warunki równowagi w gwieździe. Jego pierwsza praca, pisana podczas podróży do Anglii, była tylko krótkim zarysem, szczegółowe rozwinięcie podał w następnych latach. Prowadzi ono do podobnych wniosków, nieco różniących się liczbowo. Czemu więc granica ta związana została w historii jedynie z nazwiskiem Chandrasekhara? Jak się zdaje, Edmund Stoner nie walczył zbytnio o priorytet. Być może tematyka astrofizyczna nie była mu tak bliska jak Chandrasekharowi, stopniowo zajął się bowiem fizyką ciała stałego.

Także Lew Landau otrzymał graniczną wartość masy w bardzo eleganckiej krótkiej pracy z 1931 roku. Jednak graniczna wartość masy wydawała mu się wnioskiem absurdalnym. Pisał: „Ponieważ w rzeczywistości masy takie spokojnie sobie istnieją jako gwiazdy, nie wykazując żadnych takich absurdalnych tendencji, musimy wywnioskować, że wszystkie gwiazdy o masie przekraczającej 1,5 masy Słońca zawierają z pewnością obszary, w których prawa mechaniki kwantowej (a więc także statystyki kwantowej) są naruszone” (Neutron Stars, Black Holes and Binary X-Ray Sources, ed. H. Gursky, R. Ruffini, D. Reidel 1975, s. 272). Musimy zdawać sobie sprawę, że zarówno teoria względności, jak i mechanika kwantowa były względnie nowymi dziedzinami i nie było jasne, czy nie pojawią się nowe idee, które zmienią zasadniczo punkt widzenia. Dopiero z perspektywy dziesięcioleci widać, że zarówno teoria względności, jak i fizyka kwantowa zostały w fizyce na dobre i są niezmiernie odporne na wszelkie „poprawianie” – to dlatego trudno jest w fizyce o nowe pomysły, muszą one bowiem stanowić uogólnienie tego, co już znamy, a co zostało bardzo dokładnie przetestowane teoretycznie i przede wszystkim eksperymentalnie.

Chandrasekhar bardzo zaciekle bronił wniosku o maksymalnej masie białego karła. Arthur Eddington – podobnie jak Landau – uważał go za absurd. W ciągu kilku lat spór między Eddingtonem, uznanym autorytetem, a młodym uczonym z Indii stał się na tyle gorący, że Chandrasekhar nie mógł pozostać w Trinity College i wyjechał do Stanów Zjednoczonych.

Rację miał Chandrasekhar (i Stoner). Gwiazdy o dużych masach nie mogą stać się białymi karłami. Mogą zostać gwiazdami neutronowymi, w których materia ma gęstość zbliżoną do materii jądrowej. Znów jednak pojawia się graniczna wartość masy, powyżej której niemożliwe jest stabilne istnienie gwiazdy neutronowej. Przy dużych masach grawitacja zwycięża i jedyną możliwością staje się utworzenie czarnej dziury. Granica Chandrasekhara była pierwszą wskazówką, że struktura materii nie jest odporna na grawitacyjne zapadanie się. Być może zaakceptowanie tej sytuacji było trudne także dlatego, że intuicyjnie chcemy wierzyć w stabilny świat, dający nam metafizyczne i psychologiczne oparcie. Dlatego kłopoty miał Galileusz, z tego samego powodu zwalczano teorię ewolucji, a także niechętnie uznano teorię Wielkiego Wybuchu. Uświadomienie sobie, że zamieszkujemy narażony na rozmaite kataklizmy kawałek skalnej skorupy pływający w ciekłym podłożu i krążący po niezbyt stabilnej orbicie w zmieniającym się ciągle i katastroficznym wszechświecie, nie poprawia, by tak rzec, filozoficznego samopoczucia.

Walter Ritz, rówieśnik Einsteina (1878-1909)

Nauka jest przedsięwzięciem zbiorowym, ostatecznie to społeczność uczonych – niczym chór greckiej tragedii – osądza protagonistów i komunikuje boskie wyroki. Jest przedsięwzięciem zbiorowym także w bardziej trywialnym i współczesnym znaczeniu mrowiska, w którym nie należy przeceniać roli poszczególnych mrówczych jednostek. Jednak „lawina bieg od tego zmienia, po jakich toczy się kamieniach”, a tragedia byłaby niemożliwa bez głównych postaci. Z jednej więc strony mamy etos mrówek trudzących się dla kolektywnego dobra, z drugiej – kult bohaterów, herosów wyobraźni i intelektu.

Walter Ritz był człowiekiem niezwykle utalentowanym i zdążył wnieść oryginalny wkład do nauki, mimo że cierpiał na gruźlicę, która odbierała mu siły, a po kilku latach odebrała także i życie. Nie osiągnął tyle, ile by chciał i potrafił, ale zdążył już zaznaczyć swoją indywidualność. Chciałbym zestawić jego drogę naukową z biegiem życia i dorobkiem młodszego niemal dokładnie o rok Alberta Einsteina. Przed rokiem 1909 Einstein nie był jeszcze sławny, wręcz przeciwnie: słyszało o nim niewielu i jego kariera dopiero się zaczynała. Dopiero jesienią tego roku wziął po raz pierwszy udział w konferencji naukowej, zamienił także posadę w Biurze Patentowym w Bernie na stanowisko profesora nadzwyczajnego uniwersytetu w Zurychu. Pensja na obu stanowiskach była dokładnie jednakowa. Konkurentem Einsteina do posady był Walter Ritz, uczelnia by go wolała, „ponieważ jest Szwajcarem i według zdania naszego kolegi Kleinera jego prace wykazują nadzwyczajny talent graniczący z geniuszem”. Choroba nie pozwoliła jednak Ritzowi objąć tego stanowiska. Einstein otrzymał więc swoje pierwsze stanowisko naukowe niejako w zastępstwie za kolegę. Wcześniej ze starań o tę posadę wycofał się Friedrich Adler, który tak jak Einstein, zrobił doktorat u Alfreda Kleinera, profesora zwyczajnego na uniwersytecie w Zurychu. Drugi etat profesorski dla fizyka był skutkiem jego zabiegów, tak to się wówczas odbywało: mógł być jeden Ordinarius z danej dziedziny, ewentualnie tworzono także pomocniczy, nie tak prestiżowy i gorzej płatny, etat Extraordinariusa. Adler wszakże niezbyt walczył o stanowisko, bardziej interesowała go filozofia nauki i działalność socjalistyczna (był synem znanego psychologa i przywódcy austriackich socjalistów Victora Adlera). Pisał w roku 1908 do ojca: „Zapomniałem powiedzieć, kto prawdopodobnie otrzyma profesurę: człowiek, któremu z punktu widzenia społeczeństwa należy się ona znacznie bardziej niż mnie i kiedy ją otrzyma, będę się z tego bardzo cieszył mimo pewnej przykrości. Nazywa się Einstein, studiował w tym samym czasie co ja, chodziliśmy razem na niektóre wykłady. (…) Ludzie z jednej strony odczuwają wyrzuty sumienia z powodu tego, jak go wcześniej potraktowano, z drugiej zaś strony skandal jest szerszy i dotyczy całych Niemiec: żeby ktoś taki musiał tkwić w biurze patentowym”.

Walter Ritz był w tym czasie Privatdozentem w Getyndze. Pochodził ze Sionu w Szwajcarii, ojciec, malarz pejzaży i scen rodzajowych, przyrodnik, geolog, etnograf i alpinista, zmarł w 1894 roku po długiej chorobie. Walter uczęszczał w tym czasie do liceum i uchodził za nader utalentowanego. W 1897 zaczął studia na politechnice w Zurychu, był więc o rok niżej niż Einstein. Ritz z początku miał być inżynierem, lecz zmienił wydział na nauczycielski (jak Einstein). Obaj chodzili na wykłady tych samych profesorów. Albert Einstein nie cieszył się jednak dobrą opinią: profesor fizyki Heinrich Weber uważał go za przemądrzałego i aroganckiego i nie miał najmniejszej chęci zostawiać go na uczelni. Weber nie był wybitnym uczonym, ale Politechnika miała znakomitych matematyków, wśród nich dwóch wielkich: Hermanna Minkowskiego i Adolfa Hurwitza. Einstein w tamtym okresie niezbyt pasjonował się matematyką, toteż i na wykłady chodził rzadko. Minkowski, który później stworzył matematyczne sformułowanie teorii względności, nie spodziewał się zbyt wiele po Einsteinie: „Byłem niezwykle zdumiony, gdyż wcześniej Einstein był zwykłym wałkoniem. O matematykę w ogóle się nie troszczył” [C. Seelig, Albert Einstein, s. 45]. Nie lepszą opinię miał zapewne Hurwitz, kiedy Einstein, nie mogąc nigdzie znaleźć pracy, w akcie rozpaczy, zwrócił się do niego o asystenturę, spotkała go milcząca odmowa, choć nie prosił o wiele: Politechnika stale potrzebowała asystentów do prowadzenia ćwiczeń i sprawdzania prac studenckich.

Znacznie wyżej oceniany był Walter Ritz. W roku 1901 wyjechał on na dalsze studia do Getyngi. Minkowski, który był w stałym kontakcie ze swym przyjacielem Davidem Hilbertem, pisał: „W następnym semestrze będziesz miał u siebie matematyka stąd, W. Ritza, który wykazuje dużo zapału, ale jak dotąd wyszukiwał sobie same nierozwiązywalne problemy”. [List do Davida Hilberta, 11 III 1901, Briefe an Hilbert, s. 139] Uniwersytet w Getyndze stał się w tamtych latach najważniejszym ośrodkiem matematycznym, nie brakowało tam także fizyków teoretycznych i doświadczalnych. Centrum stanowili Felix Klein i David Hilbert, dwaj przyjaciele i znakomici matematycy, wytyczający kierunki badań w swej ukochanej dziedzinie. Niedługo dołączyć miał do nich Hermann Minkowski. Walter Ritz uczęszczał na wykłady Hilberta, a także zaczął pracować nad doktoratem pod kierunkiem fizyka teoretycznego i znawcy twórczości Bacha, Woldemara Voigta. Oprócz ważnych nauczycieli poznał Ritz w Getyndze także wybitnych rówieśników. Zaprzyjaźnił się niemal od razu z Paulem Ehrenfestem, a także z Tatianą Afanasevą, Rosjanką, przyszłą żoną Paula, także studiującą fizykę. Ehrenfest był studentem Ludwiga Boltzmanna w Wiedniu i do Getyngi przyjechał, gdy Boltzmann wywędrował z Wiednia.

Doktorat Ritza dotyczył spektroskopii atomowej. Chodziło o wyjaśnienie obserwowanych serii widmowych. Np. częstości widzialnych linii wodoru opisać można wzorem Balmera:

\nu=N\left( \dfrac{1}{4}-\dfrac{1}{n^2} \right), \mbox{ gdzie } n=3,4, 5, \ldots

Stosując mianowniki typu (n+\alpha)^2 można było opisać także inne serie widmowe, np. metali alkalicznych. Serie częstości nasuwały myśl o falach stojących, a więc układzie przypominającym strunę albo membranę. Ładunek drgający z częstością \nu wysyła falę elektromagnetyczną o takiej właśnie częstości. W przypadku kwadratowej membrany równanie ruchu ma postać:

\dfrac{1}{v^2}\dfrac{\partial^2 f}{\partial t^2}=\dfrac{\partial^2 f}{\partial x^2}+\dfrac{\partial^2 f}{\partial y^2}.

Jest to po prostu dwuwymiarowe równanie falowe (t,x,y są odpowiednio czasem i współrzędnymi kartezjańskimi w płaszczyźnie membrany, f opisuje wychylenie membrany, stała v jest prędkością fal w membranie). Łatwo stwierdzić, że dozwolone częstości własne opisane są wyrażeniem

\nu^2=A(n^2+m^2), \mbox{ gdzie }n,m=1,2,3,\ldots

Zakładamy tu, że krawędzie membrany pozostają cały czas nieruchome. Ritz spróbował znaleźć równania, które mogłyby opisać wzór Balmera i inne podobne przypadki. W przypadku wzoru Balmera odpowiednim równaniem okazało się

\partial_{t}^2\partial_{x}^4 \partial_{y}^4 f=B(\partial_{x}^2-\partial_{y}^2)^2 f.

Oznaczyliśmy tu pochodne cząstkowe po odpowiednich zmiennych przez \partial_{i}, gdzie i=x,y, t. Dobierając odpowiednio warunki brzegowe, udało się Ritzowi znaleźć także bardziej skomplikowane wzory na częstości linii widmowych. Równania te były wysokiego rzędu (tutaj dziesiątego), w dodatku o niespotykanej w fizyce postaci. Znak minus po prawej stronie oznacza, że zamiast laplasjanu (który wynika z symetrii obrotowej) do opisu membrany stosujemy pewne niestandardowe wyrażenie. Ritz pokazał, że jego równania wynikały z zasady wariacyjnej, formalnie więc były w porządku. Słabość tego podejścia tkwiła w braku jakiegokolwiek wyobrażenia drgającego atomu: po prostu bierzemy do obliczeń membranę, która nie może być czymś istniejącym w przyrodzie. Nikt wówczas nie miał pojęcia, jak wyglądają atomy, dopiero niedawno ustalono, że istnieją elektrony – naładowane cząstki o masie tysiące razy mniejszej niż masy atomów. Serie częstości w fizyce klasycznej odpowiadały zawsze falom stojącym, wystarczy pomyśleć o instrumentach muzycznych, które z punktu widzenia fizyka są rozmaicie zbudowanymi generatorami fal opartymi na falach stojących w strunie czy w słupie powietrza.

Model Ritza odniósł pewien sukces: przewidział, że w serii rozmytej potasu powinna istnieć linia widmowa odpowiadająca długości fali \lambda=6964 Å. W następnym roku, udało mu się tę linię zidentyfikować w widmie. Po doktoracie Ritz zaczął podróże naukowe: lato 1903 spędził w Lejdzie, gdzie słuchał wykładów H. Lorentza, potem znalazł się w Bonn, gdzie odkrył „swoją” linię potasu, w listopadzie pracował już w laboratorium profesora Aimé Cottona w École Normale w Paryżu. Zima paryska dała mu się we znaki, jakiś czas musiał spędzić w sanatorium w Sankt Blasien w Schwarzwaldzie. Gdy poczuł się lepiej, pojechał do Zurychu, aby wywołać swe klisze z widmami w podczerwieni naświetlone w Paryżu. Jakiś czas przemieszkał w Sion pod opieką matki. Lekarze zabraniali mu pracować, twierdząc, że to szkodzi jego zdrowiu. Zimą 1906/1907 pisał z Nicei do przyjaciela:

Zgodzi się pan ze mną, że nie mogę w takim stopniu co inni wierzyć w przyszłość, która miałaby mi wynagrodzić stan obecny. Pozostało mi zapewne niewiele czasu i jestem mocno zdeterminowany, aby spędzić go w środowiskach naukowych i intelektualnych, bo tylko tak znaleźć mogę zadowolenie i poczucie, że żyję, a może właśnie to stanowi warunek mojego wyzdrowienia? Drogi przyjacielu, nie mogę mieć nadziei ani na szczęście rodzinne, ani na dobre samopoczucie starego kawalera cieszącego się zdrowiem, pozostaje mi jedynie Nauka i życie intelektualne, i doprawdy nie mam siły zakopywać się tutaj w imię bardzo niepewnego celu.

Wrócił do pracy, zimę 1907/1908 spędził w Tybindze, gdzie współpracował z Friedrichem Paschenem, badającym eksperymentalnie widma pierwiastków. Ritz miał nowe pomysły na temat budowy atomu i mogli wymieniać się pomysłami oraz wynikami. Następnie wrócił do Getyngi, gdzie został Privatdozentem, choć nie prowadził zajęć ze względu na stan zdrowia. Henri Poincaré interesował się jego pracami i odwiedzając Getyngę, spotkał się z nim i ogłosił zamiar przyznania mu nagrody Lecomte’a przez francuską Akademię Nauk. Był to już ostatni rok życia Ritza.

Co robiło tak wielkie wrażenie na jego współczesnych? Badania nad seriami linii widmowych – po doktoracie Ritz zaproponował jeszcze jeden model atomowy: była to drgająca i obracająca się wokół osi naładowana struna. Także i ten model stanowić miał jedynie matematyczne uzasadnienie dla obserwowanych prawidłowości widm, nie mówił nic na temat np. własności chemicznych czy budowy wewnętrznej atomu. Próbował za pomocą swego modelu wyjaśnić anomalny efekt Zeemana: zjawisko rozszczepiania linii widmowych w silnym polu magnetycznym. Cząstkową teorię tego zjawiska podał Hendrik Lorentz, za co otrzymał wraz z Peterem Zeemanem Nagrodę Nobla w roku 1902. Teoria Lorentza nie opisuje jednak wszystkich obserwowanych przypadków, te niewyjaśnione objęto określeniem: anomalny efekt Zeemana – jak to często bywa, za normalne uznajemy to, co dobrze rozumiemy. Prace Ritza zawierały jeden istotny szczegół techniczny: częstości linii widmowych były w nich różnicami dwóch wyrażeń. W istocie chodzi o zasadę zachowania energii:

h\nu=E_{n}-E_{m}.

(Stała h jest stałą Plancka). Ritz nie napisał jednak takiego równania i uznałby je za bezsensowne. Jego rozważania opierały się na klasycznej teorii drgań i nie było w nich miejsca na fotony. Równanie takie znalazło się po raz pierwszy u Bohra, choć on także nie wierzył w fotony. Duński uczony sądził, że energie po prawej stronie określone były warunkami kwantowania (zawierającymi stałą Plancka – sygnał, że mamy do czynienia z fizyką kwantową), ale przejścia miedzy poziomami energetycznymi prowadziły do wysłania fali o energii danej powyższym równaniem. Sama postać tego równania, nawet jeśli nie rozumiemy różnych stałych, może być przydatna. Np. dodając stronami dwa takie równania otrzymać możemy:

\nu_{nm}+\nu_{mk}=\nu_{nk}.

Jest to związek między wielkościami obserwowanymi, mówi się w tym kontekście o zasadzie kombinacji, wcześniej zauważonej przez Janne Rydberga. Ritz znalazł dla tej zasady wyjaśnienie, choć fałszywe. Postęp w rozumieniu budowy atomów oraz wyjaśnieniu widm nastąpił dopiero za kilka lat, po odkryciu przez Ernesta Rutherforda jądra atomowego i sformułowaniu przez Nielsa Bohra znanego modelu, który stanowił przełom w badaniach. Sam Bohr opowiadał później, że o widmach dowiedział się z książki Johannesa Starka Prinzipien der Atomdynamik (cz. 2), gdzie znalazły się wzory Balmera, jak i informacje o różnych pracach na ten temat, m.in. Waltera Ritza. Z kolejnych teorii atomu szwajcarskiego fizyka nie zostało nic. Nie da się zbudować teorii atomu bez fizyki kwantowej.

Wyjaśnienie anomalnego efektu Zeemana udało się dopiero po wprowadzeniu pojęcia spinu elektronu w 1925 r. Nie wiemy, co Walter Ritz potrafiłby wnieść do tych prac, gdyby nadal żył. Wiemy natomiast, że musiałby zmienić podejście, bo tą drogą nie doszedłby do sukcesu. Widać jednak ambicję młodego fizyka, by zmierzyć się z jednym z najtrudniejszych problemów fizyki.

Jedynym fizykiem, który mógłby zapisać równanie na różnicę energii, był w tym czasie Einstein. Energia fotonu to był jego pomysł, traktowany przez kolegów jako aberracja. Ritz nie wierzył ani w prace kwantowe Einsteina, ani w teorię względności. Najwyraźniej on także nie traktował serio pomysłów kolegi ze studiów. Teoria względności zastępowała pojęcia czasu i przestrzeni jedną wspólną rozmaitością: czasoprzestrzenią, co zauważył Hermann Minkowski, który od roku 1902  pracował już w Getyndze. Nienaruszona była przy tym elektrodynamika Maxwella w postaci nadanej jej przez Hendrika Lorentza. Ritz wybrał inną drogę: też nie wierzył w eter i uznawał zasadę względności, ale postulował, aby zmienić elektrodynamikę. Jego podejście oznaczałoby zarzucenie koncepcji pola elektromagnetycznego. Elektrodynamika Ritza została jedynie zarysowana, byłaby ona teorią bardzo skomplikowaną matematycznie i nieelegancką. Gdy źródło światła się poruszało, to jego prędkość powinna się dodawać do c. Einstein dyskutował na temat elektrodynamiki z Ritzem, ogłosili nawet razem króciutki protokół rozbieżności w tej sprawie. Zdaniem Einsteina należy startować z pojęcia pola – cała jego dalsza kariera była z tym pojęciem związana.

Innym osiągnięciem Ritza było sformułowanie eleganckiej metody przybliżonej dla opisu drgań, za jej pomocą rozwiązał zagadnienie figur Chladniego.

Osiągnięcia Ritza są niepełne i niedokończone za sprawą choroby. Jednak w chwili śmierci Ritza i on, i Einstein mieli dorobek porównywalny ilościowo: jeden solidny, pięćsetstronicowy tom dzieł. Einstein ceniony był w Berlinie, gdzie pracowali Max Planck, Max Laue i Walther Nernst. Inni zachowywali dystans wobec jego prac i albo o nich nic nie wiedzieli, albo nie wiedzieli, co myśleć. Hermann Minkowski też niezbyt często wymieniał nazwisko Einsteina, może wciąż go pamiętał jako leniwego studenta? Ritz również zajmował się problemami fundamentalnymi i był chyba lepiej rozumiany przez kolegów. W jego przypadku doktorat był początkiem kontaktów z wieloma uczonymi, niewątpliwie działała tu opinia doktoratu z Getyngi, jeśli nie miał wprost jakichś listów polecających. Można się zastanawiać nad tym, jak potoczyłaby się kariera naukowa Einsteina, gdyby mniej zrażał ludzi do siebie i nie był taki arogancki? Przecież on także mógłby trafić do Getyngi i poddać się czarowi eleganckiej, choć częstokroć jałowej fizyki matematycznej. Pomogłoby mu to niewątpliwie w dalszej karierze, chyba że nie przekonałby Minkowskiego. Czy nie zaszkodziłoby mu to jednak w sensie naukowym? Ritz spędził sporo czasu w naukowym odosobnieniu z powodu choroby, ale był już mimo młodego wieku szanowanym uczonym i miał kontakty. Einstein był w tym czasie niemal całkowicie izolowany. Pracował osiem godzin dziennie w biurze przez sześć dni w tygodniu i zadowolony był, że mają z Milevą co jeść i że zostają mu wieczory oraz niedziele na pracę naukową. Opowiadał potem Infeldowi, że do trzydziestki nie widział prawdziwego fizyka teoretyka. Nie jest to prawda w sensie ścisłym, bo poznał np. Maksa Lauego, ale z pewnością zaczynał jako kompletny autsajder, który niemal wszystkiego nauczył się sam z książek i artykułów.

Do Getyngi trafił Einstein znacznie później, już jako samodzielny mistrz. Przedstawił tam swoją teorię grawitacji w czerwcu roku 1915. Skończyło się to zresztą dwuznacznym incydentem, gdyż praca ta spodobała się Hilbertowi, co miało ten skutek, że pod koniec roku obaj pracowali nad nią równolegle i mało brakowało, a Einstein zostałby pozbawiony satysfakcji postawienia kropki nad i, tzn. zapisania równań pola. W Getyndze bowiem uczeni nie mieli oporów przed korzystaniem z wyników kolegów, traktując je jako rodzaj dobra wspólnego. Nazywało się to u nich „nostryfikacją” cudzych wyników.

Prace Einsteina cechuje ogromna intuicja: zazwyczaj miał on dobre wyczucie, czego należy się trzymać i w którą stronę zmierzać. Tak było np. z polem elektromagnetycznym. Einstein wiedział, że teoria Maxwella ma ograniczenia kwantowe, ale samo pojęcie pola traktował jako fundament. Cenił bardzo dorobek Lorentza (znany mu wyłącznie z publikacji), który na Ritzu nie zrobił wielkiego wrażenia, mimo że znał jego autora. Einstein przed rokiem 1905 rozpatrywał możliwość innej elektrodynamiki, zgodnej z mechaniką Newtona, była ona podobna do późniejszej propozycji Ritza. Dlatego później nie tracił już czasu na koncepcje, które kiedyś odrzucił po starannym namyśle. Prawdopodobnie właśnie przez to, że Ritz był umysłem o wiele mniej rewolucyjnym, współcześni cenili go wyżej, osiągnięcia Einsteina od początku wydawały się kontrowersyjne, niektórzy wielcy uczeni, jak Henri Poincaré podchodzili do nich bardzo sceptycznie. Nie wiemy, jak rozwinąłby się Walter Ritz, gdyby wcześniej odkryto penicylinę, ale można przypuszczać, że był już ukształtowany intelektualnie i nie stać by go było na żaden rewolucyjny skok w nieznane. Teoretycy rzadko robią coś rewolucyjnego po trzydziestce, chyba że kontynuują coś, co już wcześniej sami zaczęli. Dorobek Einsteina z tamtych lat jest bardzo mało techniczny, nie ma tam właściwie wcale skomplikowanych obliczeń, są raczej proste rozumowania i pomysłowe argumenty. W porównaniu prace Waltera Ritza wydają się znacznie bardziej zaawansowane. A jednak: „Ten piękny wysiłek w porównaniu z geniuszem jest tym, czym urywany lot świerszcza w porównaniu z lotem jaskółki” (A. Camus).

Jak można odtworzyć wzór Balmera? Szukając rozwiązań w postaci sinusów wzdłuż x i y oraz o częstości \nu, otrzymamy (a jest długością boku kwadratu):

f(x,y,t)=A \sin \dfrac{n\pi x}{a}\sin\dfrac{m\pi y}{a}\sin 2\pi\nu t.

Drugie pochodne sprowadzają się teraz do mnożenia przez odpowiedni czynnik, podstawiając do równania Ritza, otrzymamy

\nu^2 m^4 n^4 \sim (n^2-m^2)^2,

skąd przy m=2 dostajemy wzór Balmera.