Jak Johannes Kepler odkrył eliptyczny kształt orbity Marsa? (1605)

Kepler był pierwszym liczącym się naukowo zwolennikiem teorii heliocentrycznej. Otaczał wielką czcią postać Mikołaja Kopernika, ale astronomię zbudował właściwie na nowo. Zawiłą drogę do odkrycia tego, co dziś nazywamy dwoma pierwszymi prawami Keplera, opisał w legendarnie trudnej książce Astronomia nova. Dotyczyła ona głównie ruchu Marsa, częściowo także Ziemi. Uczony miał do dyspozycji wieloletnie precyzyjne obserwacje Tychona Brahego. Na ich podstawie zbudował teorię, która dorównywała im dokładnością, był to największy krok od czasów starożytnych Greków. Bez tak precyzyjnej teorii trudno sobie wyobrazić odkrycie prawa ciążenia przez Isaaca Newtona. Sam Newton sądził, iż Kepler wiedział, że orbity planet są owalne, a odgadł, że są one eliptyczne. W jakimś stopniu miał rację: nawet obserwacje Tychona, najlepsze, jakie kiedykolwiek zgromadzono, były zbyt mało dokładne, aby precyzyjnie wyznaczyć kształt orbity szukając jej punkt po punkcie. Odkrycie było więc wynikiem konfrontowania rozważań teoretycznych i obserwacji.
W praktyce dzięki pomysłowym metodom postępowania Kepler potrafił z dużą dokładnością wyznaczyć kierunek Słońce-Mars w zależności od czasu oraz z mniejszą dokładnością odległości planety od Słońca w różnych chwilach. Jego zdaniem Mars poruszany jest przez jakąś siłę emanującą ze Słońca. A właściwie wyobrażał sobie nawet dwie takie siły, pamiętajmy, że mechanika była wciąż na etapie arystotelesowskim: siła ciągnie albo popycha – ciało się porusza, siła przestaje działać – ciało staje. Była to dynamika przesuwanej szafy. Mimo to lepsza była taka dynamika niż żadna. Przed Keplerem, a i po nim, wyobrażano sobie ruchy planet jako coś całkowicie odmiennego od mechaniki ziemskich przedmiotów. Dla Kopernika Słońce było centralną latarnią w świecie, a nie źródłem siły.
Kepler przyjął, że ruch Marsa wokół Słońca zachodzi po krzywej zamkniętej. Najprościej było przyjąć, że jest nią okrąg o umownym promieniu równym 1. Musimy jednak wtedy Słońce odsunąć od środka okręgu o pewną wielkość znaną z obserwacji, tzw. mimośród orbity. W przypadku Marsa \mbox{AS}=e \approx 1/11.

mars 1 area law

Wiadomo też z obserwacji, że planeta porusza się szybciej, gdy jest bliżej Słońca. Z takim ruchem niejednostajnym Kepler zmierzył się jako pierwszy. Intuicyjnie wydawało mu się to zrozumiałe, że z mniejszej odległości Słońce oddziałuje silniej, a więc porusza szybciej naszą planetą (Wyobrażał sobie, że Słońce wiruje wokół osi i niejako zagarnia planety swoim polem siłowym, toteż ucieszył się, kiedy odkryto wirowanie Słońca wokół osi). Uprościmy rozważania na ten temat, zakładając tzw. prawo pól, czyli dziś II prawo Keplera. W trakcie swej wojny z Marsem (jak sam ją określał w alegorycznym duchu epoki) astronom stosował także różne inne przybliżenia, które dla uproszczenia pominiemy. Prawo pól mówi, że pole powierzchni zakreślonej przez promień wodzący Marsa, czyli np. powierzchni SCM jest proporcjonalne do czasu. Np. pole wycinka SM’C jest mniej więcej równe polu BAC, czyli ćwiartce koła. Znaczy to, że Mars znajdzie się w tym położeniu po jednej czwartej obiegu. Po połowie obiegu znajdzie się oczywiście w punkcie najbliższym Słońca (peryhelium).
Na przebycie łuku orbity CM planeta potrzebuje czasu t, który spełnia następującą proporcję

\dfrac{t}{T}=\dfrac{\mbox{pole MAC}+\mbox{pole SAM}}{\pi}\Rightarrow t=\beta+e\sin\beta.

Przyjęliśmy umownie, że okres obiegu Marsa T=2\pi. Jest to tzw. równanie Keplera. Kąt \beta nazywa się anomalią mimośrodową. Nie jest to wprawdzie ten kąt, który może wprost zainteresować astronoma i który można wyznaczyć z obserwacji (choć nie wprost – trudno umieścić się na Słońcu!). Istotnym obserwacyjnie kątem jest MSC, tzw. anomalia prawdziwa. Z rysunku widać, że anomalię tę można wyznaczyć w sposób trygonometryczny. Mając \beta, możemy więc znaleźć czas i położenie planety. Równanie Keplera jest przestępne, nie można podać prostego wyrażenia na funkcję \beta(t), był to jeden z kłopotów Keplera, a potem wszystkich następnych astronomów, gdyż równanie Keplera obowiązuje także dla orbity eliptycznej. Od teraz będziemy zakładać prawo pól dla każdego kształtu orbity. Kiedy zastosuje się je do Marsa, anomalie prawdziwe (czyli kąty widziane ze Słońca) różnią się od obserwowanych mniej więcej tak:

mars circular errors

(rysunek wg pracy H. Martynki)

Różnice nie są wielkie, lecz w miarę wyraźne. Kepler znał tylko kilka punktów tej krzywej, nie miał do dyspozycji żadnych narzędzi obliczeniowych, nawet logarytmy były nieznane, każde mnożenie, dzielenie itd. trzeba było mozolnie wykonywać krok po kroku. Obserwacje Tychona pozwalały na błędy rzędu jednej albo dwóch minut kątowych (bez użycia teleskopu nie da się zresztą rozróżnić mniejszych kątów, patrz George Biddell Airy: Jak drobne szczegóły można dostrzec przez teleskop? Nasze oko ograniczone jest średnicą źrenicy, a także gęstością komórek światłoczułych na siatkówce). Kepler sprawdził także, że orbita Marsa powinna być odrobinę spłaszczona. Rzecz jednak w tym, że nie szukał jedynie odpowiedniej krzywej, ale chciał także, żeby jej kształt wynikał jakoś z mechaniki. Wpadł na pomysł dość dziwaczny dla nas, ale uzasadniony tradycją astronomii: na dużym kole (deferencie) obraca się małe koło (epicykl). Można taką konstrukcją zastąpić okrąg rozważany wyżej.

mars2 ekscent

Odcinek CM jest stale równoległy do SA. Można albo sobie wyobrażać ruch po czerwonym okręgu albo po dwóch czarnych, wynik będzie ten sam. Nowy pomysł Keplera polegał na tym, aby epicykl nadal obracał się jednostajnie, ale ruch planety miał być niejednostajny: w rezultacie kąt NXM będzie większy niż kąt NSC i wypadkowa krzywa stanie się spłaszczonym nieco owalem. Jednostajny obrót epicykla uważał Kepler za możliwy fizycznie (wymagało to jakiejś dodatkowej siły wywołującej ten obrót, ale tak czy owak potrzebował dwóch różnych sił: jednej wywołującej krążenie wokół Słońca oraz drugiej na przemian zbliżającej i oddalającej planetę od Słońca).

mars oval

Owal też nie spełnił zadania. Kepler miał kłopoty z obliczeniem jego kształtu, choć zadanie nie jest szczególnie trudne, gdy zastosować trygonometrię w zapisie algebraicznym albo prosty rachunek całkowy – narzędzia te nie były mu dostępne, bo ich jeszcze nie było. Błędy w anomaliach prawdziwych okazały się teraz równie duże co poprzednio, miały jednak inne znaki.

mars errors oval

(rysunek wg pracy H. Martynki)

Wskazywało to na zbytnie spłaszczenie owalu w stosunku do rzeczywistości. Owal miał rzeczywiście kształt jajka (ovum), choć w praktyce jajo to nie różniło się wiele od elipsy i w jakimś momencie Kepler zaczął je przybliżać elipsą. Nie zauważył, że prawo pól zastosowane do różnych elips oznacza, że planety tak się poruszające znajdują się w każdej chwili na jednej linii prostopadłej do osi NMM’. Zatem jeśli błękitna elipsa daje położenie M’, a okrąg położenie N i oba są z przeciwnym błędem, to rozwiązaniem powinna być elipsa pośrednia między tymi dwiema (okrąg to też elipsa).

mars 3 ellipses

W każdym z tych przypadków słuszne jest równanie Keplera, które wypisaliśmy wyżej. Kepler szukał jednak wyjaśnienia fizycznego: owal miał jakieś uzasadnienie, inna elipsa nie bardzo. Bez epicykla i bez okręgu znalazł się w kropce. Wrócił do odległości. Owal był nieco węższy w kierunku prostopadłym do osi (linia łącząca położenie najbliższe i najdalsze od Słońca, u nas pozioma). Między okręgiem a owalem zostawał cienki sierp, lunula – jak go określił.

mars lunulae1

Astronom wiedział, że prawdziwy tor planety mieści się gdzieś pośrodku. Obserwowane odległości nie przesądzały jednak gdzie dokładnie. Wczesną wiosną 1605 roku zauważył dość szczególne prawo, które pasowało do obserwacji i tego, co wiedział.

mars click

Najpierw przyjrzyjmy się niebieskiemu trójkątowi SKA. Kepler wiedział, że kąt na rysunku równy jest dla Marsa \varphi=5^{\circ} 18'. Przy takim kącie SK=1,00429, a więc do jedynki dodana jest mniej więcej połowa szerokości lunuli. Tymczasem odległość SM powinna być równa wówczas 1. Czyli tam, gdzie orbita jest najwęższa, od okręgu należałoby ująć mniej więcej 0,00429. Prawo, które zaproponował, przedstawione jest na rysunku. Zamiast odległości SN należało w każdym punkcie wziąć odległość ND – była to więc reguła, o ile należy skrócić promień w stosunku do promienia wodzącego SN (N leży na okręgu). Zapisane trygonometrycznie prawo to ma rzeczywiście prostą postać

r=1+e\sin\beta.

Można było mieć nadzieję, że tak proste prawo wynika jakoś z mechaniki. Miało ono zastąpić ów nieszczęsny epicykl, który sprawił mu mnóstwo zachodu. Brakowało jeszcze ustalenia, w którym kierunku należy odłożyć ową odległość r. W końcu zauważył, że prawidłowy rysunek wygląda następująco.

mars kepler ellipse

Można wykazać, że odkładając odległość DN jako SM (obie zaznaczone są na niebiesko), otrzymujemy punkt M leżący na elipsie. Spośród wszystkich elips, które mają taką samą długość dużej półosi, wybieramy dzięki tej konstrukcji taką, że Słońce znajduje się w jej ognisku (sam astronom nie zauważył tego w pierwszej chwili). Nie jest to oczywisty sposób na skonstruowanie elipsy, ale jest on prawidłowy. Zapisane przez nas równania oraz łatwy do wyznaczenia z rysunku kąt anomalii prawdziwej dają nam równania ruchu planety w postaci parametrycznej, gdzie \beta jest parametrem. Zauważmy, że linia AN nie celuje ku planecie, lecz ku pewnemu punktowi na pomocniczym okręgu. Konstrukcja jest dość zawiła, ale nie da się tego zrobić dużo prościej, to ruchy planet są skomplikowane.
W rzeczywistości orbity Marsa rozpatrywane przez Keplera bardzo mało się od siebie różnią. Na rysunku przedstawiłem przypadek e=0,4, mimośrody planet nie są tak duże. Widzimy, dlaczego starożytne teorie oparte na okręgach działały tak dobrze.

mars e equal04

(rysunek wg pracy H. Martynki)

A tak poprawiła się dokładność przewidywań w teorii Keplera w porównaniu z efemerydami przed nim.

marspos

Dane O. Gingericha

Dla porządku zapiszę jeszcze wzory dla anomalii prawdziwej v, czyli kąta MSC na rysunku wyżej. Rzutując SM na prostą SC, otrzymujemy:

r\cos v=e+\cos\beta.

Rzutując SM na prostą NM, otrzymujemy:

r\sin v=\sqrt{1-e^2}\sin\beta,

gdzie \sqrt{1-e^2} jest stosunkiem długości małej osi elipsy do dużej. Łatwo stąd otrzymać także biegunowe równanie elipsy, lepiej znane niż wzór Keplera na r. Mnożąc obie strony wzoru z \cos v przez e oraz dodając do obu stron 1, mamy:

1+er\cos v=e^2+(1+e\cos\beta)=e^2+r.

Wyznaczając r, dostajemy równanie elipsy

r=\dfrac{1-e^2}{1-e\cos v}.

W podręcznikach cosinusy mają inne znaki, ponieważ my trzymamy się historycznego sposobu liczenia kątów od aphelium, a obecnie liczy się od perihelium: \cos(\pi-\alpha)=-\cos\alpha. Owal Keplera ma równanie

r=\dfrac{1-e^2}{\sqrt{1-2e\cos v+e^2}}.

Reklamy

Thomas Young i George Airy: nadliczbowe łuki tęczy

Podstawowy mechanizm powstawania tęczy wyjaśnił już Kartezjusz. Łuki tęczy odpowiadają najmniejszym albo największym kątom odchylenia promieni świetlnych odbijających się wewnątrz kropli wody. Wynika to z prawa załamania.

descartes2

Czy na przebieg tego zjawiska ma jakiś wpływ falowy charakter światła? Pierwszy zastanowił się nad tym Thomas Young. Rozpatrzmy to na przykładzie wewnętrznego łuku tęczy. Kąt padania promienia na powierzchnię kropli związany jest z tym, jak daleko od jej środka biegnie ów promień. Dalsze jego losy są już określone: można obliczyć, jak się załamie i pod jakim kątem ostatecznie wybiegnie z naszej kropli. W pewnej odległości od środka kropli otrzymuje się promień Kartezjusza – ten odpowiadający kątowi 42º. Dla każdego kąta mniejszego niż owe 42º możemy znaleźć dwa promienie, które wychodzą pod tym kątem z kropli: jeden wchodzący do kropli nieco bliżej środka niż promień Kartezjusza, drugi zaś nieco od niego dalej. Wynika to po prostu stąd, że jeśli mamy w pewnym miejscu maksimum wykresu, to każdej wartości funkcji mniejszej od maksimum odpowiadają co najmniej dwie wartości argumentu: jedna na lewo, a druga na prawo od maksimum. Promienie takie biegną w tym samym kierunku pod pewnym kątem mniejszym niż 42º. Jeśli światło jest falą, to promienie te powinny interferować. Oba przebiegają nieco inną drogę, gdy ta różnica dróg będzie równa długości fali, promienie się wzmocnią, a my zaobserwujemy dodatkowy łuk tęczy wewnątrz zwykłej tęczy, tzw. łuk nadliczbowy.

rainbow_wave

Young wykonał jakieś obliczenia na ten temat, ale wspomniał tylko o ich wyniku w jednej ze swych prac. Dla kropli o średnicy 1/76 cala przewidywał on łuk nadliczbowy 2º wewnątrz zwykłego łuku tęczy. Bliżej tematem tym zajął się George Biddell Airy w latach 1836-1838. Wystarczy do tego falowa teoria Fresnela i trochę matematyki. Ograniczając się do promieni bliskich promienia Kartezjusza, można poczynić pewne przybliżenia matematyczne prowadzące do nowego rodzaju funkcji, tzw. funkcji Airy’ego. Jakościowo rzecz biorąc, fala wypadkowa powstaje z czoła fali o kształcie litery S, jak na rysunku. Astronom pracowicie wyznaczył wartości natężenia światła za pomocą obliczeń numerycznych.

airy

Pozioma oś wyskalowana jest w kątach. Pionowa oś wykresu odpowiada położeniu promienia Kartezjusza. Linia kropkowana to natężenie światła w teorii Kartezjusza, cienka linia ciągła byłaby wynikiem Younga, a gruba linia ciągła jest bliższym rzeczywistości wynikiem Airy’ego. Już pierwsze maksimum natężenia wypada dla kąta mniejszego niż owe 42º Kartezjusza, jak widać, powinny też pojawiać się kolejne maksima odpowiadające jeszcze mniejszym kątom – są to właśnie łuki nadliczbowe. Skala pozioma wykresu zależy od wielkości kropli wyrażonej w długościach fali światła. Wykres poniżej przedstawia teorię Airy’ego dla kropli o średnicy 1/76 cala i długości fali 0,7 μm (barwa czerwona) pierwszy dodatkowy łuk leży niecałe 2º wewnątrz łuku głównego – mniej więcej tak, jak to opisał Young (wszędzie poniżej skala pozioma jest w stopniach).

Airy1.76cala red

Jego jakościowa teoria staje się jeszcze bliższa prawdy, gdy nieco przesunie się różnicę faz obu promieni (o \frac{1}{2}\pi), co widać na wykresie z pracy Airy’ego. Gdy krople są większe, kąty między łukami stają się mniejsze. Oto wykres dla kropli o średnicy 1 mm:

airy1mm red

W rzeczywistych warunkach obserwujemy wszystkie długości fal światła widzialnego jednocześnie, powoduje to nakładanie się łuków: niżej na wykres dla światła czerwonego nałożyliśmy jeszcze wykres dla fioletu. Łuki będą się więc zacierać.

airy1mm violet red

Podobny skutek wywoła zróżnicowanie rozmiarów kropli, w rezultacie nie zawsze udaje się te dodatkowe łuki zaobserwować. Czasem jednak są widoczne. Mamy wtedy naoczny dowód, że światło jest falą.

p7285210_2

fotografia: https://collectingtokens.wordpress.com/tag/supernumerary-rainbow/

Uwaga:
Słynna całka tęczy Airy’ego ma postać:

\mbox{Ai}(-\eta)=\dfrac{1}{\pi}\int\limits_{0}^{\infty}\cos(t^3/3-\eta t) dt.

Dla dużych rozmiarów kropli trzeba stosować bardziej realistyczne i mniej eleganckie przybliżenia. Dlatego wynik dla kropli o wielkości 1 mm ma sens tylko jakościowy.

Werner Heisenberg, zasada nieoznaczoności i istnienie atomów (1927)

W roku 1925 dwudziestotrzyletni Werner Heisenberg zaproponował nową mechanikę dla cząstek mikroświata. Był to początek prawdziwej rewolucji w fizyce, największej do tej pory. Można było wziąć podręcznik, wyszukać jakiś problem klasycznej mechaniki i rozwiązać go nowymi metodami. Niemal zawsze wynik taki znajdował zastosowanie w świecie atomów i cząsteczek, pozwalając zrozumieć zjawiska dotąd zupełnie niezrozumiałe.Heisenberg,Werner_1926

 

Problemem nowej teorii była interpretacja fizyczna (w jakimś sensie stanowi ona zresztą problem do dziś). Pod koniec marca 1927 roku Werner Heisenberg opublikował pracę O poglądowej treści kinematyki i mechaniki kwantowej. Znalazła się w niej słynna zasada nieoznaczoności: w przypadku cząstki kwantowej nie możemy przyjąć, że znamy jednocześnie jej położenie i prędkość. Każdą z tych wielkości z osobna możemy zmierzyć z dowolną dokładnością, ale tracimy wówczas informację o drugiej.

  1. Zilustrujemy to najpierw przykładem, który Heisenberg podał nieco później.
  2. W następnej kolejności rozpatrzymy mikroskop Heisenberga z 1927 roku.
  3. Pokażemy też, jak zasada nieoznaczoności pozwala zrozumieć fundamentalny fakt doświadczalny: stabilność atomów – w myśl fizyki klasycznej takie układy powinny być nietrwałe.
  1. W mechanice klasycznej (niekwantowej), aby obliczyć, co się stanie z pewnym ciałem, np. kamieniem, który rzucamy, należy znać jego położenie oraz prędkość w pewnej chwili. Oczywiście, trzeba znać siły działające na nasze ciało. Warunki początkowe plus siły pozwalają, przynajmniej w zasadzie, obliczyć, co się stanie w chwilach późniejszych albo, co się z naszym kamieniem działo w chwilach wcześniejszych – mechanika nie rozróżnia przeszłości i przyszłości w taki sposób jak my: przeszłość pamiętamy, przyszłości jeszcze nie ma. Heisenberg starał się sformułować swoją teorię, używając jedynie wielkości, które można zmierzyć. Sądził np., że takie pojęcie jak tor elektronu nie ma sensu empirycznego i w związku z tym nie należy sobie wyobrażać, iż elektrony w atomie jakoś się poruszają w sposób klasyczny. Louis de Broglie zaproponował kilka lat wcześniej, aby traktować elektron jako falę o długości

     \lambda=\dfrac{h}{p}=\dfrac{h}{mv},

    gdzie h jest stałą Plancka, p – pędem, czyli iloczynem masy m i prędkości v. Fala o ustalonym kierunku i wartości pędu, to fala płaska. Wiemy, że jeśli fala taka przejdzie przez szczelinę, ulegnie ugięciu.electron diffraction

     

     

     

    Przejście przez szczelinę o szerokości d możemy potraktować jak pomiar współrzędnej: znamy położenie elektronu z dokładnością do szerokości szczeliny. Nie możemy jednak określić dokładnie pędu naszego elektronu w kierunku poziomym. Krzywa dyfrakcyjna na rysunku oznacza rozkład prawdopodobieństwa znalezienia elektronu w różnych punktach. Pęd w kierunku poziomym jest statystycznie rozmyty. Wielkość jego rozmycia, to zgodnie z tym, co pisaliśmy o dyfrakcji:

    \Delta p=p\sin\theta=p\dfrac{\lambda}{d}.

    Mnożąc nieoznaczoność poziomej współrzędnej przez nieoznaczoność poziomego pędu, otrzymujemy:

    \Delta x\Delta p= \lambda p=h.

    Co oznacza ten związek? Jeśli dokładniej chcemy znać wartość współrzędnej x, to musimy za to zapłacić większym rozmyciem pędu, i na odwrót: dokładna znajomość pędu oznacza, że fala elektronu jest płaska, czyli nieskończenie szeroka w kierunku poziomym (przed wejściem do szczeliny) – nic wówczas nie wiemy o położeniu elektronu. Stan kwantowy charakteryzuje się więc tym, że zarówno współrzędna, jak i pęd muszą być rozmyte. Mówimy tu o szerokości rozkładów prawdopodobieństwa: w ściślejszym sformułowaniu należy z lewej strony pomnożyć odchylenia standardowe współrzędnej oraz pędu. Nie dziwmy się, że fizycy z lat dwudziestych ubiegłego wieku mieli trudności w zrozumieniu zachowania elektronów. Rozkład prawdopodobieństwa narysowany powyżej obowiązuje także w przypadku, gdy przez szczelinę przechodzi zawsze tylko pojedynczy elektron. Z jakichś powodów przechodzi on więc przez całą szczelinę jednocześnie, chociaż przyłapać go możemy zawsze tylko w konkretnym punkcie. Zachowanie się cząstki kwantowej w pobliżu przeszkody oddaje dobrze poniższy rysunek Charlesa Addamsa, rysownika zupełnie niezwiązanego z fizyką.
    YAGO600SPAN

  2. Rozpatrzmy jeszcze przykład mikroskopu Heisenberga – jest to Gedankenexperiment – doświadczenie pomyślane, nie interesujemy się techniczną wykonalnością, lecz zasadami fizyki. Załóżmy, że chcemy zmierzyć położenie elektronu oraz jego pęd w kierunku poziomym. Aby elektron zobaczyć, musimy go oświetlić. Nasz przedmiot (elektron) musi znajdować się praktycznie w ognisku obiektywu mikroskopu. mikroskop1Najmniejszy kąt możliwy do rozdzielenia przez nasz mikroskop, to kąt znaleziony przez Airy’ego, mamy więc

     \Delta x=f \alpha=1,22 f\dfrac{\lambda}{D},

    Przyjęliśmy, że \alpha jest nieduży (znacznie mniejszy od jednego radiana, wówczas wartości sinusa i tangensa kąta można zastąpić jego wartością w radianach); f jest ogniskową, D – średnicą obiektywu. Ponieważ oba te parametry soczewki są mniej więcej zbliżonej wielkości, więc najmniejsza odległość przedmiotów, jakie możemy rozdzielić jest rzędu długości fali. Dlatego używa się mikroskopów elektronowych: jeśli elektrony mają znaczny pęd, to zgodnie ze wzorem de Broglie’a ich długość fali jest niewielka i mamy szansę dostrzec mniejsze szczegóły niż za pomocą mikroskopu optycznego. Heisenberg wyobraził sobie mikroskop, w którym używamy promieniowania \gamma o bardzo małej długości fali, wtedy nieoznaczoność współrzędnej może być odpowiednio mniejsza. Co jednak z pędem? Nasz elektron zderza się z fotonem, w zderzeniu tym zachowany jest pęd, zatem mierząc pędu fotonu w kierunku poziomym, możemy znaleźć pęd elektronu. Aby foton wpadł do obiektywu, musi poruszać się w odpowiednim kierunku. mikroskop2To z kolei oznacza, że pozioma składowa jego pędu jest znana z dokładnością

    \Delta p=p\sin\theta\approx p\dfrac{D}{2f}.

    Mnożąc obie nieoznaczoności, otrzymamy

    \Delta x\Delta p=0,61\lambda p\approx h.

  3. Zastosujemy zasadę nieoznaczoności do wyznaczenia wielkości atomu wodoru. Możemy sobie wyobrażać, że mamy nieskończenie ciężki proton, który przyciąga elektron. Energia potencjalna elektronu jest wówczas równa

    V=-\dfrac{e^2}{r},

    gdzie e^2 zawiera ładunek elementarny i stałą z prawa Coulomba, tzn. e^2={q_e}^2/{4\pi\epsilon_0}. Energia potencjalna w funkcji odległości wygląda jak na wykresie.coulomb

    Im bliżej protonu znajdzie się elektron, tym mniejsza będzie jego energia potencjalna. Każdy układ fizyczny, jeśli go zostawić w spokoju, przejdzie do stanu o najniższej możliwej energii. W tym przypadku nie ma najmniejszej energii: studnia potencjału nie ma dna, więc nasz elektron powinien spaść na proton. Znaczyłoby to, że nie mamy atomu wodoru. Rzeczywiście, z punktu widzenia fizyki niekwantowej, nawet jeśli umieścimy elektron na kołowej orbicie wokół protonu, zacznie on wysyłać promieniowanie elektromagnetyczne, ponieważ ruch przyspieszony generuje takie fale. Unoszą one energię i nasz elektron powinien skończyć na protonie. Zasada nieoznaczoności pozwala tego uniknąć. Załóżmy, że r i p oznaczają typowe wartości nieoznaczoności odległości i pędu. Mamy wtedy

    rp\approx h\mbox{, zatem } \dfrac{1}{r}\approx \dfrac{p}{h}.

    Typowe wartości odległości oraz pędu powinny być takiego samego rzędu, dlatego opuściliśmy symbole \Delta. Całkowita energia równa jest sumie energii kinetycznej i potencjalnej:

    E=\dfrac{p^2}{2m}-\dfrac{e^2}{r}=\dfrac{1}{2m}p^2-\dfrac{ e^2}{h} p.

    Wyrażenie to jest funkcją kwadratową zmiennej p. Wykresem tej funkcji jest parabola, współrzędne jej wierzchołka pozwalają nam znaleźć zarówno wartość najmniejszej energii, jak i wartość odpowiadającej jej odległości r_0:

    E=-\dfrac{me^4}{2\hbar^2}\mbox{, } r_0=\dfrac{\hbar^2}{me^2}.

    Oczywiście, w takim oszacowaniu nie otrzyma się dokładnych wartości. Nasze wyniki mogą się różnić o jakieś czynniki liczbowe typu \pi^2. Nieco w tych wzorach oszukałem, wstawiając wartości \hbar=h/{2\pi}, wtedy wszystko się zgadza. Energia wychodzi równa -13,6 eV (oznacza to, że trzeba elektronowi dostarczyć 13,6 eV, aby miał energię równą zero: odpowiada to jonizacji). Odległość elektronu 0,5 Å – jest to jakaś średnia odległość, atom ma średnicę rzędu 10^{-10} \mbox{ m}. Nie o dokładne liczby jednak chodzi, lecz o pewien mechanizm: gdyby elektron stale przebywał bardzo blisko protonu, co daje niską energię potencjalną, musiałby mieć duży pęd, a to oznacza dużą energię kinetyczną. Stan o najmniejszej energii jest więc swoistym kompromisem, który minimalizuje energię.

George Biddell Airy: Jak drobne szczegóły można dostrzec przez teleskop?

Widziałem jakiś czas temu reklamę, a w niej na zdjęciu – rzekomo satelitarnym – rozpoznawalne twarze jakichś celebrytów. Czy to możliwe technicznie? Nie bardzo. Wprawdzie w sprawach techniki lepiej nie twierdzić, że coś jest niemożliwe, ale tutaj trudności są dość zasadnicze i wynikają z falowej natury światła.

Do wyjaśnienia sprawy przyczynił się Airy, wtedy niedługo po trzydziestce, profesor katedry Plume’a w Cambridge, a niebawem 7. Astronom Królewski, ten ostatni urząd pełnił niemal pół wieku. Wyróżniał się jako zdolny młodzieniec, zanim skończył siedemnaście lat, znał dziewięć rozdziałów Matematycznych zasad filozofii przyrody Isaaca Newtona, a więc materiał matematycznie nietrywialny. Dostał się na studia do Trinity College w Cambridge jako sizar, czyli coś w rodzaju studenta służącego, ponieważ miał talent do matematyki, łaciny oraz greki. Ze zdecydowanie najlepszym wynikiem zdał Tripos, egzamin matematyczny, który bardzo ceniono. Potem przez dwa lata był profesorem katedry Lucasa – tak jak kiedyś Newton. Katedra ta nie przynosiła jednak wówczas dochodów, płacono 99 funtów rocznie, podczas gdy Airy jako młodszy tutor zarabiał 150. Namówiono go jednak, aby się o nią ubiegał ze względów wizerunkowo-prestiżowych. Szczerze mówiąc, katedra podupadła, Airy był pierwszym liczącym się profesorem na niej od czasów Newtona. Kiedy poinformowano go, że profesor katedry Plume’a („astronomia i filozofia eksperymentalna”) czuje się niezbyt dobrze i zapewne długo nie pociągnie, Airy zaczął się starać o tę posadę. Zdobył ją, kiedy się zwolniła drogą naturalną, przy okazji wydębiając od uniwersytetu podwyżkę z 300 do 500 funtów. W ten sposób został astronomem, do jego obowiązków bowiem należało kierowanie obserwatorium uniwersyteckim. Airy potrzebował pieniędzy: studia dawały mu możliwość awansu, nie upierał się, że musi być uczonym, ale skoro los tak chciał, to nim został. Pragnął też się ożenić, do czego również potrzebował pieniędzy. Był niezwykle pracowity, dobrze zorganizowany, sumienny, nie wyrzucał żadnych papierów, zszywał je, tworząc do nich system odnośników. Codziennie tłumaczył jakiś kawałek z angielskiego na łacinę. Optyką zajął się jako nauką pomocniczą astronomii. Odkrył we własnym wzroku wadę, zwaną dziś astygmatyzmem i jako pierwszy starał się ją skorygować specjalnymi soczewkami. Ogłosił drukiem 518 krótszych prac oraz kilka książek. Nie był wielkim uczonym, ale sporo osiągnął. Nie wszyscy muszą być twórczy i mieć szalone pomysły, nauka do codziennego funkcjonowania potrzebuje ludzi pracowitych i kompetentnych.

W 1834 roku Airy przedstawił w Cambridge Philosophical Society pracę na temat ugięcia światła na kołowym otworze. Sam chyba nie rozumiał wówczas, że rozstrzygnął fundamentalny problem astronomii: jakie najmniejsze kąty można rozróżnić posługując się przyrządem optycznym o danej średnicy – jego wynik dotyczy oka ludzkiego, aparatów fotograficznych, teleskopów, mikroskopów itd. Airy urodził się mniej więcej wtedy, gdy Thomas Young zaproponował falową teorię światła. Została ona rozwinięta niezależnie przez Augustine’a Fresnela. Fale mogą ze sobą interferować, to znaczy, gdy do jakiegoś obszaru docierają np. dwie niezależne fale, zaobserwujemy ich sumę. Fala wyjściowa może być silniejsza (interferencja konstruktywna)

constructive

Może też wystąpić interferencja destruktywna, w szczególnym przypadku, wypadkowa może być równa zeru.

destructive

Na obu rysunkach fala niebieska jest sumą zielonej i czerwonej. Oba rysunki możemy traktować albo jako zrobione w funkcji czasu w jednym miejscu, albo jako migawkowe zdjęcia fali w przestrzeni w pewnym określonym momencie. Ponieważ fala to przesuwające się z pewną prędkością drganie, zależności przestrzenne można przełożyć na czasowe i odwrotnie.

Rozważmy najpierw dyfrakcję na wąskiej długiej szczelinie. Z lewej strony dociera fala płaska, za szczeliną rozchodzi się fala nieco rozmyta pod względem kierunku (powierzchnie falowe są prostopadłe do kierunku rozchodzenia się fali).

Wave_Diffraction_4Lambda_Slit

Wikipedia: Diffraction

Jakie będzie kątowe rozmycie fali ugiętej? Mamy do dyspozycji dwie wielkości: \lambda – długość fali oraz d. Można z nich utworzyć kąt w radianach, które są bezwymiarowe (iloraz długości luku i promienia): \lambda/d. Prawdopodobnie nasz kąt będzie w przybliżeniu równy temu ilorazowi z dokładnością do jakegoś czynnika czysto liczbowego (odwrotny iloraz nie zachowywałby się dobrze przy \lambda\rightarrow 0, gdy dyfrakcja powinna być niewidoczna; gdyby fale miały zerową długość, wystarczyłaby do wszystkiego optyka geometryczna i wyobrażanie sobie światła jako promieni).

Właśnie to rozmycie w kierunkach ogranicza zdolność rozdzielczą. Soczewka teleskopu czy oka nie zmienia tego faktu. Bez dyfrakcji działanie soczewki wyglądałoby tak:

Lens_and_wavefronts

Wikipedia: Lens

Jeśli kierunki za soczewką (otworem) są rozmyte, to obraz w ognisku nie będzie punktowy, lecz będzie stanowił plamkę. Dlatego w dalszym ciągu zostawiamy soczewki, ponieważ nie one są tu istotne, lecz rozważamy szczelinę – w tym zjawisku liczy się fakt, że soczewka jest otworem, a nie np. z czego jest wykonana itp. Żeby obliczyć falę docierającą do jakiegoś punktu, można posłużyć się zasadą Huygensa: każdy punkt czoła fali jest źródłem kulistych fal. Należy wszystkie te fale dodać do siebie, co w przypadku szerokiej szczeliny oznacza całkowanie, ale obejdziemy się bez niego. W  przejściu przez szczelinę źródłami fal są wszystkie jej punkty. Jeśli punkt obserwacji znajduje się daleko, to fale cząstkowe będą biegły praktycznie równolegle do siebie. W kierunku prostopadłym do czoła fali padającej (kąt \theta=0) wszystkie fale cząstkowe mają tak samo daleko, więc będą się dodawać konstruktywnie: na wprost naszej szczeliny pojawi się maksimum natężenia fali. Jeśli nasz punkt obserwacji będzie nieco z boku, jedne fale będą miały dalej, drugie bliżej, więc w wyniku interferencji powstanie fala o nieco mniejszej amplitudzie: składowe fale nieco się „rozjeżdżają”, nie wszystkie drgają w tej samej fazie. Dla jakiego kąta \theta pojawi się pierwsze minimum natężenia? Sytuację przedstawia rysunek.

destruktywna

Skrajne fale elementarne z dwóch końców szczeliny mają teraz różnicę odległości równą \lambda – czyli długość fali. Te skrajne fale będą się więc wzmacniać, co jednak z resztą? Możemy naszą szczelinę podzielić w myślach na połowy i rozpatrywać pary fal, jak na rysunku. Różnica odległości między nimi to dokładnie \frac{1}{2} \lambda, a więc będą interferować destruktywnie, dając w wyniku zerowe natężenie. Ponieważ dla każdej fali z górnej połówki szczeliny możemy znaleźć drugą w dolnej połówce, która ją unicestwi, więc w efekcie dostaniemy zero: minimum natężenia. Kąt, dla którego wystąpi owo minimum spełnia warunek widoczny z rysunku:

\sin\theta=\dfrac{\lambda}{d}.\mbox{ (*)}

Dla małych kątów sinus można zamienić kątem (w radianach; 2\pi \mbox{rd}=360^{\circ}). Mamy więc

\theta \approx\dfrac{\lambda}{d}.

Natężenie za szczeliną przedstawia wykres.

sincsquared

Pierwsze minimum występuje dla kątów spełniających warunek (*). Większa cześć światła pojawi się jako jasny środkowy prążek, obok którego wystąpią mniej jasne prążki poboczne. Kiedy możemy rozróżnić dwie fale przybiegające z lewej strony pod różnymi kątami? Za graniczną sytuację uważa się taką, jak poniżej: główne maksimum jednej fali przypada na minimum drugiej (to tzw. kryterium Rayleigha).

rayleigh

Co się zmieni, gdy zamiast szczeliny weźmiemy okrągły otwór. To zadanie w sam raz dla Senior Wranglera (zwycięzcy Tripos). Wynik nie wyraża się przez funkcje elementarne, lecz przez funkcje Bessela. Airy obliczył je numerycznie, co w tamtych czasach – bez Wolfram Alpha, Mathematiki, Sage’a itd. – było niewyobrażalnie pracochłonne, a dziś można to liczyć w przeglądarce. Obraz jakościowo się nie zmienił. Oczywiście, będzie miał symetrię osiową, teraz będziemy mieli środkową jasną plamkę (plamkę Airy’ego), otoczoną pierścieniami.

283px-Airy-pattern.svg

 

Wikipedia: Airy disk

Kąt do pierwszego minimum wynosi dokładnie

\sin\theta=1,22 \dfrac{\lambda}{d}.

Możemy teraz obliczyć zdolność rozdzielczą fotografii satelitarnych. Oznaczmy przez x długość najmniejszego obiektu, który chcemy rozróżnić; niech nasz satelita krąży na wysokości h, wówczas kąt \theta będzie równy

\theta=\dfrac{x}{h}.

Podstawiając h=500 \mbox{ km}, d=2,5 \mbox{ m} (więcej niż teleskop Hubble’a!) oraz biorąc długość fali żółtego swiatła \lambda=0,6 μm, otrzymujemy

x=1,22 \dfrac{\lambda h}{d}\approx 0, 15 \mbox{ m}

Obliczyliśmy mniej więcej graniczną wartość „piksela” na zdjęciu satelitarnym. Rzeczywiste rozmiary piksela obecnych satelitów cywilnych są kilkukrotnie większe. Nie ma mowy o rozróżnianiu twarzy. Problem stanowi średnica naszego obiektywu. Większe wartości niż kilka metrów są zdecydowanie niepraktyczne. Można posłużyć się np. dwoma mniejszymi obiektywami, które będą dość daleko od siebie, np. w odległości 10 m albo i dużo więcej, i łączyć ich obrazy. Astronomowie używają czegoś takiego, więc pewnie i wojskowi mogą. Wciąż jednak mało prawdopodobne, aby stosować sprzęt tego rodzaju do sfotografowania paru celebrytów, których można bez problemu sfotografować z odległości kilku metrów.

Dyfrakcyjne ograniczenie zdolności rozdzielczej jest problemem w pewnych sytuacjach, choć astronomowie na Ziemi większy kłopot mają z ruchami atmosfery, które poruszają obrazem i zamazują go przy dłuższej ekspozycji. Rozumiejąc zjawiska dyfrakcyjne, można częściowo oczyścić z nich obraz za pomocą odpowiednich procedur matematycznych, ale niełatwo osiągnąć jakąś zdecydowaną poprawę.