William Rowan Hamilton: kwaterniony – odkrycie i obsesja (16 października 1843)

Hamilton był cudownym dzieckiem, miał nadzwyczajną pamięć i szybko uczył się przedmiotów formalnych. Z początku oznaczało to martwe bądź egzotyczne języki: łacina, greka i hebrajski w wieku pięciu lat, do czego w dojrzałym wieku lat dziewięciu doszły tak niezbędne w Irlandii perski, arabski, sanskryt, chaldejski, syryjski, hindi, bengalski, malajski itd. Tak przynajmniej twierdził jego ojciec, który go zresztą nie wychowywał, od trzeciego roku życia chłopiec mieszkał bowiem i uczył się u jego brata pastora (rodzice zmarli, zanim William dorósł). Dzięki zetknięciu z arytmetycznymi popisami sawanta Zeraha Colburna, reklamowanego jako „American calculating boy”, lubiący się popisywać Hamilton zajął się arytmetyką, a później szerzej matematyką i fizyką matematyczną. Przeczytał Principia Newtona, a mając siedemnaście lat spostrzegł błąd w pewnym miejscu monumentalnego Traité de mécanique céleste Laplace’a. Ktoś powiedział o tym Johnowi Brinkleyowi, Królewskiemu Astronomowi Irlandii, który zwrócił uwagę na młodego człowieka. W wieku dwudziestu dwóch lat Hamilton objął to stanowisko po ustępującym Brinkleyu. Miał już do tego czasu liczący się dorobek naukowy w dziedzinie optyki i mechaniki. W obu tych dziedzinach prace Hamiltona były wybitne i zapoczątkowane przez niego metody rozwijane są do dziś. Jednak głównym tematem pracy Hamiltona, jego wieloletnią obsesją, stały się kwaterniony.

Początkowo Hamiltonowi chodziło o uogólnienie liczb zespolonych na trzy wymiary.

Liczby zespolone można uważać za uogólnienie liczb rzeczywistych, dzięki któremu równania wielomianowe mają zawsze pierwiastki. Wiemy, że w dziedzinie rzeczywistej nawet tak proste równanie, jak x^2+a=0 nie ma rozwiązania, gdy a>0. Można temu zaradzić, wprowadzając liczby urojone, będące pierwiastkami kwadratowymi z liczb ujemnych: x\pm\sqrt{a}i, gdzie jednostka urojona i musi spełniać warunek i^2=-1. Liczby urojone możemy dodawać do liczb rzeczywistych, powstają wówczas liczby zespolone postaci c+di, gdzie c,d są rzeczywiste. Okazało się, że liczby zespolone są pojęciem wybranym bardzo udatnie: nie tylko równania algebraiczne w dziedzinie zespolonej mają zawsze rozwiązania, ale teoria funkcji zmiennej zespolonej jest piękną dziedziną matematyki z wieloma zastosowaniami. Można takimi metodami badać własności liczb pierwszych (twierdzenie o rozmieszczeniu liczb pierwszych, hipoteza Riemanna), liczby zespolone pojawiają się też u podstaw fizyki, w równaniu Schrödingera – mechanika kwantowa wymaga liczb zespolonych, dzięki nim opisuje się zjawisko interferencji kwantowej.

Hamilton poszukiwał uogólnienia liczb zespolonych na trójki liczb. Chciał, aby trójki takie można było dodawać i mnożyć przez siebie. Mnożenie miało być rozdzielne względem dodawania, tak żeby można było stosować zasady zwykłej algebry. Żądał także, aby przy mnożeniu mnożyły się moduły liczb: |xy|=|x|\cdot |y|. W przypadku liczby zespolonej z=a+bi moduł równa się |z|=\sqrt{a^2+b^2}, w przypadku trypletów mielibyśmy pod pierwiastkiem sumę trzech kwadratów. Gotów był natomiast poświęcić przemienność iloczynu, co było krokiem oryginalnym i raczej przedtem niepraktykowanym. Przez dłuższy czas co rano, gdy Hamilton schodził na śniadanie, jego syn pytał: „Tato, czy potrafisz już mnożyć tryplety?”, na co uczony, potrząsając smutno głową, odpowiadał: „Niestety, nie, umiem je tylko dodawać i odejmować”.

Rozwiązanie, które pojawiło się w głowie Hamiltona w październikowy ranek, polegało na uogólnieniu idącym jeszcze o krok dalej: zamiast trójek, należy rozpatrywać czwórki liczb rzeczywistych. Hamilton przechodził właśnie z żoną w pobliżu mostu Broome Bridge w Dublinie i na pamiątkę tej chwili wyrył na jego kamieniach prawa rachunku kwaternionów. Potrzeba aż trzech dodatkowych wymiarów: q=a+b{\bf i}+c{\bf j}+d{\bf k}.

Plakietka zastępująca wytarty wpis Hamiltona

\begin{matrix} {\bf i}^2=-1&{\bf j}^2=-1&{\bf k}^2=-1\\ & &\\{\bf ij=k}&{\bf jk=i}&{\bf ki=j}\\ & & \\{\bf ji=-ij}&{\bf kj=-jk}&{\bf ik=-ki.}\end{matrix}

Kwaterniony tworzą algebrę z dzieleniem, strukturę zachowującą wszystkie oprócz przemienności reguły działań na liczbach zespolonych. Wkrótce potem przyjaciel Hamiltona John T. Graves i niezależnie Arthur Cayley odkryli oktoniony, mające osiem składowych. Jednak w ich przypadku należało zrezygnować także z łączności mnożenia: (xy)z\ne x(yz). Nauczyciel A. Einsteina na Politechnice w Zurychu, a później także jego przyjaciel, Adolf Hurwitz udowodnił, że jeśli chcemy, by zachodziło mnożenie modułów, to liczby rzeczywiste \mathbb{R}, zespolone \mathbb{C}, kwaterniony \mathbb{H} oraz właśnie oktoniony wyczerpują wszystkie możliwości. Trudności Hamiltona z mnożeniem trypletów były nie do pokonania, a znalezione wyjście z sytuacji – praktycznie jedyne.

Do czego można było zastosować tak dziwne czterowymiarowe obiekty w XIX wieku? Czasoprzestrzeń była wciąż daleką przyszłością, choć Hamilton spekulował, iż kwaternion składa się z części skalarnej i wektorowej – oba terminy zostały zastosowane właśnie przez niego po raz pierwszy. Dziwne reguły formalne algebry kwaternionów przyjmowane były z pewnymi oporami: bo czy matematyk może zadekretować, co zechce, byle tylko nie popaść w sprzeczność? Dziś takie stanowisko znajduje znacznie więcej zrozumienia niż w połowie XIX wieku, ale i dzisiejszy czytelnik może się zastanawiać, czy aby na pewno obiekty o takich własnościach istnieją. Kwaterniony pozwoliły na krótszy zapis niektórych wyrażeń zawierających wektory. Wektor można przedstawić w postaci

\vec{a}=a_1 {\bf i}+a_2 {\bf j}+a_3 {\bf k},

jest on więc szczególnym rodzajem kwaternionu z zerową częścią skalarną (zwanym czasem czystym kwaternionem):

a=0+a_1 {\bf i}+a_2 {\bf j}+a_3 {\bf k}=(0,\vec{a}).

Kwadrat takiego kwaternionu jest równy

a^2=(a_1 {\bf i}+a_2 {\bf j}+a_3 {\bf k})(a_1 {\bf i}+a_2 {\bf j}+a_3 {\bf k})=-(a_1^2+a_2^2+a_3^2),

gdzie skorzystaliśmy z tabelki mnożenia Hamiltona. Iloczyn dwóch czystych kwaternionów nie jest więc kwaternionem czystym i ma na ogół niezerową część skalarną:

ab=(0,\vec{a})(0, \vec{b})=(-\vec{a}\circ\vec{b},\vec{a}\times\vec{b}),

gdzie \vec{a}\circ\vec{b} to iloczyn skalarny, a \vec{a}\times\vec{b} – iloczyn wektorowy obu wektorów. Oba te pojęcia czekała znaczna kariera w analizie wektorowej, ale dopiero po uwolnieniu się z gorsetu kwaternionów. Oczywiście i przedtem wiele wyrażeń spotykanych w rozważaniach geometrycznych czy mechanicznych de facto sprowadzało się do tych iloczynów. Współczesnego czytelnika nieco odstręcza powtarzanie trzy razy wyrażeń, które są składowymi pewnego wektora w dziełach, np. Eulera czy Lagrange’a. Użycie iloczynu wektorowego upraszcza zapis, choć też ogranicza go do przypadku trójwymiarowego, bo tylko trójwymiarowe wektory pomnożone „wektorowo” dają w wyniku wektor trójwymiarowy. Uproszczenie zapisu jest zawsze pożądane, choć trudno je uznać za wiekopomne odkrycie (por.  konwencję sumacyjną Einsteina).

Ambicje Hamiltona sięgały znacznie dalej i kwaterniony stały się jego ulubionym tematem, którym zajmował się przez następne dwadzieścia lat, aż do śmierci. Mimo że Hamilton pracował sam i w Dublinie był raczej osamotniony naukowo, jego odkrycie wzbudziło zainteresowanie i powstała szkoła zwolenników takiej metody formułowania problemów. Dość powiedzieć, że w jednym z wydań swego fundamentalnego traktatu o elektryczności i magnetyzmie, James Clerk Maxwell zastosował formalizm kwaternionów. Było to już po śmierci Hamiltona i w przyszłości formalizm ten wyszedł praktycznie z użycia. Druga połowa życia Hamiltona była mniej twórcza, uczony poszukiwał wciąż nowych zastosowań kwaternionów, napisał na ich temat potężne tomisko, niezbyt czytane, jak łatwo się domyślić, i do ostatnich dni pracował nad krótszym do nich wprowadzeniem. Trzeźwą ocenę kwaternionów sformułował lord Kelvin w 1892 r.:

Kwaterniony odkryte zostały przez Hamiltona już po jego naprawdę bardzo dobrych pracach i choć są pięknym pomysłem, stały się czystym złem dla wszystkich, którzy ich tknęli, włącznie z Jamesem Clerkiem Maxwellem.

Konserwatywny Kelvin miał dużo racji. Łączenie w jedną całość trójwymiarowych wektorów i skalarów jest niezbyt szczęśliwym pomysłem w fizyce. Hamilton nie potrafił oprzeć się urokowi swej koncepcji, lecz jej zastosowania nie stały się głównym nurtem matematyki ani fizyki. Choć co jakiś czas ktoś próbuje ich nowych zastosowań, jak np. kwaternionowa mechanika kwantowa. Wielką umiejętnością jest w nauce nie tylko dostrzeganie tematów, ale także ich porzucanie, kiedy nie rokują zbyt dobrze. Takim tematem przyciągającym niektórych jak ćmy do ognia było przez wieki Wielkie Twierdzenie Fermata, sporo karier matematycznych nadwyrężyły bądź zniszczyły nieudane próby jego udowodnienia.

Mnożenie kwaternionów jest nieprzemienne i w można je powiązać z obrotami w przestrzeni trójwymiarowej, co zauważył zresztą sam Hamilton. Zastosowanie to odżyło dziś dzięki grafice komputerowej. Kwaterniony są tu jednak wyłącznie wygodnym narzędziem, jednym wśród wielu. Okazuje się, że kwaternion o jednostkowym module

q=(\cos\vartheta/2, \vec{n}\sin\vartheta/2 ),

gdzie \vec{n} jest wektorem jednostkowym, opisuje obrót o kąt \vartheta wokół osi \vec{n}. Obrót taki zdefiniowany jest w języku kwaternionów jako przekształcenie wektora \vec{r} w wektor \vec{r'}:

R(\vartheta, \vec{n}):\vec{r}\mapsto \vec{r'}=R\vec{r}, \mbox{  gdzie} (0,\vec{r'})=q(0,\vec{r})q^{-1}.

Widać, że składaniu obrotów odpowiada mnożenie kwaternionów, łatwo jest w takim sformułowaniu podzielić ruch na mniejsze kroki, co przydaje się w przedstawianiu ruchu obiektów 3D. Kwaterniony o jednostkowym module z operacją mnożenia zwaną tworzą grupę, nazywaną Sp(1). Ma ona bliski związek z grupą obrotów w przestrzeni trójwymiarowej, ale nie jest z nią tożsama, gdyż dwa kwaterniony q,-q dają ten sam obrót. Inaczej mówiąc, kwaternion odpowiadający obrotowi o \vartheta=2\pi, to q=\pm 1. Znak minus nie wpływa na obrót wektora, więc mogłoby się wydawać, że jest to tylko pewna matematyczna ciekawostka, gdyż R(2\pi)\vec{r}=\vec{r}. Okazuje się jednak, o czym nie wiedziano w wieku XIX, że do opisu świata fizycznego potrzebne są obiekty zmieniające znak po obrocie o 2\pi – są to spinory. Za ich pomocą opisuje się np. elektrony, ogólnie wszelkie cząstki o spinie \frac{1}{2}.

Jak zrozumieć postać kwaternionu q opisującego obrót? Każdy obrót o kąt \vartheta jest złożeniem dwóch symetrii zwierciadlanych wzgledem płaszczyzn przecinających się pod kątem \frac{\vartheta}{2}. Z kolei operacja

S(\vec{a}):\vec{r}\mapsto \vec{r'}, \mbox{  gdzie} (0,\vec{r'})=-(0,\vec{a})(0,\vec{r})(0,\vec{a})^{-1}

jest odbiciem zwierciadlanym w płaszczyźnie prostopadłej do wektora jednostkowego \vec{a}. Dla obrotu o kąt \vartheta wokół wektora jednostkowego \vec{n} możemy znaleźć dwa wektory jednostkowe \vec{a}, \vec{b}, które spełniają warunki

\vec{a}\circ \vec{b}=\cos{\vartheta/2},\, \vec{a}\times\vec{b}=\vec{n}\sin{\vartheta/2},

a więc zgodnie z zasadami mnożenia kwaternionów kwaternion q=(0,\vec{a})(0,\vec{b}) odpowiada złożeniu symetrii zwierciadlanych, czyli obrotowi. Szczegóły znaleźć można w książce M. Zakrzewskiego, Markowe wykłady z matematyki: Geometria, albo A.F. Beardona, Algebra and geometry.

 

 

 

Tory planet i komet: wielkie odkrycie Isaaca Newtona

Johannes Kepler w roku 1609 ogłosił odkrycie, że planety poruszają się wokół Słońca po elipsach, a Słońce jest wspólnym ogniskiem tym wszystkich elips (I prawo Keplera). Nie bardzo mu wówczas chciano wierzyć, wprowadził bowiem nowe rodzaje sił, jedna miała ciągnąć planetę wokół Słońca, a druga, magnetyczna, miała na przemian, to przyciągać ją, to odpychać. Prędkość planety miała zależeć od jej odległości od Słońca: bliżej niego planeta poruszała się szybciej i na odwrót, kiedy była dalej, poruszała się wolniej (II prawo Keplera).

Z czasem astronomowie stwierdzili, że opisane przez Keplera prawa dobrze odzwierciedlają zjawiska na niebie: dokładność tablic wzrosła wielokrotnie. W 1687 roku ukazały się Matematyczne zasady filozofii przyrody, w których Isaac Newton wyjaśnił ruchy planet i szereg innych zjawisk, jak przypływy i odpływy mórz albo precesję ziemskiej osi obrotu za pomocą jednej jedynej siły: grawitacji. Wszystkie ciała we wszechświecie miały się przyciągać siłami odwrotnie proporcjonalnymi do ich odległości i proporcjonalnymi do mas. Jedno proste matematycznie prawo pozwalało zrozumieć dynamikę układu planetarnego. Problem postawiony jeszcze przez starożytnych Greków i Babilończyków został w ten sposób rozwiązany. Najważniejszą częścią tego rozwiązania było udowodnienie, że z prawa grawitacji wynikają Keplerowskie elipsy. Poniżej pokażemy współczesne sformułowanie tego rozwiązania.

Wyobraźmy sobie planetę P poruszającą się wokół nieruchomego Słońca (nie jest trudno pójść o krok dalej i uwzględnić także ruch Słońca).

Każda z orbit ma punkt najbliższy Słońca: perihelium P_0. Wybierzmy oś Ox tak, żeby przechodziła ona przez perihelium i następnie poruszała się w kierunku P. Równanie ruchu planety zgodnie z II zasadą dynamiki oraz prawem powszechnego ciążenia ma postać:

\dfrac{d\vec{v}}{dt}=-\dfrac{k}{r^2}\vec{e}_r.

Wektory \vec{e}_r, \vec{e}_\varphi mają odpowiednio kierunek promienia i kierunek do niego prostopadły (transwersalny) oraz długość jednostkową, k=GM jest iloczynem stałej grawitacyjnej i masy Słońca (masa planety nie wchodzi do zagadnienia). Znak minus pochodzi stąd, że grawitacja jest siłą przyciągającą.

W ruchu planety nie zmienia się wielkość jej momentu pędu (przyjmujemy tu masę planety równą 1):

L=rv_{\varphi}=r^2 \omega=const.

Jest to współczesne sformułowanie II prawa Keplera. Wchodzi do niego składowa \vec{v}_\varphi prędkości prostopadła do promienia. W ostatniej równości użyliśmy prędkości kątowej \omega=v_\varphi/r. Więcej szczegółów dotyczących tego wyrażenia można znaleźć niżej (*).

Pokażemy, że torem planety musi być krzywa stożkowa ze Słońcem w ognisku. W tym celu udowodnimy, że odległość planety od Słońca spełnia równanie stożkowej:

r=\dfrac{p}{1+e\cos\varphi},

gdzie p, e zwane są odpowiednio parametrem i mimośrodem stożkowej, a kąt \varphi jest kątem z osią Ox na rysunku. Wyprowadzenie tego równania można znaleźć poniżej (**).

Zakładamy, że moment pędu jest różny od zera: znaczy to, iż planeta nie porusza się po prostej przechodzącej przez Słońce. Oczywiście takie tory są matematycznie i fizycznie dopuszczalne, eliminujemy je jednak z dalszych rozważań.

Równanie ruchu planety można uprościć, jeśli zamiast czasu wprowadzić do niego kąt \varphi. Wyznaczając prędkość kątową z zasady zachowania momentu pędu, otrzymujemy

\omega=\dfrac{d\varphi}{dt}=\dfrac{L}{r^2}.

W obu równaniach występuje r^2 w mianowniku, wobec tego, dzieląc je stronami i korzystając ze wzorów na pochodną funkcji złożonej i odwrotnej, możemy się tej zależności pozbyć:

\dfrac{d\vec{v}}{d\varphi}=\dfrac{d\vec{v}}{dt}\cdot \dfrac{dt}{d\varphi}=-\dfrac{k}{L}\vec{e}_r.

Równanie wektorowe to para równań dla składowych wektora prędkości:

\left\{ \begin{array}{l} \dfrac{dv_x}{d\varphi}=-\dfrac{k}{L}\cos\varphi \\  \mbox{}\\  \dfrac{dv_y}{d\varphi}=-\dfrac{k}{L}\sin\varphi.  \end{array}\right.\quad \Rightarrow \quad \left\{  \begin{array}{l}  v_x=-\dfrac{k}{L}\sin\varphi+A_x \\  \mbox{}\\  v_y=\dfrac{k}{L}\cos\varphi+A_y.  \end{array}\right.

Ostatnią parę równań możemy zapisać w postaci wektorowej

\vec{v}=\dfrac{k}{L}\vec{e}_\varphi+\vec{A}.

Wynik ma prostą interpretację geometryczną: pierwszy wektor po prawej stronie zakreśla okrąg o promieniu k/L, a promień wodzący tego okręgu tworzy z osią Ox kąt równy 90^{\circ}+\varphi, obracając się razem z promieniem wodzącym planety. W zależności od długości wektora \vec{A} możliwe są następujące cztery sytuacje:

Punkt P_0 odpowiada kątowi \varphi=0, wektor prędkości jest wtedy równoległy do osi Oy (w chwili gdy odległość osiąga minimum, składowa x prędkości musi znikać). Oznacza to, że A_x=0. W każdym przypadku koniec wektora prędkości zakreśla okrąg albo jego łuk. Krzywą taką nazywa się hodografem. Zatem hodograf ruchu keplerowskiego jest łukiem okręgu (w trzecim przypadku to okrąg bez dolnego punktu, w czwartym dozwolone są tylko te wartości \varphi, dla których wektor \vec{v} ma z okręgiem dwa punkty wspólne; pewien zakres kątów jest niedozwolony, ruch zachodzi tu po gałęzi hiperboli i ograniczony jest jej asymptotami.) Kształt hodografu ruchu keplerowskiego odkrył William Rowan Hamilton w XIX wieku i opublikował w pracy zawierającej wyłącznie słowny opis, bez żadnego rysunku i bez wzorów. Brytyjczycy (Hamilton był Irlandczykiem) po Newtonie specjalizowali się w takiej matematyce bez rachunków, co nie zawsze da się z sensem przeprowadzić. Nieco mniej formalne podejście do hodografu tego ruchu.

albo tutaj

Równanie hodografu daje nam prędkości, łatwo z nich przejść do równania toru. Wystarczy znaleźć składową v_\varphi prędkości. Otrzymamy ją przez rzutowanie wektora prędkości na kierunek promienia okręgu zaznaczonego na rysunkach. Otrzymujemy z nich

v_\varphi=\dfrac{k}{L}+A\cos\varphi \quad\Rightarrow\quad r=\dfrac{L}{k/L+A\cos\varphi}=\dfrac{\frac{L^2}{k}}{1+\frac{LA}{k}\cos\varphi}.

Ostatnie równanie jest biegunowym równaniem stożkowej o mimośrodzie e=\frac{LA}{k}, odległości liczone są od ogniska owej stożkowej. Otrzymaliśmy uogólnioną wersję I prawa Keplera.

Na rysunku oba tory: w przestrzeni prędkości oraz w przestrzeni położeń, czyli w zwykłej przestrzeni. A to paraboliczna orbita komety z roku 1680 wyznaczona przez Newtona (obliczenia robił Edmond Halley).

(*) Prędkość kątowa to

\omega=\dfrac{\Delta \varphi}{\Delta t}=\dfrac{v_\varphi \Delta t}{r \Delta t}=\dfrac{v_\varphi }{r }.

Zastępujemy tu dla małych kątów tangens wartością kąta w radianach.

(**) Stożkową definiuje się zadając pewien punkt, zwany ogniskiem oraz prostą, zwaną kierownicą (na rysunku czerwone) oraz wartość mimośrodu e.

Stożkową będzie zbiór takich punktów P, że ich odległość od ogniska jest e razy większa od ich odległości od kierownicy:

OP=ePP'.

Łatwo stąd znaleźć równanie stożkowej. Mamy bowiem

r\cos\varphi+PP'=QQ' \Rightarrow  r\cos\varphi+\dfrac{r}{e}=\dfrac{p}{e}.

Mnożąc ostatnie równanie obustronnie przez e i wyznaczając z niego r, otrzymujemy

r=\dfrac{p}{1+e\cos\varphi}.