Od zasady najdłuższego czasu do równań Maxwella (II)

Pokażemy, jak równania Maxwella wynikają z zasady najmniejszego działania dla pól relatywistycznych. Można powiedzieć, że klasyczny elektromagnetyzm jest najprostszą teorią relatywistyczną. Kolejność historyczna była odwrotna: najpierw równania Maxwella, a potem teoria względności. Teoria względności ma tu znaczenie fundamentu, ponieważ określa geometrię czasoprzestrzeni (przestrzeni Minkowskiego). Formalizm geometrii czasoprzestrzennej nie jest może oczywisty na pierwszy rzut oka, ale nawet na pierwszy rzut oka widać, że równania mają znacznie elegantszą formę.

Pokazaliśmy poprzednio, jak z zasady najmniejszego działania otrzymać dynamikę relatywistyczną cząstki. Należy w tym celu zdefiniować działanie tak, aby nie zależało od układu współrzędnych – tzn. było skalarem lorentzowskim: a więc funkcją nie zmieniającą się nie tylko przy obrotach, ale także przy transformacjach Lorentza (które geometrycznie są podobne do obrotów, tyle że mieszają ze sobą współrzędne przestrzenne i czasowe). Chcąc uwzględnić pole zewnętrzne, nie wystarczy teraz dodać funkcję będącą energią potencjalną cząstki. Okazuje się, że jeśli żądamy, aby nasze działanie było skalarem, to najprostsze pole zewnętrzne musi mieć cztery składowe: musi być czterowektorem A_{\mu} (zwanym czteropotencjałem). Równania ruchu, które uzyskuje się z zasady najmniejszego działania są wówczas równoważne wyrażeniu na siłę Lorentza w elektromagnetyzmie. Wielkością, która wchodzi do tego wyrażenia nie jest samo A_{\mu} , lecz jego pochodne:

F_{\mu\nu}=\partial_{\mu}A_{\nu}-\partial_{\nu}A_{\mu},

gdzie wprowadziliśmy krótsze oznaczenie: \dfrac{\partial}{\partial x^{\mu}}\equiv \partial_{\mu}.
Wielkości F_{\mu\nu} okazują się składowymi pola elektromagnetycznego: jest ich sześć, bo z definicji widać, że F_{\mu\nu}=-F_{\nu\mu} , a więc macierz 4×4 jest antysymetryczna i ma sześć składowych niezależnych. F_{\mu\nu}, zwane w czasach Einsteina Sechs-Vektor, jest tensorem, tzn. przy transformacjach zachowuje się tak jak iloczyn dwóch czterowektorów: x_{\mu}y_{\nu} . Oznacza to w szczególności, że przy transformacjach Lorentza pola elektryczne i magnetyczne będą się mieszać. Łatwo zauważyć, że powinno tak być. Weźmy parę spoczywających ładunków. Działają one na siebie siłą kulombowską. Jeśli będziemy je obserwować z układu odniesienia, względem którego oba ładunki się poruszają, będziemy mieli do czynienia z prądami, a więc i z polem magnetycznym.

Chcąc zbudować nie teorię cząstek w zadanym polu zewnętrznym, lecz równania, które musi spełniać pole, trzeba uogólnić nieco podejście. Zmiennymi będą teraz nie współrzędne cząstek, lecz wartości pól A_{\mu\nu}(x^{\rho}) . Zaznaczyliśmy wprost, że wartości pola są funkcjami położeń i czasu. Lagranżian musi teraz zależeć od wartości pola oraz jego pierwszych pochodnych: {\cal L}={\cal L}(A_{\mu}, \partial_{\nu}A_{\mu}). . To, co teraz robimy, jest uogólnieniem jednowymiarowwej teorii struny. Działanie musi przyjąć postać:

{\displaystyle S=\int {\cal L} dx^0dx^1dx^2dx^3\equiv \int {\cal L}d^4 x}

Całkujemy po czterowymiarowym obszarze w czasoprzestrzeni. Jaką postać musi przybrać działanie? Podobnie jak w przypadku struny spodziewamy się funkcji kwadratowej w A_{\mu} i jej pochodnych. Działanie powinno zawierać dwa wyrazy: jeden opisujący pola swobodne, drugi – ich oddziaływanie z naładowanymi cząstkami. Ten drugi wyraz już właściwie znamy z poprzedniej części. Gdy mamy wiele cząstek, należy oczywiście po nich wszystkich wysumować. Wrażenie to nie miało postaci całki czterowymiarowej, ale można je do takiej postaci przepisać, używając funkcji (dystrybucji) Diraca. Nie będziemy tego robić, ponieważ jest to ćwiczenie czysto rachunkowe. Zajmiemy się natomiast bliżej działaniem dla pól swobodnych. Lagranżian (ściśle mówiąc: gęstość lagranżianu) powinien być skalarem lorentzowskim. Najprostszym takim skalarem będzie wyrażenie:

{\cal L}=-\dfrac{1}{4\mu_0} F^{\mu\nu}F_{\mu\nu},

gdzie \mu_0 jest stałą fizyczną: przenikalnością magnetyczną próżni. Tensor z podniesionymi wskaźnikami ma niektóre wyrazy innego znaku niż ten z opuszczonymi: transformuje się on bowiem jak iloczyn dwóch czterowektorów x^{\mu}y^{\nu}. W praktyce oznacza to, że wyrazy z jednym wskaźnikiem czasowym zmieniają znak, pozostałe zaś są takie same. Żonglerka wskaźnikami potrzebna jest ze względu na rozróżnienie przestrzeni i czasu, które są w teorii względności nadal fundamentalnie różne. Jeśli w naszych sumach każdy wskaźnik górny jest sumowany z takim samym wskaźnikiem dolnym, to wyrażenie jest skalarem lorentzowskim. Iloczyn F^{\mu\nu}F_{\mu\nu} musi się zatem transformować, jak x^{\mu}y^{\nu}x_{\mu}y_{\nu}=(x^{\mu}x_{\mu})\cdot(y^{\nu}y_{\nu}),
a więc nie będzie zależeć od układu współrzędnych.

W dalszym ciągu postępujemy jak poprzednio, tzn. wyobrażamy sobie, że nasze pole A_{\mu} zmienia się na A_{\mu}+\delta A_{\mu} i obliczamy liniową część przyrostu działania:

{\displaystyle \delta S=\dfrac{1}{\mu_0}\int \partial_{\mu}F^{\mu\nu}\delta A_{\nu}d^4 x.}

Z zasady najmniejszego działania otrzymujemy więc cztery równania:

\boxed{\partial_{\mu}F^{\mu\nu}=0.}

Są to równania Maxwella, tzn. dokładnie ta ich para, w której występują prądy i ładunki (u nas one znikają). Możemy je równie dobrze zapisać w postaci:

\boxed{\partial^{\mu}F_{\mu\nu}=0.}

.
Pochodna ze wskaźnikiem na górze jest równa z definicji \partial^{\mu}\equiv\dfrac{\partial}{\partial x_{\mu}}.

Są to trywialne zmiany zapisu, z naszego punktu widzenia potrzebne do tego, by otrzymać prawidłowe znaki.
Równań Maxwella jest jednak osiem. Co stało się z drugą parą równań? Okazuje się, że mają one postać:

\boxed{\partial_{\mu}F_{\nu\rho}+\partial_{\rho}F_{\mu\nu}+\partial_{\nu}F_{\rho\mu}=0.}

gdzie trójka różnych wskaźników jest przestawiana cyklicznie: \mu\nu\rho\rightarrow \rho\mu\nu\rightarrow\nu\rho\mu.

Trzy wskaźniki spośród czterech możemy wybrać na cztery sposoby, otrzymujemy więc jeszcze cztery równania, a łącznie osiem – tyle, co trzeba.
Ten drugi zestaw równań spełniony jest tożsamościowo, jeśli pamiętamy, że F_{\mu\nu}=\partial_{\mu}A_{\nu}-\partial_{\nu}A_{\mu}.

Podsumujmy jeszcze krótko, co otrzymaliśmy: najprostszy lagranżian utworzony z pola A_{\mu} prowadzi do równań Maxwella. Ich postać narzucona jest więc w znacznym stopniu żądaniem zgodności z teorią względności, czyli mówiąc żargonem fizyki: kowariantności relatywistycznej. Oba zestawy naszych równań: ten otrzymany z działania oraz ten drugi, otrzymany z warunków symetrii, mają taką samą postać w każdym układzie odniesienia. Forma, w jakiej zapisaliśmy równania, niekoniecznie jest najwygodniejsza do praktycznych zastosowań, ale ma tę zaletę, iż widzimy na pierwszy rzut oka, że cała teoria jest kowariantna.

Można otrzymać z tych równań wniosek, że w pustej przestrzeni pola elektromagnetyczne wędrują z prędkością światła. Została ona tu wprowadzona jako przelicznik odległości czasowych na przestrzenne w teorii względności. Inaczej: prędkość c jest stałą wynikającą z historycznych zaszłości: mamy inne jednostki dla czasu i przestrzeni, choć Stwórca (jakby to ujął Einstein) nie widzi między nimi większej różnicy niż różnica znaku w niektórych wyrażeniach. Na tym fundamencie zbudowaliśmy teorię elektromagnetyzmu i przewiduje ona fale rozchodzące się z prędkością c, czyli dla Stwórcy jednostkową. Ludzie najpierw zetknęli się z tą wielkością, mierząc szybkość rozchodzenia się światła, stąd jej nazwa.

Jeszcze jedna uwaga na koniec. Lagranżian przez nas przyjęty może się nie wydawać absolutnie najprostszy. Mamy tu jednak jeszcze jedną symetrię, zwaną symetrią cechowania: jeśli do czteropotencjału dodać pochodną czasoprzestrzenną dowolnej funkcji \partial_{\mu}f zmiennych przestrzennych i czasu, to lagranżian oddziaływania z poprzedniej części zmieni się wprawdzie, ale niegroźnie, tzn. równania ruchu z poprzedniej części nie zmienią się, nie zmieni się też tensor pola F_{\mu\nu} (bo jest antysymetryczny, a drugie pochodne cząstkowe są przemienne). Dlatego do lagranżianu nie ma sensu dodawać takich wyrazów, jak A_{\mu}A^{\mu} – bo nie są one niezależne od cechowania. Symetria cechowania okazała się bardzo istotna. Najpierw wydawało się, że jest to pewna szczególna własność elektrodynamiki, z czasem jednak symetrię cechowania uogólniono na tzw. cechowanie nieabelowe. Chromodynamika i teoria oddziaływań elektrosłabych są takimi teoriami z symetrią cechowania – czyli cały Model Standardowy.

Zauważmy też, że podstawową wielkością jest czteropotencjał, choć w wielu przypadkach wygodniej jest posługiwać się polami elektromagnetycznymi.

Reklamy

1 komentarz do “Od zasady najdłuższego czasu do równań Maxwella (II)

  1. Panie Jerzy, bardzo dziękuję za ostatnie artykuły mające związek ze znaczeniem symetrii w fizyce. Szczególnie cenie sobie klarowność wywodu oraz objaśnianie od podstaw i bez skrótów prezentowanego materiału. Pozdrawiam serdecznie.

    Polubienie

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Wyloguj /  Zmień )

Zdjęcie na Google+

Komentujesz korzystając z konta Google+. Wyloguj /  Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Wyloguj /  Zmień )

Zdjęcie na Facebooku

Komentujesz korzystając z konta Facebook. Wyloguj /  Zmień )

Connecting to %s