Carl Friedrich Gauss i jego funkcja błędu (1809)

Gauss był cudownym dzieckiem, jego zdolności zwróciły uwagę księcia, dzięki czemu młody człowiek mógł się kształcić: najpierw w rodzinnym Brunszwiku, potem w Getyndze. Syn skromnego ogrodnika i murarza początkowo nie znał nawet dokładnej daty swego urodzenia – matka pamiętała jedynie, że była to środa, osiem dni przed Wniebowstąpieniem Pańskim – w 1799 roku młody uczony obliczył, że musiało to być 30 kwietnia 1777 roku. Już jego wczesne prace matematyczne, Disquisitiones Arithmeticae, poświęcone teorii liczb, oraz doktorat, zawierający dowód podstawowego twierdzenia algebry (każde równanie wielomianowe ma przynajmniej jeden pierwiastek zespolony), zawierały istotne wyniki, szeroki rozgłos zdobył jednak dzięki astronomii. W Nowy Rok 1801 teatyn z Palermo, Giuseppe Piazzi, zaobserwował słaby obiekt, który okazał się nową planetą (według współczensej terminologii: planetą karłowatą), zwaną dziś Ceres. Planeta zbliżyła się po pewnym czasie pozornie do Słońca i Piazzi nie potrafił jej później odnaleźć. Odkrył więc nową planetę i ją zagubił. Próbowano obliczyć orbitę Ceres na podstawie dostępnych obserwacji, zadanie to rozwiązał najlepiej właśnie Gauss: jego metoda nie wymagała żadnych upraszczających założeń, np. że orbita nowo odkrytego ciała niebieskiego jest okręgiem. Dzięki obliczeniom Gaussa, który był nie tylko znakomitym matematykiem, ale też bardzo sprawnym rachmistrzem, Ceres została odnaleziona. Kilka lat później uczonemu zaproponowano stanowisko dyrektora obserwatorium w Getyndze, które zajmował aż do śmierci. W roku 1809 opublikował swoją metodę wyznaczania orbity pt. Theoria motus corporum coelestium in sectionibus conicis solem ambientium (Teoria ruchu ciał niebieskich krążących wokół Słońca po krzywych stożkowych). Był to rok tragiczny dla Gaussa, we wrześniu urodziło się jego trzecie dziecko, syn Louis, miesiąc później wskutek komplikacji poporodowych zmarła jego żona Johanna. Louis przeżył swą matkę o zaledwie kilka miesięcy. Uczony ożenił się wprawdzie niedługo później ponownie: miał dwoje małych dzieci na wychowaniu, ale tragedia ta odcisnęła się głęboko na jego psychice.

Bendixen_-_Carl_Friedrich_Gauß,_1828

Portret z 1828 roku (Wikipedia)

Theoria motus zawiera rozważania na temat błędów i metody najmniejszych kwadratów. Sama ta metoda została wcześniej opublikowana przez Adriena Marie Legendre’a, lecz rozważania Gaussa poszły dalej, inspirując z kolei Laplace’a. Przedstawimy podejście Gaussa do funkcji błędu – dziś nazywamy ją rozkładem Gaussa bądź rozkładem normalnym. Gauss założył, że prawdopodobieństwo otrzymania w pomiarze wyniku różniącego się o (x, x+dx) od rzeczywistej wartości równe jest p(x)dx. Naszym zadaniem jest wyznaczenie kształtu owej funkcji. Można przypuszczać, że powinna mieć ona kształt dzwonowy: błędy przeciwnych znaków powinny być jednakowo prawdopodobne, dla dużych wartości |x| prawdopodobieństwo powinno być niewielkie.

Załóżmy, że dysponujemy serią niezależnych wyników pomiaru pewnej wielkości \mu: x_0, x_1,\ldots, x_n. Jeśli za każdym razem funkcją błędu jest p(x), to prawdopodobieństwo powinno być proporcjonalne do iloczynu:

p(x_0-\mu)p(x_1-\mu)\ldots p(x_n-\mu).

Szukamy wartości najbardziej prawdopodobnej, traktując iloczyn jako funkcję \mu. Możemy zlogarytmować nasz iloczyn i poszukać maksimum sumy logarytmów:

\ln{p(x_0-\mu)}+\ln{p(x_1-\mu)}+\ldots+\ln{p(x_n-\mu)}.

W maksimum pochodna równa jest zero, oznaczając tę pochodną przez g(x)=\frac{d\ln{p(x)}}{dx}, mamy

g(x_0-\mu)+g(x_1-\mu)+\ldots+g(x_n-\mu)=0.\mbox{(*)}

Funkcje p(x), g(x) przedstawione są jakościowo na rysunku.

error_function

Następnie Gauss robi założenie, że prawidłową wartością \mu powinna być średnia arytmetyczna wszystkich wyników. Jeśli tak, to równanie (*) słuszne jest dla każdej liczby składników i dowolnych wyników pomiaru. Możemy wziąć np. wartości

x_0-(n+1)y=x_1=\ldots=x_n,

gdzie y jest dowolną liczbą. Równanie (*) przyjmuje wówczas postać:

g(ny)+ng(-y)=0\Rightarrow g(ny)=ng(y).

Łatwo zauważyć, że oznacza to, iż g musi być funkcją liniową, którą zapiszemy jako g(y)=-y/h^2, gdzie h jest pewną stałą; uwzględniając definicję g(x), dostajemy

p(x)=C\exp{(-\frac{x^2}{2h^2})}.

Mamy więc słynną krzywą dzwonową Gaussa. Stała C musi być tak dobrana, aby pole pod krzywą było równe 1.

normal67

Parametr h zależy od dokładności pomiarów i określa szerokość krzywej, nazywamy go odchyleniem standardowym (na wykresie jest on jednostką na osi x). Iloczyn gęstości prawdopodobieństwa przyjmuje postać:

\exp{(-(x_0-\mu)^2-(x_1-\mu)^2+\ldots-(x_n-\mu)^2)}.

Szukanie najbardziej prawdopodobnej wartości \mu odpowiada więc minimalizacji sumy kwadratów odchyleń w wykładniku:

(x_0-\mu)^2+(x_1-\mu)^2+\ldots+(x_n-\mu)^2.

Nieśmiertelny wynalazek Josepha Fouriera (1804-1822)

Fourier, syn krawca, którego wcześnie odumarli rodzice, wszystko zawdzięczał swemu talentowi, a także umiejętności niezrażania sobie ludzi. Jego kariera wiele mówi o Francji tamtych czasów. Urodził się i wychowywał za panowania Ludwika XVI. Ktoś zwrócił uwagę na zdolnego chłopca i polecił go biskupowi Auxerre. Dzięki protekcji duchownego Fourier został przyjęty do szkoły artyleryjskiej kierowanej przez maurystów (benedyktyńska kongregacja św. Maura). Wcześnie ujawnił talent matematyczny. Zabiegał o przyjęcie na służbę do artylerii, lecz mimo poparcia słynnego matematyka Adrien Marie Legendre’a, minister odmówił. „Fourier, nie pochodząc ze szlachty, nie ma wstępu do artylerii, choćby nawet był drugim Newtonem” – oświadczył minister. Młody człowiek wstąpił więc do nowicjatu u maurystów, ale wybuchła Rewolucja Francuska i Fourier zmienił zdanie. Ojcowie zatrudnili go mimo to w swej szkole artyleryjskiej, gdzie uczył matematyki, a jak było trzeba, to także retoryki, filozofii i historii. Należał do słuchaczy École normale roku III: był to swoisty eksperyment szkolny, mający dostarczyć Rewolucji nowy zastęp nauczycieli. Tysiąc pięciuset uczniów słuchało wykładów największych uczonych Francji: Lagrange’a, Laplace’a, Monge’a, Bertholleta. Prawdziwą karierę zrobił Fourier dopiero za czasów Napoleona: był wśród uczonych towarzyszących Pierwszemu Konsulowi w wyprawie egipskiej („Osły i uczeni do środka” – wołali oficerowie, kiedy konwój Francuzów został zaatakowany na pustyni). Fourier został sekretarzem Instytutu Egipskiego powołanego przez Napoleona, wniósł swój wkład do jego publikacji. Po kapitulacji armii i powrocie do Francji, został prefektem departamentu Izery, gdzie budował drogi i osuszył bagna Bourgoin. W tym czasie dobiegający czterdziestki uczony zajął się poważniej fizyką matematyczną: zagadnieniem rozchodzenia się ciepła. W roku 1807 wygrał konkurs Akademii Nauk poświęcony temu zagadnieniu. W roku 1822 opublikował swą słynną monografię Théorie analytique de la chaleur – „Analityczną teorię ciepła”.

Joseph_Fourier
Wiedza o cieple nie była zbyt wielka: znano pojęcie temperatury i ciepła właściwego. Nie wiedziano, czym jest ciepło, wyobrażano sobie, że jest rodzajem nieważkiej cieczy, która przepływa z jednego ciała do drugiego, nie ginąc ani nie powstając (zasady termodynamiki sformułowano trzydzieści lat później). Fourier przyjął, że strumień ciepła na jednostkę powierzchni i czasu zależy od tego, jak szybko zmienia się temperatura z odległością.

fourier-strum

J_x=-a\dfrac{\Delta T}{\Delta x}=-a\dfrac{dT}{dx}.

Szybkość zmiany temperatury to gradient. Strumień ciepła jest więc proporcjonalny do gradientu temperatury: jeśli ten sam spadek temperatury przypada na dwa razy krótszy odcinek, to strumień będzie dwa razy większy. Znak minus informuje, że ciepło płynie od temperatury wyższej do niższej, a nie odwrotnie. Stała a charakteryzuje materiał.
Będziemy szukali przepływów stacjonarnych, tj. takich, które nie zależą od czasu. Jeśli przepływ ciepła jest jednowymiarowy, tzn. strumień jest wyłącznie w kierunku osi x, to łatwo stwierdzić, że stacjonarność oznacza wówczas stałość J_x. Powierzchnie izoterm to płaszczyzny prostopadłe do osi Ox, a gradient temperatury jest stały.
Znacznie ciekawsza jest sytuacja w przypadku 2D. Wyobraźmy sobie prostokąt o bokach \Delta x, \Delta y. W naszym przypadku stacjonarnym całkowita ilość ciepła wypływająca w jednostce czasu z prostokąta musi być równa zeru: inaczej prostokąt ogrzewałby się albo oziębiał z czasem.

fourier box

Warunek ten zapisany matematycznie oznacza, że

\Delta y(J_x(x+\Delta x, y)-J_x(x, y))+\Delta x(J_y(x, y+\Delta y)-J_y(x, y))=

=\Delta x\Delta y\left(\dfrac{\partial{J_x}}{\partial{x}}+\dfrac{\partial{J_y}}{\partial{y}}\right)=0.

W pierwszym wierszu mnożymy strumienie przez długości odpowiedniego boku prostokąta, aby otrzymać ilość ciepła przechodzącą przez daną krawędź. Korzystając z tego, że strumień związany jest z gradientem, otrzymujemy następujący warunek stacjonarnego przepływu:

\dfrac{\partial^2{T}}{\partial{x^2}}+\dfrac{\partial^2{T}}{\partial{y^2}}=0.

Jest to równanie Laplace’a, występujące też w elektromagnetyzmie i teorii grawitacji. Aby zrozumieć jego sens, można wyobrazić sobie punkt płaszczyzny otoczony przez cztery inne punkty oddalone o niewielką odległość h.

fourier neighbours

Równanie Laplace’a mówi, że średnia arytmetyczna temperatur w punktach czerwonych równa się temperaturze w środkowym punkcie niebieskim. Nie powinno to dziwić: chodziło przecież o to, aby ciepło nie gromadziło się w żadnym obszarze ani z niego nie uciekało (**). Biorąc odpowiednio małe h, można w ten sposób rozwiązać równanie Laplace’a numerycznie. Można pokazać ogólnie, że gdy funkcja spełnia równanie Laplace’a, to jej średnia wartość po małej sferze (u nas okręgu) o promieniu h równa jest wartości w środku sfery.

fourier sfera

Wśród zagadnień rozważanych przez Fouriera znalazło się i takie: mamy nieskończony dwuwymiarowy pasek, którego jeden bok utrzymywany jest w temperaturze 1, a dwa boczne w temperaturze 0 (odpowiadały one w naszej skali 100^{\circ}\mbox{C} oraz 0^{\circ}\mbox{C}). Zakładamy też, że w nieskończoności temperatura spada do zera. Szukamy rozwiązania stacjonarnego.

fourier_boundary
Łatwo można znaleźć rozwiązania, w których temperatura na obu bokach równa jest zeru oraz stopniowo spada:

T(x,y)=C\exp{(-nx)}\sin{ny},\mbox{(*)}

gdzie parametr n jest całkowity. Dla n=1 wygląda to tak:

fourier1

Dla x=0 mamy jednak funkcję zdecydowanie różną od stałej. Łatwo sobie wyobrazić, że tak będzie i dla innych wartości n. Idea Fouriera polegała na tym, aby temperaturę wzdłuż osi Oy przedstawić jako sumę nieskończenie wielu sinusów:

T(0,y)=\frac{4}{\pi}(\sin y+\frac{1}{3}\sin 3y+\frac{1}{5}\sin 5y+\ldots).

Tak wygląda suma pierwszych trzech wyrazów:

fourier3A tak ośmiu:

fourier8

Naprawdę nasza suma sinusów jest nieparzysta i wygląda następująco (osiem składników):

fourier8full

Jest to funkcja o okresie 2\pi. Podejście Fouriera spotkało się z niedowierzaniem i krytyką. Wprowadzał on do rozważań „dziwne” funkcje, które nie są określone jednym wzorem i nie są ciągłe, przybliżając je wszystkie czymś tak banalnie prostym jak sinusoidy. Wiele prac z dziedziny fizyki i matematyki wyrosło z podejścia Fouriera. Matematycy zastanawiali się nad zbieżnością i pojęciem funkcji, fizycy i inżynierowie stosowali w praktyce. Dziś traktujemy szereg Fouriera jak przedstawienie wektora za pomocą pewnych wektorów bazowych. Np. każdy wektor na płaszczyźnie możemy przedstawić jako kombinację dwóch jednostkowych wektorów o kierunkach osi x i y. Funkcje okresowe o okresie 2\pi wyrażają się przez funkcje \sin{nx} i \cos{nx}, które pełnią rolę wektorów bazowych. Przestrzeń tak zdefiniowana jest nieskończenie wymiarowa i nazywa się przestrzenią Hilberta. Z punktu widzenia fizyka czy inżyniera analiza fourierowska pozwala rozłożyć każdy impuls okresowy na składowe, co pozwala wiele zrozumieć. Np. wysokość tonu wydawanego przez instrument muzyczny określona jest pierwszym sinusem, a następne przesądzają o barwie dźwięku: po tym odróżniamy a zagrane na fortepianie od a zagranego na skrzypcach.

Kiedy już mamy naszą dziwną funkcję rozwiniętą w szereg Fouriera, wystarczy zsumować nieskończenie wiele rozwiązań takich jak (*). Pierwsze trzy składniki dadzą rozwiązanie poniżej (możemy zawsze w razie potrzeby użyć większej liczby wyrazów).

fourier3 laplace

(**) Związek średniej arytmetycznej z równaniem Laplace’a wynika z rozwinięcia w szereg Taylora z dokładnością do h^2:

T(x\pm h,y)=T(x,y)\pm h\dfrac{\partial{T}}{\partial{x}}+\frac{1}{2}h^2\dfrac{\partial^2{T}}{\partial{x^2}},

T(x,y\pm h)=T(x,y)\pm h\dfrac{\partial{T}}{\partial{y}}+\frac{1}{2}h^2\dfrac{\partial^2{T}}{\partial{y^2}}.

Biorąc średnią arytmetyczną z tych czterech wyrażeń i odejmując wartość T(x,y), otrzymujemy

\overline{T}-T=\frac{1}{4} h^2 \left(\dfrac{\partial^2{T}}{\partial{x^2}}+\dfrac{\partial^2{T}}{\partial{y^2}}\right).

Od igły Buffona do metody Monte Carlo: statystyczne wyznaczenie liczby pi oraz wielkości mrowiska

Jean Marie Leclerc, hrabia de Buffon, był obok swego rówieśnika ze Szwecji Carla Linneusza najsławniejszym naturalistą drugiej połowy XVIII wieku. Za jego życia ukazało się trzydzieści sześć tomów historii naturalnej, a jeszcze kilka po jego śmierci z pozostawionych przez uczonego materiałów. W młodości nic nie zapowiadało, że zdolny jest do tak gigantycznej pracy. Studiował nauki przyrodnicze i Newtona zamiast poświęcić się prawu i być jak ojciec, adwokat parlamentu Burgundii oraz poborca podatku od soli. W Angers zabił w pojedynku chorwackiego oficera i musiał uciekać. Podróżował dłuższy czas po Europie razem z Evelynem Pierrepontem, drugim diukiem Kingston-upon-Hall, potem osiadł w Paryżu i zaczął starać się o przyjęcie do Akademii Nauk. Bardziej od zasług naukowych liczyły się kontakty, Buffon napisał jednak oryginalną, choć nietrudną pracę dotyczącą pewnej gry hazardowej, le jeu du franc-carreau. Polegała ona na tym, aby upuszczać przypadkowo monetę na posadzkę z drobnych płytek. Liczyło się, czy moneta mieści się całkowicie wewnątrz jednej z płytek, czy przecina jakieś granice między nimi. Buffon zastanawiał się, jak duże muszą być monety w stosunku do długości boku kwadratowej płytki, aby gra taka była sprawiedliwa. Przedstawił też jej prostszą odmianę: rzucamy w sposób przypadkowy igły długości l na podłogę z desek o szerokości d i sprawdzamy, czy igła przecina linię oddzielającą deski. Znów można zadać pytanie, przy jakim stosunku l/d gra będzie sprawiedliwa.

BuffonsNeedle

http://demonstrations.wolfram.com/BuffonsNeedleProblem/

Okazuje się, że prawdopodobieństwo przecięcia którejś linii równe jest

p=\dfrac{2}{\pi}\dfrac{l}{d}.

Wzór ten słuszny jest dla l\le d.Buffon ogłosił swe rozważania, po czterdziestu z górą latach, w roku 1777, w długiej rozprawie Essai d’arithmétique morale (arytmetyka moralna to rachunek prawdopodobieństwa). Dla kogoś, kto przełożył na francuski Traktat o fluksjach Isaaca Newtona, nie było to trudne zagadnienie. W roku 1812 Pierre Simon de Laplace zwrócił uwagę, że jeśli znamy stosunek długości igły do odległości linii, możemy eksperymentalnie wyznaczyć wartość liczby \pi. Np. na rysunku powyżej wylosowano 100 rzutów i igła przecina linię 66 razy oraz l=d. Wartość liczby \pi oszacowana na podstawie tego eksperymentu równa jest

\pi=\dfrac{2}{0,66}\approx 3,03

 My pokażemy, jak znaleźć to prawdopodobieństwo, nie korzystając z żadnych całek. Jeśli igła dowolnej długości l pada losowo na układ równoległych linii, to może je przeciąć pewną skończoną liczbę razy. Załóżmy, że zliczamy liczby przecięć dla kolejnych rzutów.

buffon1

Wartość oczekiwana liczby przecięć równa jest

E(l)=p_1+2p_2+3p_3+\ldots.

 Prawdopodobieństwo, że przecięć będzie k oznaczyliśmy p_k, suma zawiera tyle składników, ile trzeba dla danej długości igły. Jeśli podzielimy naszą igłę na dwie części o długościach l=l_1+l_2, to można ustalić zawsze, która część przecina daną linię.

buffon1_5

Jeśli przecięcia obu części będziemy zliczać oddzielnie, a następnie je zsumujemy, wynik nie może być inny niż przed podzieleniem igły:

E(l)=E(l_1)+E(l_2).

Moglibyśmy podzielić igłę na dowolną liczbę kawałków, łatwo widać, że E(cl)=cE(l) dla dowolnych wymiernych wartości c. Funkcja E(l) jest rosnąca, możemy więc napisać

E(l)=E(1)l=cl.

Wyznaczenie E(l) sprowadza się więc do znalezienia stałej c, która jest niezależna od długości igły.

Wyobraźmy sobie, że nasza igła to kawałek drutu, który zaginamy, jak na rysunku. Wartość oczekiwana liczby przecięć nadal będzie sumą wartości oczekiwanych liczby przecięć obu części. Inaczej mówiąc, wygięcie drutu nie zmieni wartości oczekiwanej całkowitej liczby liczby przecięć.

buffon2

A skoro tak, to możemy wyobrazić sobie, że rzucamy jakieś wielokąty foremne i obliczamy wartość oczekiwaną całkowitej liczby przecięć wielokąta z liniami prostymi. Nadal powinna to być ta sama funkcja E(l).

buffon2_5

Aby znaleźć wartość stałej c rozpatrzymy zamiast wielokątów ich graniczny przypadek czyli okrąg o średnicy d. Okręgi takie przecinają nasze linie proste dokładnie w dwóch punktach.

buffon3

Możemy więc napisać równość

2=E(d\pi)=d\pi E(1) \Rightarrow E(l)=\dfrac{2l}{\pi d}.

Obliczyliśmy w ten sposób wartość oczekiwaną liczby przecięć dla dowolnej igły. Co to ma wspólnego z prawdopodobieństwem pojedynczego przecięcia? Jeśli nasza igła jest krótsza niż odległość linii, to może przeciąć najwyżej jedną z nich, a więc E(l)=p_1.

Nietrudno zauważyć, że nasze obliczenie sprowadza się do ustalenia stosunku dwóch pól powierzchni z rysunku, czyli inaczej mówiąc do obliczenia pola powierzchni między sinusoidą a osią odciętych.

buffon0Można sobie wyobrazić bardziej bezpośredni sposób obliczenia pola powierzchni i tym samym liczby \pi. Wyobraźmy sobie kwadrat i załóżmy, że losujemy w sposób całkowicie przypadkowy punkty wewnątrz tego kwadratu. Jeśli w kwadrat wpiszemy okrąg, to niektóre z nich znajdą się wewnątrz okręgu, inne na zewnątrz.

MonteCarlo1000

Na rysunku wylosowano 1000 punktów, 773 leżą wewnątrz okręgu, zatem

\dfrac{\pi}{4}\approx\dfrac{773}{1000}\Rightarrow \pi\approx 3,092

Obliczenie to stanowi prosty przykład działania metody Monte Carlo. Jest ona dość powolna, bo trzeba wygenerować wiele punktów, aby wynik był w miarę dokładny. Zauważmy jednak, że moglibyśmy w ten sposób zmierzyć pole pod dowolną krzywą, czyli mówiąc inaczej, obliczyć dowolną całkę. Metodę tę zaproponował w roku 1946 Stanisław Ulam, pracujący wówczas w Los Alamos. Dzięki pierwszemu komputerowi ENIAC można już było generować liczby losowe. Podczas rekonwalescencji po chorobie Ulam, specjalista od metod probabilistycznych, a do tego wielki miłośnik gier i hazardu, układał sobie pasjanse Canfielda i zaczął zastanawiać się, jak obliczyć w tym przypadku prawdopodobieństwo sukcesu. Było to trudne, ale można by np. wymodelować pewną liczbę gier i oszacować prawdopodobieństwo na podstawie częstości sukcesów. Razem z Johnem von Neumannem zastosowali po raz pierwszy metodę Monte Carlo do obliczeń dyfuzji neutronów.

Ciekawe zastosowania rozumowania typu igły Buffona można napotkać w biologii. Wyobraźmy sobie płaski obszar wypukły o polu powierzchni S. Zamiast igieł mamy dwa zestawy łuków krzywych. Ich całkowita długość to l_1 oraz l_2. Jeśli będziemy losowo umieszczać krzywe obu rodzajów w naszym obszarze, to średnia liczba przecięć między krzywymi obu rodzajów dana jest wzorem analogicznym do wzoru Buffona:

E=\dfrac{2l_1l_2}{\pi S}.

Możemy np. posłużyć się tą zależnością do statystycznego wyznaczenia pod mikroskopem długości pewnej krzywej (np. kawałka korzenia rośliny). Umieszczamy losowo w naszym obszarze badaną krzywą wraz z odcinkami prostej o ustalonej długości. Teraz wystarczy obliczyć, ile razy badana krzywa przecina się z odcinkami prostoliniowymi, co jest znacznie prostsze niż śledzenie za konkretną krzywą (wyobraźmy sobie, że mamy do zbadania tysiące takich korzeni).

root

Niech N będzie liczbę przecięć, zaś H całkowitą długością wylosowanych odcinków, wówczas długość krzywej równa jest

R=\dfrac{\pi NS}{2H}.

Zależność ta (oraz rysunek) pochodzą z klasycznej pracy E.I. Newmana, A Method of Estimating the total length of root in a SampleJournal of Applied Ecology, t. 3, (May, 1966), s. 139-145. Wzór Newmana można też wykorzystać do znalezienia pola powierzchni S, gdy znane są pozostałe wielkości. Sugerowano, że algorytmu tego rodzaju używają mrówki, szacując, czy jakieś miejsce nadaje się na nowe mrowisko. Dwa zestawy krzywych byłyby w tym przypadku dwoma trasami tej samej mrówki-zwiadowcy: liczyłaby ona, ile razy pierwsza trasa i druga się przecinają (trasy są znaczone feromonami, zakłada się, że mrówka reaguje na swoje indywidualne feromony). Nie potrafię ocenić, czy to dobra hipoteza, z pewnością ciekawa. Szczegóły można znaleźć w pracy: E.B. Mallon, N.R. Franks, Ants estimate area using Buffon’s needle, „Proc. R. Soc. London” B, t. 267 (2000) s. 765-770.

Racjonalni inaczej? Kognitywistyka kwantowa

Nie jest to tytuł grantu z Akademii Lagadyjskiej. Chodzi o zastosowanie reguł kwantowej probabilistyki do psychologii. Nie zakładamy, że umysł jest układem kwantowym (być może zresztą jest, ale tutaj to nieistotne). Stosujemy reguły fizyki kwantowej jako alternatywne podejście do kwestii prawdopodobieństwa. Zdaniem wielu współczesnych badaczy, zwłaszcza w obszarze informacji kwantowej, fizyka kwantowa jest czymś więcej niż tylko fizyką, a mianowicie pewnym rodzajem teorii probabilistycznej, różnym od klasycznego prawdopodobieństwa, Laplace’a i Kołmogorowa. Nie jest więc niemożliwe, że zasadnicze reguły prawdopodobieństwa kwantowego można zastosować także poza fizyką.

Stan układu w mechanice kwantowej przedstawia się za pomocą wektora. Ów wektor stanu zawiera potencjalne odpowiedzi na różne pytania eksperymentalne, jakie możemy zadać, wykonując odpowiedni pomiar. W najprostszej sytuacji możemy sobie wyobrażać, że jest to wektor na płaszczyźnie. Pomiar może dać nam binarną odpowiedź: nasz układ ma własność F albo przeciwną ~F. Geometrycznym odpowiednikiem pomiaru jest rzutowanie wektora stanu na osie układu współrzędnych.

linda problem0

Możemy więc nasz wektor zapisać jako sumę rzutów na kierunki F oraz ~F, albo na jakieś inne dwa prostopadłe kierunki B oraz ~B. Operator rzutowania oznaczamy przez P z odpowiednim indeksem:

S=P_{F}S+P_{\sim F}S=P_{B}S+P_{\sim B}S

Kwadraty długości owych rzutów są prawdopodobieństwami uzyskania określonych wyników. Przyjmujemy, że nasz wektor S ma długość jednostkową. Suma kwadratów długości obu rzutów jest zatem także równa 1 (jak powinno być dla prawdopodobieństw wykluczających się zdarzeń, których suma jest pewna), obrót układu współrzędnych tego nie zmienia, bo długość wektora S nadal musi być równa 1.

Oto dwa przykłady zastosowania tego podejścia. Pierwszy to Problem Lindy. Uczestnikom badania przedstawia się sylwetkę Lindy, która studiowała filozofię w liberalnym college’u, interesowała się problemami dyskryminacji i rasizmu, brała udział w demonstracjach przeciwko broni atomowej, jest singielką. Pytamy, co jest bardziej prawdopodobne: czy to, że Linda pracuje w banku przy obsłudze klientów, czy to, że pracuje w banku przy obsłudze klientów oraz jest feministką. Badani częściej wybierają drugą możliwość. Według klasycznej teorii prawdopodobieństwa dołączenie dodatkowego warunku nie może powiększać prawdopodobieństwa (B\cap F\subset B). W modelu kwantowym może być inaczej.

linda problem

Jeśli wektor stanu umysłu S rzutujemy najpierw na oś F, to przechodzi on w wektor P_F S. Pytanie o pracę w banku daje nam kolejne rzutowanie, tym razem na oś B. Wynik jest wyraźnie różny od rzutowania S od razu na oś B (czyli wykonania jednego pomiaru). Kwadraty długości to prawdopodobieństwa, można zatem rozwiązać Problem Lindy.

Jako drugi przykład rozpatrzymy znany z badań opinii publicznej fakt, że kolejność zadania pytań ma wpływ na wyniki. W prowadzonych w Stanach Zjednoczonych sondażach pytano: „Czy uważasz Billa Clintona za człowieka uczciwego i godnego zaufania?”, zadawano też to samo pytanie w odniesieniu do Ala Gore’a (był wiceprezydentem za kadencji Clintona). Ci, którzy, najpierw pytani o Gore’a, odpowiedzieli pozytywnie, częściej byli dobrego zdania o Clintonie niż w przypadku pozytywnej odpowiedzi na pytania w odwrotnej kolejności.

problem gore clinton

 

 

Operacje rzutowania na oś C i na oś G nie są przemienne: wynik zależy od kolejności. Według klasycznego podejścia mamy tu do czynienia z iloczynem zdarzeń, a ten jest przemienny.

Podejście kwantowe może wydawać się zupełnie arbitralne i dowolne: zawsze możemy sobie ustawić osie, jak wygodnie w danym przypadku. Jednak pewne związki miedzy prawdopodobieństwami są niezależne od modelu i potwierdzają się w badaniach empirycznych. Rośnie także liczba sytuacji, w których zastosowano takie podejście (np. dylemat więźnia). Nie jest dla mnie jasne, czy liczby zespolone odgrywają tutaj jakąś rolę. W mechanice kwantowej tylko w szczególnych przypadkach można ograniczać się do wektorów rzeczywistych, najważniejsza część mechaniki kwantowej związana jest z liczbami zespolonymi. Por. też: Piękna fizyka: kwantowe interferencje do kwadratu. W każdym razie se non è vero, è ben trovato.

Podejście to omawia praca: Peter D. Bruza, Zheng Wang, and Jerome R. Busemeyer, Quantum cognition: a new theoretical approach to psychology, „Trends in Cognitive Sciences”, t. 19, nr 7 ((July 2015), s. 383-393, a także wiele innych publikacji.

Albert Einstein każe Bogu grać w kości (1916)

Słynne jest powiedzenie Einsteina, że Bóg nie gra w kości – chodziło mu o to, że prawa rządzące najmniejszymi, elementarnymi cząstkami powinny być przyczynowe. Prawami takimi są zasady dynamiki Newtona: jeśli znamy położenie i prędkość różnych ciał dziś, to w zasadzie moglibyśmy obliczyć, co się z tymi ciałami stanie w przyszłości. Pierre Simon de Laplace sformułował to następująco:

Inteligencja, która by w danej chwili znała wszystkie siły, które działają w przyrodzie, oraz wzajemne położenia bytów ją tworzących i była przy tym dostatecznie dostatecznie rozległa, by te dane poddać analizie, mogłaby w jednej formule zawrzeć ruch największych ciał wszechświata i najmniejszych atomów: nic nie byłoby dla niej niepewne i zarówno przyszłość, jak przeszłość byłyby dostępne dla jej oczu. Umysł ludzki daje słabe pojęcie owej inteligencji, której doskonałość osiągnąć potrafił jedynie w astronomii. [Théorie analytique des probabilités (1812)]

Otóż Einstein jako najwybitniejszy fizyk XIX wieku (podobnie jak Jarosław Iwaszkiewicz nazwany został, nie bez pewnej racji, najwybitniejszym polskim pisarzem dziewiętnastowiecznym) wierzył w słowa Laplace’a, technicznie rzecz ujmując, sądził, że równania różniczkowe mogą ściśle opisać rzeczywistość. Był w tym spadkobiercą Laplace’a i Jamesa Clerka Maxwella oraz całej plejady wybitnych fizyków wieku pary i elektryczności.

Jednak już sam Laplace zastanawiał się nad zdarzeniami przypadkowymi, w cytowanej książce podał klasyczną definicję prawdopodobieństwa, której każdy się uczył. Fizycy zastosowali prawdopodobieństwa do opisu obiektów zbyt złożonych, aby znać szczegóły ich ruchu, jak np. gaz doskonały. Nie musimy znać szczegółów zderzeń wszystkich cząstek w gazie, wystarczy, jeśli znamy pewne charakterystyki średnie, np. średnią energię. Metodę tę rozwinął zwłaszcza Ludwig Boltzmann, a także Josiah Willard Gibbs w Stanach Zjednoczonych oraz Albert Einstein.

W ostatnich latach wieku XIX odkryto radioaktywność niektórych pierwiastków, a Ernest Rutherford podał prawo rozpadu promieniotwórczego: liczba pozostałych jąder maleje wykładniczo z czasem t, tzn. po pewnym czasie \tau pozostaje połowa jąder, po następnym czasie \tau połowa tej połowy, czyli 1/4 itd. Wygląda to tak:

Halflife-sim

Animacja z Wikipedii, z lewej strony na początku mamy 4 atomy, z prawej 400, u góry wyświetla się liczba półokresów rozpadu.

A matematycznie można zapisać następująco:

N=N_0 2^{-\dfrac{t} {\tau} }=N_0 \exp{(-\lambda t)}.

Przez N_0 oznaczona jest początkowa liczba jąder. Ostatnia równość jest tożsamościowa: możemy po prostu zapisać naszą funkcję w obu tych postaciach, jeśli odpowiednio wybrać stałą rozpadu \lambda. Gdy przyjrzymy się przez chwilę animacji powyżej, nasuwa się pytanie: skąd dane jądro wie, kiedy ma się rozpaść? Ponieważ wszystko wskazuje, że jądra rozpadają się niezależnie od siebie, więc oznacza to, iż prawdopodobieństwo przeżycia czasu t przez dowolne jądro równe jest

p(t)=2^{-\dfrac{t}{\tau} }=\exp{(-\lambda t)}.

Jest to bardzo dziwne prawo: znaczy bowiem, że każde jądro, niezależnie od tego, jak długo już istnieje, ma ciągle takie same prawdopodobieństwo rozpadu w nadchodzącym przedziale czasu. To jak gra w ruletkę: jeśli nawet 10 razy z rzędu wypadło czerwone, to za jedenastym razem prawdopodobieństwo, że i tym razem wypadnie czerwone jest wciąż takie samo jak przedtem. Każde zakręcenie koła ruletki rozpoczyna cykl od nowa i jego wynik nie zależy od tego, co wypadło poprzednio. Prawdopodobieństwo rozpadu jądra w małym przedziale czasu (t, t+\Delta t) jest równe

p(t)-p(t+\Delta t)=\exp{(-\lambda t)}-\exp{(-\lambda (t+\Delta t))}=\\ \\p(t)(1-\exp{(-\lambda \Delta t)}\approx p(t)\lambda \Delta t.

Jest ono iloczynem prawdopodobieństwa dotrwania do chwili t i prawdopodobieństwa rozpadu w krótkim czasie \Delta t. Zatem prawdopodobieństwo rozpadu (pod warunkiem, że w chwili t że jądro nadal istnieje) jest proporcjonalne do długości przedziału \Delta t i nie zależy wcale od tego, jak długo już obserwujemy tę sytuację:

p_{rozpadu}=\lambda\Delta t.

Inaczej mówiąc, prawdopodobieństwo rozpadu na jednostkę czasu jest stałe i równe \lambda. Kiedy Rutherford podał prawo rozpadu promieniotwórczego, zastanawiano się nad tym, że wygląda ono tak, jakby rozpad nie miał konkretnej przyczyny. Nie potrafiono w każdym razie wskazać takiej przyczyny. Nie znaczy to bynajmniej, że rozpad danego jądra nie nastąpi. Sytuacja przypomina grę w rosyjską ruletkę: bierzemy rewolwer bębenkowy i ładujemy kulę do jednej komory, po czym kręcimy komorą, aż zatrzyma się w przypadkowym położeniu. Przykładamy sobie do głowy i naciskamy spust: albo przeżyliśmy, albo nie. Jeśli tak, to możemy ten zabieg powtarzać, aż w końcu nam się uda. Można pokazać, że przypadku rosyjskiej ruletki średnia liczba prób będzie równa 6 (jest to liczba komór w bębenku). Wcale to jednak nie znaczy, że konkretny gracz nie przetrwa np. 24 prób. Nie jest to bardzo prawdopodobne, ale jest możliwe.

I tu dochodzimy do pracy Einsteina z roku 1916. Pół roku wcześniej podał on równania teorii grawitacji, zrobił parę mniejszych prac i zajął się oddziaływaniem promieniowania z materią. Trzy lata wcześniej Niels Bohr ogłosił swój model atomu. Wynikało z niego, że każdy atom powinien mieć pewien zbiór określonych – skwantowanych – energii. Rozpatrzmy atomy pewnego rodzaju, a w nich dowolną parę stanów o dwóch różnych energiach E_1 < E_2. Jeśli nasze atomy znajdą się w zbiorniku z promieniowaniem o temperaturze T, to liczba atomów w stanie o wyższej energii będzie mniejsza niż tych w stanie o niższej energii:

\dfrac{N_2}{N_1}=\dfrac{\exp{(-\dfrac{E_2}{kT}})}{\exp{(-\dfrac{E_1}{kT}})}=\exp{(-\dfrac{E_2-E_1}{kT})}.

Stała k zwana jest stałą Boltzmanna, a sam rozkład liczby atomów od energii także nazywany jest rozkładem Boltzmanna. Co oznacza taka równowaga cieplna? Ano tyle, że czasem nasz atom w stanie E_1 pochłonie promieniowanie i przejdzie do stanu E_2, a czasem na odwrót (wtedy energia zostanie oddana w postaci promieniowania). W równowadze oba procesy powinny zachodzić z taką samą szybkością.

emisja

Einstein założył – i to jest punkt zasadniczy – że możliwe są procesy jak na rysunku: dwa pierwsze oznaczają przejścia między poziomami wymuszone promieniowaniem – tzw. absorpcję i emisję wymuszoną. Prawdopodobieństwa tych procesów na jednostkę czasu będą równe iloczynowi odpowiedniej stałej B oraz gęstości energii promieniowania u(\nu). Mamy tu jeszcze jeden proces: emisję spontaniczną. Jej prawdopodobieństwo na jednostkę czasu jest równe A_{2\rightarrow 1} – tutaj prawo jest takie samo jak w rozpadzie promieniotwórczym. Wiedząc to wszystko, możemy zapisać ilość przejść 1\rightarrow 2 oraz 2\rightarrow 1 na jednostkę czasu:

N_1 B_{1\rightarrow 2}u(\nu)=N_2 B_{2\rightarrow 1}u(\nu)+N_2 A_{2\rightarrow 1}.

Obliczamy stąd funkcję u(\nu) i porównujemy ze znanym rozkładem Plancka:

u(\nu)=\dfrac{A_{2\rightarrow 1}}{B_{1\rightarrow 2}\exp{(\frac{E_2-E_1}{kT})}-B_{2\rightarrow 1}}=\dfrac{8\pi h\nu^3}{c^3}\dfrac{1}{\exp{(\frac{h\nu}{kT})}-1}.

Łatwo z tej równości wysnuć pewne wnioski nt. zależności między współczynnikami A, B. Np. zgodność obu równań jest możliwa tylko wówczas, gdy

E_2-E_1=h\nu.

Niels Bohr założył słuszność takiego równania, tutaj pojawia się ono jako wniosek. Nie będziemy wchodzić w szczegóły. Rzec można, Einstein obliczył maksimum tego, co było możliwe bez mechaniki kwantowej. Jedenaście lat później P.A.M. Dirac pokazał, jak wartości einsteinowskich współczynników wynikają z teorii kwantowej. Równania Einsteina prawidłowo opisują oddziaływanie atomów i promieniowania. Np. działanie lasera opiera się na emisji wymuszonej, opisywanej współczynnikiem B_{2\rightarrow 1}. Nie znaczy to, że Einstein zbudował laser, ale z pewnością zrozumiałby, gdyby jakiś mądry ET opisał mu taki wynalazek.

Dlaczego Einstein każe tu Bogu grać w kości? Współczynnik emisji spontanicznej musi być niezerowy i taki też zazwyczaj jest w przyrodzie (chyba że są powody, aby jakieś przejście było niemożliwe, np. ze względu na symetrię). To wszystko znaczy, że atom w wyższym stanie energetycznym kiedyś przejdzie do stanu niższego: tak samo jak gracz w rosyjskiej ruletce kiedyś się zastrzeli. Tyle że w przypadku atomu nikt nie pociąga za spust. Nie ma żadnej doświadczalnie możliwej do wykrycia przyczyny tego przejścia. Okazało się, że te współczynniki Einsteina to wszystko, co możemy wiedzieć i nie ma żadnej lepszej teorii, która by nam powiedziała, kiedy dany atom wyśle foton albo kiedy dane jądro się rozpadnie. Einstein w roku 1916 jeszcze nie rozumiał, że osiągnął granicę możliwości fizyki. Nigdy się z tym zresztą nie pogodził, stając się pogodnym dziwakiem w oczach kolegów i pracując wytrwale nad teorią, która by usunęła te probabilistyczne rozważania raz na zawsze. Jak wiemy, nigdy mu się to nie udało, dziś chyba mało kto wierzy, aby przedsięwzięcie tego rodzaju było wykonalne. Laplace i Einstein nie mieli racji, Bóg najwyraźniej gra w kości.

Niebezpieczna idea Darwina (1859)

Świat wyobrażano sobie zawsze jako coś uporządkowanego i celowego. Pitagorejskie słowo κόσμος – kosmos ma takie właśnie znaczenie. Grecy wierzyli, że Ktoś, np. demiurg z Timajosa, musiał uładzić świat w taką, a nie inną całość. Nie inaczej sądził w XVIII wieku Isaac Newton, gdy pisał:

„Ten najbardziej elegancki układ Słońca, planet i komet nie mógł powstać bez zamysłu i władztwa istoty inteligentnej i potężnej. I jeśli gwiazdy stałe są środkami podobnych układów, to wszystkie one będą zbudowane zgodnie z podobnym zamysłem i będą podlegać Jednemu, zwłaszcza że światło gwiazd stałych jest takiej samej natury co światło Słońca i wszystkie układy wysyłają światło ku wszystkim innym. I aby układy gwiazd stałych nie pospadały wzajemnie na siebie pod działaniem grawitacji, porozmieszczał je na ogromnych odległościach jeden od drugiego. On rządzi wszystkimi rzeczami nie jako dusza świata, lecz jako pan wszystkiego. I z powodu swego władztwa nazywany jest Panem Bogiem Pantokratorem (tzn. władcą powszechnym)” [Principia, wyd. 2, 1713].

Newtonowi chodziło o regularności w Układzie Słonecznym: planety poruszają się po orbitach zbliżonych do okręgów, w mniej więcej jednej płaszczyźnie i wszystkie w tym samym kierunku. Oznaczało to jego zdaniem, że Stwórca w chwili początkowej nadał planetom ściśle określone prędkości i położenia, po czym dalej układ ten poruszał się pod działaniem zwykłych praw mechaniki – w tym prawa powszechnego ciążenia, odkrytego przez Newtona.

solar_system_formation
Później Laplace zasugerował, że nie trzeba angażować Stwórcy, wystarczy, aby Układ Słoneczny powstał z obłoku wirującej materii – wtedy wyróżniona płaszczyzna i ruch w tę samą stronę przestają być „cudem”.
Domena „cudów”, czyli tego, czego nauka nie potrafi wyjaśnić, ograniczono stopniowo do biologii. Jak wyjaśnić budowę oka albo nadzwyczajną szybkość geparda i gazeli, piękno pawiego ogona, a wreszcie ludzki rozum? Nauka jest bezsilna, należy więc przywołać rozumnego Autora, który stoi za tymi wszystkimi faktami. Był to tzw. argument z projektu: obiekt zaprojektowany musi mieć autora. Gdy znajdziemy na wrzosowisku zegarek, wiemy, że nie spadł on z nieba. Fred Hoyle sformułował podobną myśl następująco:

Na złomowisku znajdują się porozrzucane w nieładzie wszystkie części Boeinga 747. Przypadkiem nad złomowiskiem przechodzi trąba powietrzna. Jakie jest prawdopodobieństwo, że po jej przejściu znajdziemy tam poskładanego w całość i gotowego do lotu boeinga? Zaniedbywalnie małe, nawet gdyby tornado miało wiać nad całym wszechświatem wypełnionym takimi złomowiskami [The Intelligent Universe].

Przed Darwinem najbardziej do odpowiedzi zbliżył się David Hume. W wydanych w roku 1779 (na wszelki wypadek pośmiertnie!) Dialogach o religii naturalnej. Pojęcie „religii naturalnej” nie brzmiało wówczas jak oksymoron, lecz dotyczyło argumentów za istnieniem Boga, jakie można wyprowadzić z obserwacji świata. Chodziło więc o dyskusję na płaszczyźnie czysto naukowej, nie wchodząc w prawdy objawione. Nawet tak bystry krytyk jak Hume miał kłopot z obaleniem argumentu z projektu.

Kiedy oglądamy statek, cóż za wygórowaną ideę wypadałoby nam powziąć o pomysłowości cieśli, który zbudował machinę tak skomplikowaną, tak użyteczną i piękną! I jakaż spotkać by nas musiała niespodzianka, gdyby okazało się, że to nierozgarnięty rzemieślnik, co naśladował innych i brał ślepy wzór ze sztuki, która po wielu próbach, błędach, poprawkach i deliberacjach doskonaliła się stopniowo przez długie wieki. W ciągu wieczności spartaczono może i sfuszerowano wiele światów, zanim udało się wymyślić ten oto system; wiele roboty poszło może na marne; podjęto może wiele bezowocnych prób, a powolny, lecz stały postęp w sztuce wyrabiania światów ciągnął się nieskończenie długo. [Dialogi o religii naturalnej, przeł. A. Hochfeldowa].

Argumenty te padły jednak w dyskusji i nie były traktowane jako bliskie prawdy. Dopiero Charles Darwin, osiemdziesiąt lat później, zasugerował rozwiązanie: w ogóle nie potrzeba inteligencji, wystarczy proces doboru naturalnego. Potomstwo staje się nieco lepiej przystosowane od przodków, a każdy złożony projekt „inżynierski” można rozbić na mnóstwo drobnych etapów. Była to idea niezwykle rewolucyjna, gdyż odwracała uświęcony tradycją sposób myślenia. Być może idea taka mogła powstać dopiero w czasach masowej produkcji, gdy robotnik nie musiał umieć wiele, ponieważ wykonywał tylko jedną drobną czynność, nie był już rzemieślnikiem, który potrafi w swoim fachu wszystko i uczył się tego latami. Z pewnością nie była to jednak idea oczywista w chwili powstania. Darwin zaproponował, aby na każdy organizm spojrzeć jak na zegarek czy inny artefakt, tyle że ukształtowany stopniowo przez bardzo bardzo wiele pokoleń.

Jeśli na żywy organizm nie będziemy spoglądali tak, jak dzicy patrzą na okręt – jak na coś, co całkowicie przewyższa ich zdolność pojmowania; jeśli każdemu tworowi przyrody przyznamy długą przeszłość; jeśli każdą złożoną strukturę i każdy instynkt będziemy rozpatrywać jako sumę wielu pojedynczych, pożytecznych dla posiadacza właściwości, podobnie jak w każdym wielkim wynalazku techniki widzimy wspólny efekt wytężonej pracy, doświadczenia, rozumowania, a nawet błędów wielu robotników; jeśli każdą istotę organiczną tak będziemy rozpatrywać, o ileż ciekawsza (mówię to z własnego doświadczenia) stanie się wtedy historia naturalna! [C. Darwin, O powstawaniu gatunków, przeł. Sz. Dickstein i J. Nusbaum]

Ta niebezpieczna idea Darwina uniepotrzebniała za jednym zamachem istnienie Stwórcy, a także wiele naszych przesądów (mylonych często z kulturą) – bo skoro ewolucyjnie ukształtować się mogło nasze ciało, to także i nasze uczucia, umysł, język i w konsekwencji cała kultura, a nawet nauka – które mogą być potraktowana jako przedłużenie pewnej ewolucji (już kulturowej, a nie genetycznej).

darwin32

Rysunek z czasopisma „Fun” z roku 1872. Podpis głosił: „Doprawdy, panie Darwin, niech pan mówi, co chce o mężczyźnie [człowieku], ale moje uczucia proszę zostawić w spokoju” (w tym właśnie roku ukazała się książka O wyrazie uczuć u człowieka i zwierzątThe Expression of the Emotions in Man and Animals).

Nie ma w każdym razie potrzeby, by Boeing 747 złożył się sam pod działaniem trąby powietrznej – w jakimś sensie on złożył się sam, budując najpierw swoich konstruktorów, a przedtem wszystko, co było potrzebne, aby ci konstruktorzy zaistnieli.
Zadziwiające, jak często i jak wielu ludzi nie chce się pogodzić z takim sposobem podejścia. Słyszy się np., że to „redukcjonizm”. Lecz wszystkie największe sukcesy nauki brały się z redukcjonizmu, począwszy od doświadczeń Galileusza, który nie przejmował się tym, czy doświadczenia w pracowni są secundum naturam – „w zgodzie z naturą”, czy contra naturam – „przeciw naturze”. Prawdopodobnie należy drążyć właśnie tam, gdzie wyczuwa się opór. Wielkość Charlesa Darwina leży w tym, że zupełnie zignorował zastrzeżenia swych uczonych kolegów, pragnąc, aby historia naturalna stała się ciekawsza, tzn. lepiej zrozumiała i bogata w powiązania. Bez wielkiej przesady można powiedzieć, że biologia jako jednolita nauka zaczyna się dopiero od Darwina.

Filozoficzne konsekwencje idei Darwina omawia klasyczna książka Daniela C. Dennetta, Darwin’s Dangerous Idea: Evolution and the Meanings of Life.

Lamarck – siła przyzwyczajenia

Pięćdziesiąt lat przed Darwinem, arystokrata, żołnierz i przyrodnik, Jean-Baptiste Pierre Antoine de Monet, kawaler de Lamarck, starał się zrozumieć, skąd biorą się przystosowania zwierząt do ich środowiska i trybu życia. Otóż biorą się one z długotrwałego treningu i z przyzwyczajenia. Jego wyjaśnienia brzmią dziś naiwnie. Skąd biorą się rogi u zwierząt przeżuwających? „Mając niewiele siły w szczękach, które zaprawione są tylko w ścinaniu i miażdżeniu trawy, walczyć mogą jedynie uderzeniami głowy, kierując nawzajem ku sobie ich części szczytowe. W przypływach złości, które częste są zwłaszcza u samców, ich wewnętrzny sentyment silniej kieruje fluidy do tej właśnie części głowy i u jednych następuje wydzielanie materii rogów, a u innych materii kostnej zmieszanej z materią rogów, co prowadzi do powstania twardych wypukłości, dających zaczątek rogów i poroża, jakim uzbrojona jest głowa większości owych zwierząt”. Czemu żyrafa ma taką długą szyję? „Żyjąc w miejscach niemal zawsze suchych i pozbawionych roślinności, zmuszona jest skubać listowie drzew, wciąż wytężając się, by go dosięgnąć. Wskutek tego zwyczaju podtrzymywanego przez długi czas pośród wszystkich przedstawicieli tego gatunku, przednie ich nogi stały się dłuższe niż tylne, a ich szyja tak się wydłużyła, że zwierzę to może, nie stając na tylnych nogach, unieść głowę na wysokość nawet sześciu metrów” [Philosophie zoologique, Paris 1809, t. 1, s. 256-257].

Trzeba jednak wyjaśnienia Lamarcka oceniać na tle epoki. W roku 1802 wielebny William Paley ogłosił swoją słynną książkę Natural Theology, or Evidences of the Existence and Attributes of the Deity collected from the Appearances of Nature (Teologia naturalna, czyli dowody na istnienie i atrybuty Boga zebrane ze zjawisk natury). Paley twierdził, iż zwierzęta i rośliny są tak przemyślnie urządzone, że z całą pewnością nie może to być dziełem przypadku. To tak jakbyśmy na wrzosowisku natknęli się na zegarek – patrząc na niego, musielibyśmy wywnioskować, iż istniał jakieś rzemieślnik, który zaopatrzył go w cały ten sprawny mechanizm. Argumentacja Paleya była bardzo popularna, zwłaszcza w Anglii, przez całe półwiecze aż do Darwina. Niektórzy dopatrywali się działania Opatrzności nawet w tym, że zające mają białą łatkę pod ogonem – to po to, by myśliwym łatwiej było do nich celować.

Darwin także w zasadzie akceptował tezę Lamarcka, iż można dziedziczyć sprawności nabyte w trakcie życia. Nikt wówczas nie wiedział, jak funkcjonuje mechanizm dziedziczenia.

Zarówno Lamarck, jak i Darwin, starali się zrozumieć zjawisko życia, nie odwołując się do Stwórcy. Sądzę, że wysiłki tego rodzaju mają zawsze wartość, niezależnie od tego, co sobie wyobrażamy na temat religii. Po prostu hipoteza Stwórcy nigdy nie posuwa naszego zrozumienia jakiegokolwiek konkretnego zjawiska. Jeśli uda się coś zrozumieć w sensie naukowo sprawdzalnym, zawsze okazuje się, że nie trzeba było w tym celu fatygować Stwórcy. W XIX wieku zaczęło to być widoczne w biologii, wcześniej ulubioną dziedziną teologii naturalnej była astronomia. Newton uważał, że regularny ruch planet w jednej płaszczyźnie, wszystkich w jednym kierunku, niewątpliwie świadczy o działaniu ręki boskiego Architekta. Spekulował też na temat przyszłych boskich interwencji, które mogą stać się potrzebne, gdy grawitacja rozreguluje planetarny zegar. Sto lat później Pierre Simon Laplace wyjaśnił, że układ planetarny jest znacznie bardziej stabilny, niż przypuszczał Newton, a regularny ruch planet można wyjaśnić, jeśli się przyjmie, iż cały Układ Słoneczny powstał z jednego wirującego obłoku materii. Pytany przez Napoleona, czemu nie wspomina w swoim dziele o Bogu, Laplace miał odpowiedzieć: „Obywatelu Pierwszy Konsulu, nie potrzebowałem tej hipotezy”. Anegdota jest zapewne apokryfem. Jednak odpowiedź Laplace’a ma głęboki sens i powinna być wskazówką dla naukowców: starać się wyjaśnić jak największy obszar zjawisk w sposób racjonalny i sprawdzalny.

Zadziwiający wiersz o Lamarcku napisał na początku lat trzydziestych XX wieku Osip Mandelsztam. Przyjaźnił się on z biologami Borysem Sergiejewiczem Kuzinem i Nikołajem Leonowem. Kuzin siedział nawet jakiś czas w więzieniu za wyznawanie lamarckizmu. W tamtych latach można było siedzieć za wszystko, lepiej zresztą za lamarckizm niż za sabotaż. Nadieżda Mandelsztam, żona poety, wspomina, że „widok osobowych aut zawsze napełniał nas strachem” – burżujów już nie było, a pojazdów takich używał wiadomy resort.

Poeta interesował się biologią, czytał Darwina i Lamarcka i także innych autorów. Francuski uczony, który stracił pod koniec życia wzrok, wydawał mu się jedyną postacią szekspirowską w przyrodoznawstwie. Przyrównywał tę ślepotę do głuchoty Beethovena. Lamarck był dla niego człowiekiem, który przeżywa osobisty dramat, godząc się na ewolucję w świecie ożywionym.

„O honor żywej przyrody Lamarck walczył ze szpadą w ręku. Myślicie, że pogodził się z teorią ewolucji, jak te naukowe dzikusy z z XIX wieku? Jestem pewien, że smagłe policzki Lamarcka oblał wówczas wstyd za przyrodę. Nie wybaczył jej bowiem tej drobnostki, która nazywa się zmienność gatunków.
Naprzód! Aux armes! Zmyjmy z siebie hańbę ewolucji. (…)
Jest jakaś wielkość Dantego w Lamarcku, kiedy po drabinie żywych istot nie pnie się do góry, lecz schodzi na dół. Niższe formy bytu organicznego to dla człowieka piekło.
Długie siwe wąsy tego motyla miały ościstą strukturę i w gruncie rzeczy przypominały gałązki na kołnierzu francuskiego akademika i srebrne palmy ozdabiające trumny. Pierś silna, ukształtowana w łódeczkę. Głowa małoważna, kocia. Wielkookie skrzydła miał z pięknego admiralskiego jedwabiu, który bywał i w Cześnie, i w Trafalgarze. I nagle przyłapałem siebie na zdziczałym pragnieniu, aby spojrzeć na przyrodę wymalowanymi oczami tego straszydła” (Podróż do Armenii, przeł. R. Przybylski).

Dla poety idea bezdusznego, deterministycznego ewolucyjnego postępu była czymś głęboko nie do przyjęcia. Sam czuł się miażdżony machiną historii, która odbierała człowieczeństwo. W wierszu o Lamarcku zstępowanie do piekieł i wędrówka w dół drabiny stworzenia są ze sobą skojarzone. Zamiast dantejskich kręgów mamy wcielanie się w coraz niższe gatunki zwierząt, odejmowany jest kolejno wzrok, słuch i niepotrzebny już do niczego mózg. Rolę przewodnika w tym nieludzkim świecie odgrywa właśnie Lamarck.

Lamarck

Staruch był wstydliwy niczym chłopię,

Nieporadny, śmieszny nasz patriarcha.

Któż o cześć przyrody kruszył kopie?

Któżby, naturalnie, prócz Lamarcka!

Skoro na istnienia zmiętych kartkach

Wszystko brudnopisem jest zaledwie,

Ja najniższym szczeblem chcę w Lamarcka

Być drabinie, gdzie się życie lęgnie.
Ku rozgwiazdom zejść, ku wąsonogom,

W dół po stopniach giętkich w mroczną czeluść,

Gdzie jaszczurczy odrzucając ogon,

Zwinę się i zniknę jak Proteusz.

Płaszcz rogowy wdzieję, krwi wezbranej

Żar wygaszę, niepotrzebny odtąd,

Przyssawkami obrosnąwszy, w pianę

Oceanu wpiję się wilgotną.

Przeszliśmy owadów rząd z pełnymi

Kieliszkami oczu, z blaskiem na dnie.

Rzekł: „Przyrody próby się spełniły,

To spojrzenie twoje – już ostatnie.

Dość już – rzekł – harmonii pełnodźwięcznej,

Zduś niewczesny do Mozarta zapał:

Czas głuchoty zbliża się pajęczej

I musimy wszyscy w nią się zapaść”.

I przyroda lica odwróciła

Od nas, nie słuchając próśb ni pochlebstw,

I podłużny zbędny mózg wsadziła

Niczym szpadę zardzewiałą w pochwę.

Zaniedbała spuścić most zwodzony

I na zawsze zapomniała o tych,

Czyją dolą – ziemski grób zielony,

Migotliwy śmiech, gorący oddech…

(przeł. W. Woroszylski)

Wiersz jest olśniewający w całości i w różnych drobiazgach, które trudno oddać w przekładzie, jak rym мальчик – фехтовальщик albo owady z oczami jak pełne kieliszki: c наливными рюмочками глаз. Te owadzie skojarzenia miały się powtórzyć półtora roku później, gdy napisał o Stalinie:

Palce tłuste jak czerwie w grubą pięść układa,

Słowo mu z ust pudowym ciężarem upada.

Śmieją się karalusze wąsiska

I cholewa jak słońce rozbłyska.

(przeł. S. Barańczak)

Autor takich wierszy nie mógł umrzeć we własnym łóżku. A oto oryginał wiersza o Lamarcku.

Ламарк

Был старик, застенчивый как мальчик,

Неуклюжий, робкий патриарх…

Кто за честь природы фехтовальщик?

Ну, конечно, пламенный Ламарк.

Если все живое лишь помарка

За короткий выморочный день,

На подвижной лестнице Ламарка

Я займу последнюю ступень.

К кольчецам спущусь и к усоногим,

Прошуршав средь ящериц и змей,

По упругим сходням, по излогам

Сокращусь, исчезну, как Протей.

Роговую мантию надену,

От горячей крови откажусь,

Обрасту присосками и в пену

Океана завитком вопьюсь.

Мы прошли разряды насекомых

С наливными рюмочками глаз.

Он сказал: природа вся в разломах,

Зренья нет – ты зришь в последний раз.

Он сказал: довольно полнозвучья,–

Ты напрасно Моцарта любил:

Наступает глухота паучья,

Здесь провал сильнее наших сил.

И от нас природа отступила –

Так, как будто мы ей не нужны,

И продольный мозг она вложила,

Словно шпагу, в темные ножны.

И подъемный мост она забыла,

Опоздала опустить для тех,

У кого зеленая могила,

Красное дыханье, гибкий смех…

7 – 9 мая 1932