Adolphe Quetelet, krzywa dzwonowa i statystyczny człowiek (1835)

Był z wykształcenia matematykiem, z temperamentu organizatorem, lecz do historii przeszedł głównie dzięki swej niepohamowanej namiętności do stosowania metod statystycznych. Pragnął stworzyć statystyczną naukę o człowieku, opartą na rozmaitych szczegółowych spisach dotyczących narodzin, rozwoju, zdolności, karalności, chorób i zgonów ludnosci różnych obszarów czy grup. Jego dwutomowe dzieło z roku 1835 zatytułowane Sur l’homme et le développement de ses facultés, ou Essai de physique sociale („O człowieku i rozwoju jego zdolności, czyli zarys fizyki społecznej”) stało się szybko klasyczne. Quetelet wprowadził pojęcie statystycznego czy też przeciętnego człowieka (l’homme moyen), wyobrażając sobie, iż istnieje pewien idealny wzór, od którego poszczególni ludzie odchylają się za sprawą wielu różnych przyczyn. Pojęcie rozkładu statystycznego, który mieści całe spektrum badanej cechy, dopiero się kształtowało. Wcześniej  uczeni stosowali rozkłady statystyczne takie, jak rozkład Gaussa, do analizy błędów pomiarowych, gdy wiadomo, że mierzona wielkość przyjmuje pewną określoną wartość, a problemem jest jej ustalenie na podstawie obarczonych błędami pomiarów. Równolegle przebiegał społeczny proces uznania różnic między ludźmi za coś naturalnego, a nawet potrzebnego, nie za błąd w rozwoju czy niedostatek.

Jak to zwykle bywa w przypadku badań pionierskich, wiele wyników zostało potem zrewidowanych, niektóre stwierdzenia rażą dziś naiwnością. W swojej epoce był jednak Quetelet powszechnie uznawany za postać ważną, jego prace czytali uczeni tak różni, jak James Clerk Maxwell (który idee statystyczne zastosował do gazów) i Charles Darwin. Kontynuatorem prac Queteleta stał się kuzyn Darwina Francis Galton (to on ochrzcił rozkład Gaussa mianem rozkładu normalnego).

Znany powszechnie indeks masy ciała BMI (iloraz masy i kwadratu wzrostu) jest wynikiem obserwacji Queteleta, iż objętość ciała człowieka dorosłego nie jest proporcjonalna do sześcianu, lecz raczej do kwadratu wzrostu:

Gdyby człowiek rósł jednakowo we wszystkich wymiarach, ciężar w różnym wieku byłby proporcjonalny do sześcianu wzrostu. Obserwuje się jednak co innego. Wzrost masy jest mniej gwałtowny, z wyjątkiem pierwszego roku po urodzeniu, kiedy rzeczywiście na ogół obserwuje się powyższą proporcję. Potem jednak aż do okresu pokwitania ciężar ciała rośnie mniej więcej jak kwadrat wzrostu. (Sur l’homme, t. 2, s. 52)

Quetelet nie interesował się wszakże różnicami między ludźmi, starał się raczej odnaleźć typ idealny. Wskaźnik BMI zaczął być stosowany dopiero w drugiej połowie wieku XX, gdy problemem medycznym i ubezpieczeniowym w społeczeństwach zachodnich stały się nadwaga i otyłość.

W swym traktacie podał też Quetelet zaskakujący wzór na skłonność do przestępstwa y (mierzoną statystycznie) jako funcję wieku w latach x:

y=(1-\sin x)\,\dfrac{1}{1+2^{18-x}},

gdzie argument funkcji sinus podany jest w gradach: 100 gradów odpowiada kątowi prostemu. Wykres obserwowanej skłonności do przestępstwa wygląda u Qeteleta następująco:

źródło ilustracji: gallica.bnf.fr

Drugi wykres z płaskim obszarem szczytowym między trzydziestym a czterdziestym piątym rokiem życia dotyczy zdolności literackich. Wróćmy jeszcze do owej skłonności do przestępstwa.

Zależność Queteleta jest iloczynem dwóch funkcji: malejącej funkcji 1-\sin x w pierwszej ćwiartce (czyli czegoś zbliżonego do paraboli) oraz funkcji logistycznej, która opisuje szybki wzrost w okolicy x=18. Nb. krzywa logistyczna zastosowana została kilka lat później przez Pierre’a François Verhulsta, ucznia Quteleta, do modelowania ograniczonego wzrostu populacji, który zaczyna się wykładniczo (nieograniczone rozmnażanie), lecz osiąga naturalną barierę (np. brak pożywienia). Tutaj, w pracy Queteleta, krzywa logistyczna zdaje sprawę z osiągania dojrzałości przez człowieka, na dobre i złe. Oczywiście, nie powinniśmy zbyt serio traktować tego wzoru. Sam Quetelet w późniejszych latach ograniczał się do opisu danych statystycznych, nie upierając się przy żadnym wyrażeniu.

Wykres skłonności do przestępstw wg płci. Widzimy, że kobiety wkraczają później na ścieżkę kryminalną, lecz dłużej są aktywne.

Trwałym dorobkiem Queteleta okazało się stosowanie krzwej dzwonowej do opisu rozkładu statystycznego. Sam po raz pierwszy zastosował ją do statystyki obwodu w piersiach szkockich rekrutów. Jego dane wyglądały następująco:

Obwód w klatce piersiowej wyrażony jest w calach. Quetelet starał się dopasować do tych danych krzywą Gaussa, lecz w praktyce użył rozkładu dwumianowego z prawdopodobieństwami sukcesu/porażki 1/2 oraz liczbą prób równą 999 (tak, żeby mieć 1000 różnych wyników). Inaczej mówiąc, są to prawdopodobieństwa uzyskania k orłów w 999 rzutach monetą.

Jako uczeń Fouriera i Laplace’a wiedział dobrze, że rozkład dwumianowy dąży przy dużych wartościach liczby prób do rozkładu Gaussa. W ten sposób zaczęła się oszałamiająca kariera krzywej Gaussa w zastosowaniach statystycznych. W latach późniejszych przesadne stosowanie rozkładu Gaussa do wszelkich możliwych danych zaczęto nawet nazywać „quetelizmem” – bo, oczywiście, istnieją też inne rozkłady, choć w wielu sytuacjach właśnie rozkład Gaussa prawidłowo opisuje stan faktyczny.

James Clerk Maxwell i prędkości cząsteczek gazu (1859)

Brytyjskie Towarzystwo Krzewienia Nauk (BAAS) zebrało się na swój doroczny zjazd we wrześniu w Aberdeen. To niewielkie miasto miało wówczas dwa uniwersytety i wybudowało w ciągu roku wielką salę koncertową na 2400 słuchaczy, choć i tak wszyscy chętni ledwie mogli się pomieścić. Uczonych zaszczycił obecnością królewski małżonek, książę Albert, który wygłosił przemówienie i przez cztery godziny wizytował jedną z uczelni. Nauka stanowiła mocną stronę imperium brytyjskiego, naród kupców i żeglarzy kolekcjonował osobliwe przedmioty i rośliny, badał czaszki prehistorycznych ludzi z Nepalu, interesował się polem magnetycznym i skałami z odległych części globu, rozwijał konstrukcję parowców, pracował nad projektem kabla telegraficznego przez Atlantyk – pierwszy taki kabel położono rok wcześniej, lecz po kilku tygodniach przestał działać. Za kilka lat miała nastąpić następna próba, tym razem zakończona powodzeniem.

BA150_rdax_800x491

Na zjeździe trzy komunikaty przedstawił młody profesor z miejscowego Marischal College, James Clerk Maxwell. Dwudziestoośmioletni Szkot, absolwent Trinity College w Cambridge, napisał już kilka wielce obiecujących prac: na temat pola elektromagnetycznego, pierścieni Saturna i widzenia barwnego. Do elektromagnetyzmu miał niebawem wrócić, tworząc jednolitą teorię zjawisk elektrycznych, magnetycznych i optycznych (co stało się największym osiągnięciem w fizyce od dwustu lat, od czasów Isaaca Newtona). Kilkuletnia, rozbudowana w szczegółach, praca nad pierścieniami Saturna doprowadziła go do wniosku, że nie mogą one być zbudowane z materii stałej ani ciekłej, muszą być zbiorowiskiem niewielkich fragmentów krążących niezależnie wokół planety (co się potwierdziło: są to bryłki lodu o rozmiarach zawartych najczęściej w przedziale od centymetra do 10 m). Za pracę nad pierścieniami Saturna otrzymał Nagrodę Adamsa, nazwaną na cześć brytyjskiego współodkrywcy Neptuna. Maxwell pasjonował się też eksperymentami dotyczącymi widzenia barwnego, rozwijając idee Thomasa Younga i Hermanna von Helmholtza. Jego koło barw pozwalało ilościowo porównywać wrażenia barwne wytworzone przez zmieszanie trzech barw podstawowych: czerwieni, zieleni i błękitu. Nasuwało to myśl o fotografii barwnej: wystarczy bowiem sfotografować obraz w trzech barwach i później te trzy obrazy odpowiednio zmieszać.

My zajmiemy się tu pracą dotyczącą teorii kinetycznej gazów. Jest to niezwykle prosty model, który dość precyzyjnie opisuje zachowanie rzeczywistych gazów. Przyjmuje się w nim, że cząsteczki zderzają się sprężyście ze sobą oraz ze ściankami naczynia, poruszając się między zderzeniami prostoliniowo. Jak przedstawił to Maxwell na zjeździe w Aberdeen: cząsteczki powietrza poruszają się średnio z prędkością 1500 stóp na sekundę, przebywają między zderzeniami średnią drogę 1/447000 cala, co oznacza, że ulegają 8 077 200 000 zderzeniom w ciągu sekundy. Można śmiało przypuszczać, że Maxwell pragnął tymi liczbami zaintrygować słuchaczy (przedstawił też na zjeździe badania nad kolorami oraz model pierścieni Saturna – a więc mówił o rzeczach mogących zainteresować nie tylko ekspertów). Profesor musiał wywrzeć korzystne wrażenie, rok później przeniósł się bowiem do Londynu.

Maxwell pierwszy zadał pytanie: jaki jest rozkład statystyczny prędkości cząsteczek w gazie. Podał też prawidłową odpowiedź, zwaną dziś rozkładem Maxwella. Inspiracją były rozważania Adolphe’a Queteleta, jednego z pionierów statystyki w naukach społecznych i biologii. Szkocki uczony przeczytał długą recenzję pracy Queteleta w „Edinburgh Review”. Niepodpisany artykuł był autorstwa sir Johna Herschela i zawierał m.in. takie rozumowanie:

Przypuśćmy, że upuszczamy z dużej wysokości kulkę, pragnąc, by upadła ona w oznaczonym punkcie. Kulka spada i jej odchylenie od tego punktu stanowi błąd, a prawdopodobieństwo tego błędu jest pewną nieznaną funkcją kwadratu błędu, tzn. sumy kwadratów odchyleń w dwóch prostopadłych kierunkach. Ponieważ prawdopodobieństwo danego odchylenia zależy tylko od jego wartości, a nie od kierunku, więc prawdopodobieństwa obu odchyleń w prostopadłych kierunkach muszą być opisane tą samą funkcją ich kwadratów. Ponieważ także odchylenie w dowolnym kierunku jest równoważne odpowiednim odchyleniom w dwu prostopadłych kierunkach, które zdarzyły się jednocześnie i są od siebie niezależne – jest więc zdarzeniem, na które składają się dwa niezależne zdarzenia, zatem jego prawdopodobieństwo będzie równe iloczynowi tamtych oddzielnych prawdopodobieństw. Na podstawie tego warunku określić można postać nieznanej funkcji: takiej, że iloczyn dwóch owych funkcji dla dwóch argumentów równy jest tej samej funkcji od sumy obu argumentów. Ale w każdej książce z algebry wykazuje się, że własność taką posiada funkcja wykładnicza, i tylko ona. Jest to więc funkcja kwadratu błędu wyrażająca prawdopodobieństwo jego popełnienia.

W zapisie algebraicznym rozumowanie to sprowadza się do równości

f(x^2+y^2)=f(x^2)f(y^2) \Rightarrow f(x^2)=\exp(-\alpha x^2),

gdzie \alpha jest parametrem. Nasz wynik znany był wtedy jako funkcja błędu, dziś nazywany jest rozkładem normalnym – uzasadnieniem tej nazwy jest jego niezwykle częste występowanie w wielu sytuacjach: nie tylko błędy pomiaru, ale także mnóstwo innych wielkości wykazuje rozkład tego typu o charakterystycznym kształcie krzywej dzwonowej.

normal67

 

Wykres ze strony http://www.regentsprep.org/regents/math/algtrig/ats2/normallesson.htm. Jednostką na osi x jest 1/\sqrt{2\alpha}, odchylenie standardowe.

James Clerk Maxwell zastosował bardzo podobne rozumowanie do prędkości cząstek gazu. Jeśli potraktujemy składowe prędkości w prostopadłych kierunkach jako trzy zmienne v_x, v_y, v_z, to ich rozkłady prawdopodobieństwa powinny być opisane tą samą funkcją:

f(v_x^2+v_y^2+v_z^2)=f(v_x^2)f(v_y^2)f(v_z^2) \Rightarrow f(v^2_x)=\exp(-\alpha v_x^2),

gdzie \alpha jest pewnym parametrem. Maxwell pokazał też w swej pracy, że ów parametr zależy od masy cząsteczek m oraz temperatury T. Dziś zapisujemy to następująco:

\alpha=\dfrac{m}{2kT},

gdzie k to stała Boltzmanna. Znając rozkład prawdopodobieństwa dla składowych prędkości, można łatwo znaleźć postać rozkładu dla samej prędkości, korzystając z tego, że v^2=v_x^2+v_y^2+v_z^2. Rozkład prawdopodobieństwa przyjmuje postać:

p(v)=v^2\exp({-\alpha v^2}). \mbox{ (*)}

Zwykle ten wynik nazywamy rozkładem Maxwella. Pokazuje on, że w gazie występują wszystkie możliwe wartości prędkości, choć z różnym prawdopodobieństwem. Rozkład ten pozwala zrozumieć np., czemu w atmosferze jest mało lekkich pierwiastków, jak wodór – lżejsze atomy szybciej się poruszają i łatwiej jest im uciec w przestrzeń kosmiczną (a zawsze pewien niewielki ułamek cząsteczek ma dużą prędkość, jest to tzw. ogon rozkładu Maxwella).

MaxwellBoltzmann-en

https://en.wikipedia.org/wiki/Maxwell–Boltzmann_distribution#/media/File:MaxwellBoltzmann-en.svg

W późniejszym okresie Maxwell wrócił do wyprowadzenia tego rozkładu i uzyskał je z nieco solidniejszych założeń, które sprowadzały się do przyjęcia, iż wektory prędkości cząsteczek gazu nie są ze sobą skorelowane – co także nie jest założeniem oczywistym (tzw. chaos molekularny). To drugie podejście Maxwella otworzyło drogę do pracy Ludwiga Boltzmanna, wielkiego fizyka, który zajmował się głównie teorią gazów, rozszerzając ją stopniowo do fizyki statystycznej.

(*) Warunek v^2=v_x^2+v_y^2+v_z^2 to równanie sfery w przestrzeni v_x, v_y, v_z. Na sferze takiej prędkość jest stała. Szukając prawdopodobieństwa dla wąskiego przedziału prędkości (v,v+dv), musimy uwzględnić fakt, że objętość cienkiej powłoki między dwoma sferami równa się 4\pi v^2 dv – stąd dodatkowe v^2 w rozkładzie Maxwella. Nasze wszystkie rozkłady są nieunormowane, należy też, ściśle biorąc, rozważać zawsze niewielkie przedziały, a nie konkretne wartości, nie chciałem jednak zaciemniać prostych koncepcji, które tu się pojawiają.