Strona główna / Popularnonaukowe / Krowy w labiryncie i inne eksploracje matematyczne

Aktualności

22.01.2021

Nie żyje Henryk Jerzy Chmielewski (Papcio Chmiel)

Z ogromnym smutkiem zawiadamiamy, że 22 stycznia 2021 r. zmarł Henryk Jerzy Chmielewski (Papcio Chmiel).

Wywiady

19.11.2020

Niksen jest jedną z form dbania o siebie

Czy wiecie, jak ważne jest to, by co jakiś czas wykroić sobie z codzienności chwilę na nicnierobienie? Niby ciągle mówią o tym psychologowie i coache, ale teraz mamy to czarno na białym: Agnieszka Drotkiewicz rozmawia o niezbędności lenistwa z Olgą Mecking, autorką książki o tajemniczym pojęciu "niksen".

Posłuchaj i zobacz

07.01.2021

Krzysztof Pyzia gościem Pytania na śniadanie

Zapraszamy do wysłuchania wywiadu z Krzysztofem Pyzią, autorem książki "Stewardesy. Cała prawda o lataniu".

Bestsellery

TOP 20

  1. Pięć Stawów. Dom bez adresu Beata Sabała-Zielińska
  2. Śreżoga Katarzyna Puzyńska
  3. Uciekłam z arabskiego burdelu Laila Shukri

Fotogaleria

więcej »

Krowy w labiryncie i inne eksploracje matematyczne

Ian Stewart

Rozdział 12.

BŁĄD PRZESŁUCHUJĄCEGO

Coraz częściej matematyka ma kontakt z wymiarem sprawiedliwości. Nie, nie zdelegalizowano równań kwadratowych – przykro mi! Za sprawą materiału dowodowego DNA na sale sądowe trafiła teoria prawdopodobieństwa, otwierając tym samym przysłowiową puszkę Pandory. Co więc robią sądy? Próbują wyrzucić matematykę z powrotem.

Matematyka wkracza do sal sądowych.
Kiedyś instruowano ławę przysięgłych, by orzekała o winie oskarżonego, jeśli jest o niej przekonana „ponad uzasadnioną wątpliwość”. To polecenie zakłada podejście niejako jakościowe: wszystko zależy od tego, co każdy z sędziów przysięgłych uzna za uzasadnioną wątpliwość. Cywilizacja przyszłości mogłaby spróbować potraktować winę ilościowo, realizując scenariusz często pojawiający się w fantastyce naukowej, w którym ławę przysięgłych zastępuje Komputer Sądowy. Komputer analizuje dowody, oblicza prawdopodobieństwo winy i kończy proces, kiedy zbliży się ono wystarczająco do 1 (wartość ta oznacza absolutną pewność, rzadko osiągany ideał). Ale dzisiejsza cywilizacja nie ma Komputerów Sądowych, więc przysięgli są zmuszeni zmagać się z teorią prawdopodobieństwa. Dzieje się tak między innymi z powodu rosnącego zastosowania materiału dowodowego DNA. Analiza DNA jest stosunkowo nowa, więc interpretacja danych uzyskanych z badań genetycznych polega na ocenie prawdopodobieństwa. Podobne problemy mogły się pojawić, kiedy wprowadzono konwencjonalną daktyloskopię, ale prawnicy w tamtych czasach byli chyba mniej wyrobieni: rzadko podważa się dowody w postaci odcisków palców z uwagi na przesłanki probabilistyczne. Chociaż nawet to się może zmienić, bo coraz więcej prawników zaczyna znajdować powody (dobre lub nie), by kwestionować ich wiarygodność.
W 1995 roku Robert Matthews – którego badania nad „zasadą antropomurphiczną” opisywałem w Histeriach matematycznych – stwierdził, że za pomocą teorii prawdopodobieństwa powinno się analizować jeszcze dłużej wykorzystywane w sprawach sądowych źródło dowodów. A mianowicie: przyznanie się do winy. Jeden z najbardziej zaskakujących wniosków Matthewsa dotyczy tego, że w niektórych okolicznościach przyznanie się świadczy raczej o niewinności niż o winie oskarżonego. Nazywa to odkrycie „błędem przesłuchującego”.
Dla Tomása de Torquemady, pierwszego hiszpańskiego Wielkiego Inkwizytora, przyznanie się stanowiło niepodważalny dowód winy – nawet jeśli uzyskano je pod przymusem, jak zresztą na ogół bywało. Torquemada wręcz zezwolił na stosowanie tortur w celu zdobycia dowodów i, jak się szacuje, jest odpowiedzialny za spalenie na stosie około dwóch tysięcy osób na podstawie wymuszonych zeznań. We współczesnej praktyce prawnej przyznanie się do winy jest na ogół traktowane sceptycznie, jeśli wiadomo, że zostało wymuszone, ale w połowie lat 90. w kilku głośnych procesach w Wielkiej Brytanii zapadły wyroki skazujące za terroryzm na podstawie dowodu przyznania się. Po apelacji wyroki te unieważniono z powodu wątpliwości, czy przyznanie się oskarżonych do winy było autentyczne. Matthews pokazuje, dlaczego należy podchodzić z nieufnością do przyznania się do winy w sprawach o terroryzm, jeśli nie potwierdzają go inne odpowiednie dowody.
Główna koncepcja matematyczna, jaka będzie nam tu potrzebna, to prawdopodobieństwo warunkowe. Mówi nam, jak bardzo prawdopodobne są pewne zdarzenia, jeśli już zaszły inne. Wiadomo, że ludzka intuicja kiepsko radzi sobie z prawdopodobieństwem – na przykład przesadnie duże wrażenie robią na nas „zbiegi okoliczności”, nawet jeśli istnieją prozaiczne ich wyjaśnienia. Z prawdopodobieństwem warunkowym radzimy sobie jeszcze gorzej. Oto słynny przykład.
Państwo Kowalscy mówią ci, że mają dwoje dzieci, a jedno z nich jest dziewczynką. Nie wspominają, czy drugie to córka, czy syn, a z tego co wiemy, w grę wchodzą obie te możliwości. Biorąc pod uwagę te informacje, jakie jest prawdopodobieństwo, że drugie dziecko jest dziewczynką? Możesz założyć, że urodzenie córki i syna jest tak samo prawdopodobne, czyli prawdopodobieństwo dla obu płci wynosi ½, a narodziny kolejnych dzieci są od siebie niezależne. Te założenia nie do końca odpowiadają prawdzie, ale są do niej wystarczająco zbliżone i pozwalają uniknąć komplikacji, które odrywałyby nas od głównego toku rozumowania, nie zmieniając znacząco rezultatu.
Odruchowa odpowiedź: drugie dziecko może równie dobrze być chłopcem, jak i dziewczynką, więc prawdopodobieństwo, że to córka, wynosi ½. Jednak przy dwójce dzieci istnieją cztery możliwe konfiguracje ich płci: CC, CD, DC, DD – gdzie C oznacza chłopca, D dziewczynkę, a kolejność liter wskazuje, które z nich przyszło na świat pierwsze, a które drugie. Każda kombinacja jest równie prawdopodobna, czyli ma prawdopodobieństwo ¼. W dokładnie trzech przypadkach, CD, DC i DD, w rodzinie jest dziewczynka; w tylko jednym z nich, DD, drugie dziecko to także córka. Czyli prawdopodobieństwo, że Kowalscy mają dwie córki, jeśli wiemy, że przynajmniej jedno z dzieci jest dziewczynką, wynosi tak naprawdę 1/3.
A teraz wyobraźmy sobie, że Kowalscy mówią ci, że ich starsze dziecko jest dziewczynką. Jakie będzie prawdopodobieństwo, że młodsze to też córka? Tym razem możliwe konfiguracje płci to DC i DD; tylko w jednej z nich, DD, młodsze dziecko jest dziewczynką, więc prawdopodobieństwo wynosi tu ½. Ten wniosek wielu wydaje się nielogiczny, ale przy tych założeniach obliczenia wykonano prawidłowo. Wydają nam się dziwne, bo nie mamy dobrego wyczucia paradoksalnych cech prawdopodobieństwa warunkowego. Dwie historie dotyczące dzieci państwa Kowalskich pokazują, że wiąże się ono z określeniem kontekstu. Jego wybór może mieć duży wpływ na obliczanie prawdopodobieństwa. Ale ponieważ kontekst rzadko jest jasno sprecyzowany, nie poświęcamy mu wystarczająco dużo uwagi i łatwo dajemy się zwieść.
Wróć do rozdziału 1 i spójrz na rysunek 2, który przedstawia wszystkie 36 możliwych wyników rzutu dwiema kostkami – szanse na wypadnięcie każdej z par są równe. Jeśli przynajmniej jedną kostką wyrzucimy szóstkę, jakie jest prawdopodobieństwo, że sześć oczek wypadnie na obu? Par z szóstką jest 11, wszystkie równie prawdopodobne, i tylko jedna z nich to dwie szóstki. Czyli prawdopodobieństwo warunkowe wynosi tu 1/11. A teraz zadajmy podobne pytanie, ale zmieńmy warunek na „białą kostką wyrzucono szóstkę”. Ten warunek spełnia już tylko sześć par, toteż prawdopodobieństwo warunkowe wynosi 1/6. Mamy więc tu sytuację analogiczną do tej z dziećmi państwa Kowalskich.
Aby przekonać się, jak subtelne są to sprawy, wyobraźmy sobie, że wiesz już, iż państwo Kowalscy mają dwoje dzieci, ale nie masz pojęcia, jakiej są one płci. Któregoś dnia widzisz je w ogrodzie (rysunek 49). Jedno dziecko, widoczne, to dziewczynka. Drugie częściowo zasłania pies, więc nie możesz rozpoznać płci. Jakie jest prawdopodobieństwo, że Kowalscy mają dwie córki? Można twierdzić, że to pytanie powtarza dokładnie pierwszy z powyższych scenariuszy, toteż prawdopodobieństwo będzie wynosić 1/3. Albo można argumentować, że otrzymana przez ciebie informacja to „dziecko, które nie bawi się teraz z psem, jest dziewczynką”, a więc przypomina to drugi scenariusz, pod tym względem, że odróżnia jedno dziecko od drugiego, czyli odpowiedź brzmi: ½. Natomiast państwo Kowalscy, którzy wiedzą, że dziecko bawiące się z psem to Janek, powiedzieliby, że prawdopodobieństwo posiadania przez nich dwóch dziewczynek wynosi 0. Kto ma rację?
Odpowiedź zależy od wyboru kontekstu. Prawdopodobieństwo dotyczy modeli rzeczywistości, a nie samej rzeczywistości. Czy pobraliśmy próbki losowo z sytuacji, w których mamy (zasadniczo) wiele różnych rodzin, a w nich dowolne dziecko, losowo, bawi się z psem? Czy też nasze badania dotyczą puli rodzin, w których z psem bawi się tylko jedno dziecko – zawsze to samo? Czy może analizujemy tylko jedną, konkretną rodzinę, w którym to przypadku prawdopodobieństwo to w ogóle niewłaściwy model?
Interpretacja danych statystycznych wymaga rozumienia matematyki prawdopodobieństwa oraz kontekstu, w którym się ją stosuje. Przez całe wieki prawnicy bezwstydnie wykorzystywali braki w matematycznej wiedzy sędziów przysięgłych albo w celu uzyskania wyroków skazujących dla niewinnych ludzi albo aby uwolnić od zarzutów winnych. Przykładem może być „błąd prokuratora” (ang. prosecutor’s fallacy), pojawiający się w kontekście analizy DNA. Chciałbym móc powiedzieć, że sądy dziś już go rozumieją, to na ogół. Jednak tragiczna sprawa Sally Clark, prawniczki niesłusznie oskarżonej o zamordowanie własnych dzieci, sugeruje, że nadal pozostało tu coś do zrobienia. Proces odbywał się w 1999 roku i nie wiązał się ani z analizą DNA, ani z „błędem prokuratora”: więcej szczegółów – zob. „Strony internetowe” na końcu rozdziału.
Wracając do badania DNA (zwanego też daktyloskopią genetyczną lub ustalaniem profilu genetycznego) – najpierw poznajmy jego początki, a potem zobaczymy, na czym polega ten błąd.
Na pomysł analizy DNA w celu poznania profilu genetycznego wpadł w 1985 roku Alec Jeffreys z Uniwersytetu w Leicester. Badanie to koncentruje się na tzw. regionach VNTR (ang. variable number of tandem repeat – zmienna liczba tandemowych powtórzeń) w ludzkim genomie. W każdym takim regionie określona sekwencja DNA wielokrotnie się powtarza. U poszczególnych osób istnieją duże różnice w sekwencjach VNTR i powszechnie uznaje się, że są unikatowe dla danego człowieka, pozwalając go zidentyfikować. W „sondzie wielolokusowej” stosuje się standardowe techniki biologii molekularnej do poszukiwania zgodności między kilkoma różnymi regionami VNTR w dwóch próbkach DNA: jednej związanej z przestępstwem, drugiej pobranej od podejrzanego. Znalezienie wystarczająco wielu zgodności powinno stanowić przekonujący dowód statystyczny na to, że obie próbki pochodzą od tej samej osoby.
„Błąd prokuratora” polega na pomyleniu dwóch różnych rodzajów prawdopodobieństwa. „Prawdopodobieństwo zgodności” odpowiada na pytanie: „Jakie jest prawdopodobieństwo, że DNA danej osoby będzie pasować do próbki z miejsca zbrodni, jeśli osoba ta jest niewinna?”. Jednak sąd powinno interesować nieco inne pytanie: „Jakie jest prawdopodobieństwo, że podejrzany jest niewinny, jeśli mamy zgodność DNA?”. Prawdopodobieństwo warunkowe zazwyczaj się zmienia przy takim przestawieniu kolejności zdań, więc odpowiedzi na te dwa pytania mogą być diametralnie różne. Źródło tej rozbieżności ponownie wynika z kontekstu. W pierwszym przypadku daną osobę umieszcza się w populacji wybranej pod kątem naukowej dogodności – na przykład wśród osób tej samej płci, przynależności etnicznej i podobnego wzrostu i wagi. W drugim przypadku podejrzany trafia do populacji mniej precyzyjnie określonej, ale mającej ściślejszy związek ze sprawą i zazwyczaj mniejszej – osób, co do których istnieje uzasadnione przypuszczenie, że mogły popełnić dane przestępstwo. (…)