Test ukrytej wiedzy (CIT – Concealed Information Test) jest techniką badań psychofizjologicznych ukierunkowanych na wykrycie wiedzy związanej z okolicznościami przestępstwa. Jej odmiana: Searching CIT (S-CIT) polega na podaniu osobie badanej kilku niesprawdzonych opcji, i pomiarze siły reakcji na każdą z nich, w celu wykrycia tej prawdziwej – wywołującej najsilniejszą reakcję psychofizjologiczną.
S-CIT jest stosowany na szeroką skalę w dochodzeniach kryminalnych w Japonii, i dopuszczany w tamtejszych sądach jako dowód, aczkolwiek jego wartość dowodowa jest drugorzędna.
Japonię można uznać za prekursora w nowoczesnych badaniach nad tym rodzajem testu wariografem. Należy zaznaczyć, iż test ten ma szersze zastosowanie i nie musi się sprowadzać tylko do wykrywania winnych; to, że ktoś posiada pewną wiedzę, której nie ujawnia, nie oznacza, iż jest winny, ale w takim razie test może służyć przykładowo określaniu: wiarygodności świadka czy kompetencji biegłego i jego rzetelności.
W przypadku testu S-CIT możliwości przełożenia wyników badań przeprowadzonych w warunkach laboratoryjnych na realne są znacznie ograniczone. Po pierwsze konieczne byłoby dokładne kontrolowanie wszelkich wycieków informacji. Można takie założenia poczynić w laboratorium, ale w praktyce nie wiadomo do końca czy policja czy adwokaci nie „podzielili się” swoją wiedzą z kimś. Jeżeli niewinni ludzie znają szczegóły śledztwa, to wykrycie takiej wiedzy oznacza jedynie marnowanie czasu i zasobów.
Badania laboratoryjne
Przykładowe badania przeprowadził profesor psychologii i psychiatrii David Lykken. Zadał on próbie badawczej 6 pytań wielokrotnego wyboru; odpowiedzi były tak skonstruowane, że bez wiedzy o przestępstwie badany nie mógłby odróżnić prawdziwego przedmiotu (atrybutu) od niewłaściwego. Przykładem pytania jest następujące: „Gdzie złodziej ukrył skradziony zegarek?”. (a) w męskiej toalecie, (b) na wieszaku, (c) w pokoju, (d) na parapecie, (e) w szafce?
Jeżeli najwyższą reakcję elektrodermalną wywołała właściwa odpowiedź, dodawano 2 punkty; jeżeli właściwa odpowiedź wywoływała drugą pod względem siły reakcję, dodawano 1 punkt. Wskaźnik pozytywnych stwierdzeń – czyli właściwie zdiagnozowanych odpowiedzi oznaczających, iż dana osoba posiada wiedzę krytyczną – wyniósł 100%. Czułość testu – czyli wskaźnik braku pomyłek co do osób nie posiadających wiedzy krytycznej – wyniósł 88%1.
Interesującym odkryciem było to, iż przewodność (opór) skóry jest zdecydowanie najważniejszym czynnikiem diagnozującym osobę w ukrytymi informacjami; w przypadku oddechu i tętna często okazywało się, iż takie osoby miały zwolnioną akcje serca i spowolniony oddech. Jednak okazało się również, iż pewien procent badanych nie wykazuje zmian elektrodermalnych na bodźce.
Do pozostałych, poza wyciekami informacji, czynników utrudniających implementację założeń laboratoryjnych w realnym postępowaniu należą2:
– fałszywe wspomnienia powstałe w wyniku powtarzania testów lub powtarzania odpowiedzi,
– brak pewności, co do tego, które szczegóły zostały zapamiętane,
– możliwość wywoływania silnej reakcji przy niewłaściwej odpowiedzi (na przykład poprzez naciskanie stopą na podłogę).
Praktyczne zastosowanie S-CIT w Japonii
Zakładając, że prowadzący śledztwo nie znają właściwego szczegółu, starają się tak dobrać odpowiedzi, aby prawdopodobieństwo znalezienia się wśród nich tej poprawnej było jak najwyższe. Jednak nadal istnieje ryzyko, iż nie trafią, i wnioskowanie będzie błądzeniem w domysłach. Korzystne jest dołączenie, do wachlarza odpowiedzi, dodatkowej sformułowanej ogólnie, przykładowo: „Inne?”, „Coś jeszcze?”, „Coś innego?”. Test CIT w Japonii zazwyczaj ma następującą konstrukcję3:
– składa się z 4 do 6 pytań,
– pytania powtarzane są 3 do 5 razy, przy czym ich porządek jest zmieniany,
– badane kanały reakcji to: przewodnictwo skóry, czynność oddechowa, częstość akcji serca i znormalizowana objętość pulsu,
– jeżeli reakcje na wszystkie odpowiedzi są podobne, zakłada się brak znajomości tego szczegółu, jeśli na daną odpowiedź badany reaguje w zróżnicowany sposób, zakłada się znajomość tego szczegółu,
– brane są pod uwagę takie czynniki korygujące, jak: czynniki środowiskowe (np. hałas), artefakty (np. ruch fizyczny lub głębokie oddychanie) i rozsądne argumenty alternatywne dla pewnych kwestii (np. rozpoznanie odpowiedniego przedmiotu z przyczyn niezwiązanych z przestępstwem).
Praktyka japońskich śledztw i badania laboratoryjne różnią się między innymi ilością rund zadawanych pytań; badacze tacy jak Elaad i Ben-Shakhar założyli, iż metaanaliza większości badan dotyczących testu S-CIT i CIT nie wymaga powtarzania pytań. Według japońskich śledczych jest to konieczne, ażeby określić, czy reakcje mają cechę systematyczności. Z drugiej strony Japończycy uważają, że pytanie można powtarzać, ale nigdy w różnych konfiguracjach – musi być zadane w ten sam sposób. Podstawową różnicą jest generalizowanie wyników odpowiedzi przez badaczy laboratoryjnych z zachodu: ustalają oni pewną skalę i jeśli wynik przekroczy wartość graniczną, oznacza to, że badany ma związek ze sprawą.
W przypadku testowania w praktyce, każde pytanie interpretowane jest z osobna, przykładowo: badany może wiedzieć, co zostało skradzione, ale nie wie, w jaki sposób4.
Generalnie badania laboratoryjne zapoczątkowane przez Lykkena wprowadziły konceptualizację wiedzy winnego (guilty knowledge) – to, że badany reaguje w różnoraki sposób na pytania traktowane jest jako szum informacyjny, liczy się uśrednienie wyników. Badacze japońscy nie agregują wyników. Jaką daje to różnice w praktyce?
Załóżmy, że śledztwo dotyczy kradzieży, i przesłuchiwany jest sprawca. Jak w takim razie dowiedzieć się, czy miał wspólnika? Pytanie o wspólników musi być oddzielone i interpretowane osobno – dostarcza ono osobnej informacji, a traktowanie go jako składowej w celu określenia poczucia winy jest błędem. Test CIT oparty na zachodniej metodologii zakłada konieczność zawarcia wielu pytań, więcej niż sześciu – z tego powodu właśnie często podchodzono sceptycznie do tego rodzaju egzaminu wariografem. Zakładając, że kluczowe dane nie są dostępne, trudno jest sformułować wiele pytań.
W japońskiej praktyce interpretowania wyników testu wykresy ocenia się wzrokowo, natomiast brakuje systemu punktowego, który zapewniałby większe uporządkowanie. Człowiek jest istotą podatną na uprzedzenia i w tej kwestii japońscy badacze powinni skorzystać z metod laboratoryjnych5.
Powyżej nakreślone różnice mogą wydawać się trywialne na pierwszy rzut oka, ale w rzeczywistości sprowadzają się do skonstruowania zupełnie odmiennych metod dochodzenia.
Do podstawowych zaleceń japońskich praktyków w kwestii przeprowadzania testu S-CIT należą6:
– konieczność przeprowadzania testu wstępnego, polegającego na zapamiętywaniu liczby, a następnie ocenie siły reakcji – badany powinien zareagować najsilniej na wariant odpowiedzi z właściwą liczbą; analizując najsilniejszą reakcję ustalany jest wzorzec odpowiedzi,
– zdiagnozowanie kanału, w jakim zachodzą najsilniejsze reakcje – dla jednego będzie to oporność skóry, dla drugiego przykładowo tętno,
– nie agregowanie wyników w celu ustalania winy,
– wyszukiwanie maksymalnej liczby wariantów na dane pytanie, a nie maksymalizowanie pytań.
Algorytmy do wykrywania informacji krytycznej
Assaf Breska, Gershon Ben-Shakhar i Nurit Gronau stworzyli koncepcję algorytmów postępowania w sytuacji, kiedy kluczowa informacja nie jest znana, czyli w przypadku przeprowadzania testu S-CIT.
Algorytmy te opierają się na założeniu, iż „winni” posiadają te same informacje krytyczne, a ich reakcja na właściwe odpowiedzi będzie się systematycznie zwiększała (gdyż starają się podać „ulepszone” odpowiedzi), podczas gdy różnica w odpowiedziach na neutralne warianty traktowana będzie jako szum7.
Pierwsza klasa algorytmów składa się z 2 etapów:
1. Na początku standardowe odpowiedzi na każdą pozycję w każdym pytaniu
zostały uśrednione dla wszystkich uczestników (posiadających odpowiednią wiedzę jak również „niewinnych”). Te średnie zostały użyte do zidentyfikowania krytycznego elementu w każdym pytaniu. Taki tryb postępowania jest konieczny, gdyż egzaminator nie wie, kto jest winny, a kto niewinny – dlatego musi wziąć pod uwagę wszystkich uczestników.
2. Do obliczeń ilości punktów dla każdego z badanych – w celu zdiagnozowania winy –wykorzystano dwa algorytmy. W prostym algorytmie, Z punktów krytycznych przedmiotów, zidentyfikowanych na etapie 1, uśredniono dla każdego wynik, będący wypadkową dla wszystkich pytań. W drugim algorytmie również uśredniono wynik, ale na zasadzie średniej ważonej. Waga każdego z pytań była różnicą pomiędzy najsilniejszą reakcją wywołaną elementem krytycznym ustalonym na etapie pierwszym, a drugą z kolei najsilniejszą odpowiedzią – a więc tym większa waga, im większa różnica, czyli im silniej zaznaczona była reakcja na wariant krytyczny.
Druga klasa algorytmów działa na zasadzie badania interkorelacji między profilami odpowiedzi wszystkich uczestników: podstawowym uzasadnieniem metodyki tego algorytmu jest to, że dwie osoby podzielające te same ukryte informacje powinny wykazywać pozytywne korelacje między profilami odpowiedzi dla poszczególnych pozycji.
Chodzi o to, żeby zidentyfikować grupy osób, które mają dodatnie korelacje, ponieważ dzielą one wspólny wzorzec i odróżnić ich od tych, którzy mają korelacje o sile w pobliżu zera8.
Aby to osiągnąć, przeprowadzono liniową dekompozycję
oryginalnej macierzy danych z wykorzystaniem analizy głównych składników. W
tej metodzie wzór wartości każdej zmiennej (kolumna macierzy danych) w punktach danych (wiersze macierzy danych) przyjmuje się jako liniową kombinację utajonych wzorów (nazywanych głównymi składowymi), tak aby każda obserwowana zmienna była ważoną sumą tych składników. Każdy składnik jest ważony przez skalar, nazywany współczynnikiem, który odzwierciedla stopień, w jakim utajony składnik wpływa na obserwowaną zmienną9.
Procent zdiagnozowanych prawidłowo ukrytych informacji dla poszczególnych algorytmów kształtuje się następująco:
Algorytmy pierwszej klasy:
69,8-99,3
71,8-99,3
Algorytmy drugiej klasy:
66-100
Względna wydajność algorytmów waha się w przedziale 89-100%, a więc jest zbliżona do wydajności testu CIT przy pełnej znajomości informacji krytycznych. Z drugiej strony badanie to zostało przeprowadzone przy użyciu dużej próby badawczej: wielu „winnych” i „niewinnych”. Mniejsza próbka dałaby bardziej znaczące wyniki. Zastosowanie mniejszych prób zwykle daje gorsze wyniki i efektywność S-CIT jest mniejsza.
1 T. Ogawa, I. Matsuda, B. Verschuere, M. Tsuneoka, CIT Test In Laboratory Versus Japanese Field Practice: Bridging The Scientist – Practictioner Gap, https://www.researchgate.net/publication/283491759_The_Concealed_Information_Test_in_the_Laboratory_Versus_Japanese_Field_Practice_Bridging_the_Scientist-Practitioner_Gap, S. 17.
2 I. Matsuda, H. Nittono, J. Allen, The Current and Future Status of the CIT Test for Field Use, https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3507001/
3 T. Ogawa, I. Matsuda, B. Verschuere, M. Tsuneoka, CIT Test…op.cit, s. 19.
4 Tamże, s. 19-20.
5 Tamże, s. 22.
6 I. Matsuda, H. Nittono, J. Allen, The Current…op.cit.
7 A. Breska, G.Ben-Shakhar, N. Gronau, Algorithms for Detecting Conealed Knowledge Among Groups When Critical Information is Unavailable, Journal of Experimental Psychology 3/2012, s. 294.
8 Tamże, s. 295.
9 Tamże.