
Okazuje się, że nawet w dzisiejszych czasach, w dobie super szybkich komputerów i bardzo zaawansowanych algorytmów, istnieją problemy, z którymi komputer radzi sobie znacznie gorzej niż (nawet niezbyt inteligentny) człowiek. Jednym z takich problemów jest interpretacja (rozpoznawanie) obrazów. O ile współczesny komputer dość dobrze poradzi sobie z odczytaniem prostego tekstu z obrazka, o tyle powiedzieć co znajduje się na bardziej skomplikowanej ilustracji już nie będzie w stanie. Tę „ułomność” maszyn wykorzystuje się w rozmaitych systemach komputerowych, w których chcemy się upewnić, że mamy do czynienia z żywym człowiekiem, a nie robotem (wszyscy chyba znają tzw. CAPTCHA, czyli obrazki z pokrzywionym tekstem wpisywane np. w czasie rejestracji w rozmaitych serwisach).
Młot na spamerów?
Tego typu zabezpieczenia przy zakładaniu darmowego konta pocztowego jest sporym utrudnieniem dla spamerów, którzy potrzebują milionów kont do prowadzenia swej niecnej działalności. Wprowadzenie captcha było na pewno dla nich silnym ciosem, ale jednocześnie zmusiło do wymyślenia sposobu jak obejść to zabezpieczenie. Jaka była pierwsza myśl? Zatrudnić tysiące osób, które siedząc u siebie w domu odczytywałyby napisy na obrazkach. Rozwiązanie dość dobre, bo płacić za tego typu usługę nie trzeba dużo, ale … jednak trzeba. Czy nie dałoby się zmusić tych ludzi do tego, aby robili to z własnej woli i do tego za darmo? Oczywiście, że się da. Wystarczy zamiast pieniędzy dać im jakąś inną nagrodę. Co może być tą nagrodą? Np. strona internetowa z ciekawą treścią. Idealnie do tego nadają się strony erotyczne, na których np. publikujemy zdjęcia. Można je oglądać bezpłatnie, ale aby przejść do następnej podstrony należy wpisać tekst z wyświetlanego obrazka. Nie muszę już chyba dodawać skąd tam się weźmie ten obrazek i co zrobimy z wpisanym tekstem:-). To się właśnie nazywa ‘human computation’.
Human computation w Google
Ale czy moc przerobową milionów internatów można spożytkować jedynie dla tak niecnych celów? Oczywiście nie. Istnieją setki sposobów na bardziej produktywne jej wykorzystanie. Na jedne z ciekawszych wpadła fima … Google.
Nie od dziś wiadomo, że dobrą wyszukiwarkę nie jest łatwo zrobić. A dobrą wyszukiwarkę zdjęć … to już prawdziwe mission impossible. Skąd serwery Google mają wiedzieć co się znajduje na zdjęciach zaindeksowanych przez Googlebota? Tylko w jeden sposób: ludzie muszę im to powiedzieć. Czy zatem google zatrudnia dziesiątki tysięcy ludzi ‘otagowujących’ zdjęcia? A może śladem spamerów ma całą sieć tajnych stron porno? Otóż nie … Google tworzy gry.
Gry Google
Gry są różne i mają różne zasady, ale ich cel jest jeden: jak najlepsze opisanie zdjęć z bazy Google. Oczywiście grający w te gry ludzie myślą, że celem jest zdobywanie punktów i wygrywanie rankingów – to jest ich motywacja do częstej gry.
www.espgame.org/
Dwoje losowo wybranych graczy dostaje na swoim ekranie jakiś obrazek. Ich zadaniem jest wpisywanie słów kluczowych, które im się z tym obrazkiem kojarzą. Gdy u obu graczy pojawi się to samo słowo otrzymują oni punkt i przechodzą do następnego obrazka. Co w tle robi Google? Oczywiście notuje jakie to słowo zostało podane przed obu graczy. Gdy dany obrazek zostanie pokazany kilkunastu-kilkudziesięciu parom graczy mamy świetną listę tagów opisujących go. Jeśli jakieś słowo powtarza się zbyt często, np.: przy jednym z obrazków wszyscy wpisują „słońce”, to kolejnym graczom utrudnia się zadanie i mogą oni wpisywać wszystkie słowa, ale nie „słońce”. Dzięki temu listy słów kluczowych są bardzo różnorodne i dobrze opisują przedmiot.
Mamy już bazę świetnie opisanych zdjęć, ale czy to wszystko co chcielibyśmy wiedzieć? Jeśli wiemy, że na danym obrazku jest: mężczyzna, kobieta, piłka, słońce i parasol, to czego nam jeszcze brakuje? Bylibyśmy w pełni szczęśliwi, gdybyśmy wiedzieli, w którym miejscu obrazka znajdują się poszczególne ‘obiekty’. Jak to osiągnąć? Tu z pomocą przychodzi kolejna gra:
www.peekaboom.org/
Zasady znowu są bardzo proste. Znowu mamy dwóch graczy, ale tym razem tylko jeden widzi zdjęcie, a drugi jedynie czarny prostokąt. Gracz, który widzi zdjęcie otrzymuje także hasło ‘do pokazania’. Hasłem jest najczęściej jakiś obiekt znajdujący się na zdjęciu. Jak zatem najłatwiej go pokazać? Oczywiście odsłaniając partnerowi tę część obrazka, w której znajduje się obiekt. Gdy partner odgadnie hasło, Google już wie, żeyle=""> w odsłoniętym obszarze znajduje się zadane hasło. A skąd wziąć listę haseł do zdjęć? Oczywiście z gry esp.

Dzięki tym dwu prostym grom mamy nie tylko świetnie opisane zdjęcia, ale dodatkowo jeszcze znamy rozmieszczenie poszczególnych obiektów.
Gier jest więcej (np.: http://www.peekaboom.org/phetch/) i zachęcam do zapoznania się z nimi.
Oczywiście zastosowań ‘human computation’ jest dużo więcej i mozna by jeszcze długo o nich pisać. Jeśli ktoś zna jakiś ciekawy przykład to zachęcam do podzielenia się informacjami w komentarzach.