Captcha je z pohľadu užívateľov jednou z najmenej obľúbených ochrán na internete. Slúži na ochranu pred robotmi, ktorí zahlcujú internetové stránky spamom. Užívateľom je známa skôr ako deformované slovo, ktoré treba opísať do prázdneho políčka, čím sa potvrdí napríklad vloženie komentáru alebo registrácia.
V priemere venujeme opísaniu jedného takéhoto deformovaného obrázka desať sekúnd. Teoreticky by nás to malo tešiť, pretože pri správnom vylúštení si ujasníme, že sme ešte stále ľudia a nie roboti.
Prvá otázka, ktorú položil Louis von Ahn účastníkom konferencie TEDx, bola, či im captcha lezie na nervy. Zasmiali sa a prikývli. Reakciu zdieľali aj účastníci TEDxBratislava, ktorí jeho vystúpenie sledovali z videozáznamu. „Vymyslel som ju,“ priznáva so smiechom Louis. Ďalej o nej ale hovoriť nechce.
Keď si uvedomil, že ľudstvo strávi lúštením deformovaných obrázkov päťstotisíc hodín denne, začal sa cítiť zle. Rozhodol sa, že vymyslí spôsob, ako tento čas zužitkovať. Tak vznikla recaptcha - služba, ktorá pomáha digitalizovať knihy.
Prvým krokom je naskenovanie knihy. „Skenovaním sa vytvorí niečo ako digitálna fotografia každej strany. Je to obrázok textu a počítač ho musí vedieť rozlúštiť. Technológia, ktorú používa, sa volá OCR, no nie je ale dokonalá. Predovšetkým v starých knihách nedokáže rozoznať značnú časť slov,“ vysvetľuje Louis, ktorý spolu so svojím tímom našiel riešenie. Počítačom nerozlúštiteľné slová využili pri textových obrázkoch.
Dnes sa môžete stretnúť s tým, že obrázok neobsahuje jedno deformované slovo ale dve. Jedno z nich potvrdzuje, že ste človek a je tiež výsledkom úspešnosti lúštenia. Druhé je slovo z digitalizovanej knihy, ktoré technológia OCR nedokáže rozlúštiť. Ak ste úspešne prepísali prvé slovo, predpokladá sa, že aj druhé je správne. A teda, vďaka tomu, že ste človek a nie robot, sú knihy úplné.
L. von Ahn však dodáva, že to má ešte jeden háčik. Ak sa dve náhodne vybrané slová objavia v zlom kontexte na zlom mieste, stáva sa, že recaptcha niekoho urazí. Ako napríklad vtedy, keď sa objavilo spojenie „zlí kresťania“ na webovej stránke kostola. :)