reCAPTCHA

V komentářích článku CAPTCHA jsem narazil na komentář, odkazující na nějaké – pro mě do té doby neznámé – “reCAPTCHA”. A pak jsem shlédl toto video

Váš prohlížeč nepodoporuje Flash stáhnětě jej.

Pokud máte chvilku tak doporučuji shlédnout, je to opravdu úžasná věc. Pokud ne, tady je shrnutí

– každý den je opsáno asi 200 miliónů “nesmyslných” textů CAPTCHA

– průmÄ›rná doba opsání textu je asi 10 vteÅ™in, vynásobte si to 200 milióny a máte neuvěřitelné plýtvání časem

A tak si někdo moudrý položil otázku – jak využít tohoto času? A výsledkem byla právě reCAPTCHA. Je to vlastně CAPTCHA, do které se přidá další slovo a tady je právě ta pointa. To slovo pochází z OCR programů, které scanují staré knížky a další tištěné publikace do elektronické podoby tak, aby byly přístupné celému světu a zachovány i pro další generace.

Problém OCR programů je, že u starých tisků mají až 30% chybovost a jsou tak skoro nepoužitelné. Ale člověk umí přemýšlet a text přečíst a v rámci ověření text i přepíše do textové formy. A když se více lidí shodne na tom slově tak systém začne slovo považovat za správné.

Podívejte se na to, jak složité je převést některé texty: http://www.google.com/recaptcha/digitizing

Je to asi neuvěřitelné, ale lidi každý den takto přeloží do textové formy asi 100 miliónů slov, což je asi 2,5 miliónu knížek za rok. Představte si to. Jedno za čas musíte vložit tento otravný text, ale díky tomu se převede do elektronické formy 2 500 000 knížek ročně. ZDARMA. Je to nádherná ukázka toho, jak z něčeho otravného udělat prospěšnou věc.

Mimochodem, video pokračuje představením nového projektu, nazvaného DUOLINGO (www.duolingo.com), což je systém, který vás naučí cizí řeč bez peněz a vy nevědomky pomůžete s překladem celého internetu do cizích jazyků. Moc chytře vymyšlené a naprosto velkolepé. Jsem unešen z tak skvělých nápadů.

No a na závÄ›r povídání o reCAPTCHA trochu legrace. PÅ™edstavte si (je o tom zmínka na videu), že pÅ™i opisování textu je potÅ™eba dodat dvÄ› slova – jedno které systém zná a druhé, které nezná a potÅ™ebuje ho od vás opsat. Takže nemůže kontrolovat, co se vedle sebe objevuje. A právÄ› tím vznikají nÄ›kdy neuvěřitelnÄ› vtipná slovní spojení. A tak vznikl web www.captchart.com – když narazíte na nÄ›jaké vtipné slovní spojení tak k nÄ›mu stačí dodÄ›lat nÄ›jaké pozadí a umístit to tam. Dají se najít opravdu povedené kousky Veselý obličej

Censor Can

Submitted by Anon

This entry was posted in Sčot. Bookmark the permalink.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.