anchan_uk: (Default)
[personal profile] anchan_uk

нарисовал Matt с ресурса http://www.captchart.com/

Небось все френды по пять раз на дню тратят по двадцать секунд на заполнение очередной капчи. Я теперь буду чуть меньше фырчать на эту штуковину. Знаете, что это на самом деле такое?

Предположим, есть у вас доступ к редким старым книжкам. Захотели вы отсканировать и выложить тексты в интернет. Беда в том, что часть слов ваш софт не распознает. И чем старше книжка, тем больше будет таких кусочков. Если сядете сами, процесс затянется на годы. Что же делать?..

А вот что. Подначить с десяток человек прочитать непонятный кусочек и набить то, что они там разобрали. А для проверки того, что они это сделали более-менее верно, поставить рядом второе слово, уже распознанное компьютером. Набьешь правильно это слово - пропустят на Фейсбук, ведь робот так не сумеет. А первое слово, пропущенное через пару десятков рук, с хорошей степенью вероятности будет прочитано и занесено в базу данных. Ну так вот, последние года два капча работает на отцифровку старых книг!..

Для англоязычных френдов - ссылка на доклад Лукаса Джонсона на TED по истории этого проекта.

A теперь внимание вопрос. Что напоминает этот процесс? Правильно. Кто-то нашел реку и перегородил ее турбиной, подвешенной на крепких канатах. Река не осознает того, что крутит турбину и чего-то там вырабатывает. Дальше Лукас Джонсон спросил - где бы найти такую реку, чтобы она позволила нам... перевести интернет на все возможные языки. Ну для начала - википедию на испанский. Причем так, чтобы не оказаться с протянутой рукой посередь проекта...

Ответ уже есть на сети. Это бесплатный портал duolingo для обучения иностранному языку. Идея та же самая. Двадцать обезьян начинающих переводчиков как-то переводят материал википедии на испанский. Программа сравнивает их переводы и приводит их к общему знаменателю. Эффективность такого метода для обучения языка достаточно велика. Вот слайд с примером качества такого перевода (сложная немецкая фраза в переводе на английский).

Сколько же времени потребуется duolingo для перевода Вики на испанский? Только не падайте со стула!.. При 100 000 пользователях - 5 недель. Если они сделают платформу на миллион - 80 часов. Это с одной стороны. С другой нужно кое-что прикинуть. Сколько народу в мире хочет учить иностранные языки?.. 1,200 000 000 человек. Из них больше пяти миллионов уже заплатили за софт для обучения больше полутысячи долларов каждый. Сдается мне, это даже не Обь. Это Амур, причем в период весеннего разлива!.. Потираю руки и собираюсь зарегистрироваться. Может дойдут руки и до немецкого...
This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

March 2014

S M T W T F S
       1
23 4 56 78
910 11 12 13 14 15
16171819202122
23242526272829
3031     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 9th, 2025 07:22 pm
Powered by Dreamwidth Studios