Macacos a escrever à máquina

As probabilidades dizem-nos que, dado tempo suficiente (leia-se quase infinito), um chimpanzé a digitar aleatoriamente, seria quase certamente capaz produzir todas as peças de Shakespeare.

Parece uma ideia descabida essa de escrever coisas aleatoriamente para tentar obter um qualquer resultado, mas a verdade é que é mais ou menos isso que muitos de nós (humanos) fazemos quando temos que escrever as letras, habitualmente deformadas, que alguns sites nos obrigam a escrever, para assim nos deixar aceder a algum conteúdo, ou simplesmente para deixar um comentário no blog.

E não é pouco o tempo que o mundo todo gasta nisto, os 200 milhões de CAPTCHAs preenchidos diariamente levam-nos 150 000 horas.
Luis von Ahn, o inventor dessa técnica chamada de CAPTCHA achou que estava a fazer perder demasiado tempo à humanidade e imaginou uma forma de conseguir transformar esse acto banal em algo mais produtivo.

O resultado foi o ReCAPTCHA, uma ideia simples e engenhosa, como costumam ser as boas ideias, que permite recuperar estes segundos que desperdiçamos em vão num contributo para algo mais interessante que é a digitalização de documentos.

Assim, em vez de escrevermos conjuntos de letras aleatórias, passamos a ter que escrever 2 palavras, uma aleatória e outra que é uma palavra real, de um livro real, que foi digitalizado, resolvendo assim os problemas que mesmo os melhores sistemas de reconhecimento de caracteres (OCR) ainda não conseguem ultrapassar.

O resultado concreto deste trabalho é que, entre outras coisas, até ao final de 2010 o arquivo do New York Times (mais ou menos desde 1850) ficará previsivelmente todo convertido em texto.
Mais informação na apresentação que Luis von Ahn deu na ultima sessão de PopTech 2009.

Comments


  1. Genial. Não conhecia esta utilidade do sistema. Agora vou olhar para as palavrinhas com outros olhos.