La storia di reCAPTCHA: stop spam, read books

Oggi e domani sarò al Web Marketing Garden 2012, due giornate no-stop di aggiornamento e consigli per sfruttare al meglio la rete nella propria attività di comunicatori digitali.
Tra le tantissime curiosità ho scoperto la bellissima storia di reCAPTCHA… e non potevo non dedicarle un post. CAPTCHA è il famoso test digitale composto da una immagine contenente una o più parole/numeri offuscati o distorti per cui viene richiesta all’utente la riscrittura nel box sottostante. In questo modo si può determinare se dall’altra parte dello schermo sia presente una persona o un computer – correttamente detto bot – impedendo quindi alle macchine di registrarsi a newsletter, siti web, compilare automaticamente form – evitare spam, insomma. L’algoritmo a base del Captcha è stato coniato nel lontano 1997 dal pioneristico search engine AltaVista per impedire ai bot di aggiungere URL al proprio motore di ricerca.L’algoritmo non è stato rigidamente protetto da brevetti e ha consentito la rinascita del plugin in tante forme, tra cui quella che vado a raccontarvi.

Qualche anno fa gli istituti culturali e le università hanno iniziato a riflettere su nuove e più produttive forme di conservazione delle opere letterarie, in particolar modo manoscritti e testi antichi di preziosa bellezza e rarità, pensando per loro una casa che permettesse loro di vincere le barriere del tempo e della corrosione.
Una su tutte, ovvero l’Università di Carnegie Mellon in Pensilvania, ebbe l’intuizione innovativa di proporre un progetto di digitalizzazione di libri per cui fossero scaduti o non confermati i diritti d’autore.
Idea geniale, che però portò alla luce nuove difficoltà: con la scrittura a mano e le pagine ingiallite il lettore ottico iniziò a perdere colpi, impedendo di proseguire nella scansione dei documenti e richiedendo l’intervento dell’occhio umano. Questo avrebbe rallentato troppo il già complesso processo di digitalizzazione e avrebbe fatto lievitare i costi di un progetto che di fondi ne aveva purtroppo pochissimi.

Da qui l’idea geniale: creiamo un CAPTCHA fondato sull’insieme di parole non riconoscibili dal lettore ottico. Inseriamo una parola letta correttamente e una indecifrabile dall’OCR (Optical Character Recognition). In questo modo saranno gli utenti, cost-free, a decifrarle per noi! Sulla base della media statistica delle compilazioni date per la parola, il sistema è in grado di decifrare le parole incomprensibili predisponendone la compilazione in digitale all’interno dei file.

Contando su una manodopera di 1.600.000 volontari (oltre 20mila dipendenti diversi che lavorano ogni giorno 24h 7 giorni su 7), il sistema è riuscito a resistere e ad oggi colleziona oltre 200 milioni di parole risolte ogni giorno.

L’iscrizione è gratuita e ti permette di usufruire di un plugin sicuro – marchiato Google – e per una buona causa.
L’ultima cosa: use reCAPTCHA on your site, NOW.

Annunci

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...