No debe ser nada fácil soportar que 1600 personas al unísono
levanten la mano para responder a dos preguntas: ¿Quién alguna vez debió
llenar un formulario en Internet e introducir unas letras
distorsionadas?: 1600 manos en alto; ¿Cuántos odian hacer eso?: 1600
manos en alto
. No debe ser nada fácil si esas 1600
personas expresan su odio hacia algo que has inventado. Y menos fácil
debe ser el afrontar semejante manifestación de “odio” desde un
escenario.
Luis von Ahn lo tiene asumido: su invento es sumamente antipático. Luis von Ahn es el creador de la prueba desafío-respuesta
captcha, esa misma que nos hace perder 10 segundos de nuestras vidas en cada oportunidad que la enfrentamos.
Imagen en
desenredandolared
El
momento de interpretar la imagen distorsionada de un conjunto de
caracteres (letras y números) para enviarlos y demostrar que somos
humanos es uno de los más antipáticos de los protocolos de uso de
Internet. El captcha lo afrontamos al registrarnos como usuario en
internet, llenar un formulario o realizar una compra, con la misma
resignación con la que Luis von Ahn enfrentaba al gigantesco auditorio
del evento TEDxRiodelaPlata convertido en un mar de manos alzadas.
El
captcha, es definitivamente una pérdida de tiempo que resulta
inevitable para el buen funcionamiento de tantas webs (protege a unas
100.000 páginas web del fraude y el spam). Pero entre tanto fastidio, la
misión de la charla parece encaminarse a convencer a quienes pasamos
por la prueba captcha y lo odiamos, que hay algo productivo cuando
interpretamos y tecleamos los extraños caracteres:
estamos colaborando para digitalizar libros.
Von
Ahn creó el sistema captcha, y se lo vendió a Google en su evolución
reCaptcha. Y Google, hoy utiliza el sistema para completar su proyecto
de digitalización de libros, un proyecto en el que sin saberlo,
participamos millones de personas a diario. Se estima que 200 millones
de odiosos captcha son completados en un día, lo que suma (a un promedio
de 10 segundos por captcha) unas 500 mil horas diarias. Von Ahn
necesitaba convencer a los 1600 usuarios fastidiados de su invento, que
aunque es antipático, el captcha sirve para algo productivo. La idea de
completar la digitalización de libros a través del captcha, es en
definitiva, un consuelo para su conciencia.
Resulta que los
sistemas que escanean libros antiguos de forma automática para
digitalizarlo, no son perfectos: en el reconocimiento óptico de
caracteres (OCR) pueden tener dificultades para “interpretar” ciertas
palabras impresas con tinta borrosa, o gastadas, una dificultad que
suele alcanzar el 30% de lo escrito.
La idea genial es mostrar
esas palabras distorsionadas que las computadoras no saben interpretar a
través de las pruebas captcha. Una palabra no reconocida en la parte
automática de la digitalización, pasa a la base de datos de Recaptcha,
que se las muestra a algún usuario que “inocentemente” la interpreta, la
teclea, y la envía. Cuando varios usuarios coinciden al interpretar el
mismo captcha, la palabra queda confirmada y digitalizada completando
algún fragmento de un libro.
Ésto también explica la razón por
la que el sistema recaptcha nos muestra dos palabras a la hora de
determinar si no somos un robot: una es para hacer el control
“antirobots” tradicional, y la otra una palabra para digitalizar en
algún libro. El problema es que no sabremos cual es cual.
Von
Ahn explica que con éste mecanismo se están digitalizando alrededor de
100 millones de palabras diarias, o lo que se traduce, suma dos millones
de libros al año. Para más cifras, 900 millones de personas estamos a
diario ayudando a digitalizar libros mientras respondemos a un
reCaptcha.
La charla de Von Ahn casi concluye con un clima
genial. Las mismas 1600 personas que minutos antes expresábamos nuestro
odio hacia el padre de la criatura, ahora aplaudimos con
reconocimiento. Queda por explicar cuanto dinero le hubiese salido a
Google completar la digitalización de libros a través de trabajadores a
sueldo, pero hay que reconocerlo, al menos, al pasar por una prueba
captcha, nos sentiremos más útiles.
Contenido tomado íntegramente del blog ViSioN BeTa.