Hoy les vengo a contar una curiosidad. Muchos de ustedes llenarán recaptchas para registrarse en foros, bajar archivos y demás, ¿pero saben qué es? Google hace un tiempo se propuso crear la biblioteca virtual más grande de la tierra, haciendo acuerdos con universidades para que les den sus libros (y violando millones de derechos de autor, porque los libros los tienen las universidades pero no sus derechos de copia). Entonces el trato fue éste: Las universidades -algunas tan prestigiosas como Harvard- compartían sus miles o cientos de libros con Google, y ellos con una máquina y un software que nadie conoce los digitalizaban y les daban una copia sin derecho a lucro para las universidades, y ellos conservaban otra copia (para $$$ llevar el conocimiento a la humanidad con ella). Pero muchos libros estaban en pésimas condiciones, o incluso algunos eran manuscritos. Entonces Google tenía un desafío: Convertir libros físicos que su software no podía leer a textos digitales. ¿Cómo lo logró? Con una brillante idea: Que la gente, que posee ojos humanos, nos diga qué dicen los libros. Una de las imágenes del captcha sirve para evitar los bots. La otra sirve para, comparandola entre los resultados de miles de usuarios, adivinar qué palabra sigue en el libro (que una computadora no podría leer bien). ¿Qué consiguieron con ésto? 1) Ofrecer un servicio de captcha con una excelente calidad gratis. 2) Lograr que millones de personas por día transcriban libros a formato digital (gratis too). 3) Hacer posible que Google Books pueda procesar miles de libros cada día, convirtiendosé en la biblioteca virtual más grande del mundo. 4) No pagar derechos de autor (google usa generalmente un esquema pirata: todo "gratis" -a cambio de tu información-. Es un esquema con buena recepción por el público general y es rentable porque sale más barato comerse 500 juicios que pagar derechos de autor por 15 millones de obras que es lo que quieren digitalizar). Así que bueno, esa es la historia de por qué recaptcha tiene dos palabras, por qué a veces una de ellas es ilegible o tiene simbolos matemáticos o está en ruso, y de cómo un par de personas con buenas ideas lograron que todo el mundo transcriba libros que podrán poner el entero conocimiento humano a disposición de cualquiera, la mayoría sin saber lo importante que es lo que está haciendo. Adicionalmente, recaptcha reconoce tu país por tu IP y analitycs, por lo cual le da prioridad para palabras en tu idioma. De vez en cuándo falla y te mete una árabe o china, pero generalmente te pone algo que puedas leer. Nada, quería contarselos por si alguno no estava enterado. Saludos!
¿No lo sabían? Hace rato se sabe lo del recaptcha, igual tengo entendido que la idea no fue de google, ellos lo compraron. Este año agregaron fotos de calles, alturas.. A mí alguna que otra vez me apareció.
Ya lo sabía, está muy copado. Últimamente se usa mucho esto de "aprovechar el tiempo al pedo" de los usuarios de internet, especialmente también para estudios científicos sobre la atención y la asociación de conceptos. Sólo para agregarles un ejemplo, tengo una ex-compañera del laboratorio que ahora está trabajando sobre el tema de Toma de Decisiones específicamente tomando como modelo el Ajedrez, y una de las herramientas que más usa es la base de datos de partidas en internet del server más conocido de partidas online.
si, yo lo sabia también... Lo que faltó decir fue lo del bug. D: Cada re-captcha esta compuesto por dos palabras: una de esas proviene de un libro, o manuscrito que se pretende traducir, es la parte útil para google. La otra es la "palabra de control", y se usa para verificar que hayas escrito algo coherente. Por ende, si la palabra de control esta bien escrita, el captcha se da como resuelto, sin tener en cuenta lo demas. Ejemplo: Spoiler En este captcha podemos ver que la primera palabra esta repleta de unos puntitos un tanto sospechosos, se deduce entonces que está sacada de un libro. Por lo que la segunda palabra seria, en este caso, la "palabra de control" y el captcha podría resolverse escribiendo solo: "muzenew" ----- Pero si bien el bug es funcional, usarlo conlleva un dilema moral. Pensemos que todo esto de los re-captchas tiene un buen fin. Yo preferiría evitarlos a toda costa, porque hacen que las tareas que una PC puede hacer por si misma en un tiempo muy eficaz, no solo se vean retrasadas, sino que ademas tengan que ser supervisadas por una persona que escriba estos catpchas. El típico ejemplo es cuando ponemos 70 links de un server pedorro en el JDownloader Todo depende del uso que se les dé. En el caso de un foro, puede evitar el registro de bots, y eso me parece excelente! Hay lugares donde están bien implementados, y otras veces molestan. Yo uso catpcha-trader para el JD, y cuando resuelvo en la página intento poner todos bien, con las dos palabras, porque sé que ayudo un poco con eso de los libros. Pero si me encuentro con algún captcha desubicado, que considero que molesta donde está, lo paso rápido con el bug! En fin... es un dato importante, que no está de mas saber, pero queda en cada uno como usarlo.
Un amigo me lo había contado hace unos meses. Siempre que completamos un captcha pensamos en que trabajamos gratis para una entidad que no conocemos. Apuntala en "Experiencias laborales ad honorem"
Ya lo sabia a ésto, tambien lo del bug, pero no creas que estas llenando la base de datos de libros con datos incorrectos, en tu ejemplo la palabra 'chief' se la mandan a más de uno, con simples conocimientos de estadística se puede relacionar la imagen a todas las respuestas que hay y una computadora se encargue de filtrar las respuestas incorrectas (basado en que opina la mayoria), por lo cual tampoco hay mucho trabajo humano de por medio luego que le das aceptar. También, para que sea como un captcha de verdad, observen que se le aplican algunas deformaciones a la palabra para asegurarse que un bot no las pueda leer facilmente. ---------- More info: http://www.google.com/recaptcha
se, no quise entrar en el tema de las estadísticas para no irme por las nubes! Pero es así como dijiste, una misma palabra es descifrada por muchos usuarios. se va creando una estadística, y de ahí se toma la "moda" para que vaya a parar al e-book. Aunque debe ser un tanto mas complejo supongo... Ese link que pasaste es la posta! Google destaca por tener buena documentación de sus aplicaciones!