Captcha: Escribe el código de la imagen, si puedes…

26 de noviembre de 2009

Captcha

¿Quién no se ha tropezado, a la hora de registrarse en un sitio web, con el estúpido cuadro de texto en el que debemos escribir el código de letras y números que aparece en una imagen anexa? ¿Quién no se ha ciscado tres veces en la madre que engendró al que inventó esta chorrada porque es incapaz de vislumbrar siquiera alguno de los caracteres de la mencionada imagen?

Este sistema para autenticar que usuarios humanos y no programas o robots o spambots están tecleando delante del ordenador sus datos a la hora de realizar un registro es, sin quedarme corto, la mayor de las gilipolleces que los lumbreras de este mundo digital han asacado tras exprimir al máximo sus binarios cerebros.

Captcha es un acrónimo de Completely Automated Public Turing test to tell Computers and Humans Apart, uséase Prueba de Turing pública y automática para diferenciar computadoras y humanos. Es un sistema inventado para determinar que el que está rellenando determinado formulario es una persona física humana terrestre del mundo mundial y no un programita informático que se dedica a, por ejemplo, darse de alta automáticamente en foros de noticias y llenarlos de spam y mensajes para comprar Viagra hasta que revienten.

La idea es buena, el resultado un asco. Proviene, como su nombre indica, del archiconocido Test de Turing, pero con una pequeña gigantesca diferencia, que es que en la prueba de Turing el que debe determinar si le contesta una máquina o un ser humano es otro ser humano, y no un programa informático.

El Test de Turing pretende demostrar la supuesta inteligencia de una máquina. Se supone un juez situado en una habitación y una máquina y un ser humano en otra. El juez debe descubrir cuál es el ser humano y cuál es la máquina, estándoles a los dos permitido mentir al contestar por escrito las preguntas que el juez les hace. La tesis de Turing es que si ambos jugadores son suficientemente hábiles, el juez no podrá distinguir quién es el ser humano y quién la máquina. Hasta hoy, gracias al Cielo, ninguna máquina ha conseguido superar esta prueba.

Supongamos por un momento que queremos registrar nuestra página güeb en un buscador o motor de búsqueda internetero. Sabemos que existe software especializado para realizar esta función en millones de buscadores a lo largo y ancho de la Red de redes de un solo plumazo. Tocotó. Clic, clic y clic y ya tengo mi paginita en todos los buscadores del mundo. Pos no.

Parece ser que estos programitas les repatean las gónadas sexuales a los dueños de los buscadores, porque ellos lo que quieren es que tú entres en su web, te recorras seiscientas páginas hasta encontrar la del alta de sitios nuevos y teclees los datos con esmero y pulcritud en sus bonitos formularios hachetemele. Es por ello que anulan de un brochazo la posibilidad de utilizar software especializado cascándote un cuadro de texto con una imagen a su lado en la que se reflejan una serie de caracteres que, de manera aleatoria, cambian cada vez que accedes a esa página. Evidentemente los programas que ejecutan registros no pueden leer estos caracteres porque forman parte de una imagen prediseñada.

Esta técnica comenzó de este modo y ahora se ha extendido a cualquier página de todo pichichi que cuelga un formulario en el Intenné. Que quieres formar parte de mi peña de futbolín, pues te registras pero me rellenas la casillita de marras con los caracteres de la imagen; que lo que quieres es darte de alta en mi página de coleccionistas de bigotes de foca, pues ídem majete, a ver si van a inventar un programa que registra automáticamente usuarios en páginas de coleccionistas de bigotes de foca y se me va a terminar el chollo de que navegues a gusto por mi web recién horneada.

Si partimos de la premisa de que el sistema es válido para la función que realiza, aunque vulnerable sin no mucha inteligencia programática, yo me pregunto por qué demonios las letras y números de las imágenes de las pelotas no están más claros y mejor escritos. Qué más dará, digo yo, que una «I» parezca un «I», como tiene que ser, o que parezca un «i» o una «L» o una «l» o un «1».

Pues nada, exactamente, da igual hacerlo bien que mal. Entonces, ¿por qué cojones no ponemos las cosas más fáciles al usuario y empezamos a hacerlo bien? Supongo que pensarán que se pueden aplicar complicadísimas técnicas OCR para que un software descifre las letras y tal. Hombre, por favor. Hay imágenes prácticamente indescifrables a golpe de ojo humano (como la del afoto adjunto) y algunas que dan tanto por el culo que entran ganas de mandar al mismo lugar corporal al que inventó la gilipollez ésta, al güebmaster, al dueño de la página y la madre que los parió a todos.

El problema es que los diseñadores web se creen que esto es seguro, pero nada más lejos de la realidad. Actualmente hacer un captcha seguro requiere métodos complicados de implementar que únicamente poseen las grandes empresas. Cualquier algoritmo que se le aplique a una imagen puede ser desalgoritmado en cero coma. Que si tachan las letras, que si las deforman, que si utilizan la misma gama de colores para el frente y el fondo… Na de na. La ingeniería inversa deshace todo aquello antes hecho, y más teniendo en cuenta que los algoritmos de los captcha son públicos,… ¿qué más quieres?

Aunque los captcha fueron originalmente diseñados para impedir que un software OCR reconozca los caracteres de las imágenes generadas, existen proyectos de investigación que han probado que es posible saltarse muchos de estos engendros con programas que han sido específicamente diseñados para un tipo determinado de captcha. Para los que tienen letras distorsionadas, por poner un ejemplo, la aproximación típica es seguir los siguientes pasos:

Eliminación del ruido de fondo, por ejemplo con filtros de color y detección de líneas finas.
Segmentación, por ejemplo partiendo la imagen en segmentos que contienen una sola letra.
Identificar la letra de cada segmento, y así utilizar la información extraída de la imagen.

El paso 1 es típicamente muy fácil de automatizar. Además, en 2005, se mostró que un algoritmo de una red neuronal tiene un menor margen de error que los humanos resolviendo el paso 3.

La única parte dónde los humanos superan a las máquinas es en el paso 2. Si el ruido de fondo consiste en formas similares a letras, y las letras están unidas a este ruido, la segmentación se hace casi imposible con el software actual. Por lo tanto, un captcha efectivo debería enfocarse en el paso 2, la segmentación.

Otros captcha son vulnerables por múltiples factores, ya que algunos sisitemas pueden sortearse simplemente reutilizando el ID se sesión de una imagen conocida y cascándolo en la URL a la hora de acceder a la page en cuestión; otros se alojan en servidores compartidos; otras veces, si parte del software de generación del captcha se realiza en el lado del cliente (la validación se hace en el servidor, pero el texto que el usuario tiene que identificar es renderizado en el lado del cliente), los usuarios pueden modificar el cliente para que muestre el texto sin renderizar. En fin.

Además de todo ello, siempre queda el recurso de la mano de obra barata, usando humanos explotados para decodificar los captcha. Un documento de la organización W3C afirma que un operador «puede fácilmente verificar cientos de ellos cada hora».

En fin, que hoy en día estoy viendo por ahí métodos de autenticación mucho más fiables e ingeniosos (como las operaciones matemáticas o las definiciones de términos y palabras) que los captcha estos de los cojones. Así que déjennos en paz con cartelitos ilegibles y paren de poner trabas a la hora de navegar. Esto viene a ser las barreras arquitectónicas del Internet de futuro.

Escrito en la categoría Internet |

Etiquetas: captcha

18 comentarios a “Captcha: Escribe el código de la imagen, si puedes…”

JGP:

jueves, 26 de noviembre de 2009, a las 12:04

Todo sistema de seguridad siempre va a tener sus huecos e inconveniencias que lo harán inútil ante un ataque mal intencionado, en el caso de los captcha a pesar de que pueden ser vencidos son sumamente efectivos al momento de detener el spam, que de verdad si alguien tiene un blog y se le ha ocurrido dejar abierto los comentarios sabe lo constante y molesto que es el spam y mientras no surga algo mas sencillo y efectivo creo que se seguirán usando. (irónicamente tu mismo tienes captcha en tus comentarios).

Ademas existen esfuerzos como este http://recaptcha.net/ donde constantemente se estan buscando formas y algoritmos para hacer mas efectivo el captcha.

Responder
- Osmal:
  
  jueves, 31 de agosto de 2017, a las 18:28
  
  Yo entre aqui,para no joderme en otra oportunidad y saber mas sobre este asunto de los captchas, para pedir una cotizacion para una Web me encontre que el experto, vasco,gallego o andaluz o quizas migrante ilegal sudaca ,asiatico o africano, habia puesto una captcha de medio centrimetro de diametro y dentro una ensalada de grises y negros que parecia un codigo de una etiqueta alienigena, lo estire al maximo,use una lupa ,no pude descifrar, ni idea si deberia encontrar un numero una letra o una figura, ninguna pista, este gilipollas la hizo tan bien que pierde a todos sus posibles clientes. Ojo yo soy ingeniero artista escritor, un Davinci,con los mas altos puntajes en tests de inteligencia y nada, me hizo perder tiempo redactando y detallandole mis especificaciones..que tal hijo de puta….
  
  Responder
Simón:

jueves, 26 de noviembre de 2009, a las 12:04

Es curioso pero usas captchas en tu propio blog para aceptar los comentarios!!

Responder
Pablo882:

domingo, 14 de febrero de 2010, a las 22:56

Simón: En todo caso, lo usa el sistema del blog y no el admin del blog.

Responder
bfsdgb:

lunes, 15 de febrero de 2010, a las 07:42

prueba de captcha

Responder
asds:

domingo, 18 de noviembre de 2012, a las 22:47

sdasdladkcncnasklc

Responder
eduard:

miércoles, 27 de marzo de 2013, a las 04:10

la puta madre para el imbentor de esto

Responder
Jefferey:

miércoles, 3 de julio de 2013, a las 14:26

Guardado en mi marcador!, Me encanta tu página web!

Responder
Joseba:

jueves, 15 de enero de 2015, a las 14:06

Si el banco de imágenes es finito no es necesario siquiera descifrar la imagen. Basta con capturarla y compararla con un banco de imágenes de las que tengamos la solución (Hay empresas que pagan a gente por descifrar captchas). Asocian la respuesta a la imagen y luego simplemente tienen que comparar imágenes (que es inmensamente más rápido que lo que se pueda pensar).

Hace años participé en un concurso tipo test de una conocida marca con unos premios del copón. Me percaté de que algunos jugadores tenían demasiados aciertos, así que hice un programa que sacaba un patrón de la imagen, lo comparaba con los patrones de otras imágenes anteriores y si encontraba coincidencia. Si ya tenía la respuesta la daba, si no probaba la siguiente opción y guardaba el resultado. Para acelerar el proceso hice que el programa manejase simultáneamente 8 navegadores (lo que admitía la memoria) y puse el programa todos los ordenadores que tenía a mano (casa, novia, hermanos, curro…). Conseguía un millón de aciertos por noche…Desgraciadamente anularon el concurso porque era evidente que todos los primeros lugares estaban ocupados por programas robot.

Responder
gerardo Luis Bürck:

lunes, 8 de junio de 2015, a las 23:27

$%&/(x»·$%&$%*

Responder
MARA:

jueves, 29 de octubre de 2015, a las 00:41

jaja la puta mierda nada es bueno aca

Responder
MARA:

jueves, 29 de octubre de 2015, a las 00:41

jaja la puta puta es mejor mundo gaturro.

Responder
MARA:

jueves, 29 de octubre de 2015, a las 00:42

http://teknoplof.com/2009/11/26/captcha-escribe-el-codigo-de-la-imagen-si-puedes/?replytocom=128399#respond

Responder
MARA:

jueves, 29 de octubre de 2015, a las 00:42

eso no sirve ok soy 4 de mg de mundo gaturro

Responder
MARA:

jueves, 29 de octubre de 2015, a las 00:44

No se han encontrado resultados de la búsqueda ingresada.Te sugerimos intentar con otra palabra. eso es otro contact de ansesanses.gov.ar

Responder
yannina:

miércoles, 12 de abril de 2017, a las 02:46

escriba los caracteres que ve en la imagen siguiente

Responder
Google reinventa el CAPTCHA – rsclick.es:

lunes, 1 de enero de 2018, a las 23:25

[…] humano y no un boot que dejará todo tipo de spam en los comentarios, por ejemplo. (Echad un ojo a este post de nuestro blog hermanado […]

Responder
apirikok:

lunes, 17 de septiembre de 2018, a las 22:21

orlistat reduces fat by. taking orlistat and not eating Xenical before and after pictures – what is orlistat 120 mg used for, european multicentre orlistat study group,

Responder