Allt du någonsin velat veta om CAPTCHAs men var rädd att fråga [Teknologi förklarad]
Älska dem eller hata dem - CAPTCHAs har blivit allestädes närvarande på Internet. Vad är CAPTCHA ändå, och var kom det ifrån? Den ödmjuka CAPTCHA har varit centrum för stor uppmärksamhet som det enda effektivaste vapnet i kampen mot webspam. Men är de effektiva? Finns det någon annan typ av CAPTCHA än den grundläggande “luta på huvudet, knippa och läs mig”?
Du får inte passera (Turing-testet)!
Captcha har uppfunnits av ett team av Carnegie Mellon professorer och lanserades år 2000 av AltaVista och Yahoo i ett försök att förhindra automatiserade chattrobotar och URL-inlägg. Det är faktiskt en akronym för Completely enutomated Public Turing test för att berätta Computer och Humans endel.
För er som inte vet vad det betyder kan det hjälpa till att förklara vad Turing-testet är. Uppkallad efter brittisk professor Alan Turing är Turing-testet standardtestet av en Artificiell intelligens baserad maskin, varigenom en maskin kan klara provet, anses den utgöra intelligent beteende. I grunden innebär testet att man samtalar med ett antal domare genom ett textgränssnitt - om domarna inte kan säga att de pratar med en dator passerar det testet. Personligen anser jag att Turing-testet är värdelöst, med tanke på att en delfin inte kunde tala med en människa heller, men vi tilldelar dem en högre form av intelligent beteende. Men jag avviker.
CAPTCHA är därför ett automatiserat Turing-test. Det finns ett antal olika sätt att göra det här, men den vanligaste som vi tycks ha avgjort är att presentera användaren med en krypterad form av text, förutsatt att (ofta felaktigt) att någon normal människa kommer att kunna dechiffrera text.
CAPTCHA har utvecklats över tid, men har i slutändan besegrats, så vi får reda på det senare.
Textbaserade CAPTCHAs och Re-CAPTCHA-projektet
ReCAPTCHA-projektet, som nu ägs av Google, bestämde att det istället för inanely deciphering kryptisk text för inget riktigt bra presenterade en fantastisk möjlighet att rätta till bristerna i datorbaserad optisk teckenigenkänning. För äldre böcker speciellt, tycker datorer det är mycket svårt att känna igen orden, medan en människa finner uppgifterna triviala. Kombinera uppgiften att digitalisera gamla böcker med spamförebyggande, och du är på en absolut vinnare.
Men om datorn hade problem med att erkänna ordet i första hand, hur kan det säga om det du skrev in är nonsens? Enkel - presentera användaren med två ord - varav en är känd. Systemet antar att om användaren korrekt skriver det kända ordet, är chansen att det okända gränssnittet också är korrekt.
En annan genial idé är att kombinera CAPTCHA med någon form av reklam.
Matematikproblem
OK, bilden är ett skämt, men i huvudsak presenteras användaren med ett grundläggande matematiskt problem. Vi använder ett liknande system på Answers webbplats just nu. Det behöver inte vara svårt, bara lite grundläggande tillägg.
Bildbaserade CAPTCHAs
Så svårt som några av ReCAPTCHA-koderna kan vara för dig och jag ibland, har programvara redan utvecklats som kan bryta koden med ungefär 30% framgångsrika - vilket för en spam-kampanj med miljontals försök är en ganska acceptabel takt. Bilder å andra sidan är extremt svåra att bearbeta för datorer semantiskt. Tänk på en enkel kattbild - programmera en dator för att känna igen ett mänskligt ansikte är tillräckligt svårt, men för att skilja en katt från alla andra djur och föremål i världen är det ganska omöjligt vid denna tidpunkt.
Logic-baserade
Dessa bygger på logisk och semantisk intelligens om världen, eller bara grundläggande gemensam mänsklig förnuft. Några exempel kan vara:
- Identifiera maten i denna lista: asfalt, bacon, moln, dolk.
- Identifiera vapnet i denna lista: asfalt, bacon, moln, dolk.
- Hur många dörrar finns på en fyrdörrbil?
- Vad är det tredje ordet i denna mening?
- Vad är kvar om du tar bort B från ABC?
En bra plugin för att integrera dessa typer av test i ditt WordPress-kommentarsystem är WP-Gatekeeper, förresten.
De-CAPTCHA Tjänster
Det sorgliga faktum är att medan CAPTCHAs är en nödvändig ondska, övervinnas de lätt av spammare nuförtiden. Medan vissa spammare verkligen har utvecklat sofistikerad programvara som kan efterlikna det mänskliga ögat och hjärnan att avkoda som en människa gör, är sanningen mycket enklare och mer skrämmande. Varför utveckla dyr programvara när du kan betala några pennies för att göra CAPTCHA för dig? Den nuvarande billigaste hastigheten är 1,39 USD för 1000 CAPTCHAs, med en 98% noggrannhet, och tjänster som Death By Captcha har utvecklat utarbetade API för utvecklare att använda. Den enda personen som försenas av CAPTCHAs idag är du!
Framtiden för Captcha
Precis som allt annat i livet är CAPTCHAs inte otänkbara för att hacka eller spammar. När nya och mer geniala tester utarbetas kommer allt mer sofistikerade sätt att bryta dem att utvecklas - och lösningen att betala någon annan att göra dem för dig kan aldrig besegras. Ändå är det vårt ansvar som webbutvecklare och administratörer att hålla spammare borta från våra webbplatser utan att försämra användarupplevelsen.
Är du chockad över att lära dig hur billigt en CAPTCHA kan besegras för? Har du sett någon annan typ av CAPTCHAs ute i det vilda som imponerade dig? Låt oss veta i kommentarerna! Också, se till att kolla alla de roliga bilderna taggade “captcha” över på Geeky Fun.
Bildkredit: xkcd
Utforska mer om: Spam.