はてなのCAPTCHAのクラック

今度研究室でOpenCV勉強会というのをすることになったのですが、そのネタにと思い、id:yaneurao:20090802 を参考にはてなの画像認証をクラックしてみました。CAPTCHAの画像をHTMLを解析して自動収集するところから書き始めたりして、全然30分では終わらず3時間ぐらいかかりましたが、結果的にそこそこの精度で認識できました。

なお、一応断っておくと、今回の目的はあくまで画像認識であり、これを使って本当にスパムコメントを送ったりする意図はありません。とはいえ、こういうセキュリティに立ち向かうようなコードを書くのってなぜか楽しいし妙にがんばってしまいます。

続きを読む