Окт 31

Найдено вот здесь – http://www.netzgesta.de/cvi/contact.php

Собственно ничего такого, очередная неумелая попытка.
Каптча часы

Стрелка часов черная, стрелка минут красная. Обе стрелки могут быть в 12 разных положениях.

Таким образом для распознавания данной каптчи достаточно проверять цвет пикселя в 12 местах.

автор: e64f \\ теги: ,

Окт 07

Любой кто имеет в сети сайт, рано или поздно сталкивается с проблемой спама. Не в смысле почтового спама, а спама в гостевую книгу, форум, блог, вобщем везде, где посетители сайта могут оставлять свои сообщения. Сразу стоит сказать, что хотя и бывает, что спам рассылается вручную, т.е.  живым человеком – это бывает редко, обычно это делает специальная программа, которая может: изменять свой IP адрес, распознавать каптча картинку, постить разные сообщения, отвечать на свои же сообщения, но уже под другим пользователем. И много чего еще, как говорится на каждую стандартную защиту находится программист, который сделает программу или модуль к программе и защита будет повержена.

Обычно защита от нежелательного программного постинга спама, делается с помощью каптчи, но проблема в том что в распрастраненных стандартных движках каптча тоже стандартна. И всегда находится заказчик, желающий проспамить те несколько миллионов форумов, где установлен стандартный форум с одной и той же картинкой защиты.

Перехожу  к делу, короче говоря если хотите чтобы вас не спамили нужно делать свою уникальную каптчу. Если не можете сами программировать, наймите кого нибудь, думаю что цена в 50$ не такая высокая.

Как должна работать каптча

Встречал я в сети ресурсы, где спамеру вообще ничего не нужно было распознавать, текст написанный на картинке, в открытом виде засовывался в куки. Так делать непреемлемо, потому что данные кук, можно вытащить программно.

Встречал также ресурсы, где в куки записывали результат хеш функции md5 от строки что написана на картинке, ну эти ребята давали спамерам просто так проверку правильности распознавания, что тоже неприемлемо.

Правильно делать так, строка на картинке = str1 и строка в куках = str2, генерятся случайным образом независимо друг от друга. STR2 нужна для того чтобы передавать ее в форму в открытом виде. STR1 написана только на картинке каптча.  Обе строки связаны между собой в таблице. Т.е. человек в скрытом поле формы(или куках) имеет STR2, STR1 введет с картинки, и когда форма отправится скрипту скрипт достанет из таблицы запись по STR2 и сравнит STR1 из таблицы и строку введенную пользователем.

Это было небольшое отступление от темы создание каптчи, просто нельзя делать вышеуказанные ошибки.

Делаем генератор картинок

Первое, что нужно сделать, это найти уникальный шрифт. Взял с полки диск с 1 000 000 шрифтов и вперед. Решил выбирать только из рукописных шрифтов, набралось около 20 штук.

Еще насчет шрифтов, можно использовать рандомом все 20 шрифтов, например каждый раз писать случайным фонтом все буквы. Можно каждый символ на картике писать случайно выбранным шрифтом. Я для себя решил писать всегда одним и тем же шрифтом, если начнется спаминг, просто сменю шрифт на следующий.

Теперь насчет шума. Всякие шумовые помехи встречаются почти на всех капчах. От себя скажу, из опыта программного распознавания капч, шум больше мешает человеку распознать каптчу, чем программе. Может быть поэтому на капче от гугла нет никаких шумов. Вобщем свою каптчу решил делать без шумов.

Исходный код


Пару слов о копирайте, изначально скрипт взят у Ивана Склярова(хорошие у него коментарии к коду), и немного модифицирован.
Естественно получившаяся картинка совсем не похожа на каптче картинку Ивана.

Вот, что получилось.

Вся работа заняла не более 30 минут.

автор: \\ теги: , , ,

Сен 04

Последнее время в основном работал в сотрудничестве в NMAN-ом над созданием распознавалок каптч.

Пора подвести итоги. Привожу примеры “сделанных” каптч.

Форумный движок PHPbb 2 – хотя выпущена 3 версия все еще достаточно сильно распространен
Очень простая каптча, распознавание 100%
Очень простая каптча, распознавание 100%
выхлоп примерно 75% удачных распознаваний
выхлоп 100% удачных распознаваний
выхлоп примерно 80% удачных распознаваний
выхлоп примерно 75% удачных распознаваний
выхлоп примерно 99% удачных распознаваний
выхлоп 100% удачных распознаваний
выхлоп 100% удачных распознаваний
выхлоп примерно 75% удачных распознаваний
выхлоп примерно 95% удачных распознаваний
выхлоп 100% удачных распознаваний
выхлоп примерно 75% удачных распознаваний
выхлоп примерно 85% удачных распознаваний
выхлоп 100% удачных распознаваний
выхлоп примерно 85% удачных распознаваний
выхлоп примерно 99% удачных распознаваний

Результатами данных работ стали не только сами программы распознавания, но и отладка технологий распознавания каптч как таковых. 🙂

автор: e64f \\ теги: , , ,

Июл 17

Не помню как забрел на блог Ивана Склярова, но читать мне его понравилось.

И в одном из постов Иван предлагает бесплатно взять скрипт генерации капчи http://www.sklyaroff.ru/comm.php?mess=8

И вот что я ему написал в коментарий:

2008-07-11 08:41:23 e64f пишет:
Добрый день!
Ваша капча картинка относится к разряду примитивных.
Могу на спор сделать программу распознавалку ваших картинок за 2 дня.
Если интересует, то вот инфо для связи
————————————–
Почта: VMatvienko@gmail.com
Сайт: vmatvienko.foxhole.ru
С уважением Матвиенко Валерий.

На что последовал ответ:

Напиши, посмотрим.

Заняло это правда чуть больше 2 дней, по причине того, что большой загруз на работе.

Представляет из себя консольное приложение которому на вход подается путь к картинке, а приложение выдает что на картинке написано.

О тонкостях реализации пожалуй умолчу. )

Вот видео 2 мб. captcha.avi с доказательством.

Еще хочу сказать, что делал все это я не один, а нас сейчас двое, наши ники e64f и nman.

автор: \\ теги: ,