Содержание
- 2. Постановка задачи Зачем тестировать: оценка возможного эффекта от внедрения антиспама; cравнение продуктов разных вендоров и выбор
- 3. Определения СПАМ - анонимные незапрошенные массовые рассылки электронной почты (как правило, имеющие рекламный характер). Нежелательная почта
- 4. Потери от спама и антиспама Потери от спама: лишний сетевой трафик; потери времени и концентрации сотрудников
- 5. Критерии оценки качества Нужно одновременно использовать два критерия: Доля ложных тревог (false positive, FP) – нормальных
- 6. Ложные тревоги Отношение числа ложно отклассифицированных как спам сообщений к общему числу не-спам сообщений (ошибка: считать
- 7. Требования к методике тестирования Тестировать нужно на реальном потоке почты, а не тестирование на архивах почты
- 8. Требования к методике тестирования (продолжение) Нельзя пересылать (forward) почту (потеря части данных исходного сообщения). Нельзя отвергать
- 9. «Черный ящик» или понимание принципов работы фильтра ? Принцип «черного ящика» - не требует знаний о
- 10. Особенности: RBL-системы Одно спам-письмо отправляется многократно и многократно отвергается, потом все-таки доставлено. Результат: показатели качества (отношение
- 11. Особенности: фильтры с обновлениями Нельзя тестировать на архивах: образец (сигнатура) письма может быть уже удален из
- 12. Особенности: статистические фильтры Статистическим фильтрам свойственно «переобучение», следовательно тестирование должно быть длительным (недели-месяцы) Нужно переобучение в
- 13. Ошибки: последовательное соединение фильтров Фильтр Б проверяет поток спама после фильтра А. Если пропускает, то «распознал
- 14. Ошибки: пересылка спама При пересылке теряются данные почтовой сессии: IP-адрес посылающей стороны Параметры SMTP-сессии (HELO, MAIL
- 15. Ошибки: тестирование на коллекциях Трудность в сборе коллекций: Вручную много не набрать, у разных пользователей разные
- 16. Ошибки: статистические системы Проблемы с обучающей выборкой: Обучение и тестирование на одной коллекции (даст замечательные результаты).
- 17. Пример тестирования Тестовая площадка: @lexa.ru: персональный домен с 9-летней историей; «засвеченный» адрес [email protected], кроме него ~30
- 18. Анализ пропусков и ложных срабатываний Пропуски и ложные срабатывания: Вся почта, распознанная как спам (т.е. не
- 19. Особенности настройки Система с использованием RBL и анализом данных SMTP-сесии: установлена первой в цепочке фильтров. Система
- 20. Пример результатов * без учета срабатывания на пересылаемых образцах спама; ** - основные ложные срабатывания на
- 22. Скачать презентацию