eXeL@B —› Программирование —› Exe Sign vs Наивный байесовский классификатор |
Посл.ответ | Сообщение |
|
Создано: 29 октября 2009 22:32 · Личное сообщение · #1 Приветсвую Ктонибудь игрался с байесовскими классификаторами для определения спама или же детекции Пе программ ? Вот разбирал технологии детекции по сигнатурам , собственно пайд техника более менее известна , есть идеи разные , по детекту сигнатур , но пока решил пройтись по тому что уже есть. Если глянуть статистику то байесовские классификаторы вообщем то справляются очень даже ничего с детекцией сигнатур. Также можно выводить статистику , по процентам совпадения с известными сигнатурами. Можно искать с пропущенными данными. Интересно то что , для анализа нужна статистика , собственно мои основные наработки от этого тоже не далеко ушли. По крайней мере проблема детекции по сигнатуре с одним имеющимся файлом не решена. Но рассматривая анализ множества файлов , я вот и вышел на эту модель. Мнения по теме детекции сигн с bayes ?! ----- RE In Progress [!] Coding Hazard [!] Stay Clear of this Cube |
|
Создано: 30 октября 2009 18:59 · Личное сообщение · #2 /offtopic Какие-то уж очень сложные методы Вы находите (ну в реализации), ПЕ сканер на основе этого метода для меня нов, т.к. только сейчас узнал из вики (что это) ru.wikipedia.org/wiki/Наивный_байесовский_классификатор Я так понимаю - этот метод будет заюзан в вашем новом ПО нового поколения? (распаковщике) //ПЕ сканер сейчас сам разрабатываю ----- Gutta cavat lapidem. Feci, quod potui. Faciant meliora potentes |
|
Создано: 30 октября 2009 19:07 · Поправил: Hexxx · Личное сообщение · #3 Конкретно про байеса: Может лучше кластерный анализ на основе функции наиболее длинной общей последовательности байт? Правда тогда надо иметь эталонные образцы заранее, чтобы смотреть к чему тяготеет. ----- Реверсивная инженерия - написание кода идентичного натуральному |
|
Создано: 30 октября 2009 19:44 · Личное сообщение · #4 |
|
Создано: 30 октября 2009 20:37 · Личное сообщение · #5 Coderess именно , речь идет не о методе , а о новых средствах детекции сигнатур. Основной метод я пока освещать не буду , главное цель а не средства , но в любой модели как говорит Hexxx нуждаюсь в эталонных образцах, и это няпряжно. Это вообще не проблема , но было бы классно если этот эталон сведется к минимальному числу взятых с ехе сигнатур. В данном случае выше описанная модель по статистике имеет высокий процент распознавания неизвестных файлов. Например в детекции спама он доходит до 97 процентов , где 7 из них бывают ложные при одном конечном решении. Метод же детекции сигнатур обыкновенный 100 процентов если эталон известен заранее , и 33 процента если файл полностью не известен , туда входят всякие ухищрения как в пайде, например деление сигнатуры. Собственно это стандартная информатика ... судя по прошлым постам у людей происходит искривление лица при виде моих постов ) Я уже к этому привык , и большинство тем не были созданы именно по этой причине , тем не менее я помню тут экспертов по сигнатурам , которых нет у меня в аське. Hexxx Hexxx пишет: Может лучше кластерный анализ на основе функции наиболее длинной общей последовательности байт? Правда тогда надо иметь эталонные образцы заранее, чтобы смотреть к чему тяготеет. Там есть такой термин как определение новизны , если считать его как фактор детекции , то его можно сравнить с баесом где строится предположение. А само дробление в пайде есть тоже. С виду баес по проще кажется , ближе к цели Хотя можно попробовать из этого собрать что то одно , скажем вариант энтропия + кластерный анализ + байес , с каждой части возьмем что то свое , кластерный анализ ответсвенен за общее сравнение и получение Обнаруженной новизны , байес же проведет анализ умным методом. Обнаруженной новизны об этом я думал ... ----- RE In Progress [!] Coding Hazard [!] Stay Clear of this Cube |
|
Создано: 30 октября 2009 20:43 · Личное сообщение · #6 |
|
Создано: 30 октября 2009 20:48 · Личное сообщение · #7 |
|
Создано: 30 октября 2009 21:24 · Личное сообщение · #8 |
|
Создано: 30 октября 2009 21:37 · Личное сообщение · #9 |
|
Создано: 30 октября 2009 21:43 · Личное сообщение · #10 |
eXeL@B —› Программирование —› Exe Sign vs Наивный байесовский классификатор |