Comments / Profile of lancerx / Habr

Николай @lancerx

Начинающий созидатель

Profile Publications Comments 8Bookmarks 41

Деньги на ветер: почему ваш антифишинг не детектирует фишинговые сайты и как Data Science заставит его работать?

lancerx Sep 3 2018 at 00:06

Спасибо за интересный пост!

Хочется задать пару-тройку вопросиков:

1) Как сейчас оценивается точность в вашем варианте кластеризации?
2) Будет ли использоваться получаемая разметка для дальнейших изысканий, или дрифт данных в этой задаче очень высок?
3)

Стандартные методы кластеризации не работают из-за большого количества признаков. Проклятье размерности не позволяет даже загрузить данные в память,… какие-то алгоритмы кластеризации.

Не хочу показаться капитаном, но ведь сейчас хватает инструментов для distributed computing (Spark, Dask), или объем данных настолько немыслим? Как же вы сейчас с обработкой справляетесь? :)

Look

Хеш-стеганография в dataset-ах. На этот раз быстрая

lancerx Mar 23 2018 at 13:37

Что мешает использовать обычный текстовый файл? Можно также брать хэши от строк

Look

Ссылочная TCP/IP стеганография

lancerx Jul 14 2017 at 11:02

В данном случае схема работает только если пакеты доходят в том же порядке, в котором были отправлены. Поэтому приходится жертвовать скоростью (задержка между пакетами), чтобы использовать поле ID не по назначению.

Мне думается что в сетях где достаточно тонко настроен QoS — могут быть проблемы с сохранением порядка. Поправьте если не прав.

Look

Ссылочная TCP/IP стеганография

lancerx Jul 14 2017 at 09:46

Не особо силен в тонкостях протоколов, поэтому вопрос вызвают пара моментов:

Поле ID нужно для того, чтобы собрать упорядоченные фрагменты данных. Т.е. в случае единственного пакета это поле не используется. Значит для наших целей уже можно использовать 2 байта.

При многопакетной передаче вы все таки должны упорядочить пакеты?

Мы узнали, что сканирование портов может оказаться совсем не сканированием портов.

Об этом только один коммент, если не сложно — поясните плиз)

Поле Sequence Number первого пакета соединения не является фиксированным, потому что иначе его бы могли знать злоумышленники (RCF 793). А это еще 4 байта.

В чем его «фиксированность»?

Получается что объем инфы, передаваемый на каждый пакет, варьируется?

Look

День открытых дверей в «Лаборатории Касперского»

lancerx Aug 23 2016 at 19:35

Не могли бы вы продлить регистрацию?
Так хочется попасть, а узнал лишь сегодня…

Look

Информационное сокрытие в PDF документах

lancerx Jul 28 2016 at 13:54

Нативная подпись в PDF представляется в виде структур, которые тоже можно вычленить из документа.

Look

Информационное сокрытие в PDF документах

lancerx Jul 28 2016 at 13:51

geher — вы, как и товарищ Psychosynthesis, вы путаете аннотации и комментарии. Комментарий — элемент синтаксиса формата.

Look

Информационное сокрытие в PDF документах

lancerx Jul 28 2016 at 13:08

Похоже вы путаете комментарии с аннотациями. Аннотации отображаются и их можно редактировать.
А вот комментарии, как уже в статье упоминалось — наследие PostScript. Согласно стандарту при работе с файлом они игнорируются.

Look