YChebotaev May 29 2015 at 11:02

Сниффинг истории браузера с помощью favicon

2 min

29K

Information Security*JavaScript*

From sandbox

+49

Comments 20

Rastishka May 29 2015 at 12:20

Идея классная!
Но не хватает примера с десятком сайтов для теста.

nickolaym May 29 2015 at 12:40

Произвольная иконка для страницы

<link rel="shortcut icon" src="fig-vam-a-ne-favicon.ico" />

Или проверка реферерра при запросе favicon

RewriteCond %{HTTP_REFERER} ^(?!your.domain.com)(.+)$
RewriteRule ^favicon.ico$ [R=404,L]

Ибо нефиг!

sonor May 29 2015 at 13:47

А если стоит блокировщик реферера?
Но что нефиг согласен.

shergin May 29 2015 at 20:14

Описанные вами способы защиты работать не будут. Правильным решением было бы использовать Content Security Policy.

nowm Jun 2 2015 at 15:31

Проверкой реферера вы только облегчите работу этому скрипту. Если в браузере в кэше есть «favicon.ico», она нормально отдастся скрипту. Если в кэше её нет, вернётся ошибка 404, которую отловить легче, чем экспериментировать с «threshold».

Ogra May 29 2015 at 13:13

var diffTreshold = 200; // Порог времени, который необходимо преодолеть, чтобы считать, что пользователь посетил сайт.
visited: diff > diffTreshold

Ну наоборот же, елы-палы. Преодолели порог, значит не посещали сайт. Вы свой froof-of-concept сами хоть проверяли?

Ну и по мелочи:
saveResult(host, start, new Date() — забыли закрывающую скобку;
threshold, а не treshold;

+20

YChebotaev May 29 2015 at 21:22

Прошу прощения за ошибки и опечатки, сам удивился, как это у меня так получилось.

CAH4A May 29 2015 at 14:06

Если сделать достаточное количество запросов, то можно даже попытаться применить кластерный анализ, вместо непонятно что означающего «среднего значения между минимальным и максимальным временем загрузки».

А ещё, можно делать два запроса: на favicon.ico и на favicon.ico?randomhashhere.
Тогда можно знать за сколько скачивается та же фавиконка, но без кеша.

YChebotaev May 29 2015 at 21:14

Я не думаю, что делать свое решение для кластерного анализа будет целесообразно в каждом конкретном случае. Однако, его можно попытаться продать как отдельный сервис или стать частью более крупного решения.

CAH4A May 29 2015 at 22:25

Тут отлично подойдёт самый простой алгоритм «k-средних» (а у нас тут k=2), да и пишется он на коленке за пол часа.
И для каждого конкретного случая писать его снова не нужно. В том и прелесть, если сравнению с Threshold=200.

Продать «k-средних» как отдельный сервис, это к маркетологам. -)

YChebotaev May 29 2015 at 22:52

Насколько я понимаю, к-средних может быть все равно не точным, если среди тестовой выборки нет гарантированного промаха и попадания в кеш. Потому что без наличия таких калибровочных значений в выборке, алгоритм кластеризации не сможет разделить случаи, когда вся выборка принадлежит к одному из двух классов. С этой точки зрения, предрассчитанная пороговая константа работает лучше.

На моем компьютере, скорость кэшированной картинки редко превышает 10 миллисекунд, а скорость загрузки с сервера редко быстее 100 миллисекунд. Тут нужно еще учитывать, что раз пользователь не был на сайте, то браузер, скорее всего, будет еще и dns lookup делать.

stifff May 29 2015 at 14:32

«боливар не выдержит двоих.»
Такой трюк только один раз можно будет провернуть.

akirsanov May 29 2015 at 16:04

Интересно!
Также есть замечательное исследование тайминг атак с BH-13 media.blackhat.com/us-13/US-13-Stone-Pixel-Perfect-Timing-Attacks-with-HTML5-WP.pdf
Ребята заметили, что отрисовка элементов занимает некоторое время, увеличили это время с помощью фильтров и выводили среднее время задержки рендеринга для посещенной и непосещенной ссылки. На данный момент затронутая ими проблема пофиксена в ff/chrome/ie.

Bo0oM May 29 2015 at 21:49

Насколько я знаю, там было не детектирование посещения, а считывание содержимого страницы.
Не знал, что это собираются фиксить =)

В копилку, есть детектор социалок от bushwhackers. Еще прошу обратить внимания на детект посещения с помощью HSTS :)

akirsanov May 30 2015 at 17:13

Там было и детектирование посещения по времени отрисовки, и распознавание элементов страницы по view-source во фрейме при наложении фильтров, — и все это пофиксено в 13 году.

amarao May 29 2015 at 18:31

Для тех, кого раздражают сайты, качающие что-то с других сайтов без вашего разрешения (например, как в этом посте):

addons.mozilla.org/ru/firefox/addon/requestpolicy

Куда менее агрессивный, чем noscript, и после минимальной настройки позволяет практически исключить любые подобные трюки.

Pongo Jul 14 2015 at 21:41

Попробуйте uMatrix вместо RequestPolicy. Позволяет не просто блокировать запросы, а выбирать какой контент (куки, картинки, скрипты, стили, плагины и т.д.) блокировать, а какой нет. Так же есть более удобный интерфейс (быстрее можно настроить блокировку) и дополнительные штуки типа рандомизации реферера для сторонних запросов и т.д.

У этого же автора есть uBlock — аналог adblock plus, но более эффективный по памяти и процессору.

xana4ok May 30 2015 at 03:29

Это только половина дела. Надо взять топ 100000 сайтов по версии quantcast с демографией.

bogolt May 30 2015 at 07:40

Пора кажется пользователям каждый сайт запускать в своей песочнице.

SlimHouse Jun 2 2015 at 01:04

Show the best of all time