Pull to refresh

Как и зачем компании накручивают голоса на хабре

Reading time9 min
Views20K


Так получилось, что я много лет занимаюсь консалтингом различных компаний на хабре по теме того, как надо вести блог. На данный момент консультирую несколько компаний. И вижу, что большинство блогов, которые выходят на хабр, не понимают, что это за аудитория и как с ней работать. Поэтому решил сделать серию статей о том как надо или не надо писать статьи, вести блог и что следует или не следует делать на хабре. Начать хочу с порочной практики, которыми грешат некоторые компании — это накрутка голосов.

Большинству читателей хабра даже невдомёк, что на этом ресурсе идёт настоящая корпоративная борьба за первые места в рейтинге компаний. Это престиж, имя, реклама и вообще можно почесать чувство собственной важности. Хотя в новой версии хабра, особенно мобильной, это совершенно потеряло смысл, потому что рейтинг компаний не видно.

Главная цель быть на первых местах: чтобы имя компании было узнаваемым. И в целом, если борьба идёт честной: ищут хороших авторов, приносят годный материал на ресурс и вообще стараются сделать его лучше, то это всегда идёт только на пользу читателям и хабру в целом. Но, понятно, что честными методами долго держать такой темп невозможно. Поэтому в какой-то момент начинают компании мухлевать, поднимая свой рейтинг искусственным путём.

Сегодня мы на хабре наблюдаем просто удивительную гонку накрутки рейтинга, которая выражается в том, что некоторые компании ушли в неадекватный отрыв от всех остальных компаний в списке, в гонке за право быть на первом месте.

Чем это плохо для нас, читателей: мы не получаем адекватную оценку статей на хабре, средние статьи занимают первые места, а по-настоящему качественный материал теряется за накрутками.

Сократ мне друг, но истина дороже

Поэтому расскажу вам, механизм рейтинга, и как компании его накручивают. И предложить методы борьбы с накрутками у компаний, для администрации Хабра.

Публикация подобной статьи может выйти мне боком, но мне бы хотелось, чтобы на хабре продолжал работать механизм рейтинга, который позволяет увидеть по-настоящему интересный материал, вне зависимости опубликован ли он в компании, либо от независимого автора.

Этот материал может нанести урон хорошим авторам, которые имеют вполне заслуженный рейтинг в своих публикациях, без всяких накруток. Но авторам я просто посоветую попробовать свои силы в других компаниях, которые не замарали себя накрутками.

Поскольку я не хочу показывать пальцем на отдельные компании, которые накручивают рейтинг, называть я их не буду. И вообще, все совпадения с реальными компаниями случайны, картинки — просто фотошоп, а статья — плод воображения автора. Поэтому все имена и явки будут замазаны.

Скажу сразу, за мной никто в этом посте не стоит, эта публикация — полностью моя инициатива на возникшую несправедливость.
Статья создавалась в течение нескольких недель, и цифры могут отличаться в день прочтения от тех, что опубликованы в статье. Ну и я напоминаю, что цифры — фантазия автора.

▶ Рейтинг


Рейтинг компании — это циферки, можно увидеть справа от имени компании.



Чем цифра больше, тем компания круче и выше стоит в рейтинге.
На скрине выше можно увидеть, что некоторые компании с отрывом в космос, что, вероятнее всего, говорит о накрутке.

Как считается рейтинг?


Рейтинг считается очень просто: суммируется количество плюсов по статьям за 30 календарных дней. Рейтинг обновляется каждые полчаса: в начале часа и в середине. Мой плюс равен +3, и я проводил эксперимент, ставил плюсы всем постам компании за месяц. В течение получаса компания поднялась на +90.

Обращаю внимание, что это относится к постам, а вот переводы сейчас влияют на рейтинг с каким-то коэффициентом (думаю 0,5). Поэтому если раньше можно было легко набивать рейтинг, клепая переводы, то, благодаря введению коэффициента, это стало невыгодно. Коэффициент существует около года, и именно ему мы обязаны тем, что с хабра ушло засилье поганых переводов.

Резюмируя, если хочется быть на первых местах рейтинга, надо увеличивать количество плюсов за свои статьи. Таким образом, если хочешь быть в топе, надо получать больше плюсов за свои статьи.

▶ Как компании накручивают рейтинг


Как можно понять, если хочешь быть в топе рейтинга, пиши интересные статьи и выпускай их как можно чаще. И к чести топовых компаний, они стараются выпускать достаточно годный материал, а также держат пул “золотых” авторов, которые могут писать топовые статьи. Но невозможно гнать постоянно классный контент, поэтому есть пути обхода.

Совершенно легальный способ — это увеличить количество публикаций в день. Обычно топовые компании выпускают одну-две публикации в день. Но, поскольку, ограничения на количество выпускаемых статей в день нет, то можно гнать хоть по 10 штук. Как вы понимаете, качество материала при этом падает.

Помню, был период гонки на хабре, когда некоторые компании выпускали по три материала в день, ради накрутки рейтинга. При таком количестве качество материалов стремилось к нулю, а вот замусоривание хабра было большим.

Благо, администрации хабра это быстро надоело и компании были убраны с хабра. Помню этот момент, что было прям очищение ресурса, появились на главной по-настоящему интересные статьи.

Но в целом сейчас компании не увеличивают количество публикаций в день больше двух, хотя я бы настоятельно рекомендовал бы его ограничить, во избежание.

Другой способ — это плюсовать свои статьи. Если взять пул пользователей хабра и «приплачивать» им за накрутку статей, то лавочку такую быстро прикроют. Но удивительно, администрация хабра не запрещает плюсовать свои статьи сотрудникам компании!

Представляете, я вот не могу на хабре поставить плюс своей статье (в отличие от Пикабу).



А вот компания может, и это совершенно легально! Таким образом, можно делать виртуальных пользователей, выпускать от них статьи, и затем от них ставить плюс к своей статье. Несложно убедиться, зайдя в профили топовых компаний, сколько же у них «сотрудников» (на деле виртуалов) на хабре.

У одних компаний 60 виртуалов, у других компаний больше сотни, а у кого-то даже 700! Возможно, даже столько людей в компании не работают, но сотрудники на хабре есть.


Пример мифической компании с кучей виртуальных сотрудников

Представляете, у компании 700 виртуалов, каждый может поставить 1 плюс, а если пользователь опубликовал много статей, то даже +2 или +3. Соответственно, можно хоть у каждой своей статьи добивать до сотен плюсов!

Ещё момент, если пост выходит, и у него рейтинг добирает +10, то он попадает на главную, и другие пользователи его видят, соответственно, более радостно плюсуют. И нужно как можно быстрее вывести пост на главную, поэтому его доплюсовывают искусственно.

Вы можете наблюдать, когда сомнительный пост, на каждые 100 просмотров имеет +1 рейтинга, ещё обязательно его добавляют в избранное (сами сотрудники, потому что это тоже показатель интереса поста). И именно поэтому в блоге топовых компаний вы не встретите постов с рейтингом ниже 10, они его искусственно добивают по схеме выше.

К сожалению, я не успел сделать скринов, но были моменты, когда сомнительный пост на каждые 100 просмотров имел по одному плюсу. Или за час вдруг с +15 добежал до +30, при этом до предыдущего значения шёл в течение 12 часов.


Пример накрученного поста, всего 3900 просмотров и 68 плюсов!

Если вы видите, что отличие компании на 1000 от предыдущей компании, то это может говорить о двух вещах:

  1. Компания реально делает классный, уникальный контент, который хабровчане одобряют своими плюсами.
  2. Компания накручивает рейтинг.

Истина, как говорится, посередине. Я не могу упрекнуть рейтинговые компании, что их публикации мусор. Их сам читаю, и сам ставлю плюс, и в действительности их маркетологи не просто так едят свой хлеб, за это мы и любим хабр. Но вместе с тем, накрутка рейтинга создаёт несправедливую диспозицию для других авторов и компаний, которые создают годный контент и не занимаются накруткой.

▶ А есть ли доказательства накрутки?


Меня можно справедливо обвинить в оговоре компаний, для каких-то своих целей. Истинное положение вещей насчёт накруток знает только редактор компании и администрация хабра, простому автору необходимо использовать другие методы оценки, накручен ли пост или нет. Самый простой и надёжный способ — это применить математические методы, от них не скроет ни VPN, ни какие-то другие способы.

Просмотры и плюсы являются распределением Пуассона, и в идеале смотреть с какой частотой и когда происходит просмотр и ставится плюс. Далее проверить это распределение с помощью критерия согласия Пирсона соответствия распределению Пуассона, и станет ясно — искусственная накрутка или это реальные пользователи.

Но без API Хабра это сделать весьма сложно. Тут были ребята, которые делают статистику по хабру, будет круто если они сделают подобные проверки по компаниям.

Для меня этот подход оказался не очень удобным и недоступным, поэтому я решил в качестве оценки рассчитывать коэффициент конверсии. У нас есть данные: количество просмотров и количество плюсов, если поделить одно на другое, получим этот коэффициент. Для оценки накруток взял первые 10 компаний в рейтинге (мы помним, что это всё фантазии автора поста), и взял последние 10 постов от этих компаний. Свёл данные в таблицу и посчитал коэффициент.


Таблица отношения голосов к просмотрам

Сам коэффициент конверсии считал по формуле:

$k_{конверсии}=\frac{\sum_{i=1}^{10}{голосов}}{(\sum_{i=1}^{10}{просмотров}\div100)}$


Получается, чем больше статью плюсят на количество просмотров, тем выше данный коэффициент. Из моей практики, средний коэффициент у обычной компании, которая не занимается накруткой, колеблется в пределах 0,2-0,4.

Проще говоря: на 1000 просмотров, должно быть, в среднем 2-4 плюса за период.

Всё, что выше — вероятнее всего, накрутка. Исключение в этой таблице является графа 8 — это сама компания хабр, и в целом её статистически оценивать некорректно. Так что ей мы можем пренебречь, потому что не могу сказать, накручивают они или нет, но им точно можно.
Ничто так не украшает статью, как красивый график.



Как можно увидеть, целых три компании (не считая хабра) имеют неестественно высокий коэффициент конверсии. А две компании имеют практически одинаковый, говоря о том, что схема накрутки примерно одинаковая.

Обращаю внимание, что коэффициент конверсии имеет смысл рассматривать на более длительном периоде, потому что бывают статьи, которые имеют значение коэффициента даже больше 1. Например, у меня есть статья, которую никто никогда не накручивал, которая имеет коэффициент конверсии 2,5! Но это исключение лишь подтверждает правило.


Моя статья, с конверсией больше 2,5!

UPD Мне в комментариях верно сказали, что статья написана в те времена, когда количество просмотров на хабре не учитывалось, поэтому пример неудачный. Но смысл, тем не менее, понятен.

Но у компаний редко может быть такая высокая конверсия, потому что компании не очень любят на хабре, да и годный контент клепать два раза в день, семь дней в неделю, 31 день в месяц — невозможно. И в среднем за месяц у компании конверсия должна быть в пределах 0,4 (исключения тоже могут быть).

Проще говоря: единичная статья может быть с большой конверсией, если она реально крутая, и очень зашла пользователям. Но статистически, дальше будет не очень крутая с очень малой конверсией и в среднем за период конверсия выровняется.

Могу сказать, что эти знания эмпирические, доказать или опровергнуть их поможет только статистический анализ всего хабра и всех компаний на этом ресурсе.

▶ Накрутка рейтинга с переводами


Поскольку перевод не сильно влияет на рейтинг, то это ограничение тоже научились обходить. Статью писать сильно сложнее и дороже, чем сделать перевод. Для того, чтобы создать перевод, нужен любой человек, который знает язык оригинала статьи и статья на перевод. Автор оригинальной статьи уже проделал работу по созданию контента, и остаётся только его взять и опубликовать на другом языке.

Компания просто берёт несколько статей на английском языке, делает компиляцию из нескольких переводов, и выдаёт компиляцию в виде статьи. Это вроде бы и не перевод, но на деле усилий по созданию такого контента требуется совсем немного, и квалификации там не требуется, может делать любой рерайтер.

Поэтому на хабре появилось огромное количество статей про обзоры одноплатников, паяльных станций, различной техники и новинок IT. При этом человек, который её «написал», понятия не имеет о чём пишет. Задаёшь вопрос по теме в комментариях, и автор статьи не может дать развёрнутый ответ. Потому, что статья откуда-то надёргана, а автор — просто банальный рерайтер-копирайтер. Фактически это введение в заблуждение создания контента, где его генерят не для пользы читателей, а для рейтинга.

▶ Что с этим делать?


Читателям хабра рекомендую оценивать статью не по количеству плюсов или минусов, которые стоят внизу публикации, а исключительно по её содержанию. Авторы, которые пишут в топовые компании живые люди, многих знаю лично, и они делают сами годный контент. И если вам понравилось, ставить плюс, если нет, то проходить мимо, только если вызывает отторжение, то поставить минус. Лучше нейтральная реакция, чем бахнуть минус, потому что негативизация ресурса ему тоже вредит.

Обращайте внимание на количество сотрудников у компании, вряд ли 50, 100 или 700 человек — это реальные авторы хабра. Задумайтесь, для чего компании столько сотрудников в блоге? Не для накруток ли?

Понимаю, что деньги не пахнут, компании платят за свой блог и могут отходить от правил, но всё же хотелось бы дать рекомендаций и администрации. Рекомендую ограничить количество публикаций в день от компаний. Запретить самоплюсование всем сотрудникам компании, пускай оценивает публикацию и компанию сообщество, а не идёт накрутка рейтинга. Тем более, что автор не может сам себе поставить плюс. При этом плюсовать не могут даже те, кого компания пригласила.

Ещё я бы сделал возможность ставить плюс в статье, после хотя бы 20 секунд её чтения, чтобы было понятно, что человек хоть как-то ознакомился со статьёй, а не заходит тупо бахнуть плюсец.

▶ Выводы




Не стоит думать, что компании гонят мусор, в действительности с появлением возможности авторам получать деньги за свой труд, качество статей повысилось. И, реально у топовых компаний весьма годный контент. Система рейтинга на хабре — это очень ценный инструмент, благодаря которому, мы можем видеть более качественные статьи, понимать какой материал, автор или компания заслуживают нашего внимания.

Но всё это превращается в пыль, когда начинаются махинации с плюсами, доведения как можно скорее до +10 и вывода компании в топ. Давайте все будем играть по общим правилам, а не переписывать правила в процессе игры.

На деле, если запретить возможность самонакруток, то выиграют все:

  • Читатели выиграют потому, что будут получать качественный контент без вранья.
  • Компании выиграют, потому что будет честная конкуренция, и мы будем видеть реально сильнейших, которые создают качественный контент.
  • Редактора компаний наконец выдохнут, им не придётся сидеть в выходные или ночами и плюсовать статьи.

Одна сплошная польза для всех.

▶ P.S.


Всё это пятничный вечерний бред, картинки в статье — это gimp, цифры придумал на ходу, статья — вымысел. А все совпадения с реальными компаниями являются случайным и непреднамеренными.
Tags:
Hubs:
Total votes 255: ↑242 and ↓13+229
Comments227

Articles