Pull to refresh

Comments 134

Хм, я думал везде будет экспонента, тем более с открытием реги. В 2012 по июнь или май?
По апрель, т.к. информацию начал собирать еще в мае + у топиков не окончился срок голосования.
Забыл еще добавить, что read-only пользователи не учитывались при сборе статистики.
А интересно было бы узнать, сколько юзеров было за забором до реги.
Если не секрет, почему в черновики ушла предыдущая публикация, а эта была написана заново?
Предыдущая была случайно опубликована в очень уж черновом варианте: без ссылок и с недописанными частями.
UFO just landed and posted this here
Проблема в том, что второй, по количество комментариев, топик, тоже с раздачей инвайтов.
UFO just landed and posted this here
Может топик про разрезание фигуры? Тогда было как минимум 600 комментариев и десятоу нервных срывов.
UFO just landed and posted this here
по-моему были с большим количеством комментариев, толи к выходу айфонов, толи топики счастья, с котами или просто раздачи кармы, просто они внеформатные были и их потерли, кажется.
> Больше всего комментариев написал VolCh — 19323
OMG
Какое же это «ОМГ»? Довольно скромное число. На иных форумах звание «флудер» дают только на числах порядка «100 000».
Даже не знаю, радоваться или огорчаться в связи с таким сомнительным рекордом.
такими темпами можно и наверстать же
Э-э-э… Что наверстать?
НУ с такими темпами — все что угодно :)
Например, интенсивность. Сейчас всего лишь 1 комментарий в 2 часа с момента вашей регистрации на Хабре.
Таки набил ещё 1к комментов за один день?))
Данные явно не вчерашние :)
Ой, да лааадно тебе, оправдыватся! Все поняли, что ты статистикодрочер! =)
новый вид спорта на хабре? главное засветился!))
> Ответ на вопрос, чем обусловлен такой провал по количеству регистраций начавшийся в августе 2008 и достигший минимума в сентябре (1 регистрация за месяц), я не нашел.

Вроде как именно тогда ввели регистрацию по инвайтам, отсюда и провал
Кстати, взлет регистраций в июле 2009-го связан с акцией, когда для получения инвайта нужно было установить IE8 с хабронадстрокой
UFO just landed and posted this here
Но у заблокированных тогда на месте их комментариев появляется надпись про нло прилетевшее и оставившее надпись. Разве не так?
UFO just landed and posted this here
Возможно, начиная с какого-то времени решили не превращать старые обсуждения в решето?
Это деактивированные пользователи
А ведь данные о пользователях сейчас закрыли, поэтому Вы, наверное, не смогли получить полные сведения о регистрациях, а только тех посетителей, ссылки на персональные страницы которых нашли на сайте. Верно?
Получены данные всех, кто хотя бы раз написал комментарий или пост и не является заблокированным или переведенным в read-only.
Тогда это, наверное, надо упомянуть под графиком, что данные о регистрациях неполны. (Ещё можно было бы прочитать тех, кого пригласили из страниц пригласивших.)
Ответ на вопрос, чем обусловлен такой провал по количеству регистраций начавшийся в августе 2008 и достигший минимума в сентябре (1 регистрация за месяц), я не нашел.

Утверждать не буду, но тогда, кажется, ввели регистрацию по инвайтам
Эх, новички… Уже и не помнят, что когда-то на хабре никто и знать не знал богомерзкого слова «инвайт»:(
Я ужасен.
Впервые попал на хабр и подумал – а не запостить ли мне все свои подкасты разом? :)
Главное чтобы никто не захотел теперь побить рекорд.
Жалко, что нет доступа к базе хабры. Было бы интересно глянуть распределение «кто больше всех плюсует/минусует комментарии/топики/карму» с графиками распределения между «добрыми» и «злыми». :)
P.S. Принимаю предложения по построению интересных графиков на основе полученной информации.

Абсцисса — (количество или суммарный рейтинг) (постов или комментариев), ордината — (карма или рейтинг). Каждый пользователь — точка.
кстати да, было бу интересно увидеть и другие разрезы «облаков», глядишь и кластеризация выявится какая нибудь.
Насчёт пользователей из прошлого:
public class OldUsers
{
public static void main ( String[] args )
{
Date date = new Date ( 0 );
SimpleDateFormat sdf = new SimpleDateFormat ();
System.out.println ( sdf.format ( date ) );
}
}


И на выходе…
01.01.70 3:00


Думаю, это должно навести на мысли ;)
А тэг «code» всё такой же бесполезный :(
3:00, видимо, из-за смещения часового пояса?
UFO just landed and posted this here
Ещё один интересный вопрос, ответ на который Вы узнали и сможете выдать страшную тайну.

Вот смотрите, идём на habrahabr.ru/posts/collective/ и нажимаем «Последняя страница». Сейчас там ничего интересного нет, а раньше красовалась надпись Внутреннего Голоса: «Подкаст не может быть хорошим». Сообщения эти не сопровождаются ссылками, поэтому не мог просмотреть страницу и комментарии и получить очень хорошую авторитетную ссылку :). Но, просмотрев пару десятков первых номеров, его не нашёл. Попадалось ли Вам такое сообщение? Каков его номер?
UFO just landed and posted this here
Да, такое часто встречал, из за этой аномалии около 4 часов дебажил софтину, не мог разобраться почему он возвращает неправильное количество комментариев.
Я же не вручную 120к постов перебирал:). Хотя таких топиков не встречал.
Извиняюсь, пора бы мне уже запомнить, что работает только «source»…

public class NewTopicPage extends WebPanel
{
    public static void main ( String[] args )
    {
        Date date = new Date ( 0 );
        SimpleDateFormat sdf = new SimpleDateFormat ();
        System.out.println ( sdf.format ( date ) );
    }
}
Ну, вообще-то, code тоже работает, только назначение у него другое.
А подо что он конкретно нужен/работает?
Комментарий к несуществующей статье прям в точку)
UFO just landed and posted this here
Поразительно, тоже где то месяц назад пришла идея, а не скачать ли и не проанализировать ли хабр, но руки пока так и не дошли.

Постройте еще график доли пользоателей, голосовавших за топики в каждый конкретный день.

Ну и скаое то интересное — зависимости:
• как влиятет успех предыдущего поста на успех следущего и как это зависит от рейтинга/кармы пользователя
• как заивисит рейтинг топика от времени публикации/хаба/рейтинга пользователя
• как зависит активность пользователя от его рейтинга и даты регистрации
ну и прочее.
> предложения по построению интересных графиков

Точечную диаграмму зависимости: «средняя длина статьи / количество статей» (обе шкалы логарифмические) по каждому автору. И диаметр точки — количество с одинаковыми данными, интервалы по Х подобрать (по Y будут ровные ряды). Авторы — точки, а по их плотности будет видно, каких авторов больше, сколько пишут в среднем.
К сожалению, нет информации по длине статьи.
Распарсить скачанную статью, нет?
В базе нет текста скачанных статей.
А как Вы (не только автор поста, но и пользователи) оцениваете текущее качество контента по сравнению с 2011, 2010, 2009 годами? Хабр развивается или забивается шлаком?
Качество оценить сложно будет. Судя по количественным показателям: развитие достигло пика и стабилизировалось.
Есть раздел «Лучшее за все время». было бы интересно посмотреть на «Худшее за все время».
«Лучшее за все время»: Стив Джобс умер:( O_o
вы смотрите по постам самых заминусованных юзеров :)
БолженОС — думаю самый худший пост за все время
Чем и как парсели, если не секрет?
А какой язык использзовали?
>Как ни грустно, но чуть больше половины пользователей не опубликовало ни одного топика.

Было бы грустно, если бы опубликовали, но при этом не разбирались в теме. Пусть лучше пишут более опытные товарищи…

За обзорность Спасибо. Очень познавательно вышло.
Интересно, сколько из этих не написавших ныли про «желтизну» Alizar :)
Сколько их этих не написавших ныли про то, что хабр уже не тот, и они бы намного лучше бы топики писали.
А топ первонахов реально собрать?
Если честно, я так и не понял, в чем суть претензий к Ализару.

Многие известные мне новости науки и технологий с американских ресурсов в рунете появлялись и появляются первым делом, или вообще исключительно, в его переводе.
Да так, людям заняться нечем, возмущаются его переводами, хотя сами ни разу и не пытались что-либо перевести
Не только Ализар, таких тут несколько. Обычно они переводят желтуху, либо непроверенные данные, либо что-то заурядное, но с зазывающим заголовком. Мн лично не нравится терять кучу времени на отсеивание подобных топиков (не интересно, а для новостей есть специализированные издания) — пришлось писать фильтры для rss. Но это дело вкуса и gtd.)
В основном претензии состоят в том, что:
-Информация первоисточника иногда перевирается\недоговаривается\преподносится однобоко в целях привлечения аудитории
-Из-за большого числа постов некоторые из них теряют важные детали (нюансы перевода, ссылки, комментарии и правки автора оригинала)

В результате читатель получается одним из трёх слепцов, который держит слона то ли за хвост, то ли за ногу, то ли за хобот и пытается делать вывод о том, что такое этот слон.
Но спасибо, ему, конечно, за то, что пытается нести информацию не-англоговорящим читателям.
UFO just landed and posted this here
Может ализар это бот — генератор контента? Порою с размахом такой рандом выдает…
Лучше что-то, чем ничего, даже если это что-то только что висело на заборе? Аднака…
Если только чуть больше половины — Парето с его 80/20 вертится в гробу:)
В «Лучшем за все время» отображаются самые заплюсованные посты, а интересно, какой самый заплюсованный комментарий — не со списком порносайтов ли в помощь челу, который жаловался, что что-то где-то заблочили?:)
Ага, вот его следы. Оказывается, самый заплюсованный не со ссылками, а с комментарием к ним юзверя sedictor:
Если вы видите много ссылок фиолетового цвета, то у меня плохие новости для вас. +622!

habrahabr.ru/post/118370/#comment_3859518

искал тот самый комментарий.
набрал «porno» в поске…
=)

а в самом низу страницы, внутренний голос:
«Эрик, ну сделайте там наконец Google Porno, народ жаждет!»

я уже молчу о «pornohabr», который выпал в search suggestion
UFO just landed and posted this here
Так он автор этого комментария.
PS И снова ни одной фиолетовой…
UFO just landed and posted this here
Если хотите иметь этот комментарий у себя в избранном, то выполните в консоли:

$.post('/json/favorites/', {tt: '3', ti: '3854405', action: 'add'})
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
Это еще был не слив. Реальный слив был в другом хабрапосте с единственным текстом «Идите нах*й», когда за обычный плюс без всяких комментариев банили на 1000 дней до 2014 года.
Какой приятный ровный график появления топиков по часам!

Интересно, почему вдруг в начале 2010-го случился резкий обвал кол-ва топиков и комментариев, и до сих пор не поднялось до этого уровня?
НЯП, тогда с главной заоффтопили целую кучу блогов (теперь хабов): «Я умный», «Будущее здесь», «Научно-популярное».

Помню, как после этого геноцида специально отслеживал, что новость о разработке в IBM мемристора или какой-то другой потенциально вкусной технологии на хабре так и не появилась, зато наверх повылазили обзоры каких-то быдлосмартфонов для среднего класса нижнего уровня.
Хаброаномалии

Вот еще аномалия — у меня в профиле отмечено, что я работаю в РПЦ, но её уже удалили :(
Учитывая, что с хабра выпилили топ комментариев, очень порадовала бы Ваша версия топа. Особенно в виде периодически обновляемой страницы.
Тоже не можете найти коммент со списком порносайтов?
мать вашу! пошел взглянуть на самые заминусованные топики и опомнился только через два часа(
> Из этой диаграммы следует, что больше всего написали топиков пользователи зарегистрировавшееся до середины 2008 года
Этому есть объяснение. Во-первых, провал графика (и другие его части) схож с графиком количества регистраций пользователей в месяц. Во-вторых, 2006 год столь большой, потому что alizar зарегистрирован 11 июня 2006 в 20:02, а статей сами знаете у него сколько. Таким образом, можно сделать вывод, что много написали потому, что пользователей в этот период зарегистрировано много. С другой стороны логично, пользователи давно на хабре, статей у них и должно быть больше.
Тогда, наверное, стоит делить на количество регистраций. График будет более показательным.
Самые заминусованные пользователи (по карме):
quadregus -641
egorinsk -402
gigawatt -333
Himari -299
almaz -260

Пользователю egorinsk можно официально присудить звание «главный антикармадрочер». На протяжении лет, находясь в глубоком минусе, написать больше 5000 (!) комментариев, многие из которых — огромный развёрнутый грамотный аргументированный троллинг на разнообразные темы. Я восхищён стойкостью этого человека.

Остальные герои топа-задом-наперёд гораздо менее примечательны.

P.S. Хочу статистику по пользователям с самым большим количеством заминусованных комментариев и топиков. Одно дело добиться минусов несколькими «меткими» комментариями и другое дело — постоянно вызывать несогласие собеседников.
… и не подвергнуться при этом абдукции НЛО, как пресловутый karma ака sixapart:)
Ещё можно было бы связать карму и количество голосов за карму (можно вывести график количества голосов в одних координатах с распределением кармы), а также рейтинг комментария и количество голосов за него.
Явно виден боковой флэт в жизни ресурса со склонностью к нисходящему тренду. Все это связано с системой голосований. Пользователю не хочется постить, чтобы получить минуса в карму, а подстриваться под непредсказуемые пожелания юзеров — нормальный человек не станет. Вот и сидят с нулевыми кармами, иногда почитывая опусы других. Ресурс, впрочем. крепко занял свою узкую нишу и это устраивает всех, так что пусть все остается как есть. Автору +1, интересная стата собрана, тем более с аномалиями
Больше всего удручает, что карма сама медленно не восстанавливается со временем. В результате каждый интересный, сатирический и может быть спорный комментарий мне приносит чуть-чуть негативной кармы (позитивной конечно тоже, но на 1-2 голоса меньше, чем негативной). Ну скажите, зачем нам скучные комментарии, которые нравятся абсолютно всем? И если я провёл на Хабре 2010-2011 годы под эгидой «не больше 1 комментария в час», то 2012 начался с «не больше 1 комментария в день» (как я понял это -30 кармы), по планам Хабра к 2015 году я стану рид-онли. =T_T=
По большому счету тут гуманитарию и читать нечего и общаться не с кем. Больше техническое сообщество. Так что лично для меня это небольшая потеря. Так, изредко читаю о том о сем. На 95% ресурс не мой.
Ещё забавно видеть забаненными народ с баджами «Легенда». Раз — и топиков не стало.
Да уж, сменилась политика Хабра, сменились и «звезды».
Решение пришло быстро, надо перебрать все опубликованные топики, начиная с 1 и заканчивая 144 400 номером
Оооо, частота нашего ретранслятора :)
было бы очень интересно видеть еще такие данные:
* средний рейтинг топиков по часам (по дням есть, но так интереснее)
* среднее количества голосов за топик по часам по времени создания топика
* среднее количество комментариев на топики по часам именно по времени создания топика

такая информация может дать представление о том когда лучше публиковать, чтобы получить максимальную активность.

а вообще интересно было бы еще видеть суммарную статистику по тэгам и хабам, но я так понимаю что парсер придется запускать заново.
А просто количество комментариев под часам и дням не сложно будет?
Почему вы скрыли разметку оси ординат на графиках активности?
habrahabr.ru/post/119754/#comment_3918136 -203 (Изображение в комментарии потеряно

Помню этот комментарий, там была картинка, типа саркастичный демотиватор, мужчины с КДПВ.
Пользователи, зарегистрировавшиеся в далеком 1970 году

[CHUCK_NORRIS_MODE]Я пользовался Хабрахабром, когда он ещё даже не существовал.[/CHUCK_NORRIS_MODE]
Да ладно, Хабр не существовал… Взглянем на дату рождения: 1 января 1988 :)
подскажите, пожалуйста, каким в туле строили такие красивые графики?
UFO just landed and posted this here
У кого сейчас самая большая карма? А за все время?
Sign up to leave a comment.

Articles