Pull to refresh
76
0
Сергей Петренко @gray

Пользователь

Send message
Это не тот "хостинг", который забанен Яндексом за спам?
Вы хотите сказать, что только надышавшись выхлопных газов в пробках можно читать Вебпланету? Не соглашусь, тогда она особенно опасна для ослабленного мозга :).
Еще раз - в конкретном случае Google проиндексировал примерно в два раза больше, чем есть на самом деле. Можете считать это признаком качества поиска - найдет даже то, чего нет.
Вероятно, не креститесь, потому и кажется :).
Еще раз - абсолютно точно на форуме существует порядка 100к страниц, которые можно проиндексировать - с уникальным контентом. Добавьте сюда архив - копию форума, фактически, с очень легким дизайном и статическими урлами - и получите еще 70к. Таким образом, на примере отдельно взятого форума мы видим, что Google показывает явно завышенное число результатов поиска - считая там дубли (а весь архив это дубль, причем на 80% - довольно четкий), мусор и т.д.
Так что вам может казаться, что кто-то недоиндексирует, но факт остается в том, что кто-то индексирует больше, чем есть в наличии.
А, это тот замечательный сервис, от рассылок которого невозможно отписаться?
http://exler.ru/blog/item/1326/
Что-то спаммеры стали дороги...
Из них в архиве - больше тысячи.
Похоже, кто-то не умеет склеивать нечеткие дубли :).
Конкретно в данном случае очень легко посчитать, что на форуме:
1 главная страница;
несколько десятков страниц разделов;
~82 тысячи страниц тем - при дефолтной выдаче по десятку сообщений на страницу, причем часть нельзя проиндексировать, ибо это закрытый форум, например.
~19 тысяч страниц профилей пользователей.
Итого - ~100K страниц, которые действительно что-то содержат.
Вероятно, кто-то что-то переиндексировал :).
В итоге мы оказались полностью друг с другом согласные :).
В действительности мы уже одну такую сделку видели и обсуждали - когда РБК покупало движок Альтависты.
Мы куда-то не туда с тобой заехали. Изначально речь шла о том, что:
1. У FAST`а нет веб-поиска и Рамблер не может у него его купить.
2. Поиск по вебу требует немного других решений по сравнению с чистыми коллекциями - поэтому нельзя взять корпоративную искалку и получить из нее веб-поиск.
Если подытожить - Рамблер не будет ничего менять в веб-поиске в связи с покупкой машинки у FAST.
Лень, я не знаю, будет она или нет, но у меня в августе Новотека выкачала 250 тысяч страниц с форума. И не унимается, кстати.
Нет, Игорь, человечество нифига не осилило. Это ты нашел компромисс между своей идеей создания веб-поиска по коллекции отобранных документов (а не сплошняком по грязному вебу) и расходами на создание такой коллекции. Не берусь судить, на каком этапе количество маленьких коллекций перерастет (если перерастет) в качество одной большой. Но отчуждаемость-то тут где? Арендуемый сервис, персональные кабинеты, все, что может пользователь - добавить адрес сайта.
Игорь, ну не мне же тебе объяснять разницу между корпоративной искалкой, которая ищет по многотерабайтной базе документов сотни разных форматов, и веб-поиском. Ведь главный фокус состоит в том, что эта самая много... база - чистая, а веб-искалка должна искать по грязному вебу и никак тут нельзя опускать борьбу со спамом, учет цитируемости, подавление дубликатов и другие "тонкие штуки".
Да, понятно, что технология поиска Google в основном одинакова и в веб-поиске, и в Google Desktop, и в Google Mini. Как ты, вероятно, догадываешься, поиск Яндекса по блогам или Персональный поиск принципиально мало отличаются от Большого поиска по вебу и друг от друга. Но разница все же есть и она критична.
Я уж не говорю о том, что такого зверя, как отчуждаемый веб-поиск, даже FAST не изобрел :).
Придется вслед за Ильей повторить - у FAST нет такой технологии, как веб-поиск.
Вот что у них действительно есть - это поиск по видео и аудио. В качестве примера - новость годичной давности - http://www.searchengines.ru/news/archive…
Честно говоря, очень плохо представляю себе, что из этого получится :).
У FAST нет никакой особой кластеризации, вроде бы.
Не говоря уже о том, что кластеризация - это такое "модное слово в поиске" 2.0, для тех, кому надоело медитировать на слово 1.0 - "морфология".
Куча модных слов. Абсолютно не понял, причем здесь Яндекс с Google? Вам очень хочется попасть в популярные теги?
Непотизм для дорвейщиков несвойственен.
Дорвейные технологии здесь не помогут. Нужно было непотисткий спам изучать :).
Как одессит, могу сказать, что поиском сложно найти услугу, которой и в оффлайне не так уж много :).
12 ...
23

Information

Rating
Does not participate
Location
Одесса, Одесская обл., Украина
Date of birth
Registered
Activity