Pull to refresh

Comments 45

Забыли упомянуть, что нахождение частной информации даже в открытом виде на одних сайтах не даёт права использовать эти данные третьими лицами.

да, вы правы. Если мы говорим про цены конкурентов, то это не является объектом авторского права :) и использовать можно как угодно.
И конкуренцию не ограничивает, а стимулирует )
точно, поэтому суд будет на стороне ответчика :)
Только сегодня писал блокиратор для подобных сервисов с баном ip на несколько часов.
UFO just landed and posted this here
Основное, что беспокоит — тырят оригинальные описания товаров и фотки.
фотки и описания — действительно могут быть объектом авторского права, а ведь могут и не быть!
Мы не собираемся ни с кем судиться за кусок текста, просто максимально усложним работу подобным сервисам и программам по скачиванию сайтов. Эти сервисы будут получать 404 практически на все страницы. Все что мы захотим отдать во вне, мы отдадим через api.
А что у вас за сайт такой, извините, что вы так прямо дорожите контентом? :) Можно взглянуть? Обычные Инет-магазины обычно дублируют контент друг у друга.
Мы производим жалюзи. Сами пишем тексты. Покупаем фото на стоках, сканируем текстуру материалов, если поставщик не предоставил фотографии. Периодически возникают сайты с полной копией наших текстов и фотографий, вплоть до полных зеркал. Вот, захотелось усложнить людям жизнь :)

так наложите на фото адрес вашего домена. Или вас такой вариант не устраивает?

У знакомых как то стали клонировали новостной портал раз в день, они нашли ip злодей и стали отдавать вместо картинок с сайта, картинки с порнохаба. Парсить перестали.

что-то легко отделались — они могли перейти на парсинг через прокси

UFO just landed and posted this here
Ручное скачивание не беспокоит. Беспокоит машинное. Именно его и блочим :)
UFO just landed and posted this here
Проданный уникальный контент = неуникальный контент. Не пойдет.
Это не проблема, обходится через прокси.
Тестировал. Лист блокировки заполняется десятками заблокированных адресов прокси за несколько секунд. Я пропущу только, если вы прикинитесь гуглоботом и аккуратно прочитаете все директивы robots.txt и не будете лезть куда запрещено.
UFO just landed and posted this here
UFO just landed and posted this here
Тогда уж похвастались бы чем он крут, а то без регистрации ничего не посмотреть.
UFO just landed and posted this here
Ага, чтобы что-то посмотреть надо и зарегистрироваться и пополнить баланс?
UFO just landed and posted this here

Ещё есть специализированный прокси-сервис для бизнеса – luminati.io – позволяющий смотреть сайты конкурентов из разных гео-локаций (причём, с очень высокой точностью выбора локации). Ну и обходить всевозможные блокировки по IP и всё такое.

Пользуясь случаем, задам вопрос, возможно кто-либо знает адекватный вариант. Есть задача стащить все картинки и описания с одного интернет-магазина и засунуть в другой. Т.е. нужен какой-то парсер/граббер который это сможет. Посоветуете?
xmldatafeed.com попробуйте, но вы держите в уме, что вы можете нарушить авторские права правообладателя.
Спасибо, посмотрю. Речь идет не об авторских описаниях товаров, а о «заводских».
Из вышеуказанных запретов следует, что организация вправе осуществлять автоматизированный сбор информации, размещенной в открытом доступе на сайтах в сети интернет если соблюдаются следующие условия:
1. Информация находится в открытом доступе и не защищается законодательством об авторских и смежных правах.

Законодатель определяет Интернет как информационно-телекоммуникационную сеть, которая не является местом, открытым для свободного посещения, по смыслу ст. 1276 ГК Российской Федерации — Определение № 84-КГ15-1 Судебной Коллегии по гражданским делам ВС РФ.
Информация никак не может быть «незащищённой законодательством об авторских и смежных правах», потому что данные права возникают автоматически и не требуют ни какого-то подтверждения, ни регистрации (ст. 1259 ГК РФ).
Далее, правообладатель может по своему усмотрению разрешать или запрещать другим лицам использование результата интеллектуальной деятельности или средства индивидуализации. Отсутствие запрета не считается согласием (разрешением) — ГК РФ, ст. 1229.
В РФ то, что не запрещено законом, априори разрешено. Отсюда и следствие по парсингу.
В данном случае как раз запрещено — читайте выделенный текст, а лучше сразу всю часть 4 ГК РФ.
Это публичная информация :) как доступ к ней может быть запрещен?
«Информация никак не может быть «незащищённой законодательством об авторских и смежных правах»

Информация не охраняется авторским правом. „Читайте лучше сразу всю 4 часть ГК“.
Информация — сведения, воспринимаемые человеком и (или) специальными устройствами как отражение фактов материального или духовного мира в процессе коммуникации.
Иными словами, она включает в себя всё, что мы видим, слышим или осязаем, в любой форме.
Вы путаете информацию с определением «сообщение о событиях и фактах, имеющее чисто информационный характер» — то есть, не несущее на себе отпечаток интеллектуального труда.
Если же Вы имеете в виду информацию в виде какой-то статистики или даже просто массива данных, то она точно так же защищается законодательством об интеллектуальной собственности, как и любая другая, потому что за ней стоит составитель и (или) изготовитель.
1. «Сообщение… имеющее информационный характер» и «информация» — одно и то же. Вы зачем-то выдумали себе какую-то «информацию, несущую отпечаток интеллектуального труда», такой информации быть не может. Потому что…

2. «ФЕДЕРАЛЬНЫЙ ЗАКОН ОБ ИНФОРМАЦИИ, ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЯХ И О ЗАЩИТЕ ИНФОРМАЦИИ
Статья 1. Сфера действия настоящего Федерального закона

2. Положения настоящего Федерального закона не распространяются на отношения, возникающие при правовой охране результатов интеллектуальной деятельности и приравненных к ним средств индивидуализации, за исключением случаев, предусмотренных настоящим Федеральным законом.»

Информационные правоотношения и «авторское право» — это две разных правовых сферы, которые взаимно не пересекаются. Авторское право охраняет форму произведения, а информационное — его содержание.
Вы зачем-то выдумали себе какую-то «информацию, несущую отпечаток интеллектуального труда

Я ничего такого не говорила, прочтите внимательнее. Я Вам объяснила суть "сообщения чисто информационного характера" (это определение есть в ГК).
«Сообщение… имеющее информационный характер» и «информация» — одно и то же.

Абсолютно нет. Информация — собирательное словарное определение любых сведений, которые мы воспринимаем, а «сообщения о событиях и фактах, имеющие исключительно информационный характер» — это регулятивная норма гражданского права (точнее, её диспозиция). И правоприменение основывается именно на нормах права, а не на философских концепциях. Но эти два понятия не идентичны, даже если абстрагироваться от сферы юриспруденции: первое является составной частью второго.
Информационные правоотношения и «авторское право» — это две разных правовых сферы, которые взаимно не пересекаются.

Вы сделали совершенно неверные выводы из процитированного параграфа. То, что положения 149-ФЗ «не распространяются на отношения, возникающие при правовой охране результатов интеллектуальной деятельности и приравненных к ним средств индивидуализации», означает лишь, что в этой части данный закон следует нормам, применяемым ГК РФ.
И не стоит уводить дискуссию в другую плоскость — речь в статье идёт о парсинге материалов с чужих сайтов.
Вы зачем-то подменяете определение «информации», данное в законе, на «словарное», после чего делаете из этого выводы космического масштаба. Не надо так.
Я ничего не подменяю, это Вы пытаетесь смешивать понятия, говоря о том, что, цитирую,
Информация не охраняется авторским правом

На что я Вам отвечаю, что это утверждение — некорректно, поскольку нигде в законодательстве РФ Вы такого определения не найдёте. Информация как таковая — это совокупность понятий, которая имеет большое количество подмножеств, и каждое из этих подмножеств, а также входящие в них объекты, в праве классифицируются и рассматриваются отдельно.

Приведённый же Вами в качестве примера Федеральный Закон вообще никакого отношения к обсуждаемой теме не имеет. Да, он не регулирует отношения в области авторских и смежных прав, но только потому, что его цели лежат совершенно в иной плоскости. Точно так же, скажем, ФЗ «Об основах охраны здоровья граждан РФ» не регулирует вопросы семейного права, хотя косвенно они там тоже затрагиваются.

Интересно было бы посмотреть на техническую реализацию данных парсеров.

А для мониторинга цен на товары в личных масштабах другие сервисы/программы или какой то из перечисленных подойдет? Интересует скажем процессор i5-2500, искать хочу на ebay, aliexpress и avito, нужно при появлении товара по хорошей цене получить уведомление на почту или мессенджер.
Подойдет, например allrival.com. Там есть возможность бесплатного парсинга 2 сайтов. При этом особых заморочек не нужно будет делать, только сохранить ссылки на интересующие с этих сайтов товары

Еще для организаций есть ватсон эксплорер от IBM, который умеет кроулить все что угодно, индексировать, искать, а так же делать аналитику. Но небесплатно)

Sign up to leave a comment.

Articles