Интернет, компьютеры, софт и прочий Hi-Tech

Подписаться через RSS2Email.ru

Интернет-пиратство — охота на забытый контент

Эта мода пришла к нам с Запада, но точно так же как и там, в первую очередь она касается многостраничных сайтов (от 1000 и более страниц), блогов на бесплатной платформе Blogger.com. А в последнее время жертвами подобных интернет-охотников за контентом все чаще становятся сайты на Народе Яндекса. Но в любом случае приёмы хакеров всегда одни и те же. Вот мы и решили рассказать о них, чтобы вы знали, как не стать жертвой похитителей контента или что делать, если ваш сайт все-таки смогли обокрасть.

Воровство контента с бесплатных блогов и сайтов

По последним подсчётам блоги и сайты на Народе и Блоггер пытались вести порядка 80% пользователей русскоязычной Сети. Подобные благие намерения появились у пользователей после прочтения многочисленных статей на тему «как заработать на блоге» или «бесплатном сайте». Вот, загоревшись идеей, они создавали свой блог, размещали на нем от 3 до 10 написанных собственноручно, а значит — уникальных во всех отношениях статей и... не заработав ни копейки, забрасывали его.

А ведь такие тексты прекрасно индексируются поисковыми машинными, и при этом редко служат источником для копипаста (копирования с ссылкой на первоисточник), а раз так, то существуют в Сети исключительно в единственном варианте.

Сообразив это, хакеры тотчас стали ломать такие забытые хозяевами блоги и сайты, копируют с них статьи, и тут же удаляя первоисточники. То есть в прямом смысле слова оставляя от взломанных блогов одно название. Украденные таким образом статьи они размещают на своих сайтах, обеспечивая себя бесплатным и уникальным контентом, или продают на биржах.

Вы же, вернувшись на свой сайт или блог, видите пустые страницы и решаете, что статьи удалены администрацией по причине того, что вы давно не были на своем сайте. И не знаете при этом, что и Народ и Блоггер берут перед вами обязательство «хранить ваши статьи вечно!!!».

Взлом страниц ЖЖ и прочих «живых журналов»

Тоже самое происходит и со статьями Живого Журнала и прочих подобных ресурсов. Ведь хакерам все равно, какой контент воровать — тематические статьи о ремонте, или записки наивной девочки из Волоколамска о несчастной любви. Главное — чтобы эти статьи индексировались роботами и считались уникальными. (А делается это для того, чтобы создавать сайты для размещения на них платных ссылок). Потому они так же охотятся на заброшенные страницы ЖЖ.

Воровство контента с многостраничных сайтов

Но иногда они могут поступать еще более цинично. Вы ведете многостраничный сайт, успев разместить такое количество постов, что у вас просто нет физической возможности отслеживать судьбу каждого. Но однажды вы находите в поисковых выдачах один свой пост, затем — другой, и все — на сторонних ресурсах, причем не только поданные так, будто разместившие их ресурсы считают эти посты своими, но и проиндексированные поисковыми машинами как авторские.

А вот что произошло — взломав ваш сайт, хакер на время запретил индексацию понравившейся ему статьи. Как только она выпала из индекса (при условии, что у нее нет копий на других сайтах) хакер тотчас продает ее или размещает у себя, а как только она индексируется поисковиками как «авторский материал», вновь возвращается к вам, разрешив ее индексацию.

Самое печальное при этом, что лучше бы он ее украл, удалив. А так подобная статья воспринимается поисковыми роботами как копипаст, что автоматически приводит к понижению ПР и ТИЦ вашего сайта. Ну а в случае, если у вас украдут более 50% статей, вы и вовсе можете оказаться под фильтром.

Что делать?

Если что-либо из описанного выше произошло с вами, то нет никакого смысла писать хозяевам сайта, разместившим украденный у вас контент, так как и они могли стать жертвами мошенников, купив ту или иную статью на какой-нибудь бирже под видом авторской. Они будут настаивать на своей правоте, вы — на своей, затеется никому не нужная переписка и обмен оскорблениями...

Лучше сразу писать в техническую поддержку Яндекса или Гугла, у которой есть все средства для того, чтобы восстановить, кому именно принадлежат авторские права на оспариваемый текст или фото. В своем письме опишите не только суть своей проблемы, но и обязательно поделитесь свои подозрениями о том, как именно у вас украли статью. Увы, но результаты подобные письма дают при обращении к Яндексу только в 1 случае из 5, а Гугл реагирует и того реже.

А раз так, то лучшее, что вы можете сделать — сменить пороли доступа к своему сайту и построить такую систему его защиты, которую впредь не сможет сломать ни один хакер.

Автор: Efrem2Efrem, специально для xBB.uz, 20.01.2012


Предыдущие публикации:

Биржа долевых инвестиций SIMEX.

Последнее редактирование: 2012-01-20 20:47:43

Метки материала: интернет, пиратство, охота, контент, интернет-пиратство, забытый контент, мошенничество в интернете, контент-проект, веб, web, internet, хакеры, инет, интернет сеть, интернет-бизнес, всемирная паутина, безопасность в сети, жизнь online, интернет и www


26 комментариев

Последние десять комментариев:

14.02.2016 08:49:36 #
Mozilla Firefox Гость Роман
лучшее, что вы можете сделать — сменить пороли доступа

Автор знает толк в порке Yes
25.01.2012 12:22:55 #
Mozilla Firefox dima
Если это повторение известных вещей написано автором своими словами, с уникальностью все будет в порядке. Алгоритм шинглов не умеет распознавать известность или неизвестность утверждений. Для него значимо только наличие/отсутствие последовательности слов. Поэтому, если научная статья изобилует точными цитатами, то ее уникальность будет мала.
24.01.2012 22:27:42 #
Mozilla Firefox Гость
>Программы проверки уникальности считают, что у таких текстов уникальность 0%.
 
Интересно, а что считают эти программы по поводу научных статей?
Поскольку статей, описывающих действительно достижения, единицы, а основная масса это повторение известных вещей, чтобы донести до читателя сущность того самого микроскопического достижения, которому посвящена статья.
23.01.2012 08:54:39 #
Mozilla Firefox dima
>Бредогенераторы можно разделить на четыре группы:
Группа номер 5 - повторять банальности.

Точно, забыл! Well
5. Миксеры. Берут кусочки текстов (абзацы, предложения) из разных источников и перемешивают их. Получается более читабельно, чем цепи Маркова или машинные переводы.
 
Программы проверки уникальности считают, что у таких текстов уникальность 0%. Поэтому таких текстов на статейном рынке нет. Однако в вебмастеринге этот приём применяется очень часто и очень успешно.
 
Статьи таким способом создавать бессмысленно, так как несвязность темы сразу выкупается, но взять, например, из БД названия товаров, их описания, цены, отзывы о товарах и т.п., а затем миксануть их на страницах сайта в разных сочетаниях - обычное дело. Посетители и поисковики считают, что находится на сайте интернет-магазина и просматривают прайс-лист, а реально - на псевдомагазине, созданном для Сапы.
23.01.2012 04:36:43 #
Mozilla Firefox Гость
>Бредогенераторы можно разделить на четыре группы:
Группа номер 5 - повторять банальности.
 

>Главный критерий статьи - интересность. Чтобы посетитель сказал "класс!" и возвращался на сайт регулярно.
 
А вы уверены что сможете отличить "класс" от бреда?
А если уверены что можете, то тогда скажите пойдет завтра фондовый рынок вверх или вниз? И я от вот не знаю.
Потому любая "аналитика" предсказывающая неважно что, главное побольше мудреных слов и графиков, сойдет.
Другой вариант - холивары.
Иными словами для бреда подойдет любая тематика, где нет единственно правильного мнения.
22.01.2012 05:35:49 #
Mozilla Firefox dima
И известны протоколы, по которым они это передают?
Тогда никуда и переходить не надо, достаточно генерить поток таких сообщений с разных IP адресов Well

Это называется накруткой пользовательских факторов (ПФ). Существуют даже специализированные сервисы, которые обещают накрутить их за деньги любому желающему.
 
Получается плохо. Еще задолго до введения ПФ в формулы ранжирования, поисковики разрабатывали способы распознавания скликивания, которое наносило ущерб их системам контекстной рекламы. И за многие годы в этом хорошо преуспели. Теперь накопленный опыт применяется в борьбе с накрутками ПФ.
21.01.2012 21:57:27 #
Mozilla Firefox vanilinkin
А если они ссылаются друг на друга? Допустим некая группа поставила это своей задачей.
Ссылки на забаненных или просто непосещаемых (неинтересных) страницах бесполезны, как сказано выше. Никто из участников такой группы в рейтинге поисковиков не поднимется (или поднимется совсем ненадолго), пусть хоть миллион ссылок друг на друга поставят в миллионе бредовых статей.
 
Мне попадаются в изрядном количестве, в том смысле что по форме оно не бред, а по содержанию наукообразная бессмыслица.
Даже если форма более менее человеческая, то посетители "проголосуют ногами", прекратят заходить - и прощай, рейтинг, навсегда.
 
Главный критерий статьи - интересность. Чтобы посетитель сказал "класс!" и возвращался на сайт регулярно. И друзьям-знакомым ссылки давал. Более эффективного способа продвижения не существует, а любые ухищрения давно известны и наказуемы.
21.01.2012 19:07:00 #
Mozilla Firefox Гость
И известны протоколы, по которым они это передают?
Тогда никуда и переходить не надо, достаточно генерить поток таких сообщений с разных IP адресов Well
21.01.2012 18:45:47 #
Mozilla Firefox dima
А как поисковики могут отследить переходы? Переход же осуществляет клиентский браузер.

Яндекс.Метрика, Гугл.Аналитикс, Яндекс.Бар, браузер Хром, сборки браузеров от Яндекса, Гугл.Адсенс, Яндекс.Директ, tns-counter...
21.01.2012 18:21:46 #
Mozilla Firefox Гость
>В поисковых системах реально очень мало бредотекстов.
Мне попадаются в изрядном количестве, в том смысле что по форме оно не бред, а по содержанию наукообразная бессмыслица.
 
>Ну и опять же, посетителей не приманить ни бредом, ни машинными переводами, ни пропущенным через синонимайзер контентом. Посетителю подавай только внятный текст, удобочитаемый. Иначе не вернётся, ссылкой не поделится и рейтинг в поисковой выдаче не повысит.
 
А если они ссылаются друг на друга? Допустим некая группа поставила это своей задачей.
 
>Кстати, если много ссылок на сайт разместить, но по ним никто никогда переходить не будет, то такие ссылки тоже бесполезны.
 
А как поисковики могут отследить переходы? Переход же осуществляет клиентский браузер.

Оставьте, пожалуйста, свой комментарий к публикации

Представиться как     Антибот:
   

Просьба не постить мусор. Если вы хотите потестить xBB, воспользуйтесь кнопкой предварительного просмотра на панели инструментов xBBEditor-а.


© 2007-2017, Дмитрий Скоробогатов.
Разрешается воспроизводить, распространять и/или изменять материалы сайта
в соответствии с условиями GNU Free Documentation License,
версии 1.2 или любой более поздней версии, опубликованной FSF,
если только иное не указано в самих материалах.