защитить контент от копирования ботами парсерами

Discussion in 'PHP' started by GAiN, 6 Dec 2014.

  1. GAiN

    GAiN Elder - Старейшина

    Joined:
    2 Apr 2011
    Messages:
    2,528
    Likes Received:
    166
    Reputations:
    99
    Всем доброго времени суток.
    Чем можно защитить контент от копирования ? понятно что есть способы запрета выделения текста от людей, но основная проблема - это боты граббера, у которых useragent такой же как у людей, ip меняется
    и текст им доступен, так как исходный код страницы они могут прочесть.
    можно ли защититься на сайте с html разметкой ?
    знаю про способ текст превращяется в картинку, но насколько это прожорливо для хостинга превращать текст при обращении ?
    можно ли зашифровать код страницы, люди смогут читать текст, а js не выполнится у парсеров и текст они не получат ?
    можно ли как то сайт выводить во флеш ? не делать стили а всё вместе с дизайнов во флеш выводить и показывать ?
     
  2. yarbabin

    yarbabin HACKIN YO KUT

    Joined:
    21 Nov 2007
    Messages:
    1,664
    Likes Received:
    912
    Reputations:
    363
    а куки боты принимать могут? если нет, можно сделать проверку по кукам, это удобнее.
    если не обрабатывают js, то можно под него запихнуть.
    Code:
    <script type="text/javascript">
       $(document).ready(function() {
          $('#addcont').load('/file_with_text.html');
       });
    </script>
    
    затем в нужном месте вставляешь
    Code:
    <div id="addcont"></div>
     
    _________________________
  3. 1nf3c7ed

    1nf3c7ed Member

    Joined:
    8 Mar 2014
    Messages:
    25
    Likes Received:
    5
    Reputations:
    1
    да ничем, только морфировать постоянно структуру html чтобы задолбать разработчиков :D
     
  4. GAiN

    GAiN Elder - Старейшина

    Joined:
    2 Apr 2011
    Messages:
    2,528
    Likes Received:
    166
    Reputations:
    99
    некоторые боты могут читать куки, с js наверное у них посложнее, но контент они наверное умеют выдирать и если он будет даже в js контейнере размещён, разве что будет только подключаться извне через js
     
  5. roxblnfk

    roxblnfk Elder - Старейшина

    Joined:
    6 Feb 2010
    Messages:
    189
    Likes Received:
    42
    Reputations:
    19
    Заметно упрощается жизнь боту, т.к. качать контент можно прямо по ссылке из .load() :)
    Без кодирования по индивидуальному ключу бесполезно.

    а ещё динамический css для динамического html + динамический JS :D Тут скорее сам задолбаешься..

    Самый нормальный вариант, на мой взгляд, это прикрутить reCaptcha и, например, каждые n статей предлагать пройти проверку на робота. Ну а с недавними нововведениями в reCaptcha даже не придется вводить код каждый раз...
    Либо, если проблема в этом, то проводить проверку на бота при первом посещении и далее при повышенной интенсивности загрузок страниц. (это точно не поисковые боты? :) )
     
    #5 roxblnfk, 26 Dec 2014
    Last edited: 26 Dec 2014
Loading...