Как получать данные с сайта на свой сайт:

Discussion in 'Песочница' started by inlanger, 12 Aug 2007.

  1. inlanger

    inlanger Elder - Старейшина

    Joined:
    7 Jan 2007
    Messages:
    985
    Likes Received:
    283
    Reputations:
    27
    Есть куча сайтов типа:ссылка на сайт. Где они берут данные? Или может подскажите как с этих сайтов эти данные взять.
     
  2. Piflit

    Piflit Banned

    Joined:
    11 Aug 2006
    Messages:
    1,249
    Likes Received:
    585
    Reputations:
    31
    парсинг. но брать чужое нехорошо. поэтому смотри канал "спорт"
     
  3. inlanger

    inlanger Elder - Старейшина

    Joined:
    7 Jan 2007
    Messages:
    985
    Likes Received:
    283
    Reputations:
    27
    Ну, понятно, что чужое брать нехорошо. Но какой файл парсить?
     
  4. Piflit

    Piflit Banned

    Joined:
    11 Aug 2006
    Messages:
    1,249
    Likes Received:
    585
    Reputations:
    31
    какой файл? не знаю, какой файл. код странички с результатами парсь
     
  5. inlanger

    inlanger Elder - Старейшина

    Joined:
    7 Jan 2007
    Messages:
    985
    Likes Received:
    283
    Reputations:
    27
    Эээ... разве это так делается? По-моему эти данные должны где-то быть, чтобы их все подобные сайты брали... Разве не так? Они же не в ручную пишут.
     
  6. Dr.Frank

    Dr.Frank Elder - Старейшина

    Joined:
    31 Jul 2002
    Messages:
    301
    Likes Received:
    72
    Reputations:
    12
    Ищи ссылку типа RSS, если нету, то скорее всего
     
  7. Dr.Frank

    Dr.Frank Elder - Старейшина

    Joined:
    31 Jul 2002
    Messages:
    301
    Likes Received:
    72
    Reputations:
    12
  8. inlanger

    inlanger Elder - Старейшина

    Joined:
    7 Jan 2007
    Messages:
    985
    Likes Received:
    283
    Reputations:
    27
    Мне не надо всю таблицу брать. Мне нужны отдельные матчи, которые меня интересуют.
     
  9. groundhog

    groundhog Elder - Старейшина

    Joined:
    12 May 2007
    Messages:
    1,159
    Likes Received:
    425
    Reputations:
    180
    Тебе же сказали - прасить...
     
  10. Raz0r

    Raz0r Elder - Старейшина

    Joined:
    7 Jan 2007
    Messages:
    126
    Likes Received:
    20
    Reputations:
    0
    А вручную дак никак? И как ты это будешь делать автоматом если тебя не все подряд интересует? Вручную делай, Кулибин епрст.
     
  11. inlanger

    inlanger Elder - Старейшина

    Joined:
    7 Jan 2007
    Messages:
    985
    Likes Received:
    283
    Reputations:
    27
    Как чужую страницу парсить?
     
  12. *D1VER

    *D1VER Elder - Старейшина

    Joined:
    5 Dec 2006
    Messages:
    108
    Likes Received:
    67
    Reputations:
    21
    мож так?
    $straniza=filegetcontents("http://site.ru/index.html");
    echo"$straniza";
     
  13. groundhog

    groundhog Elder - Старейшина

    Joined:
    12 May 2007
    Messages:
    1,159
    Likes Received:
    425
    Reputations:
    180
    *D1VER, у нормального прова отключён вызов filegetcontents с удалённой урлы... Так что на 99% это гиблое дело...

    vovan x100, если у тебя нормальный хостер, есть PHP с сокетами, то алгоритм прост:
    1) Посылаешь GET запрос через сокеты и получаешь содержимое страницы;
    2) С помощью регулярных выражений (или иными функциями) ищёшь/вырезаешь интересующие тебя врагменты;
    3) Найденные фрагменты выводишь/сохраняешь/обрабатываешь;

    Для примера привожу функцию на PHP для получения страницы:

    Дальше содержимое из $pageContent парсишь с нужными тебе критериями для поиска необходимой информации.
     
    #13 groundhog, 12 Aug 2007
    Last edited: 12 Aug 2007
    1 person likes this.
  14. inlanger

    inlanger Elder - Старейшина

    Joined:
    7 Jan 2007
    Messages:
    985
    Likes Received:
    283
    Reputations:
    27
    у сеюя на апаче такое не сотворишь?
     
  15. inlanger

    inlanger Elder - Старейшина

    Joined:
    7 Jan 2007
    Messages:
    985
    Likes Received:
    283
    Reputations:
    27
    белая страница...
     
  16. inlanger

    inlanger Elder - Старейшина

    Joined:
    7 Jan 2007
    Messages:
    985
    Likes Received:
    283
    Reputations:
    27
    во как матерится

    А на серваке хостера:
     
    #16 inlanger, 12 Aug 2007
    Last edited: 12 Aug 2007
  17. groundhog

    groundhog Elder - Старейшина

    Joined:
    12 May 2007
    Messages:
    1,159
    Likes Received:
    425
    Reputations:
    180
    У себя на апачах, это легко можно сотворить... Странно, проверил - всё работает... Вот код + пример вызова:
    А Internal Server Error может быть вызван отсутствием поддержки сокет на стороне провайдера... В любом случае, откатай сначала локально скрипт и убедись, что он работает... Проверь, правильно ли сделал вызов...
     
    1 person likes this.
  18. inlanger

    inlanger Elder - Старейшина

    Joined:
    7 Jan 2007
    Messages:
    985
    Likes Received:
    283
    Reputations:
    27
    Сокеты закрыты...
    есть ещё выход, кроме как хостера менять?
     
  19. inlanger

    inlanger Elder - Старейшина

    Joined:
    7 Jan 2007
    Messages:
    985
    Likes Received:
    283
    Reputations:
    27
    О-па... на другом хостинге заработало! А теперь тупой вопрос... Как парсить содержимое?
     
  20. NOmeR1

    NOmeR1 Everybody lies

    Joined:
    2 Jun 2006
    Messages:
    1,068
    Likes Received:
    783
    Reputations:
    213
    Ты PHP знаешь?

    Попробуй мою функцию.
    PHP:
    <?
    function 
    parse($site,$ot,$do)
    {
         
    $fp file_get_contents($site);
         
    preg_match_all('#'.$ot.'(.*?)'.$do.'#is'$fp$parsePREG_SET_ORDER);
         foreach(
    $parse as $out) {
              echo 
    $out[1];
         }
    }
    parse('сайт.ру','<ОТ>','</ДО>'); // 'сайт','от какого тега','до кокого тега'
    ?>
    P.S. Не проверял.
     
Loading...