Парсер HTML'а сайта с PHP + Немного JS

Discussion in 'PHP' started by Filipp, 6 Aug 2015.

  1. Filipp

    Filipp Member

    Joined:
    10 May 2015
    Messages:
    246
    Likes Received:
    56
    Reputations:
    31
    Мне нужно получить HTML код файла test.html
    Code:
    <html>
    <body>
    <script language="javascript" charset="UTF-8" type="text/javascript" src="http://site.ru/id?=2"></script>
    </body>
    </html>
    Вся проблема состоит в том, что оно просто получает вот этот код, а мне нужно что бы он выполнился, и только потом записать его в переменную. Пробовал двумя способами:
    PHP:
    <?php
    $html 
    file_get_contents("site.ru"); // varian №1
    $handle curl_init();
        
    curl_setopt($handleCURLOPT_URL"http://localhost/test.php");
        
    curl_setopt($handleCURLOPT_RETURNTRANSFERtrue);
        
    $html curl_exec($handle); // variant №1
        
    curl_close($handle);
    Конечная целью является получение всех URL'ов с исходного кода, я даже регулярку написал для этого дела. Как с этим бороться?
     
  2. i~DOS

    i~DOS Member

    Joined:
    26 Mar 2009
    Messages:
    44
    Likes Received:
    40
    Reputations:
    4
    Чтобы выполнился javascript код, нужен движок, который будет этот самый код выполнять. Советую посмотреть в сторону phantomjs, casperjs и подобного.
     
    hesher likes this.
Loading...