Комплексный маркетинг сайта: продвижение сайта, контекстная реклама, соц. сети, аналитика. От 15.000 рублей в месяц.
Главная » Полезные статьи » Программирование (статьи) » Парсинг через Google.Docs

Парсинг через Google.Docs

Скрипт будет брать ссылку из первой ячейки и поставлять во вторую что-то из сграбленного контента.

Создаём google spreadsheet.

В столбик A:A вставляем по вертикали ссылки.

В столбик B:B будет писаться спарсенная инфа.

Открываем "Инструменты -- редактор скриптов"

Вставляем туда код ниже. В данной ситуации воровать будем определённый table.

function getPageContent() {
var i=1;
var options = {
'muteHttpExceptions': true
};

var sheet = SpreadsheetApp.getActiveSheet();
var range = sheet.getRange("A1:B100");
var cell = range.getCell(i, 1);

for (i;i<=100;i++){
var url=cell.getDisplayValue();
var response = UrlFetchApp.fetch(url,options);
var textResp = response.getContentText();

var start=0, end=0, table="";

start = textResp.indexOf('<table id="t01">',0);

if(start>10){ end = textResp.indexOf('</table>',start)+8;
table=textResp.substring(start,end);
cell=cell.offset(0, 1);
cell.setValue(table);
cell=cell.offset(0, -1);
}
cell=cell.offset(1, 0);
}

}

Во всех статьях в коде заменены:

[ на &#91;

{ на &#123;

< на &123;

Звоните! +7 (812) 914-41-56

Заказать эту или любую другую услугу вы можете на странице контактов.