Az online áruházak elemzése
Tehát most, hogy le a nagyon értelmező először írok a kódot (azok számára, akik kevés megértést megbirkózni anélkül, hogy a megjegyzések), majd elkezdik magyarázni a ravasz.
var lap = SpreadsheetApp.getActiveSheet ();
var tartomány = sheet.getRange ("A2: I5000");
var cell = range.getCell (startRow, 1);
var válasz = UrlFetchApp.fetch (url);
mert (var i = 1; i<=10;i++)

Jelenleg 2 funkció van, getconten és getPageContent. A getconten-ból átadjuk a szükséges adatokat, és futtatjuk a getPageContent függvényt, hogy elemezzük a getconten-ból átadott oldalt.
A getconten függvény: itt van egy hurok, amely megegyezik az ebben a részben szereplő oldalak számával. A ciklus minden egyes lépésénél linket küldünk az oldalra és a már feldolgozott termékek számára.
Tehát milyen linket kell beillesztenünk webhelyünkre? A legtöbb webhely hasonló struktúrával rendelkezik a site.ru / section /? Oldalak = 1 alatt a szóoldalon elrejtheti bármelyik szót a mi esetünkben, elindul, gyakran oldal. Néha egy webhely első oldalán, ahol ez a változó nincs jelen, egyszerűen csak át kell mennie a másodikra. A jobb megértés érdekében javaslom olvasni a GET kéréseket itt vagy a Google-on.
Formula 1 + 10 * (j-1) - van szükség annak érdekében, hogy rögzítse haladt, ahelyett, hogy felülírja a dokumentumot, ahol a 10 a bejegyzések száma (számlaszám az alapértelmezett bejegyzéseket frekvencián jobban menjen a kívánt oldalra egy másik böngészőt vagy! a privát lapon, akkor az oldalt pontosan úgy látja, ahogy a szkript látja).
A getPageContent funkció: itt a fő varázslat jön létre. Szerintem érdemes megmagyarázni csak a főbb pontokat, ha többet szeretne olvasni, akkor mindegyik funkció a Google-ban érdekelheti.
sheet.getRange ("A1: I5000") - itt választjuk azt a cellatartományt, amellyel dolgozni fogunk.
mert (var i = 1; i<=10;i++) - параметры цикла, где 10 см.формулу выше (!Внимание! цифры должны совпадать с формулой вышей).
A fő paramétereket állítottuk be, most készen állunk az elemzés konfigurálására.
További lépések azt jelentik, hogy a HTML alapfogalmai és az oldal forrásszövege van, ha nem, azt javasoljuk, hogy először olvasd el ezeket a dolgokat.
Így tehát a repülés elemzése:
Ahhoz, hogy beillesszen egy szöveget a cellába az oldalról, meg kell tudnunk a kezdeti pozícióját (kezdet) és a végét (végét). Ehhez egy egyedi sort találunk az elemhez, amelyet el akarunk távolítani, a termékkép esetén ez a karakterlánc
', vég) +50;
// start = textResp.indexOf (' ', start) +23;
// start = textResp.indexOf ('
a (var j = 1; j<=898;j++)
var cell = range.getCell (j, 1); |