Példa beállítás tartalmának import

Példa beállítás import hírek top.rbc.ru helyszínen

1) Válassza ki az új szalagot WPGrabber dugó, és a szalag neve írni a nevét az első import beállításokat. Írhat e paraméter, amit szeret, például: Breaking News RBC.

2) A típusú szalagot kell beállítani html

Példa beállítás tartalmának import

4) Ezután azt kell mondanunk egy olyan fontos paraméter a kódolás HTML-oldalakat.

Kódolás oldalt az oldal megtalálható az eredeti HTML-kódot.

Az oldal betöltését követően nyissa meg a forráskód (HTML-kód oldalakon).

A Google Chrome a böngésző, nyomja meg a Ctrl + U.

Példa beállítás tartalmának import

Firefox és az Internet Explorer a Ctrl + U működik ugyanúgy.

A nyílt forráskód keres egy sort:

Példa beállítás tartalmának import

Itt utf-8 csináltam a kódolás az oldalt! Mert úgy döntünk encoding paraméter HTML-oldal értékét UTF-8.

Bizonyos esetekben egy csomó kódot, hogy könnyebb megtalálni az összhangban van a referenciák, használja a keresési szót charset. Keresés a Google Chrome és más böngészők egyszerűen nyomja meg a Ctrl + F és adja meg a szót charset. A legvalószínűbb az első eredmény a forráskód található a húr meg kell adnia a kódolást.

Ismét megjegyezzük, hogy, mint az eredeti html-kódot oldal kódolását megadva:

Egyes oldalak, kódolás nincs megadva, majd próbálja meg: a kezdeti, vagy WINDOWS-1251.

5) Most meg kell határozni az egyik legfontosabb paraméter (paraméter: Template linkeket), amely kezdődik a linkgyűjtemény érdekes számunkra oldalakon szeretnénk importálni a webhelyen.

Annak érdekében, hogy megfelelően beállított paraméter sablon linkeket. először is meg kell nézni, hogy milyen linkeket a HTML forráskód az oldal.

Példa beállítás tartalmának import

Felhívjuk figyelmét, hogy nem szükséges a keresést a teljes szövegét a cím, lehet, hogy túl hosszú. Akkor lefoglalni egy kis részét, mint ebben a példában, és keresse meg ezt a részt a kimenetele a kódot.

Mivel ez a szöveg megtalálható a forráskód az oldal, nem csupán linkeket, hanem más helyeken, meg kell találnunk pontosan része a kód, hogy hol keressen a szöveg nyílt html-tag linkre: Példa beállítás tartalmának import

Most nézzük meg a linkeket, a többi hír:

Az összes fenti referenciák megfelelő a korábban leírt „verbális” sablont. Állítsa be a referencia sablont WPGrabber kell használni egy adott méret a leírás az ilyen minták (rendes vyrazheniyPCRE leírás formátuma PCRE on).

A reguláris kifejezések PCRE bármely nem üres karakterrel jelzi az alábbi konstrukciót \ S

Megjegyzés: a perjel \ előtt nagybetű S. A fordított perjel egy reguláris kifejezés felülírja a szokásos akció a karakter, írhatnánk egy szimbólum az S betű, és akkor még csak egy nagybetűvel a mi reguláris kifejezés. Azonban \ S - páros módon egyetlen karakter, kivéve a szóközt!

Mivel a változás a szó: textonlines. társadalomban. politika és a gazdaság állhat több karaktert (betűket a szó), meg kell valahogy határozni a mi tekintve a karakterek számát. Ehhez használja fogszabályozó.

például a kifejezés \ S azt jelenti, hogy pontosan 5 mb egymást követő nem szóköz karaktert.

Például a „hamburger” alá reguláris kifejezés \ S. de ez nem vonatkozik a kifejezést \ S. mert a szó burger 9 betű. 4 helyett.

Amellett, hogy a pontos megjelölése karakterek száma soronként, a reguláris kifejezések lehetővé teszi, hogy meghatározza egy sor karaktert, és például a következő kifejezéssel: \ S minden hosszúságú szavak 3-6 karakter (beleértve!).

Továbbá azt a képességét, hogy egy minimális száma soronkénti karakterek megadása nélkül a maximális, például: \ s - minden szó 4 karakteres, és így tovább.

Átírta a kezdeti része a sablon, akkor kap a következő:

Ebben a szakaszban írhatnánk az egész referencia minta formájában:

Újraírása kifejezést lépését követően ez számokat, és nem az összes karakter:

Ez a kifejezés könnyen beilleszthető a referencia sablon. kattintson az Apply gombra. és tárolása után a szalag beállításait, kattintson az Importálás gombra tesztet. meg kell győzni a helyességét egy reguláris kifejezés keresése hivatkozásokat a szövegben az oldalon.

Most vegye figyelembe, hogy a plugin talált egy sokkal linkek, mint amire szükségünk van. Hivatkozva referencia lista tartalmazza a szükségtelen minket linkek:

Példa beállítás tartalmának import

Továbbá, a rossz (nem dolgozik) összeköti, mint például:

Mikor kell felsorolni az előfordulása a különböző karakterek (a karakterkészlet) egy reguláris kifejezés, fel tudjuk használni szögletes zárójelben. Kifejezése a forma:

szó szerint azt jelenti: minden egy betűt vagy egy számot vagy több ilyen szimbólumok.

Például, a típusú expressziós (bármely két betű vagy szám, vagy betűk és számok és több hasonló szimbólumok):

de nem tartoznak a vonal típusát:

Így, ha átírjuk a kifejezést:

Ez megszűnik fogni szükségtelen és helytelen linkeket!

Beírása ez a kifejezés a sablon linkeket, kattintson az Alkalmaz, majd importálja a tesztet, és látni fogja, hogy a beépülő modul egy összesen 12 linkeket és ezek mind rendben!

Az biztos, hogy megy az oldal és úgy a kapcsolatok száma a hírek ellenőrzi a helyes hivatkozás sablon beállításait. A 10. oldalon, amellett, hogy a linkeket található az oldal közepén a mi sablon kaptunk 2 link található más részein az oldalt. A következő leckében talál információt, hogy hogyan válasszuk linkeket csak egy bizonyos részét a kezdőoldalt.

Figyelem! Ha az import teszt üzemmódban a képernyő talált linkek: 0 - további létrehozott más szalagos paraméterek gyakorlatilag mentes elmosta! Nem linkek hírek - nem importált bejegyzéseket WordPress.

És ha nem talál WPGrabber linkeket hírek - ez azt jelenti, hogy hibáztunk írásban egy reguláris kifejezés referencia minta vagy hibásan megadott paraméterek: URL index vagy kódoló HTML-oldalakat.

Egy másik kis pont a fontosságát írásban a szabályokat a reguláris kifejezések. A lényeg az, hogy a reguláris kifejezések PCRE méret, van egy speciális karakterek vagy más gyakran nevezik a vezérlő karakterek.

Ha írsz egy reguláris kifejezés például egy pontot (.) - ez nem jelenti a szó szoros értelmében egy egyszerű pont a szövegben. Pont a reguláris kifejezés - egy különleges karakter megjelölésével bármely karaktert, tsifernogo karakter, szóköz karaktert, és általában bármely más karakter. Ie pont a reguláris kifejezés - általában minden karaktert a szövegbe.

Így tehát a kifejezést:

Annak érdekében, hogy illesszék be a reguláris kifejezés egy pontot, meg kell, hogy ellenőrizzék karaktert, hogy egy backslash, azaz kifejezést \. Ez azt jelzi, elég a szokásos pont a szövegben.

Így a jobb mi sablon kell átírni a következő formában:

azaz menekülni minden belépési pont hivatalos jelképe.

Lehet kérdezni, hogy miért van a sablon, még a következő formában:

Dolgoztam sikeresen? A válasz egyszerű: egy pont a szabályos kifejezés, ahogy korábban írtam, a kifejezés bármely karakter, köztük egy egyszerű pont!

Ha lapozzunk az eredmény az import a vizsgálati szalag alatt a kijelzőn látni fogja az alábbi linkeken:

Példa beállítás tartalmának import

Mi nem határoznak meg mintavételi szabályok két főbb paramétereit WordPress bejegyzések - a címet és a szöveget.

6) Először Fejes - ami, ha az importáló a szalag fejléc, a WordPress bejegyzések (hozzászólások).

Ahhoz WPGrabber fejléc találtam a szövegben egy bizonyos híroldal, meg kell leírni azt a keresési mintát. Itt is a méret a reguláris kifejezések használjuk a leírásban a sablon linkeket.

Miután a hírek oldalon, nyissa meg a forráskódot (nyílt forráskód az oldal fentiek kombinációját használja a Ctrl + U). Végezzük el a keresést a címet a forráskód az oldal:

Példa beállítás tartalmának import

Ukrajnában kezdte a választásokat a Verhovna Rada. Policy. RosBusinessConsulting

de ne rohanjunk, hogy ezt a bejegyzést, mert benne van amellett, hogy a cím szövege „Ukrajnában megkezdődött a választásokat a Verhovna Rada,” van még egy további szöveget. „politika. RosBusinessConsulting”, amire nincs szükségünk a cím rekordokat.

Keressen egy tiszta bejegyzés fejléc nélkül további szavak előtt és után. Esetünkben ez a bejegyzés formájában található meg:

És még ennél is alacsonyabb:

Használhatja bármilyen egyértelmű belépési cím szövegét.

Most létre kell hoznunk egy reguláris kifejezést szöveget keresni az oldal fejlécében.
Az előző példában, akkor írj a következő kifejezést:

Emlékszel, hogy a lényeg - ez nem csak egy pont, és minden karakter egy reguláris kifejezés!

Azonban egy ilyen kifejezést visszatér hozzánk az egész sort, azaz a címben az anyag esik vonal formájában:

Csak azt akarjuk, hogy a szöveg „az Ukrajna megkezdte a választásokat a Verhovna Rada” között helyezkedik el, a jegyzések a tag.

Ahhoz, hogy kijelöl egy speciális minta a szöveget a húr, a reguláris kifejezések csoportosítása szimbólumok zárójelben () kell alkalmazni. Amelyen belül csak kell, hogy legyen, hogy a szöveg része, hogy szeretnénk választani egy húr.

Amellett, hogy a reguláris kifejezések, van egy fajta építési :. *?

Ez a kialakítás miatt akár (elnyeli) a tetszőleges számú karakter fel az ülésen a következő szimbólum után. Ie Például kifejezése a forma:.? * B - visszatér minden szó végén a levél b vagy amelynek belsejében egy levél b. Nézzük ezt a tervezéstől a kifejezést:

Másolás egy kifejezés a fejlécben sablon. Kattintson az Alkalmaz, majd az Importálás teszt.

Látjuk, hogy WPGrabber most találja a megfelelő fejlécet:

Példa beállítás tartalmának import

7) A következő fontos lépés, hogy megtaláljuk a fő oldalnyi szöveget.

Példa beállítás tartalmának import

Másolata az eredeti szöveg (nem feltétlenül az elejétől lehet a közepén a szöveget), nyissa meg a forráskód az oldal, és keresni azt a részét a szöveget. Fennáll annak a lehetősége, hogy ez a szöveg találkozunk a forráskód az oldal többször, mert fontos, hogy megtalálja a bejegyzést, ami az elején a szöveg az oldalon News. Hasonlítsa össze a szöveget a forráskód magán az oldalon, megtalálja a kezdete és vége.

Fontos feladat a helyes meghatározása a határokat a szöveg, hogy megtalálja egyedi darab HTML-kód, vagy bármilyen egyéb szerkezetek (a szöveg része, stb) előtt és után a teljes szövegét a híreket.

Így találjuk a kiindulási pont a szöveg:

Példa beállítás tartalmának import

A program megkezdése előtt a szöveg „előrehozott választásokat a Verhovna Rada Ukrajna tartják a magas szintű biztonsági intézkedéseket. Hány fog választani képviselők független” látjuk a címkét

.

Így teszünk a start pont területén egy teljes sor szöveget:

Következő, azt látjuk, a végén a szöveg a híreket. Ehhez, akkor is használja a kereső a szöveg szerint a hír az utolsó mondat:

Példa beállítás tartalmának import

Példa beállítás tartalmának import

Tehát a végpont teljes szöveg kerül beillesztésre:


Válasz Ön e-mail


Ugyanez a probléma, és kérje meg, hogy küldje el a döntést.

És ezért kérem, hogy tanácsot döntést:


És ezért kérem, hogy tanácsot döntést:

Hozzon létre egy szál a fórum.

Kapcsolódó cikkek