Webmester jegyzete

Webhely indexelése keresőrobotokkal

Először is azt kell mondanom, hogy ha a kereső megkapta a felhasználó kérését, akkor nem keresi meg a teljes internetet a szükséges oldalak kereséséhez, hanem előzetesen összeszerelt adatbázisokra hivatkozik. Az indexek:. (leírást kell találni). Az index oldalak létrehozásához és frissítéséhez a kereső rendszeresen indít egy speciális programot (amelyet pók vagy botnak neveznek). Ez a program feltérképezi az internetes oldalakat, és a feltérképezés eredményei alapján elkészíti vagy frissíti az indexet.

Mi történik, ha egy felhasználó lekérdezéssel érkezik a keresőmotorhoz?

A keresőmotor hivatkozik az indexre, hogy összeállítsa a felhasználók lekérdezéséhez leginkább megfelelő oldalak listáját, ezeket "releváns lekérdezésnek" nevezik. Döntse el, hogy az indexben szereplő összes oldalszámnak megfelelő oldal megfelel-e a felhasználó lekérdezésének, a keresőmotor csak a kiadott lekérdezésre alapulhat. A lekérdezés egy vagy több szóból áll. Ezért az oldal relevánsabbnak tekinthető, ha a lekérdezésből annyi találatot tartalmaz, amennyire csak lehetséges. A SERP oldalainak rangsorolásához a keresőmotorok - az oldal szövegén kívül - a címkéken felsorolt szavakat használják , <Description>, <Keywords>. A webmesterek és optimalizálók gyorsan elsajátították a keresőmotorok oldalainak relevanciáját bizonyos lekérdezésekhez, növelve a kulcsszavak előfordulási gyakoriságát az oldal szövegében és a megadott címkékben. A kibocsátás jelentősége csökkent.</p> <p>Ezután (vagy még korábban, de ebben a pillanatban ez a pillanat nem fontos), a keresőmotorok - a keresési kulcsszavak előfordulásainak száma mellett - további kritériumokat kezdtek használni az oldal relevanciájának értékelésekor. Az egyik kritérium az oldal súlya vagy jelentősége. A fenti oldal a keresőmotor kimenetén található, annál nagyobb súlyt adott az adott keresőmotor. Az oldalak vagy oldalak jelentőségének kiszámításának gondolatát a tudományos publikációk gyakorlatából kölcsönzik.</p> <p>Az interneten az idézési indexek kiszámításának ötlete az egyes oldalak vagy webhelyek súlyainak felhasználásával valósul meg. A különböző keresőprogramok különböző módszereket használnak az oldalak súlyának kiszámításához. A Google legkeresettebb keresőmotorja és a Yandex keresőmotorra hivatkozó tárgymutató. Ugyanakkor a Yandex a webhely egészének fontosságára összpontosít, így a hivatkozási index (TCI) kiszámításra kerül a webhelyek számára. És a Google kiszámítja PR-indexét a webhely minden egyes oldalára vonatkozóan.</p> <p>Beszéljünk részletesebben a két indexről.</p> <h3>Mi a Page Rank?</h3> A PR-index kiszámításához használt algoritmusról bővebben lásd a cikket <ul> <li>Chris Ridings, fordította: A. Sadovsky, "Racionalizált PageRank, vagy mindaz, amit mindig szeretett volna tudni a PageRank-ról"</li> </ul> <h3>A Yandex keresőmotor idézettségi indexe (TCI)</h3> <p>Mivel a TCI csak a megadott internetes források súlyát veszi figyelembe, a TCI-t nem lehet "belső" linkekkel (az erőforrás egyik oldaláról másokra) növelni, vagy több hivatkozást helyezhet el ugyanazon vagy több oldalra ugyanaz a "külső" erőforrás. A webhely (könyvtárak) egyik szakaszának TIC-je kiszámításakor a webhely más részeitől a webhely egy szakaszára mutató linkek belsőnek minősülnek, ezért nem növelik a TCI-jét. Ebben az esetben a weboldal egyes szakaszaira mutató hivatkozásokat a teljes webhely TIC számításakor figyelembe veszik (kombinálva).</p><p>A tIC mérésekor a hivatkozások csak azokból a forrásokból származnak, amelyeket a Yandex indexelt, és amelyekre néz. A webhely TIC kiszámításánál nem veszi figyelembe a webes fórumok, fórumok, hálózati konferencia, nem moderált könyvtárak és egyéb olyan erőforrások, amelyekhez bárki linkeket adhat hozzá az erőforrás tulajdonosának ellenőrzése nélkül. A TIC kiszámításánál azonban a szabad tárhelyeken található helyekről származó hivatkozásokat nem veszi figyelembe, ha azokat a Yandex.Catalog nem tartalmazza. Más szavakkal, minden ilyen linknek nulla súlya van a Yandex számára.</p> <p>A tIC értékét minden olyan erőforrásra vonatkozóan kell kiszámítani, amelyet a Yandex által beolvasott összes erőforrás legalább egy alkalommal említett. Az erőforrás TCI megismeréséhez használhatja az interneten elérhető szolgáltatásokat webmestereknek, például a weboldalon. A Yandex.Catalog hivatkozási indexben leírt helyek az erőforrás leírásának mellet találhatók:</p> <h3>A robots.txt fájl használatával kizárja az oldalak indexelését</h3> <p>Nem feltétlenül érdemes megadni a webhely összes oldalát a keresőmotorok indexeléséhez. Például nem kell indexelni a CGI- vagy ISAPI-parancsfájlokat, valamint a statisztikai fájlokat vagy fájllistákat a mappákban. Az oldalak indexelésének megtagadását a titoktartási megfontolások vagy a különböző kódolású dokumentumok indexelésének vágya okozhatja. Minél kisebb a webhelyed, annál gyorsabban megkerülik a robot. Ezért egy webhely létrehozásakor érdemes gondolkodni annak megakadályozásával, hogy a keresőrobotok olyan dokumentumokat indexeljenek, amelyeknek nincs értelme indexelni. Ehhez egy robots.txt fájlt kell használni a webhely gyökérkönyvtárában.</p> <p>A fájl specifikáció részletes leírását a "Robotok kivételek standardja" dokumentumban találja. A legegyszerűbb formában (a parancsfájl kivételével) a robots.txt fájl így néz ki:</p> <p>A Felhasználó-ügynök mezővel rendelkező karakterlánc kötelező, és meg kell előznie a sorokat a Disallow mezővel.</p> <p>A robots.txt fájl üres sorai jelentősek, elkülönítik a különböző robotokhoz tartozó bejegyzéseket. Például a robots.txt fájl következő részében a Disallow: / forum sor figyelmen kívül hagyható, mivel nem volt sor a felhasználó-ügynök mezővel.</p> <p>A Disallow mezővel rendelkező sor megakadályozhatja a dokumentumok indexelését egyetlen előtagmal. Több előtag letiltásához több sort kell írni. Például, hogy megakadályozza a / cgi-bin és / fórumon induló dokumentumok indexelését, meg kell adnia.</p> <p>És a következő töredék helytelen lesz</p> <p>A Disallow mezőben szereplő sorok nem abszolút, hanem relatív előtagokat írnak. Vagyis a fájl:</p> <p>tiltja a "*" jelzéssel kezdődő dokumentumok indexelését (ami természetesen nem létezik), de a fájl:</p> <p>megakadályozza az egész webhely indexelését.</p> <p>Ha nem tudja létrehozni / módosítani a robots.txt fájlt, akkor csak egy további címkét kell hozzáadnia <МЕТА> az oldal HTML kódjában (a címkén belül) <HEAD>):</p> <p>Ezt a dokumentumot szintén nem fogják indexelni. A címkét is használhatja</p> <p>A dokumentum egyes töredékeinek indexelésének megakadályozásához jelölje meg őket címkével <NOINDEX> </NOINDEX> Most, hogy az összes fejléc megfelel az oldalak tartalmának, minden oldalon tartalmaz egy leírást és kulcsszavakat, és minden kép megjelölt, és egyes dokumentumok vagy részei indexelése tilos, elkezdheti regisztrálni a webhelyet a keresőmotorba.</p> <h3>Noindex és nofollow használatával</h3> <p>Az oldal egy részének indexelésének megakadályozásához létezik egy noindex címke.</p> <p>A noindex címkét csak a Yandex és a Rambler keresőmotorai érzékelik, más keresőmotorok, köztük a Google is, figyelmen kívül hagyják. A noindex tag használható a Robots meta tagben.</p> Mikor kell használni a noindex címkét: <ul> <li>1) Zárja le a számlálók kódját az indexelésből;</li> <li>2) Kijelenti a kimenő hivatkozásokat az indexelésből, amikor nem szeretné, hogy a keresőmotorok vagy linkcserék figyelembe vegyék őket.</li> <li>3) Zárja be a noindex címkét olyan információkkal, amelyeknek az indexelésnek nincs értelme állandó változás miatt.</li> <li>4) Zárja be a duplikált tartalom indexelését.</li> </ul> <p>Ha nem szeretné bezárni a hivatkozást az indexelésből (és néha szükséged van a bejáró követésére), használhatja a rel = "nofollow" attribútumot.</p> <p>A nofollow attribútumot fel kell használni minden olyan linkre, amely más oldalakhoz vezet (ha nem az Ön webhelye, és nem szeretné átadni nekik az oldal súlyát). A saját oldalaira mutató linkekhez ezt az attribútumot nem szabad használni.</p> <p>A nofollow attribútum a robots meta tagben is használható.</p> <h3>Hasznos források</h3> <h4>Kapcsolódó cikkek</h4> <ul> <li> <p><a href="/szakerto-203/a-lecke-absztraktja-a-temarol-allampolgar-es-diak.html">A lecke absztraktja a témáról Állampolgár és diák vagyok</a></p> </li> <li> <p><a href="/szakerto-203/a-beszed-fejlodesenek-lecke-elokeszlto-csoport-az.html">A beszéd fejlődésének lecke (előkészítő csoport) az absztrakt témájáról</a></p> </li> <li> <p><a href="/szakerto-203/a-7-evfolyamon-tanulo-tanorakon-klvuli-tevekenyseg.html">A 7. évfolyamon tanuló tanórákon kívüli tevékenység körvonala</a></p> </li> </ul> </div> <div class="extra"> <div class="info"><a href="/szakerto-203/hagyomanyos-baba-tavaszi-labu.html">előző</a> ◈ <a href="/szakerto-203/hol-panaszkodni-az-alapkezelo-tarsasag-panaszarol.html">a következő</a></div> <div class="clear"></div> </div> </article> </div> </div> </div> </div> <div id="sidebar" class="col-1-3"> <div class="wrap-col"> <div class="box"> <div class="content"> </div> </div> </div> </div> </div> </div> </section> <footer> <div class="wrap-footer pominodiko"> <div class="row"> <div class="col-1-1"> <div class="wrap-col"> <div class="box"> <div class="content"> </div> </div> </div> </div> </div> </div> <div class="copyright"> <h4>Hasznos cikkek</h4> <p> <li><a href="/szakerto-117/mark-haval-mondani-helyesen-ellen-a-szabalyok.html">Mark HAVAL mondani helyesen ellen a szabályok, Autoworld - minden, ami autó</a></li> <li><a href="/szakerto-204/savanyu-uborka-konzervdobozban-mint-hordo-recept.html">Savanyú uborka konzervdobozban, mint hordó - recept egy fotóval</a></li> <li><a href="/szakerto-199/a-kifejezesrol-csokolozas-hamutartoval.html">A kifejezésről - csókolózás hamutartóval</a></li> <li><a href="/articles/hogyan-keszltsunk-egy-tegla-ablaknyllas-meleg.html">Hogyan készítsünk egy tégla ablaknyílás, meleg otthon</a></li> <li><a href="/szakerto-153/narancs-kulinaris-enciklopedia.html">Narancs - Kulináris Enciklopédia</a></li> <li><a href="/articles/ragyog-fogsor.html">ragyog fogsor</a></li> <li><a href="/szakerto-151/hajhullas-noknel.html">Hajhullás nőknél</a></li> </p> <p>Copyright © 2025</p> </div> <script> new Image().src = "https://counter.yadro.ru/hit;adolfru?r"+ escape(document.referrer)+((typeof(screen)=="undefined")?"": ";s"+screen.width+"*"+screen.height+"*"+(screen.colorDepth? screen.colorDepth:screen.pixelDepth))+";u"+escape(document.URL)+ ";h"+escape(document.title.substring(0,150))+ ";"+Math.random();</script> </footer></div> </body> </html>