Daca cauti ceva pe Internet, cu siguranta o sa folosesti un motor de cautare. Aproape instant acesta iti va cauta prin milioane de site-uri, si ti le va afisa pe cele mai relevante.

Binenteles, nu intodeauna gasesti pe loc ceea ce cauti, si uneori trebuie sa cauti putin mai mult pana sa gasesti informatia dorita, dar in mare parte motoarele de cautare fac o treaba excelenta, afisandu-ti cele mai relevante pagini.

Deci cum reusesc motoarele de cautare sa dea rezultate atat de relevante cand se confrunta cu milioane de site-uri din care trebuie sa sorteze rezultatele? Majoritatea urmeaza anumite reguli numite algoritm. Va prezentam principalii factori care influenteaza pozitiv pozitia in clasamentul Google, si binenteles in principalele motoarelor de cautare.

Top factori care influenteaza o clasare buna pe Google

  • cuvintele cheie utilizate in titlul paginilor
  • continutul text al linkurilor interne
  • popularitatea site-ului, data de linkurile externe de pe alte pagini (pagerank)
  • vechimea site-ului
  • structura site-ului si distributia popularitatii linkurilor interne
  • continut relevant cu linkurile primite de pe alte pagini
  • cuvintele cheie din continutul paginii
  • linkurile primite de pe “site-urile mari”
  • linkurile primite de pe site-urile relevante cu continutul paginii tale

Acesti pasti vor fi explicati mai in detaliu in urmatoarele posturi de pe blog.

Structura motoarelor de cautare

Exista mai multe feluri de organizare a site-urilor, dar in mare parte majoritatea motoarelor de cautare au cam aceeasi structura:

  • crawler si spider
  • index ( catalog )
  • rezultatele motoarelor de cautare

Crawler si Spider

Crawlerul este un program specializat care urmareste linkurile gasite pe alte pagini si directioneaza spider-ul spre acestea. Cand crawler-ul viziteaza un website, el cauta linkuri noi pe care le adauga in lista sa de URL-uri, apoi hotaraste unde va trimite spider-ul.

Schimbarea permanenta a continutului unei pagini web, precum si importanta documentelor aflate pe site, are o mare importanta in frecventa cu care crawler-ul va vizita site-ul. De aceea un site de stiri, care este actualizat la fiecare 5 minute va fi vizitat de catre crawler foarte des, chiar la 10 minute. Un site static, care este actualizat foarte rar, va fi vizitat de motoarele de cautare doar o data la o luna sau doua luni.

Spider-ul este un program automat, foarte asemanator unui browser care downloadeaza documentele spre care este directionat de catre crawler.

Index (catalog)

Indexul este locul (baza de date) unde sunt colectate datele descarcate de catre spider. Cand efectuam o cautare pe motoarele de cautare, defapt nu cautam pe web ci in baza de date a motoarelor de cautare. Indexul stocheaza website-urile si le organizeaza in functie de cuvintele cheie.

Rezultatele motoarelor de cautare

Dupa cum zice si numele, rezultatele unui motor de cautare sunt partea de interfata unde sunt listate site-urile cand facem o cautare. Ele genereaza rezultate din baza de date a motoarelor de cautare, hotaraste la ce cuvinte cheie sa fie listat website-ul, in functie de factorii care i-am enumerat mai sus.

Articole similare