Kako izgleda Google Indexing?
Iako svaka osoba upotrebljava Googleov pretraživač mnogo puta dnevno, nismo svjesni procesa koji on uključuje. Danas ćemo raspravljati o onome što se stalno događa čak i prije pretraživanja – a to je indeksiranje dostupnih internetskih stranica.
Što Google radi kada nitko ne gleda?
Google ima oko 92 % ukupnog tržišnog udjela među pretraživačima. Zbog toga se može reći da je globalno najpopularniji među njima. Uostalom teško je pronaći osobu koja ne upotrebljava usluge koje Google nudi. Ne govorimo samo o pretraživaču već i o Google Disku, Mapama, prevoditelju, pregledniku, multimedijskoj trgovini ili e-pošti.
Posebno nas zanima ono po čemu je Google postao poznat – razvoj metoda za katalogizaciju sadržaja objavljenog na internetskim stranicama, što je omogućilo oblikovanje najvećeg svjetskog pretraživača. To je isto kao i surfanje internetom. Glavni je razlog za to činjenica da bez Googlea cijela grana digitalnog marketinga putem interneta ne bi toliko napredovala (uz copywriting i pisanje sadržaja koji su njezini sastavni dijelovi).
Naravno, u vrijeme početaka Googlea (povratak u 1998.), bilo je manje internetskih stranica, a globalna mrežna struktura bila je prilično slaba. Mnoge stvari promijenile su se tijekom ove 22 godine – naravno, tehnologije kojima se Google koristi također su se razvile. Danas pretraživač dijeli vlastite metode i ideje objavljivanjem iscrpnih opisa algoritama kojima se nedavno koristio. Zahvaljujući tome mi znamo (iako nismo svjesni njegova koda) kako Google pretraživanje funkcionira i što se uzima u obzir.
S druge strane pretraživač ne ostaje aktivan samo kada korisnici traže nešto (iako prema globalnom intenzitetu istraživanja na internetu nikad ne bi uzeo stanku). Pretraživanju prethode zasebni procesi poznati kao indeksiranje.
Definicija indeksiranja
Indeksiranje je proces koji uključuje aktivnosti poput katalogiziranja i organiziranja informacija na internetskim stranicama.
Internet se mijenja i razvija dinamično, zbog čega je potrebno stalno ažurirati trenutnu strukturu i resurse. Neke internetske stranice ne postoje dan prije, dok se opseg sadržaja objavljenog na drugima može brzo promijeniti. Neke internetske stranice mogu nestati. Stoga se indeksiranje obavlja prije svakog istraživanja određenog upita. Njegov je učinak stvaranje – za kasniju upotrebu pretraživača – nešto poput indeksa knjige, što nam omogućava smještanje relevantnih informacija.
Internetske se stranice indeksiraju u skladu s riječima koje sadrže.
Da bi algoritmi prepoznali i katalogizirali sadržaj web stranice, potrebno je uzeti u obzir nekoliko čimbenika. Jedan je od najvažnijih odabir ključnih riječi koje signaliziraju tematski sadržaj. No da se sustav oslanjao samo na njih, preciznost takve radnje bila bi niska. Nakon svega zasićenost ključnim riječima trebala bi činiti 0,5 – 3 % ukupnog obujma teksta i, osim toga, ne smije biti nametljiva ili protiv stilskih pravila. To nije jedini kriterij.
Google upotrebljava Knowledge Graph. To je skup definicija i opisa činjenica iz određenih domena, međusobno i logički povezanih, što olakšava pristup informacijama. Zahvaljujući tome namjera pretraživanja određenog pojma i odabir rezultata točniji su i bolje razumljivi. Prilikom obrade korisničkih upita prilagođava ih određenom pitanju i traži internetske stranice koje sadrže sveobuhvatni, tematski presjek.
Indeksiranje je stoga poput čišćenja staza jer se temelji na stvaranju odgovarajuće baze podataka za pretraživanje.
Kako indeksirati?
Potrebno je koristiti se zbirkom prethodno katalogiziranih internetskih stranica i mapa stranica. Indeksiranje se obavlja pomoću robota koji se kreću s jedne lokacije na drugu putem poveznica koje upućuju na druge internetske stranice unutar jedne strukture i na vanjske internetske stranice.
Tijekom ovog procesa algoritmi određuju koje će se internetske stranice uključiti u stvaranje indeksa. Oni se uglavnom usredotočuju na internetske stranice koje se do sada nisu posjećivale, one koje su se promijenile i internetske stranice koje sadrže neaktivne poveznice. Sve se to radi u skladu s postupkom odlučivanja, čiji je cilj odrediti hoće li obujam informacija na internetskoj stranici biti dostupan i hoće liga pretraživač upotrebljavati u budućnosti.
Ako smo vlasnici internetske stranice, možemo utjecati na proces indeksiranja samostalno, na primjer isključivanjem određenog sadržaja ili preciziranjem kako bi se to trebalo učiniti. To se može postići putem alata koji pruža Google pretraživač, a zove se Search Console.
Indeksiranje – što slijedi?
Pretraživač kasnije upotrebljava gotovi indeks ili skup analogne strukture kako bi prikazao relevantne rezultate pretrage. Internet je skup bez nametnute strukture, stoga je indeksiranje potrebno svaki put kada se vrši pretraga.
Iako često prođe manje od jedne sekunde između tipkanja upita i dobivanja rezultata, mnoge se stvari odvijaju. Rad je pretraživača nesumnjivo zanimljivo i impresivno pitanje. Budući da ga svakodnevno upotrebljavamo, vrijedi znati što se događa tijekom opisanog procesa i zašto tako često moramo slušati o prikupljanju podataka koje provodi Google.
Sažetak
- Pretraživanje je prethodno popraćeno procesom nazvanim indeksiranje.
- Sastoji se u stvaranju završenog „indeksa”, koji je skup informacija dobivenih s internetskih stranica. Pretraživač ga upotrebljava kako bi olakšao pronalaženje odgovarajućeg odgovora ili rješenja na postavljeno pitanje.
- Pohranjeni podaci dobivaju se iz prethodno obavljenih postupaka i internetskih stranica koje su stvorili njihovi vlasnici.
- Ostajete neovisni i utječete na indeksiranje upotrebljavajući alate koje je Google pružio svojim korisnicima.
Odgovori