Pretraživanje Web-a

Pretraživanje Web-a

Rad pretraživača može se opisat na sljedeći način. Web agent pretražuje bazu podataka, izlistava riječi koje zadovoljavaju upit (ključnu riječ) i zapisuje mjesto gdje ih je našao, indeksira pronađene riječi u indeks prema vlastitom sustavu prosudbe, kodira podatke na sigurno
mjesto i sprema podatke za uporabu[TEŽA2001]. Što se sprema u bazu podataka, ovisi o određenom pretraživaču. Neki indeksiraju svaku riječ iz Web dokumenata, a drugi indeksiraju samo naslov. Kada se provodi pretraživanje preko ključne riječi ili fraze, pretražuje se cijela baza podataka, ali u rezultatu se pokazuju samo Web stranice u kojima je nađena ta ključna riječ ili fraza

Danas je količina dostupnih sadržaja na Webu toliko velika da su pretraživački alati neophodni, ali isto tako neophodno je i njihovo usavršavanje. Trenutno je najveći problem količina dostupnih sadržaja i nemogućnost agenata da uključe sve dostupne sadržaje u bazu. Jedan korak u rješavanju tih problema je upotreba meta-pretraživača, koji koriste baze podataka različitih pretraživača, pa na taj način povećavaju vjerojatnost pronalaženja željenih informacija. Međutim upotreba meta-pretraživača ne rješava ostale probleme. Jedini način za rješavanje svih problema bi bila upotreba umjetne inteligencije. Inteligentni agenti za pretraživanje Web-a (eng. Intelligent Web searching agent) bi pretraživali Web samo u potrazi za korisnikovim upitom.

Razlikujemo dvije osnovne klase algoritama za pretraživanje:
1. SLIJEPO ILI NEINFORMIRANO PRETRAŽIVANJE (eng. blind search or uninformed search)
2. HEURISTIČKO ILI USMJERENO (INFORMIRANO) PRETRAŽIVANJE (eng. heuristic or informed search)

Slijepo pretraživanje je pretraživanje koje nema nikakvih informacija o broju koraka ili
vrijednosti putanje (vrijednost udaljenosti čvora od početnog čvora) od početnog do krajnjeg
stanja, tj. cilja. U ova pretraživanja spadaju:
− pretraživanja po dubini (eng. Depth-first search)
− pretraživanja po širini (eng. Breadth-first search)
− pretraživanja s jednolikom cijenom (eng. Uniform-cost search)
− pretraživanje do određene dubine (eng. Depth-limiting search)
− iterativno pretraživanje po dubini (eng. Iterative deeping search)
− dvosmjerno pretraživanje (eng. Bidirectional search)

Heurističko pretraživanje je pretraživanje koje ima dodatne informacije o cilju, cijenu putanje ili
broj koraka. Te informacije čine ova pretraživanja boljim od slijepih te im omogućuju gotovo
racionalno ponašanje. U ova pretraživanja spadaju:
− pretraživanje najboljim prvim (eng. Best first search)
− pretraživanje penjanjem (eng. Hill-climbing search)
− A* pretraživanje (eng. A* search)
− ograničeno pretraživanje po širini (eng. Beam search)
− IDA* pretraživanje (eng. Iterative deeping A* search)

Metode pretraživanja razmatraju se u okviru ovih kriterija: [ŠULJ2008]
– Potpunost (eng. completeness): da li strategija pretraživanja garantira pronalazak rješenja?
– Vremenska složenost (eng. time complexity): koliko je vremena potrebno za pronalazak
rješenja?
– Složenost prostora (eng. space complexity): koliko je memorije potrebno za izvođenje
pretraživanja?
– Optimalnost (eng. optimality): da li strategija pretraživanja pronalazi visoko kvalitetno
rješenje među više rješenja?

Nastavak dokumenta nalazi se na linku www.splithorizont.com/pdf/metode_pretrazivanja_weba.pdf