Menneskets beste venn?

Publisert

Søkemotorar på nettet er blitt storforretning, men få tenkjer over at det ligg avanserte algoritmar bak eit internettsøk. Forskingsdirektør i Google, Monika Henzinger, vitja konferansen ALGO 2004 for å snakke om akkurat dette.

Henzinger var invitert til å halde opningsføredraget på konferansen tysdag, der ho tok for seg algoritmeproblem i søkemotorar. Per i dag har Google indeksert vel 4,2 mrd. nettsider, og har over 100 mill. søk per dag. Det stiller store krav til algoritmane som skal finne dei mest relevante treffa til søkeordet ditt.

– Mykje av søket handlar berre om å ha stor nok kapasitet. Det er rangeringa av treffa som er den vanskelege delen. Til dømes måtte vi lage ein definisjon av likskap, for å unngå å liste opp alle dokument som er heilt eller nesten like. Og søkemotoren må ta høgde for slikt som at når folk skriv ”Madonna” i søkefeltet, vil dei aller fleste ha popsongarinna, og ikkje jomfru Maria. Det må trefflista reflektere, forklarte Henzinger.

Rangering basert på anbefalingar

Google nyttar eit system basert på hyperlenkeanalyse for å sikre høg kvalitet på søkeresultatet. Ligg det ein peikar til ei nettside A på ei nettside B, er det rekna som ei anbefaling av nettside A frå forfattaren av B. Di fleire sider som har peikarar til A, di betre kjem A ut i søket.

I løpet av få år er ”å google” blitt eit heilt kurant verb. Sidan 2000 har selskapet vore den største søkemotoren på nettet, og vart for ein knapp månad sidan notert på teknologibørsen Nasdaq. Henzinger er klar over at selskapet sit med eit stort ansvar.

– Eg vonar vi er ei positiv makt for folk flest. Vi har eit ansvar for å gje folk best moglege søkeresultat. Vi prøver å betre kvaliteten, men har inga meining om innhaldet på sidene som kjem fram. Folk skal kunne stole på at rankinga frå Google er objektiv, seier ho.


Augneblikksbilete

– Har søkemotorar som Google noko ansvar for å vere med på å ta vare på verda si elektroniske historie?

– Det er eit spørsmål om kapasitet, og det verkar som om våre brukarar er mest interesserte i oppdatert informasjon. Difor har vi valt å berre bruke dei ”ferske” nettsidene, og ikkje eldre utgåver. Det finst organisasjonar som tek vare på elektronisk informasjon over tid, der du kan sjå den historiske utviklinga til ei nettside, til dømes. Men det er ofte komplisert for brukaren å finne fram. Vi har valt å berre bruke notidig informasjon.

– Kva med faglitteratur frå institusjonsarkiv, som ofte er dårleg dekka av søkemotorar?

– Det som er avgjerande, er at informasjonen er tilgjengeleg for søkemotoren via ein peikar. Ofte organiserer arkiva informasjonen på ein slik måte at du til dømes kjem til ei inngangsside der du må fylle ut eit skjema for å kome til den artikkelen du er ute etter. Då kan heller ikkje ein søkemotor finne resultatet direkte. Det er fleire måtar å løyse dette på, og det vil nok bli betre.


Trur på personlege søk

Henzinger ser for seg at i framtida vil brukarane få tilbod om ”personlege” søk, der søkemotoren etter kvart lærer kva preferansar du har, og brukar dette til å rangere treffa.

– Brukaren vil få moglegheit til å seie ”eg vil at over tid skal søkemotoren forstå at eg likar desse tinga og ikkje desse.” Det trur eg vil bli eit tilbod ved nettsøk generelt. Men det er viktig å hugse at dei aller fleste brukarane aldri vil nytte seg av slike tilbod, men berre halde seg til standardmetoden. Det gjeld å syte for at søkemotoren fungerer både for standardbrukaren og for dei meir sofistikerte. Vi prøver heile tida å gjere det enklare for folk. No må brukaren tenkje ”kva for ord kan finnast i det dokumentet som har svaret på det eg lurer på?”, og så må søkemotoren prøve å forstå kva du eigentleg vil ha tak i. Helst vil du jo berre kunne skrive inn spørsmålet ditt. Vi prøver heile tida å kome nærare det målet.

Meir enn halvparten av søka på Google skjer no på andre språk enn engelsk. Tysk er det nest største språket.

– Skandinavia er også svært godt representert på internett, mykje betre enn folketalet skulle tilseie. Vi har ein teori om at folk her ikkje har anna å gjere i dei lange vinterkveldane enn å sitte inne og lage nettsider, ler ho.

Sjølv er Monika Henzinger på veg tilbake til akademisk forsking. Frå januar tek ho til som professor ved det École Polytechnique Fédérale de Lausanne.

– Eg vil gjerne publisere meir enn eg gjer no. Google er veldig produktorientert.

Powered by Labrador CMS