Google 2.0 och den semantiska webben
26 Jul 2010
Nyheter, Trender
Man brukar säga att den semantiska webben är nästa stora grej, eller Web 3.0 som en del försöker kalla det. Jag tror inte nödvändigtvis att den semantiska webben blir lika revolutionerande som den sociala webben(Web 2.0) utan snarare en kvalitetsförbättring av hur vi letar efter information. Kvaliteten med vilken vi hittar vad vi faktiskt söker efter kommer att öka. Indexeringen och taggning av innehåll på webben kommer att bli oäntligt mycket bättre. Men jag vet inte om det kvalificeras som nästa stora grej. Det innebär ett jättejobb på ”vår sida”(teknikerna och redaktörerna), som ”bara” resulterar i bättre sökresultat och metadata för användarna. Men man kan aldrig underskatta värdet av att tekniken anpassar sig till människan. Det är alltid bra. Men slutanvändarna kommer inte märka så stor skillnad tror jag.
För det är ungefär så jag tänker på den semantsika webben: datorns förmåga att bättre tänka som en människa. D.v.s. en sökning på Google betyder inte bara att Google, förenklat uttryckt, söker i en databastabell och visar ut tekniska sökträffar. Istället gör Google en analys och ”förstår” i vilket sammanhang användaren vill söka och kan på det sättet filtrera och vikta resultat på ett helt annat sätt. Genom att förstå att det är en sökning om recept kan begreppet ”Apple” betyda just frukt och inte datorer. De sökresultatet kan med gott samvete utelämnas. Den semantiska webben är förstås mycket mer än så men jag brukar använda det som belysande exempel.
Den första teknik jag stötte på som i någon påtaglig utsträckning pysslade med Semantisk webb var Open Calais(finns ännu inte, och kommer nog aldrig att lanseras, på svenska). Ett analysverktyg som automatiskt taggar upp en artikel i ämnesområden. Inte bara på sökfraser utan på innehållsmässiga sammanhang. Sedan kom Wolfram Alpha som tog steget än längre och erbjöd webbsökning i natural language. Man bara ställer en fråga och så räknar sökmotorn ut vilken information man kan tänkas söka och genererar ett datablad. En fantastiskt läcker söktjänst som är mer häftig än användbar men så länge man är ute efter teknisk data tycker jag den gör ett mycket bra jobb på att generera vad jag är ute efter.
Det vi alla väntar på är dock den dag Google börjar indexera innehåll än mer semantiskt än vad man gör idag. Redan idag korrigerar man felstavningar semantiskt. Se exemplena nedan. Beroende på vilket sammanhang föreslår den olika rättstavningar på samma felstavning som i exemplet nedan. I en fallet ersätts ”rlly” med ”really” och i andra fallet med ”rally”. Imponerande.


Jag gissar att man åstadkommer detta i exemplet ovan bland annat med hjälp av den översättningsteknik man använder i Google Wave eller Google Translate. Alltså genom statistiskt underlag gissa vilket or som skall fyllas i. Men nu har man tagit ett steg till genom köpet av Metaweb och deras teknik Freebase. När denna teknik väl är implementerat kan det nästan ses som ett paradigmskifte då Google kompletterar sina tekniska ordmatchningar med kontextmedvetna sökningar. Innan sökningen påbörjas görs en semantisk analys av sökfrasen för att ta reda på vad användaren faktiskt är ute efter och inte bara en lista över de bokstavskombinationer vi skall leta efter. Det låter enkelt men på baksidan måste ett jääätejobb göras för att detta skall fungera, men när det är klart kanske vi kan kalla det Google 2.0. Och när Google väl är igång med detta kommer vi som bloggare och sajtägare behöva anpassa vår SEO för att hjälpa Google på traven att beskriva vad våra texter verkligen handlar om, inte bara tagga och tekniskt anpassa som idag.
Tycker du att allt dravel om den semantiska webben känns nytt och krångligt kan du med fördel kolla in den här filmen. Jag tycker den gör ett bra jobb av att beskriva läget.

juli 30th, 2010 kl 7:18 e m
För mig som redan tänker världen i databasmodeller känns det som vi borde gjort såhär för länge sedan. Men ok, dags att börja nu då kanske!