Den semantiske weben

World Wide Web (WWW) er en applikasjon som bruker TCP/IP protokollen for å knytte ulike PC-er sammen. TCP/IP frakter informasjonen mellom ulike klienter i form av Bytes uten å vite hva innholdet er i det som fraktes. WWW forholder også nøytral til innholdet i informasjonen som publiseres, og har i utgangspunktet bare oppgaven med å presentere informasjonen slik at det blir forståelig for mennesker. Den semantiske weben er ideen om en videreutvikling av WWW der det er meningen at også datamaskiner og applikasjoner skal kunne forstå innholdet i informasjonen som publiseres på Internett.

Grunnen til at vi trenger den semantiske weben, er et evigvarende problem, som vi mennesker har kjempet mot siden vi først begynte å produsere informasjon. Særlig påtagelig ble kanskje problemet etter at boktrykkerikunsten fikk sitt gjennombrudd i Europa rundt 1450, da Gutenberg introduserte sin oppfinnelse. Problemet var rett og slett en alt voksende informasjonsmengde som man prøvde å holde styr på. Vi fikk først biblioteker, så tidlig på 1900-tallet kom avanserte klassifikasjonssystemer, slik at det skulle bli lettere å finne frem blant alle publikasjonene. Under midten av 1900-tallet presenterer Vannevar Bush ideen om at man skulle kunne navigere med hjelp av assosiativ lenking. Denne teorien fikk stor gjennomslagskraft, i form av hypertekst, da Internett ble ett nytt medium for publisering av informasjon.

WWW slik vi kjenner den i dag baserer seg i hovedsak på Hypertext Markup Language (HTML). Dette er et oppmerkingsspråk for å presentere en tekst, samt at det er mulig å legge til multimedia elementer som bilder, video, lyd osv. Man representerer med andre ord dokumenter som mer eller mindre kun gir mening for mennesker, som har evnen til å sette det hun leser i en kontekst slik at det som står i dokumentet gir mening. Den semantiske weben innebærer at informasjon blir lagret i form av data, istedenfor i form av dokumenter slik vi er vant med i dag. Mest vanlig er det å lagre informasjon i formateringsspråket XML, enten som en separat fil eller i form av et XHTML dokument. I kombinasjon med for eksempel RDF og OWL, som er språk spesielt designet for å gjengi data, er det mulig for datamaskiner selv å forstå innholdet i en tekst.

Gevinsten med at datamaskinene selv skal kunne forstå innholdet er at man da kan automatisere prosesser som vi mennesker ellers vil måtte gjøre selv. Dessuten vil det bli mulig for søkemotorer å gi mer relevante treff, og dermed kan man behandle informasjonen på for eksempel Internett på en mer effektiv måte. Kritikken mot den semantiske weben går i hovedsak ut på det faktum at belastningen på nettet vil øke betraktelig når alle datamaskiner surfer på egen hånd, parallelt med oss mennesker. Dessuten er det også de som tviler på om den semantiske weben faktisk er teoretisk mulig å implementere.


Referanser:
Internett: Wikipedia, "Semantic web": http://en.wikipedia.org/wiki/Semantic_Web (lest 24.10.2008)
Internett: Frode Sørensen, "Neste generasjon web": http://www.ipkompetanse.no/IPakademiet/pdf/IPakademiet%20-%20del%2020.pdf (lest 24.10.2008)