URL

 

Hvad er en URL?

URL står for Uniform Resource Locator (på dansk: Enhedsressourcefinder) og er en syntaks der beskriver adressen for en bestemt ressource på et computernetværk. Denne ressource er oftest en side på nettet, men kan også være en fil, en mail, en database eller specifik data i en database. Oftest bliver URL benyttet til at adressere websider på World Wide Web. Når man surfer rundt på nettet kan man se URL’en for den vilkårlige side man er på, oppe i toppen af browseren i adressefeltet.

Et eksempel på en URL er https://simplecode.dk/hvad-er-en-browser/. Denne URL kan indtastes i browserens adressefelt og vil føre til en artikel om browsere på denne hjemmeside.

Hvad er en URL?
Sådan ser en URL ud i en Edge-browser. URL’en kan ses i browserens søgefelt.

 

URI, URN og URL

En URL er den ene halvdel af en URI, som står for Uniform Resource Identifier (på dansk: uniform ressourceidentifikator). En URI er en syntaks som både kan identificere og adressere ressourcer på nettet. URI’en består af en URN (Uniform Resource Name), som identificerer ressourcen, og URL’en, som adresserer ressourcen. Derved kan man sige, at URN’en er i stand til at definere ressourcens identitet, mens URL’en er i stand til at finde ressourcen. Tilsammen udgør de en URI.

Hvordan de tre syntakser relaterer til hinanden er illustreret i nedenstående model:

URI

En URN kan f.eks. være det internationale standard bognummer, som enhver bog i verden er forsynet med, efter ISBN-standarden. Denne URN er i stand til at identificere enhver unik bog i verden, og kan f.eks. være ISBN 9788205248939, som fører til et unikt eksemplar af bogen Sult, skrevet af Knut Hamsun. URN’en er dermed i stand til at identificere bogen, men den er ikke i stand til at finde bogens lokation.

I denne artikel vil vi dog fokusere på URL, som er den mest velkendte og benyttede af de tre syntakser.

 

IP-adressen og URL’en

Hver enkel side på World Wide Web er tilknyttet en vilkårlig IP-adresse. F.eks. så har simplecode.dk IP-adressen 94.231.103.59. Denne IP-adresse kan man også søge på i browserens adressefelt for at komme ind på hjemmesiden. En URL fungerer som en stedfortræder for IP-adresser, da de er mere systematiske og langt nemmere at huske for mennesker. På den måde kan man betragte URL’en som et “kælenavn” til IP-adressen.

 

Domænet og URL’en

En hjemmesides domæne er ikke er det samme som en URL. En vilkårlig URL indeholder også domænet for hjemmesiden, men inkluderer også flere oplysninger, som f.eks. protokollen og filstien. Derved inkluderer en URL både hjemmesiden, men også mere specifikke oplysninger om hjemmesiden, bl.a. den vilkårlige side på hjemmesiden. Domænet for denne hjemmeside er simplecode.dk, men URL’en for hjemmesiden er https://simplecode.dk/.

Hvis man besøger en bestemt side på hjemmesiden, så vil sidens navn blive indikeret efter en skråstreg i URL’en, f.eks. https://simplecode.dk/hvad-er-gdpr/, hvor man kan læse, at sidens titel er skrevet efter domænenavnet, adskilt af en skråstreg.

Forskellen på domænet og URL’en kan også ses i nedenstående illustration:

Domæne og URL

Som det også kan ses i illustrationen, så kan man ikke bruge mellemrum i en URL. Derfor bliver mellemrummet erstattet med bindestreg (-).

 

Hvad består en URL af?

En URL er opbygget af forskellige elementer, som tilsammen leverer information til browseren om den side som man vil besøge på World Wide Web. Nogle af disse elementer skal inkluderes i URL’en for, at den virker. Andre er valgfrie.

Betragt nedenstående URL:

https://simplecode.dk:443/alt-hvad-du-skal-vide-om-soegemaskiner.html?nøgle1=værdi1&nøgle2=værdi2#Anker

Denne URL er opbygget af følgende elementer:

Hvad er en URL?

Disse elementer vil blive gennemgået i denne sektion. Oftest er det kun protokollen, domænenavnet og evt. filstien der skal inkluderes i URL’en for at den virker, men yderligere elementer kan give ekstra informationer som browseren kan bruge når den skal finde ressourcen. Der kan også være flere elementer i en URL end dem som man kan se i ovenstående URL, men de bliver ikke gennemgået i denne artikel, da de ikke er ligeså relevante.

 

Protokol

URL Protokol

Den første del af URL’en indikerer hvilken protokol der benyttes til kommunikationen på World Wide Web. Denne protokol definerer hvordan tekst, billeder og videoer bliver hentet ned fra hjemmesidens webserver til browseren. For de fleste hjemmesider er protokollen enten http (Hypertext Transfer Protocol) eller https (Hypertext Transfer Protocol Secure), som er en krypteret version af http. Dog kan det sagtens også være mindre kendte protokoller, såsom ftf, som bruges til filoverførsel, eller mailto, som bruges til at sende mails.

I eksemplet som er vist i denne artikel er protokollen https.

Disse protokoller som bestemmer hvordan data bruges på hjemmesider, ligger i det syvende lag i OSI-modellen. OSI-modellen er en oversigt over netværksprotokoller, som består af i alt syv forskellige lag.

URL’ens protokol efterfølges af et kolon (:) og to bindestreger (//), som bruges til at adskille protokollen fra det næste element: domænet.

 

Domæne

URL domæne

simplecode.dk er domænet i vores eksempel. Domænet indikerer den hjemmesiden som browseren skal hente. Domænet består af topdomænet, domænenavnet og eventuelle subdomæner.

 

Topdomæne

Topdomæner kaldes også for et niveau 1 domæne og er den del af domænenavnet som er længst til højre. I simplecode.dk er topdomænet .dk. Topdomænet kan enten være et landespecifikt topdomæne, kaldet ccTLD (Country code top-level domain), eller et generisk topdomæne, kaldet gTLD (Generic top-level domain).

Hvert land har et landespecifik topdomæne som består af to bogstaver. Danmarks topdomæne er .dk, Sveriges topdomæne er .se og Tysklands topdomæne er .de.

Generiske topdomæner kan benyttes af alle lande og er ofte opdelt i kategorier. F.eks. er .com-domænet for kommercielle virksomheder, .org-domænet er for organisationer og .info-domænet er for oplysningssider. Det er dog ikke et krav at hjemmesiderne skal høre ind under disse kategorier.

 

Domænenavn

Domænenavnet kaldes også for et niveau 2 domæne, efter topdomænet, som er niveau 1. I simplecode.dk er domænenavnet simplecode. Domænenavnet kan betragtes som den del af domænet der lægger navn til hjemmesiden, ligesom Facebook, Google og Twitter.

 

Subdomæne

Sammen med domænenavnet og topdomænet kan domænet også have et eller flere valgfrie subdomæner. www. er et subdomæne, som bruges til at indikere, at man søger efter en webadresse på World Wide Web, men et subdomæne er ikke nødvendigt at have med i domænet. I vores eksempel kan vi nemlig også se, at der ikke er noget subdomæne.

Man bruger ofte et subdomæne til at opdele en hjemmeside i flere kategorier. Wikipedia bruger subdomæner til at opdele hjemmesiden i forskellige sprog. Dvs. at domænet for den danske version af Wikipedia hedder da.wikipedia.org og den engelske version hedder en.wikipedia.org. Hvert subdomæne betragtes som en selvstændig hjemmeside.

 

Port

URL port

Den del af eksemplets URL som hedder :443 er en port. Ligesom protokollen, bestemmer porten, hvordan indhold fra nettet skal hentes ned i browseren. Porten er ofte udeladt af URL’en, hvis den bruger standardporten for HTTP- eller HTTPS-protokollen (for HTTP er porten 80 og for HTTPS er porten 443). Hvis dette ikke er tilfældet er porten altid inkluderet i URL’en.

 

Side-sti

URL side-sti

Side-stien angiver navnet på den specifikke side på hjemmesiden. Hvis man befinder sig på forsiden af denne hjemmeside, så vil URL’en blot være https://simplecode.dk uden en fil-sti. Men hvis man går ind på en af hjemmesidens sider (en underside), så vil det fremgå i URL’en som en fil-sti. F.eks. vil URL’en være https://simplecode.dk/hvad-er-gdpr/ hvis man klikker ind på den artikel som hedder “Hvad er GDPR?”. Hver underside til hjemmesiden er adskilt med en skråstreg, og der kan sagtens være mere end en underside – det vil sige, at en underside også sagtens kan have en underside.

Til den sidste underside fremgår sidens filtype også – i vores eksempel er filtypen HTML og derfor slutter side-stien med .html.

 

Parametre

URL parametre

Parametrene i eksemplet som er givet i artiklen er ?nøgle1=værdi1&nøgle2=værdi2. Begyndelsen på en parameterangivelse i en URL er angivet med et spørgsmålstegn (?). Parametre er opbygget af nøgle/værdi-par, som bruges i mange programmeringssprog. Et nøgle/værdi-par består af navnet på en nøgle og nøglens værdi. Man kunne sige at nøglen var en genstand, som f.eks. en blyant og værdien var antallet af blyanter som man har, eller at nøglen var et navn på en person og værdien var alderen på personen. Hvert enkelt nøgle/værdi-par er adskilt med et Og-tegn (&) i URL’en.

Parametre bruges til at overføre ekstra information til browseren som kan være relevant for siden. Hver hjemmeside har sine egne regler for, hvordan parametrene bliver benyttet, så den eneste måde hvorpå man kan være sikker på, hvad de skal bruges til er, at spørge hjemmesideejeren.

 

Anker

URL anker

Den sidste del af URL’en er ankeret. Et anker fungerer som et bogmærke og angiver et bestemt sted på siden. Det følgende link har ankeret “#Protokol”: https://simplecode.dk/hvad-er-en-url/#Protokol. Hvis du klikker på linket, så vil du blive ført op til det punkt i denne artikel der omhandler protokoller. Et anker begynder altid med et nummertegn (#).

Et anker er praktisk at benytte til sider der har en indholdsfortegnelse, da man så kan klikke på de forskellige kapitler i indholdsfortegnelsen og komme ned på det rigtige sted på siden.

Skriv et svar