Kapittel 3 Nettsidestruktur

3.1 Hva er en nettside?

Før vi går videre, kan det være nyttig å forstå hva en nettside egentlig er. Et nettsted er et område på nettet, for eksempel www.ssb.no. Innenfor nettstedet er det flere nettsider, f. eks. www.ssb.no/innrapportering og www.ssb.no/arbeid-og-lonn. Disse nettsidene er stort sett skrevet i kodespråket HTML, som står for Hyper Text Markup Language. Det er dette språket vi bruker for å hente ut informasjon fra nettsidene. Mange nettsider bygger på andre språk også, blant annet CSS og Javascript, som muliggjør mer avansert design og funksjonalitet. Disse språkene kommer vi tilbake til senere.

Nettstedet kjører på en server. Når man skal sette opp en nettside, må noen “hoste” den, som vil si at nettstedet kjører på en server. Hvem som helst kan sette opp en server, men det går også an å “leie” servere av andre. Å bygge en nettside regnes gjerne som en utviklingsjobb, mens å passe på en server regnes som en driftsjobb. For å oversette HTML, CSS, Javascript og hva annet som bygger opp nettsiden til et bilde som vi ser, går informasjonen gjennom en web browser. Dette kan for eksempel være Chrome, Firefox eller Explorer.

De som bygger nettsider snakker også ofte om “frontend” og “backend”.

  • Frontend: Den delen av nettsiden som bruker interagerer med. Noen av de viktigste frontend-språkene er HTML, CSS og Javascript.

  • Backend: Alle tingene som jobber i bakgrunnen for å få apper og websider til å fungere, for eksempel databaser og script. Dette kodes for eksempel i SQL, SAS, Python, R, Java eller C++.

Vi er først og fremst opptatt av “frontend”-delen av nettsidene når vi jobber med webscraping, for det er denne delen som brukerne av nettsidene interagerer med.