Kapitel 4 Befolkning

Antalet diagnostiserade cancerfall påverkas först och främst av befolkningen i regionen, dels dess antal men också i hög grad av dess ålderssammansättning.

Med “befolkning i regionen” avser vi folkbokförda på adress inom vårt geografiska område. Observera att detta inte per definition sammanfaller med vårdsökande vid regionens sjukhus. Eventuella skillnader bör dock (i detta sammanhang) kunna anses negligerbara.

Antalet folkbokföra i regionen kan skilja sig från dag till annan. En metod för årsskattning är att beräkna medelantalet över året. En annan vanlig metod är att addera antalet folkbokförda vid årets första och sista dag samt därefter dividera med 2. I en hypotetisk situation innebär detta att regionen kan ha en befolkning om två miljoner individer per första januari, få ett befolkningstillskott om, låt säga 10 miljoner individer, den 2 januari, därefter ha en konstant befolkning över året men en minskning med 11 miljoner per 30 december. Årets befolkning kommer då presenteras som 1,5 miljoner individer. Det bör förstås poängteras att ett dylikt scenario är ytterst osannolikt.

För att skatta kommande cancerincidens nyttjar vi dels observerad befolkningsstatistik (för att bygga modellen), dels prognostiserad befolkningsutveckling för kommande år (som underlag för prediktionen).

Ett första steg blir därför att inhämta sådan data.

4.1 Observerad befolkning

Sveriges observerade befolkningsmängd finns att hämta från Statistiska Centralbyrån (SCB) sedan 1968 (året efter införandet av dagens personnummerformat). Uppgifterna redovisas per:

  • område: kommun, län med mera
  • kön: man/kvinna
  • civilstånd: ogift, gift, frånskild, änka/änkling
  • ålder: som helår upp till 99 år, samt i en sammanslagen åldersgrupp för individer om 100 år och äldre.

Kön och civilstånd är ej av intresse för vår analys, varför antal aggregeras över dessa kategorier. Vi kommer i slutändan inte att redovisa prognoser per ålder men denna uppgift krävs interimt för själva predektionsmodellen (cancerincidens tenderar öka med ökad ålder).

Vi begränsar oss till de områden som av SCB benämns “Västra Götaland” respektive “Halland”. Dessa benämningar är inte fullt ut justerade för historiskt material, det vill säga för perioder då länsgränser sett annorlunda ut. Enligt privat korrespondens har ansats till sådan justering funnits men ej fullt ut genomförts.

För projektet hämtas befolkningsuppgifterna in maskinellt (via ett så kallat API; applikationsgränssnitt eller “Application Programming Interface”) men de är också åtkomliga manuellt för den intresserade via SCB:s statistikdatabas

4.2 Befolkningsprognos för riket

Från SCB finns också befolkningsprognoser för ganska många år framöver. Dessa uppgifter är aggregerade för hela riket. Här redovisas enskilda åldrar upp till 104 år (jämför med 99 år för observerad data enligt avsnitt 4.1). Även om vi ej är primärt intresserade av hela rikets data så inhämtas informationen för egen prognos av Halland enligt avsnitt 4.4 nedan.

SCB beskriver sin prognos så här

För att göra en befolkningsprognos utgår man från dagens befolkning. Sedan lägger man till de som föds och invandrar och drar ifrån de som utvandrar och dör. Sist men inte minst tar man hänsyn till att alla blir ett år äldre för varje år som går. För att räkna ut hur många som kommer att födas tittar SCB på hur många barn kvinnor i olika åldrar har fått de senaste åren. När vi ska beräkna hur många som kommer att dö framöver tittar vi på samma sätt på hur dödligheten sett ut och förändrats i olika åldrar den senaste tiden. Sedan gör vi en bedömning av hur det kommer att utvecklas i framtiden. Invandringen är svårast att förutse eftersom krig och oroligheter som blossar upp plötsligt i världen kan leda till att antalet människor som söker skydd i Sverige ökar snabbt. Utvandringen påverkas inte lika mycket, men om fler invandrar innebär det vanligtvis att fler lämnar landet.

Befolkningsuppgifter till denna analys inhämtas automatiserat via API men den intresserade kan också komma åt samma data manuellt via SCB:s statistikdatabas

4.3 Befolkningsprognos VGR

För regionala befolkningsprognoser krävs utöver antaganden ovan också information om eventuellt befolkningsomflyttning inom riket. Härvidlag är urbanisering eller omflyttningar på grund av arbetsmarknad, utbildningsmöjligheter eller bostadstillgång av intresse.

VGR har publicerat en sådan befolkningsprognos i sin öppna statistikdatabas på nätet. Här finns även prognoser för arbetsmarknadsregioner inkluderande vissa kommuner från Halland, varför uppgifter finns även för Kungsbacka och Varberg. För denna geografiska uppdelning finns prognos dock endast till och med år 2025. Detta bedömdes initialt som tillräckligt men under arbetets gång beslutades att tidsfönstret utökas med ytterligare fem år. För åren 2017-2030 finns en separat prognos men då bara för VGR.

Befolkningsuppgifter till denna analys inhämtas automatiserat via API men den intresserade kan också komma åt samma data manuellt via VGR:s statistikdatabas

Även i denna statistikdatabas finns uppgifter om historiskt observerad folkmängd men vi har valt att nyttja SCB:s databas för detta. Fördelen är att den går längre tillbaka i tiden. Nackdelen är enligt ovan att VGR de facto inte funnits så långt tillbaka som databasen förespeglar.

4.4 Befolkningsprognos Halland

Det finns inga tillämpliga befolkningsprognoser publicerade för Halland online. Enligt ovan (avsnitt 4.3) ingår dock Kungsbacka och Varberg i en arbetsmarknadsregion för vilka VGR publicerat en prognos (dock bara fram till 2025). Vi har istället valt att nyttja den längre tidsserie som finns för åren 2017 till 2030 men då med nackdelen att data för hela Halland måste skattas på eget bevåg.

För detta utgår vi från en predektionsmodell baserad på ålder, period och kohort, det vill säga samma modell som vi senare avser nyttja för själva cancerincidensprediktion (se avsnitt 2.2). Här betraktar vi hela rikets befolkning (dels historiskt observerad, dels predicerad för 2017-2030) som “person years at risk” (pyr). Istället för utfall “cancer” blir utfallet “folkbokförd i någon av de fyra kommunerna ovan”. Här inhämtas historiska data från SCB enligt ovan, varpå skillnader mellan den lokala befolkningstillväxten kan sättas i relation till den nationella dito. Vi antar sedan att detta mönster går igen i den framtida utvecklingen sett i relation till den redan prognostiserade utvecklingen för hela riket.

Det finns förstås många invändningar mot en sådan förenklad modell men just nu låter vi anta att detta är tillräckligt för våra syften.

4.5 Sammantagen befolkningsmängd i VGR och Halland

Vi adderar nu VGR:s publicerade skattningar till våra egna skattningar för Halland. Vi har i detta skede bara punktskattningar. Skattning av predektionsintervall kräver en fördjupad förståelse av de antaganden som också SCB och VGR:s analysenhet gjort för sin del av skattningen. Detta anses just nu ligga utanför vårt primära intresse.

Vår befolkningsprognos kan illustreras i figur 4.1 eller mer exakt i tabell 4.1

Observerad och prognostiserad befolkning i VGR och Halland.

Figure 4.1: Observerad och prognostiserad befolkning i VGR och Halland.

Table 4.1: Antal folkbokförda (i medeltal per femårsperiod) i VGR och Halland, observerat och prognostiserat 1981-2025.
år antal source
1981-1985 1 628 671 observerad
1986-1990 1 669 223 observerad
1991-1995 1 729 740 observerad
1996-2000 1 760 670 observerad
2001-2005 1 796 121 observerad
2006-2010 1 852 720 observerad
2011-2015 1 924 992 observerad
2016-2020 2 046 156 prognostiserad
2021-2025 2 165 206 prognostiserad
2026-2030 2 254 751 prognostiserad

Uppgifter predicerade längre fram i tiden är förstås behäftade med större osäkerhet än mer närliggande uppgifter.

Vi ser av figur och tabell att folkmängden i regionen ökat (och förväntas fortsatt öka) över tid. Fler individer totalt innebär förstås fler individer med risk att utveckla cancer. Om allt annat lika kan således ett ökat antal cancerfall förväntas baseras enbart på ett ökat befolkningstal.

4.6 Åldersfördelning

Risken för cancer ackumuleras över tid och är därmed (betydligt) högre för äldre åldersgrupper. Utöver absoluta befolkningstal är därmed också åldersfördelningen i regionen av intresse. Denna kan illustreras per tidsperiod och åldersgrupp enligt figur 4.2.

Vi nyttjar här en åldersindelning med femårsintervall upp till 84 års ålder samt en sammanslagen åldersgrupp därefter. Denna uppdelning skiljer sig åter från de ovan (avsnitt 4.1 respektive 4.2) men är den uppdelning som traditionellt används inom den så kallade APC-modellen (se avsnitt 2.2). Observera dock att vi på x-axeln endast markerar varannan åldersgrupp explicit, detta enbart av estetiska skäl (texten skulle annars bli oläslig).

Ålderfördelning över tid, observerad och prognostiserad för VGR och Halland. Vi ser att kurvans nedåtlutning tenderar att rätas upp över tid, vilket indikerar en åldrande befolkning.

Figure 4.2: Ålderfördelning över tid, observerad och prognostiserad för VGR och Halland. Vi ser att kurvans nedåtlutning tenderar att rätas upp över tid, vilket indikerar en åldrande befolkning.

Streckade linjer avser observationer och prediktioner av andelar för enskilda åldersgrupper. Studerar man exempelvis topparna av dessa kan noteras att dessa “flyttar sig åt höger” mellan tidsperioderna, det vill säga att enskilda födelsekohorter blir äldre över tid. Vi ser också att den nedåtgående slutet av kurvan (för äldre åldersgrupper) rätas upp allt mer efter tid. Den så kallade APC-modellen har använts en längre tid och för populationer med annan åldersfördelning än den svenska. Det har således varit historiskt relevant att sammanföra åldrar över 84 år. Med dagens svenska befolkning är detta allt mindre relevant, varför vi eventuellt skulle kunna använda en finare åldersfördelning även högre upp i åldersspannet. Detta låter sig dock inte göras i nuläget utan viss mjukvaruutveckling (vilket just nu får anses ligga utanför detta projekt).

Heldragna linjer markerar estimerade trendlinjer omringade av grå 95 procentniga konfidensintervall.

Vi kan notera att vi får en allt högre andel äldre individer över tid. Även detta bidrar alltså till potentiellt fler cancerfall.