Väestölaskenan menetelmiä

Viljelimme joitakin keskeisiä väestötieteen käsitteitä kirjoitussarjassa Sympathy for the Devil. Tässä liitteessä pyritään antamaan jonkinlainen yleiskuva niistä. Lähestymistapamme oli perusluonteeltaan demograafinen eli pyrkimys luoda kvantitatiivinen arvio väestökadosta sekä Lon Nolin että Pol Potin aikakaudella laskennallisin keinoin unohtamatta kuitenkaan tunneetuja historiallisia tosiasioita.

Väestön kokoa voidaan ennustaa ja projektoida useammallakin erilaisella tavalla. Menetelmät ulottuvat yksinkertaisista ekstrapolaatioista hyvin mutkikkaisiin monia muuttujia huomioiviin malleihin. Mutkikkaimmissa malleissa otetaan huomioon kymmenittäin demograafisia, taloudellisia ja ympäristötekijöitä. Nämä mutkikkaammat mallit tulevat esiin kun halutaan tutkia väestöä laajemmin, nähdä yhteyksiä numeeristen arviointien ja erilaisten sosiaalisen, kulttuurillisten ja taloudellisten tekijöiden välillä. Esimerkiksi jälkimmäisistä lähestymistavoista ovat pohdiskelut siitä, miksi monissa länsimaissa väestö supistuu, väestön hedelmällisyys taantuu tai kysymys miksi elinajanodotteella on suuria eroja eri maiden välillä tai kysymys onko maahanmuutto vastaus Euroopan ”väestöongelmaan” eli eurooppalaisen väestön trendiin supistua. Puhtaasti väestömäärän keskittyvät laskelmat tulevat esille kun halutaan kohdistaa kustannuksia tiettyyn väestön osaan esim. heidän koulutuksensa kehittämiseen tai pohtia ikääntymisen vaikutuksia koko väestöön tai kuten tässä haluamme tietää mikä oli väestömäärä Kambodzhan kussakin 70-luvun vauhdikkaassa käänteessä.

Erityisesti kehitysmaissa ei ole olemassa keskitettyä jatkuvaa järjestelmää kansan koon laskemiseksi. Näissä tehdään myös harvakseltaan väestölaskentaa. Asioita mutkistaa edelleen näissä maissa suuret yht’äkkisesti kehittyvät kuolleisuuskriisit kuten epidemiaksi kehittyvät sairaudet, suuret kuivuuskaudet, sodat jne. puhumattakaan korruptiosta ja muista talouden vakauteen syvästi vaikuttavista tekijöistä. Sihanoukin, Lon Nolin ja Pol Potin Kambodzha ei ollut mitenkään poikkeuksellinen tässä. Siksi väestön laskenta onkin hyvin haastellinen tehtävä ja tarjoaa monia mahdollisuuksia virhetulkintoihin ja spekulaatioihin kuten olemme jo havainneet blogissamme.

Väestötieteilijät usein erottavat toisistaan väestön projektion ja väestömäärän ennustamisen toisistaan. Väestön projektiolla tulevaisuuteen (tai menneisyyteen) tarkoitetaan laskennallista menettelyä, jolla pyritään laskemaan väestön koko ja rakenne tietyssä hetkessä kun tunnetaan nämä seikat toisessa hetkessä ja tiedetään miten kokoon vaikuttavat tekijät esiintyvät. Moniin tarkoituksiin riittää pelkästään tietää väestön koko ja toisinaan taasen muodostuu tieto väestön rakenteesta tärkeäksi. Rakenteella tarkoitetaan usein väestön jakautumaa iän ja sukupuolen mukaan, usein taasen tarkastellaan väestön maantieteellistä jakaumaa rakenteellisena seikkana. Joihinkin tarkoituksiin taasen avioliiton status, koulutus tai taloudellinen toimeliaisuus ovat myös tärkeitä rakenteellisia tekijöitä. Väestöprojektioita usein lasketaan nykyisestä hetkestä tuleviin hetkiin, mutta monissa sovelluksissa taasen joudutaan projektoimaan taaksepäin. Taaksepäin projektiossa olemme kiinnostuneet siitä, mikä oli väestön koko ja rakenne aikaisemmin.

Entä väestömäärän ennustaminen? Sillä taasen tarkoitetaan projektiota, joka pohjautuu tiettyihin olettamuksiin, joiden arvellaan tuottavan todennäköisimmät ennusteet tulevaisuudesta. Siispä ennusteet ovat projektioita mutta kaikki projektiot eivät ole ennusteita. Läheisesti ennusteisiin liittyy skenaarion käsite. Tällä taasen tarkoitetaan ”jos … niin ...” ajattelua. Usein meillä on useita eri vaihtoehtoisia skenaarioita. Esimerkiksi voidaan kehittää väestön koulutusta eri tavoilla, tällöin saattaa olla kiinnostavana seikkana, jonkun skenaarioiden tuottama näkemys elinkeinorakenteen muuttumisesta tulevaisuudessa alueellisesti väestön kehittymisen myötä. Esimerkiksi monissa kehitysmaissa on rajoitettu määrä kansanterveyteen käytettyjä pääomia ja reusursseja. Kansaa saattaa riivata lukuisat eri sairaudet kuten tuberkuloosi, lavantauti, malaria ja AIDS sekä paikallisesti kuivuusjaksot. Nyt joudutaan etsimään eri vaihtoehtoisia kustannuksiltaan erilaisia skenaarioita pääomien ja resurssien optimaaliselle käytölle, jotta koko kansakunnan kärsimys (kokonaisuutena) olisi mahdollisimman pieni. Näin ennusteilla on laajat sovellusalueet.

Väestöprojektioiden laskemiseksi voidaan menetelmät jakaa kahteen luokkaan, joita kutsutaan totaalimenetelmiksi ja kohortti komponentti menetelmiksi. Tässä keskitytään pääasiassa kohortti-komponenttimalliin ja sivuutamme kokonaan matemaattisesti huomattavasti kehittyneemmät lähestymistavat. Näitä viimeksi mainittuja ovat esimerkiksi erilaiset differentiaaliyhtälöiden ratkaisujen tuomat mallit.

Tasapainoyhtälö

Väestölaskennan ehkä perustavanlaatuisin yhtälö on ns. tasapainoyhtälö (balancing equation). Tämä kuvaa mikä on kansan koko tietyllä hetkellä kun toisella hetkellä se tiedetään ja tunnetaan syntyvyys, kuolleisuus sekä migraatio. Kun merkitsemme väestöä ajanhetkellä t N(t):llä, ja aikaisempaa ajanhetkeä t – x, syntymät aikavälillä t - x (esim. vuosi) B(t-x,t):llä, kuolleet samalla aikavälillä D(t-x,t) ja lopulta migraatiota M(t-x,t) saadaan kansan kooksi hetkellä t:

\[ \overline N(t) = \overline N(t-x) + \overline B(t-x,t) – \overline D(t-x,t) + \overline M(t-x,t) \]

Migraatio koostuu kahdesta komponentista, joita ovat sisäänmuutto \( \overline M_s \) ja poismuutto \( \overline M_p \).

\[ \overline M(t-x,t) = \overline M_s(t-x,t) – \overline M_p(t-x,t)\]

Vaikka merkitsemme tasapainoyhtölömme vektorimuoisena (jonka elementteinä on komponetti kohortti ikäluokat) niin sitä voidaan toki käyttää myös skalaarimuodossa, jonka tekijöinä on yksinkertaiset luvut.

Kasvunopeus

Kun monissa maissa joudutaan laskemaan kansan koko harvakseltaan, niin väestömäärän laskemiseksi vuositasolla turvaudutaan usein likimääräisiin arvioihin. Näissä tapauksissa on kansan kasvunopeus r, kasvu-% keskeinen mitta vaikkakin hyvin karkea. Se kertoo miten kasakunta kasvaa (tai supistuu) tietyllä aikajaksolla. Tämän komponenttina ovat syntyvyys (CBR) ja kuolleisuus (CDR) ja migraatio. Näillä tarkoitetaan seuraavaa:

CDR Kuolleisuus, Crude Death Rate CDR määritellään seuraavasti ^[207]: Se on väestön mittaluku joka ilmoittaa tietyssä alueessa (kuten valtiossa) kuolleiden määrän tuhatta asukasta kohden. Laskennassa käytetään väestön kokona saman alueen keskivuoden väestön kokoa (laskentavuonna).

CBR Syntyvyys, Crude Birth Rate määritellään vastaavasti väestön mittalukuna, joka ilmoittaa tietyssä alueessa syntyneiden määrän tuhatta asukasta kohden. Väestön kokona käytetään kuten CDR: laskennassa.

Nyt saadaan kansan kasvunopeudeksi laskettua kaavalla kun migraatio on nolla:

\[r = {(CBR – CDR) \over 100} \]
Kun tunnetaan kasvunopeus, niin väestölaskenan välivuosina voidaan stabiileissa yhteiskunnissa laskea kansan koolle karkea likiarvo korkoa korkoa periaatteella:

\[N(t) = N(t - x)*(1 + r)^n\]
missä N(t) on väestö hetkellä t, N(t - x) väestö hetkellä t - x, r vuotuinen väestön kasvuprosentti ja n laskentaperiodi vuosissa. Menettely antaa vain likimääräisiä arvioita monistakin syistä. Ensinnäkin siinä ei ole otettu mitenkään huomioon hedelmällisen väestön osuuden suuruutta, toiseksi monet yhteiskunnat eivät ole kuolleisuuden, syntyvyyden, terveydenhoidon ja koulutuksen suhteen stabiileja, joten kasvuprosenttikin vaihtelee vuodesta toiseen. Lopulta väestön ikäjakaumaa ei ole myöskään otettu huomioon tässä. Kun CIA arvioi Kambodzhan väestömäärää sekä Lon Nolin että Pol Potin aikakaudella käyttivät he tämäntyyppistä kasvunopeus laskelmia ^[147].

Vähiten kehittyneissä maissa r on yleensä 2.5 %, kehittyvissä maissa 1,48 % ja kehittyneissä maissa 0.30 %. Tänään koko maailman kasvuprosentti on pienentynyt olleen luokkaa 1.07%. Vaikka kehitys on 70 luvun puolivälistä lähtien ollut ilahduttavaa, niin silti 1% maailman väestön vuotuinen kasvu on liikaa kun väestö silloin kaksinkertaistuu 70 vuodessa. Kun vuonna 1974 maailman väestön kasvuprosentti oli huikeat 2 % sai tämä väestötieteilijän Coalen toteamaan: 200 vuodessa väestöä on niin paljon, että maapallon jokaisella neliöjalalla on yksi ihminen, 6 000 vuoden kuluttua väestö kasvaa niin nopeasti, että se täyttää pallon jonka säde kasvaa valon nopeutta nopeammin. Tietenkään tämä ei ole mahdollista vaan enemmin tai myöhemmin ihmiskunta kohtaa koko olemassaoloaan ravistelevan kriisin.

Komponentti-kohorttimalli

Väestötieteessä on hyvin yleinen ns. komponentti kohorttimalli. Tässä väestö on jaettu sukupuolen mukaan eri ikäryhmiin. Tavallista on jakaa väestö joko 1- tai 5 vuotisiin ryhmiin ( 0 - 4, 5 – 9, 10 – 14 jne). Usein 0 - 4 vuotiaissa erotetaan aliryhmänä imeväisikäiset eli alle 1 vuotiaat. Mallin graafista kuvaajaa usein kutsutaan pyramidimalliksi kun kukin kohortti sukupuolen mukaan kuvataan vaakasuorana pylväänä ja näitä pylväitä on ikäluokkien mukaan pinottu päällekkäin nuorimmasta vanhempaan. Kuvaaja muistuttaa kehitys- ja kehittyvissä maissa, pyramidia kun on alhaalta leveämpi supistuen vanhempia ikäluokkia kohden. Komponentti-kohorttimalli on keskeinen kun halutaan ennustaa väestön kehitystä tulevaisuuteen ja tutkia väestön elinoloja menneisyydessä. Menneisyyden alhaiset elinajat näkyvät selvästi pyramidissa vääristyminä, suuret kuolleisuuskriisit näkyvät epäluonnollisen pieninä vaakapylväinä. Samoin jos terveysolot ovat suhteellisen stabiileja, niin pyramidista voidaan päätellä, miten väestö tulee kasvamaan kun tietty väestönosa saavuttaa hedelmällisen iän ja osa vastaavasti poistuu siitä. Komponentti kohorttimalli on keskeinen väestötieteilijöiden käyttämä työkalu muttei kuitenkaan ainoa. Sen pohjalta tehdyt ennusteet ovat matematiikaltaan kohtalaisen yksinkertaisia vaikka numeromääriltään massiivisia.

Tyypillinen esimerkki koko väestön komponentti-kohorttimallista on vuoden 1962 Kambodzhan väestölaskenan tulos:

Kohortti	Kaikki	Miehet	Naiset
0	241 309	122 398	118 911
1-4	787 541	399 354	388 187
(0-4)	(1 028 851)	(521 752)	(507 098)
5-9	885 220	445 900	439 320
10-14	706 798	356 880	349 918
15-19	522 013	259 727	262 286
20-24	455 440	224 455	230 985
25-29	414 051	200 979	213 072
30-34	367 015	182 369	184 646
35-39	309 494	154 312	155 182
40-44	250 489	124 825	125 664
45-49	219 700	109 652	110 048
50-54	178 162	89 036	89 126
55-59	141 055	70 556	70 499
60-64	104 121	51 964	52 157
65-69	69 334	34 370	34 964
70-75	40 962	19 755	21 207
75-79	21 768	10 305	11 463
80-84	9 453	4 009	5 444
85+	4 846	2 093	2 753
Yhteensä	5 728 772	2 862 939	2 865 832

Laskentamenettely

Kohortti-komponenttimalli laajentaa tasapainoyhtälöämme kuhunkin ikäluokkaan. Sen avulla voidaan laskea väestön kehittyminen vuosi vuodelta. Seikka perustuu siihen tunnettuun tosiasiaan, että kun vuosi kuluu niin jokainen populaation jäsen on vuoden vanhempi. Niinpä 5 vuoden jälkeen 0 - 4 kohortista selviytyneet kuuluvat 5 – 9 kohorttiin ja jälleen 5 vuoden jälkeen selviytyneet kuuluvat 10 – 14 kohorttiin jne. Samoin syntymien myötä kohortiin 0 – 4 tulee uusia jäseniä jne. Näin voimme soveltaa vuosi vuodelta, ikäkohortti kohortilta laskentamalleja syntyvyydestä ja kuolleisuudesta. Näitä laskentamalleja taasen voimme muuntaa sitä mukaan kun olosuhteet muuttuvat.

Kun tietyn ikäiset naiset saavat enimmillään lapsia jonain vuonna niin yleensä seuraavana vuonna samanikäiset saavat myös eniten lapsia. Kuolemien ja syntymien ikäspesifiin muotoon tulee hyvin verkkaisesti muutoksia elintason, teveysolosuhteiden ja koulutuksen myötä. Komponentti kohorttimallissa on myös mahdollista laskea kohtalaisen nopeasti eri kriisien vaikutus väestön kokoon.

Väestön projektio tietyn aikajakson (esim. 10 tai 15 vuotta) puitteissa etenee seuraavin osalaskelmin eri laskentapisteiden välissä kun käytetään komponentti kohorttimallia:

Askel 1) Määritellään laskennan aloituspiste esimerkikksi väestön kohortti komponnettijakauma väestölaskennan tuloksiin nojautuen (Sympathy for Devil 1- 6 lähtökohta oli vuoden 1962 laskenta)

Askel 2) Lasketaan kuinka moni kussakin kohortissa tulee selviytymään seuraavaan laskentapisteeseen saakka. Tässä laskennassa tuonnempana esitettävät ns. elinaikataulut ovat merkittäviä apuvälineitä.

Askel 3) Lisätään kuhunkin kohorttiin vastaavaan sisäänmuutajien kohortin väestö, poismuuttajien tapauksessa vähennetään.

Askel 4) Lasketaan kuinka monta syntymää tulee tapahtumaan seuraavaan laskentapisteeseen saakka eritelään pojat ja tytöt omiin ryhmiinsä.

Askel 5) Lasketaan elinaikataulujen avulla kuinka moni näistä syntymistä on vielä elävinä seuraavassa laskentapisteessä, myös tässä otetaan myös huomioon migraation vaikutus.

Askel 6) Toistetaan vaiheet 2 – 5 seuraavaan laskentapisteeseen jne.

Tässä on tärkeätä huomata, että väestö on rakenteeltaan lopulta dynaminen, joten kussakin laskentavälissä hedelmällisyys, kuolleisuus ja migraatio voivat vaihdella hyvinkin laajassa skaalassa. Näin laskenta on huomattavasti joustavampi kuin puhdas kasvunopeusmalli (laskennan yksityiskohtia kts vaikkapa UNFPA:n ja IUSSP:n julkaisua Population Analysis … ^[210])

Kun yllä staattisessa kasvunopeusmallissa korvasimme syntymät CBR:llä ja kuolemat CDR:llä niin nyt syntymille vuorostaan käytetään apuna synnyttäneiden äitien ikäryhmittäistä hedelmällisyyttä ASFR:ää jolla saadaan laskettua syntyneitä lapsia äidin iän mukaan jaoteltuna ja kuolemia taasen mallinnetaan elinaikatauluilla. Näistä keskeisiä käsitteitä pohdimme hieman seuraavassa.

ASFR

Ikäryhmittäisellä hedelmällisyysluvulla ASFR (Age Specific Fertility Rate) tarkoitetaan elävänä syntyneiden lasten määrää tuhatta naista kohden tietyssä ikäryhmässä ja maantietellisessä alueessa sekä tietyn ajanjakson puitteissa. Se lasketaan siis laskemalla tiettyyn ikäkohorttiin kuuluvien naisten saamien elävänä syntyneiden lasten määrä jaettuna samaan kohorttiin kuuluvien naisten määrällä kerrottuna tuhannella. Siis esimerkiksi jos tietyssä maassa 20 – 24 vuotiaat naiset saavat yhteensä 72 000 elävänä syntynyttä lasta, jos samaan kohorttiin kuuluvia naisia on vaikkapa 310 tuhatta niin tämän ikäryhmän ASFR on 232.3 syntymää tuhatta naista kohden (72 000/310 000)*1000 = 232.3.

ASFR voidaan laskea kylläkin kutakin ikävuotta kohden mutta tavallisimmin se lasketaan 5 vuotisjaksoina naisten ollessa hedelmällisiä eli 5 vuotislle ikäkohorteille vuosina 15 – 49 (15-19, 20- 24, …, 45-49).

Vaikka ihmisten käyttäytyminen on näennäisesti satunnaista, niin ASFR on samankaltainen vuodesta toiseen. Aina samaan ikäkohorttiin kuuluvat naiset saavat yleensä ASFR:n osoittaman luvun lapsia hyvin säännönmukaisesti. Muutokset tapahtuvat hyvin hitaasti. Esimerkissämme ikäkohorttiin 20 - 24 naiset saavat mitä todennäjköisimmin seuraavana vuonna myös 232.3 lasta tuhatta naista kohden, samanverran sitä seuraavana jne. Näin voimme laskea hyvinkin tarkasti vuosien vieriessä kuinka paljon naiset saavat kussakin iässä lapsia.

ASFR on väestötieteessä tärkeä suure sikäli että todennäköisyys saada lapsia vaihtelee iän myötä. Esimerkiksi postauksessa Sympathyy for Devil pohdimme vuosien 1962 ja 1998 väestölaskennan tuloksia ja piirsimme oheisen kuvan mukaisen ASFR:n kummaltakin väestölaskennan tuloksista (x-akselilla äidin ikä on 5 vuotisen kohortin päätösikä siis esim 24 vuotta vastaa 20 – 24 ikäisten kohortin ASFR:ää)..

Kuvaajista selvästi näemme, että syntyneiden lasten lukumäärä oli suurimmillaan äidin kuuluessa ikäkohorttiin 25 – 29 vuotta. Samoin näemme että maksimi syntyvyyden laskeneen vuoden 1962 tasosta 322 tuonne 260 syntymään ikäkohortin 1000 naista kohden. Samoin näemme että koko maan ASFR vuonna 1998 oli laskenut samalle tasolle mitä se oli Phnom Penhissä vuonna 1962. Vaikka syntyvien lasten määrä pienentyi vuodesta 1962 vuoteen 1998 niin kuvaajan muoto säilyy samana. Vain hiljakseen kuvaajan huippu on siirtymässä vanhempiin kohortteihin päin sitä mukaan kun elämäntavat, elintaso ja koulutus kehittyvät. Laskelmissamme muodon oletettiin olevan samankaltainen läpi koko 70 luvun. Kun laskelmissamme hedelmällisyyden puolittuessa niin oletimme hedelmällisyyden puolittuvan samanlailla kussakin kohortissa. Olettamuksemme oli sikäli epärealistinen, että sisällisodassa sotatoimet kohdistuivat ensisijaisesti hedelmällisessä iässä olevaan väestönosaan (15 – 24 vuotiaat). Näitä kuoli paljon, sekä miehiä että naisia, joten tiukasti yksiavioisessa yhteiskunnassa ASFR:n muoto myös vääristyi siitä, mitä se oli 60 luvun alussa ja oli 90 luvun lopussa. Emme kuitenkaan varmuudella tiedä millainen tämä vääristymä oli, joten olettamuksemme samanmuotoisuudesta läpi koko 70 luvun on lievästi epärealistinen mutta paremman puutteessa emme muutakaan voineet käyttää.

ASFR:n käyttö on kohtalaisen suoraviivainen. Kun tiedetään tietyn kohortin naisten määrä ja vastaavan kohortin ASFR niin saadaan syntyvien vauvojen määrä, edellyttäen ettei tulevia äitejä kuole ajanjaksolla paljon, kertomalla ASFR todennäköisyydet äitien lukumäärällä (ja jakamalla 1000:lla). Esimerkiksi Kambodzhan vuoden 62 tapauksessa saadaan laadittua oheinen taulukko.

kohortti	naisia	ASFR	lapsia	poikia	tyttöjä
15-19	262 286	102	26 753	13 568	13 185
20-24	230 985	306	70 681	35 846	34 836
25-29	213 072	323	68 822	34 903	33 919
30-34	184 646	295	54 471	27 625	26 846
35-39	155 182	233	36 157	18 337	17 820
40-44	125 664	118	14 828	7 520	7 308
45-49	110 048	25	2 751	1 395	1 356
50-54	89 126	7	624	316	307

Ensimmäisessä sarakkeessa esitetään ikäkohortti, toisessa naisten lukumäärä, kolmannessa ASFR (synnytystodennäköisyys) ja neljännessä vauvojen lukumäärä. Lopulta saadaan eroteltua toisistaan tyttöjen ja poikien lukumäärä kun tiedetään sukupuolisuhde syntymässä, joka vuoden 1962 väestölaskennassa oli 1,029

TFR

Kokonaishedelmällisyysluvulla TFR eli lapsiluvun odotteella tarkoitetaan lukua, joka kertoo kuinka monta elävää lasta nainen synnyttäisi koko elämänsä aikana, jos ikäryhmittäiset hedelmällisyysluvut (ASFR) pysyisivät samana laskennan perusteena olevana vuonna. Toisin sanoen suure kuvaa sitä lapsimäärää, jonka naiset keskimäärin saavat elinaikanaan. TFR laskettaessa oletetaan, että kussakin iässä he synnyttävät yhtä usein kuin sen ikäiset naiset synnyttävät arviota tehtäessä. TFR saadaan helposti laskettua ASFR:stä. Kunkin ikäkohortin (15 – 49) tuhannella jaettu ASFR lasketaan yhteen ja kerrotaan viidellä. Tämä kerroin 5 tulee siitä, että kohortin koko on 5 vuotta. Yllä esitetyn Kambodzhan tapauksessa saadaan laskettua että TFR vuonna 1962 oli 7.07.

Kansakunta ei kasva eikä supistu kun sen TFR on 2.1, lukua sanotaan usein hedelmällisyyden korvaustasoksi. Kaksi tulee siitä, että vanhempia tarvitaan yleensä 2 ja 0.1 taasen siitä, että 0.1 osa väestöstä menehtyy ennen aikuistumistaan eli ennen kuin saavuttaa hedelmällisen iän. Maailmanlaajuisesti TFR on pudonnut tasoon 2.5. Saharan eteläpuolisessa Afrikassa se on yhä vielä sangen korkea eli 5.1. TFR on suurempi kehitysmaissa kuin kehittyneissä teollisuusmaissa. Suomessa se on hälyttävän alhainen eli 1.54. Kansamme supistuu siis kiihtyvällä nopeudella, joten saavuttaaksemme nykyisen elintason myös tulevaisuudessa pitäisi lapsia syntyä enemmän tai tuoda siirtolaisia laajemmin. Jos nykyinen meno jatkuu niin suomalaiset eivät saa enää yhtään lasta 2030 luvulla.

Elinaikataulut

No hyvä tasapinoyhtälössämme toinen komponentti oli kuolleisuus. Kysytään: Miten väestö kuolee, kussakin ikäkohortissa? Väestölaskennallisissa sovelluksissa elinaikataulut antavat kohtalaisen hyvän kuvan asiasta. Elinaikataulujen lisäksi on vuosien vieriessä kehitetty monia muitakin matemaattisesti hieman mutkikkaampiakin menetelmiä ^[208]. Sivuutamme nämä tässä. Oheinen tarkastelu pohjautuu lähteisiin ^{[207] - [213]}.

Elinaikataulu (life table) on väestölaskennassa, biologisissa ja epidomologisssa tieteissä ym. laskennan apuvälineenä käytetty taulukko, jolla kuvataan tarkastelun alaisten eliöiden (väestön, mikrobien, eläinten tms) todennäköisyyksiä päätyä tarkastelujakson puitteissa johonkin päätetapahtumaan, kuten kuolemaan. Elinaikataulut ovat myös löytäneet tiensä sosiaaliturvaan ja vakuutusmatemaattisiin sovelluksiin. Näissä päätetapahtuma ei aina ole ihmisen kuolema vaan tosinaan tarkastellaan seuranta-ajan puitteissa jonkin taudin ilmaantumista tai vaikkapa työhön palautumista kuntoutuksen jälkeen. Näitä sovelluksia ja taulujen erityispiirteitä emme sen enempää tarkastele tässä. Rajoitumme siis sellaiseen päätetapahtumaan, jossa henkilö kuolee ja termillä elinajantaulu tarkoitamme tässä yksinomaan niiden käyttöä demograafisissa, väestölaskennallisissa sovelluksia, kuolleisuuden laskennassa. Toisinaan käytetään suomenkielisenä vastineena hieman kuvailevampaa elonjäämistaulu-termiä. Käyttämämme elinaikataulu on erotuksena muista samankaltaisista luonteeltaan periodinen, jolla pyritään siis ennustamaan väestön nykyisyyttä ja tulevaisuutta.

Taulut kuvailevat kuolleisuuden ikäjakaumaa ja suuruutta tilastollisin suurein. Ne ovat ehkä yksi tärkeimmistä työkaluista mitä väestötieteilijät käyttävät. Niissä nimittäin on kuvattu kullakin ikäluokalle todennäköisyys, millä ikäluokkaan kuuluva ihminen kuolee ennen seuraavaa syntymäpäiväänsä. Näin ne kuvaavat miten väki vähenee (jos uusia ei synny tai muualta muuta väkeä täydentämään vajetta). Ne ovat keskeisessä roolissa väestöprojektioissa eteenpäin. Keskeinen käyttökohde elinaikatauluilla on laskea selviytymistodennäköisyys tietyn ikäisille ihmisille sekä laskea elinajanodote eri ikäisille ihmisille.

Kun elinikätaulut kertovat mikä on populaation keskimääräinen elinajanodote, niin vastaavasti voidaan kääntäen sovittaa oletettu elinajanodote tiettyihin (universaaleihin) malleihin ja näin saadaan muodostettua elinaikataulut kyseiselle väestölle tai väestön osalle. Juuri näin menettelimme Sympathy for the devil blogissa eli asetimme tietyt elinajanodotteet ja laskimme selviytyneiden määrän seuraavaan vuoteen ja arvioimme uudelleen elinajanodotteet, laskimme edelleen selviytyneiden määrän seuraavaan vuoteen jne. Prosessi toistettiin iteratiivisesti vuodesta toiseen.

Elinaikataulut yleensä laaditaan erikseen sekä miehille että naisille. Näillä kun toisistaan poikkeava tapa kuolla. Oheinen taulu on sangen tyypillinen, kun elinaikaodote naisille on 48 vuotta. Se on laadittu MortPak ohjelmalla käyttäen YK:n uutta väestömallia.

'

x	n	m(x,n)	q(x,n)	l(x)	d(x,n)	L(x,n)	T(x)	e(x)	a(x,n)
0	1	0.10437	0.09767	100000	9767	93583	4800001	48.000	0.343
1	4	0.01453	0.05599	90233	5052	347619	4706418	52.159	1.365
5	5	0.00354	0.01756	85181	1496	422165	4358799	51.171	2.500
10	5	0.00270	0.01343	83685	1124	415616	3936634	47.041	2.500
15	5	0.00565	0.02789	82561	2302	407544	3521018	42.647	2.714
20	5	0.00800	0.03924	80259	3149	393719	3113475	38.793	2.594
25	5	0.00962	0.04701	77110	3625	376638	2719756	35.271	2.542
30	5	0.01078	0.05250	73484	3858	357889	2343118	31.886	2.529
35	5	0.01233	0.05981	69626	4164	337844	1985229	28.513	2.529
40	5	0.01405	0.06790	65462	4445	316399	1647385	25.165	2.545
45	5	0.01763	0.08451	61017	5157	292559	1330986	21.813	2.571
50	5	0.02354	0.11133	55860	6219	264236	1038427	18.590	2.577
55	5	0.03235	0.14995	49641	7444	230081	774191	15.596	2.565
60	5	0.04445	0.20033	42197	8453	190194	544110	12.894	2.540
65	5	0.06121	0.26557	33744	8961	146397	353917	10.488	2.509
70	5	0.08560	0.35164	24782	8714	101799	207520	8.374	2.462
75	5	0.12033	0.45785	16068	7357	61136	105721	6.580	2.390
80	5	0.16787	0.57654	8711	5022	29919	44584	5.118	2.285
85	5	0.22939	0.69323	3689	2557	11148	14665	3.975	2.147
90	5	0.30529	0.79375	1132	898	2942	3517	3.108	1.976
95	5	0.39337	0.86967	233	203	516	575	2.463	1.793
100		0.51638	...	30	30	59	59	1.937	1.937

Taulukon sarakkeille on annettu seuraavat nimet:
x = täsmällinen ikä
n = kohortin koko vuosina
m(x,n) = ikärajoitteinen kuolleisuus
q(x,n) = todennäköisyys kuolla
I(x) = selviytyneiden lukumäärä
d(x,n) = kuolleiden määrä
L(x,n) = intervallissa eletyt henkilövuodet
T(x) = kokonais henkilövuodet (kumulatiivinen summa L(x,n) sarakkeen lopusta laskettuna)
e(x) = elinaikaodote
a(x,n) = kuolleiden suhde eläviin

Ensialkuun taulumme lukuarvot vaikuttavat sangen sekavilta ja sarakkeiden esiintymisjärjestys mielivaltaiselta. Näin ei kuitenkaan ole kuten kohta huomaamme. Tähän näennäiseen sekavuuteen on yhtenä syynä niiden historia. Ensimmäiset elintaulut julkaistiin jo 350 vuotta sitten kun muuan John Graunt pyrki laskemaan kuolleisuuden aiheuttamia kustannuksia Englannissa. Nykyisessä muodossa ne ovat eläneet runsaat sata vuotta. Ne siis syntyivät aikakaudella, jolloin laskelmat tehtiin kynällä paperille. Yhteenlasku oli kaikkein helpoin laskutoimitus, vähennyslasku puhumattakaan kerto- ja jakolaskuista ovat hyvin virhealttiita. Näin laskelmissa jouduttiin tekemään välilaskelmia ja päädyttiin lopullisiin tuloksiin useamman sarakkeen kautta vain jotta voitaisiin välttää mahdollisimman pitkälle virhealttiita laskutoimituksia.

Ensimmäinen sarake x vastaa täsmällistä ikää ja toinen sarake n kuvaa intervallin kokoa. Yleensä erotetaan 0 – 1 vuotiaat omaksi ryhmäkseen, jotta paremmin saataisiin kuvattua imeväisikäisten kuolleisuutta. Muut taulun rivit vastaavat ikäintervalleja 4 ja 5 vuotta. Toki voidaan laatia elinaikatauluja vuosikohtaisesti mutta tätä harvemmin tehdään periodisissa väestöennusteisiin pyrkivissä tauluissa.

Osa sarakkeista ovat kaksiparametrisia ja osa taasen yksiparametrisia. Usein kirjallisuudessa käytetään näille hieman eri notaatioita, merkintätapaa. Toisinaan käytetään alaindeksejä, toisinaan taasen parametrit esitetään sulkeissa. Siis esimerkiksi todennäköisyydelle kuolla voidaan käyttää merkintää q(x,n) tai _nq_x jolla siis tarkoitetaan x vuotiaan kuolintodennäköisyyttä ikäluokassa x:stä x+n ikään saakka. Kun sarake x esittää täsmällistä ikää niin ikäluokka ännään vuoteen saakka on puoliavoin väli [x, x+n) eli kun henkilön ikä olisi vaikkapa x_i ja kuuluu tiettyyn ikäkohorttiin niin \( \sf {x \le x_i <x+n}\).

Keskeinen käsite tauluissa on intervallissa eletyt henkilövuodet. Tällä tarkoitetaan tilastollista suuretta, joka kuvaa kaikkien segmentissä (kuten jossain maassa) eläneiden henkilöiden määrän summaa tarkastellussa periodissa. Siis jos periodi on 1 vuosi niin tuhat henkilöä on elänyt tällöin 1000 henkilövuotta, jos taasen periodi on 10 vuotta, niin sata henkilöä on elänyt saman määrän (eli 1000 henkilövuotta).

Taulun konstruointi etenee vasemmalta oikealle. Ensin lasketaan kuolintodennäköisyys q(x,n), seuraavaksi I(x) selviytyneiden määrä, sitten kuolleiden määrä, intervallissa eletyt henkilövuodet L(x,n), kokonaishenkilövuodet ja lopuksi elinajanodote.

m(x,n)

Sarake m(x,n) kuvaa ikärajoitteista kuolleisuutta, usein tämä jätetään julkaistuista elintauluista pois kun se ei ole varsinainen taulun laskennallinen sarake ollenkaan. m(x,n):ää ja a(x,n):ää käytetäänkin taulun konstruointiin. Jos väestölaskentadataa on saatavissa, niin ikärajoitteinen kuolleisuus voidaan saada suoraan kerätystä datasta. Mutta jos ei ole saatavissa niin m(x,n) generoidaan esimerkiksi elinaikaodotusten pohjalta käyttäen soveltuvaa elinaikataulumallia kuten tuonnempana pohditaan.

a(x,n)

a(x,n) on toinen elinaikataulujen konstruoinnissa käytetty ei laskennallinen sure. Se kertoo keskimääräiset eletyt vuodet intervallissa [x,x+n) niillä ihmisillä, jotka kuolevat tässä intervallissa. Se saadaan (yleensä) väestölaskennan yhteydessä. Se kuvaa niitä vuosia mitä intervallissa kuoleva henkilö keskimäärin elää. Esimerkiksi taulussamme a(50,5) = 2.577. Tämä siis tarkoitta, että henkilö joka kuolee 5 vuotta pitkässä intervallissamme selviytyy siinä 2.577 vuotta eli elää keskimäärin hieman yli puolet koko ajanjaksosta. Jos aktuaalista dataa ei ole olemassa niin usein käytetään a(x,n) arvona 2.5 ikäkohorteissa yli 5 vuotiaat ja alle 80 vuotiaat kun intervallinpituus on 5 vuotta.

Reaalista, kerättyä dataa on yleensä olemassa kehittyneissä maissa ja kehitysmaissa taasen kuolleisuus on sangen suurta joten lukuarvo 2.5 on kohtalaisen tarkka yli 5 vuotiaille ja näissä maissa ei kovin usein muodosteta elinaikatauluja yli 80 vuotiaille. Alle 5 vuotiaiden a(x,n) alhainen arvo heijastaa sitä tunnettua tosiasiaa (kehitysmaissa) että imeväisyyskuolleisuus on suurta. Esimerkiksi taulussamme a(0,1) = 0.343 jolloin jos vauva kuolee, niin hän kuolee ensimmäisten kuukausien aikana.

q(x,n)

Sarake q(x,n) kuvaa todennäköisyyttä kuolla niinä vuosina jotka alkavat x:stä ja päättyvät x + n:ään. Parametri on ehkä taulun tärkein sarake. Se voidaan määritellä suhdelukuna ^[212]:

\[ \sf {q(x,n) = { {henkilöiden \ lukumäärä,\ jotka \ kuolevat \ intervallissa \ [x, x+n)} \over {x \ ikään \ selviytyneiden \ henkilöiden \ lukumäärä}}} \]

Em. taulua silmäiltäessä huomataan, että todennäköisyys kuolla on pienimmillään kun lapsi täyttää 5 vuotta. Imeväisyyskuolleisuus q(0,1) on tässä 9.7 %.

Koko taulun konstruointi alkaa q(x,n) laskennasta ja etenee muihin sarakkeisiin, tämä selittää sarakkeiden järjestyksen. q(x,n) arvot saadaan laskettua m(x,n), a(x,n):n pohjalta seuraavasti, ns. Chiangin kaava (kts. Myös UNFPA:n ja IUSSP:n julkaisua Population Analysis for Policies & Programmes, [210] ) :

\[ \sf q(x,n) = { n*m(x,n) \over {1+ n*(1-a(x,n))*m(x,n)}} \]

Koska a(n,x) on likimäärin (paitsi imeväisikäisillä) 0.5 vuotta kohden, niin likimääräisissä laskuissa voidaan kaava redusoida muotoon:

\[ \sf q(x,n) = { 2*n*m(x,n) \over {2+n*m(x,n)}} \]

q(x,n) voidaan tulkita myös edustavan ehdollista todennäköisyyttä:

\[ \sf P(A|B) = {P(A \cap B) \over P(A)} \]

missä A tapahtuma on: kuollut intervallissa [x, x+n) ja B tapahtuma selviytynyt ikään x saakka, joka siis on sama asia kuin kuollut intervallissa \( \sf { [x, oo) } \). Näiden kahden tapahtuman (joukko-opillinen) leikkaus on kuolema intervallissa [x, x+n). Joten q(x,n) on ehdollinen todennäköisyys kuolla intervallissa [x, x+n) kun selviytymisikä x on annettu. Jotta asia hieman selkiytyisi tarkastellaan esimerkkiä:

Oletetaan että olen tietyn kohortin jäsen ja olen juuri saavuttanut iän x. Haluan nyt tietää kuinka todennäköistä on että kuolen ennen kuin saavutan iän x + 5 vuotta. Jos olisin 30 vuotias nainen ja eläisin Kambodzhassa kun elinajanodote on 48 vuotta, niin esimerkki taulukosta nähdään, että mahdollisuus kuolla ennen 35-vuotis päivääni on 5,25 %. Jos taasen olisin 70 vuotias niin todennäköisyys kuolla ennen 75-vuotis päivääni on peräti 35,16 %.

I(x)

Parameri I(x) kuvaa tiettyyn ikään x selviytyneiden ihmisten määrän kun heitä alunperin oli syntynyt 100 000. Sarake on siinä mielessä keinotekoinen kun vuonna nolla ikäluokan jäsenten määräksi merkitään 100 000, se voisi olla mikä tahansa muukin luku (toisinaan se merkitäänkin 1:ksi). Vuonna yksi ikäluokan koko on q(1,0) * I(0) eli esimerkkitaulussamme kun syntyneitä oli 100 000 niin vuoden kuluttua heitä oli jäljellä runsaat 90 tuhatta. Samoin esimerkiksi 15-vuotiaita oli jäljellä I(15) = 82 561 kun heitä oli syntyessä 100 000 jne.

Suhdeluku \( \sf I(x) \over I(0) \) voidaan tulkita todennäköisyydeksi selviytyä ikään x saakka [209]. Vastaavasti todennäköisyy kuolla ennen x ikää saadaan laskettua \( \sf 1 - {I(x) \over I(0)} \)

d(x,n)

d(x,n) kuvaa aikavälissä [x, x+n) kuolleiden määrä, se saadaan siis laskemalla d(x,n) = I(x) – I(x+n), Missä I(x+n) rivi I(x):n alapuolella.

Kun tutkimme taulukkoamme hieman tarkemmin huomaamme että I(1) = I(0) – d(0,1) samoin voimme laskea I (5) taulukkomme aikaisemmasta rivistä eli I(5) = I(1) - d(1,4) samoin I(10) voidaan laskea edellisen rivin I:stä ja d:stä jne. Toisin sanoen koko taulu voidaan generoida kun tiedämme todennäöisyyden q(x,n).

Koska kaikki syntyneet kuolevat joskus niin ^[209]

\[ \sum_{x=0} d(x,n) = I_0 \]

L(x,n)

L(x,n) on I(x) henkilön elinvuodet ikäryhmässä intervallissa [x, x+n) eli suhdelukuna

\[ \sf L(x,n) = {{elettyjä \ henkilövuosia \ intervallissa [x, x+n)} \over {kohorttiin kuuluvien \ henkilöiden \ määrä}} \]

Osoittaja L(x,n):ssä on summa niistä vuosista jotka kukin henkilö om elännyt ja selviytynyt ikään x saakka. Summa voidaan jakaa kahteen komponenttiin eli [212]:

a) Henkilöt, jotka selviytyvät läpi koko intervallin eli ikään x + n muodostavat n henkilövuotta . Kertomalla näiden henkilöiden määrän n:llä ja jakamalla kohorttiin kuuluvien henkilöiden määrällä antaa n*I(x+n).

b) tähän joudutaan lisäämään henkilöt jotka kuolivat kun täyttävät x_i iän \( \sf {x \le x_i <x+n}\) intervallissa eletty kesto on taasen a(x,n) eli \( \sf x_i – x\)arvojen keskiarvolla ts. a(x,n) ja jakamalla kohorttiin kuuluvien henkilöiden määrällä saadaan a(x,n)*d(x,n)

Yhdistämäällä nämä saadaan

\[ \sf L(x,n) = n*I(x+n) + a(x,n) * d(x,n) \]

Näin saamme laskettua L(x,n):n jos tunnemme a(x,n):n (ja a(x,n) kuten edellä jo todettiin on 5 vuotisintervallissa likimäärin 2.5 lukuunottamatta ihan pieniä lapsia ja vanhuksia).

Esimerkiksi edellä olevassa taulukosta nähdään, että täsmällisessä iässä 45 on 61017 ( = I(45) ) selviytynyttä kun taasen iässä 50 heitä on 55 860 joten kuolleita on 61017 – 55 860 = 5157 = d(45,5). Näin 55 860 on elänyt kuluneet 5 vuotta joten heidän osuus on 279 300 henkilövuotta. Mutta koska nämä 5157 ihmiset ovat kuolleet ? Tähän antaa vastauksen a(x,n) sarake. Taulukkomme mukaan a(45,5) = 2.571 eli kuolleet ovat keskimäärin eläneet hieman yli puolet koko intervallissa käytetystä ajasta. Joten kaiken kaikkiaan 5157 kuollutta olivat eläneet 5157 * 2.571 = 13 259 henkilövuotta. Joten kaiken kaikkiaan elettyjä henkilövuosia oli 279 300 + 13 259 = 292 559 henkilövuotta. Aivan kuten sarake L(45,5) kertoo.

T(x)

No hyvä meillä on jäljellä kaksi saraketta nimittäin eletyt elinvuodet T(x) ja valitettavan usein väärin ymmärretty elinajanodote e(x)

T(x) on siis additiivinen eli summa yli kaikien intervallien, joten se saadaan laskettua T(x) L(x,n):n avulla (huomaa että kaksi ensimmäistä kohorttia olivat esimerkissä 1 ja 4 vuotta muiden ollessa 5 vuotta):

\( \sf T(x) = L(x,n) + L(x+n, n) + L(x + 2*n, n) … kun \ x >= 5 \)
\( \sf T(1) =L(1,4) + T(5) \)
\( \sf T(0) = L(0,1) + T(1) \)

e(x)

T(x) kuvaa siis tietystä iästä eteenpäin elettyjen henkilövuosien määrän. Esimerkiksi em. taulukosta nähdään että T(0) = 4 800 001, kun synteettisen kohorttimme I(0) oli 100 000, niin elettävien elinvuosien määrä on yksinkertaisesti 4 800 001 / 100 000 = 48.0 eli elinajanodote syntymässä.

e(x) elinajanodote kullakin ikäryhmällä määritelläänkin näin suhdelukuna:

\[ \sf e(x) = {T(x) \over I(x)} \]

Odote kuvaa kuinka monta vuotta kunkin ikäkohortin jäsenelle on keskimäärin jäljellä. Elinaikaodote tietylle kohortille on sama kuin kohortin jäsenten kuoliniän keskiarvo. Em, esimerkkitaulussa odote oli syntyessä 48 vuotta ja vuoden vanhana odote oli jo kasvanut 52.159 vuoteen ja laskee tästä tasaisesti alaspäin. Elinajanodote yhden vuoden ikäisillä on suurempi kun syntyessä koska imeväisyyskuolleisuus on esimerkissämme suurta. Erityisesti vakuutusihmiset ovat kiinnostuneet näistä luvuista voidakseen hinnoitella eri ikäisille ihmisille heidän henkivakuutuksensa.

Mielenkiintoinen piirre taulukossamme (ja yleisesti elinajanodotteessa) on että ihmisen odotettavissa oleva elinikä itseasiassa kasvaa iän myötä. Esimerkiksi 10 vuotiailla jäljellä oleva odote on 47.041 vuotta eli elinaika yhteensä saavuttaa 57.041 vuotta kun taas esimerkiksi 30 vuotiailla odote on 31.886 vuotta eli yhteensä elinaika saavuttaisi 61.886 vuotta. Seikka johtuu siitä, että jokaisena syntymäpäivänä elossa oleva ihminen kuuluu alati pienenevään selviytyjien joukkoon. He ovat selviytyneet varhaislapsuuden sairauksista, erilaisista riskeistä kuten liikenneonnettomuuksista, kuolemaan johtavista tapaturmista jne. He ovat tavalla tai toisella robustimpia.

Usein maallikot ajattelevat, että kun elinajan odote syntymässä on vaikkapa 75 vuota niin täytettyään 60 vuotta alkavat heikkenemään ja kuolevat 15 vuoden kuluttua. Näin ei kuitenkaan ole. Syynä tälläiseen väärinkäsitykseen on se että elinajan odote on itse asiassa odote syntymässä ja ajatellaan sen olevan staattinen vakiona säilyvä suure.

Kun kansakuntaa kohdistuu suuret kuolleisuuskriisit kuten sodat ja väkeä kuolee paljon (myös vanhempaa väkeä) on T(x) alhaisempi ja näin e(x) on myös alhaisempi. Selviytyjien määrä on pienempi. Tämä taasen heijastuu elinajanodotteeseen syntymässä, joka siis laskee. Näin laskevan elinajanodotteen mukaisesti myös elinaikataulu vaihtuu. Tämän syyn vuoksi laskelmissamme (Sympathy for the Devil-6) voitiin käyttää elinajanodoteta kuvailevana parametrina. Samoin jos kuolleisuuskriisi kohdistuu hedelmällisessä iässä oleviin naisiin niin kokonaishedelmällisyyslukukin pienenee.

Jos lukija on kiinnostunut yksityiskohdista siitä, miten taulut generoidaan voi ehkä saada lisävalaistusta vaikkapa Measure Evolutionin on-line kurssimateriaalista Population Analysis for Planners [209] monen muun julkaisun ohessa.

Elinaikataulumallit

Olisimme suurissa vaikeuksissa laskelmissamme jos väestö kuolisi noin vain yksilöllisesti. Emme pystyisi laatimaan elinaikatauluja emmekä laskemaan väestön ikärajoitteista kuolleisuutta silloin kun väestölaskentaa on puutteellista tai jopa ei sitä ole tehty ollenkaan. Joudumme turvautumaan eri epäsuoriin menetelmiin. Suurena apuna on ollut havainto kuolemisen noudattavan hyvin samanmuotoista hahmoa. Väestö nimittäin kuolee suurin piirtein samanikäisinä vuodesta toiseen tietyillä maantieteellisillä alueilla, kun elintaso ja elinkeinorakenne on suurin piirtein sama eri kansojen välillä. Siis esimerkiksi väestön kuolleisuus suomalaisilla ja ruotsalaisilla tai khmerellä ja bamareilla (Myanmar) seuraa keskenään hyvin samankaltaista hahmoa. Seikka havaittiin jo hyvin varhain väestötieteellisissä tutkimuksissa. Tarkastellaan oheista q(x,n) kuvaajaa eri elinaikaodotuksilla ja eri maissa (huomaathan, että pystyakseli on logaritminen):

Kuolintodennäköisyys naisilla q(x,n) eri maissa. Data on ajanjaksolata 1960 - 1965. Lähteenä on käytetty YK:n väestöosaston julkaisemia taulukoita (World Population Prospects 2019 [214])

Kaikissa kuvaajissa todennäköisyys kuolla on heti syntymän jälkeen suuri ja pienenee tuonne 10 – 15 vuotiaisiin saakka. Tämän jälkeen todennäköisyys kasvaa. Imeväisyyskuolleisuus on erittäin alhainen Ruotsissa kuten muissa pohjois euroopan maissa. Mielenkiintoinen ero on nähtävissä Chilen ja Sausdi-Arabian välillä. Vaika syntymässä elinikäodotuksen ero on kojhtalaisen pieni (2.5 vuotta) niin 10 vuotiaiden kuolleisuus Chilessä on paljon alhaisempi kuin Saudi-Arabiassa.

Havainto näiden kuvaajien samanmuotoisuudesta johti väestötieteilijät kehittämään osittain empiiriseen dataan pohjautuvia malleja, joita voidaan soveltaa aktuaalisen elinaikataulun laatimiseen kohtuullisella tarkkuudella. Mallit ovat osoittautuneet sangen hyödyllisiksi silloin kun aktuaalista, todellista dataa on harvakseen tai ei ole ollenkaan. Parhaiten tunnettuja ovat:1) varhainen YK:n elinaikataulumalli, 2) Coale-Demeny elinaikamallitaulut, 3) YK:n uusi malli kehittyville maille, 4) Lederman järjestelmän mukaiset mallit, 5) Brass Logit järjestelmä 6) WHO:n malli [213]. Laskelmissamme käytimme Coale-Demney sekä YK:n uutta mallia.

Mallien kehittämisen tavoitteena on ollut kehittää järjestelmä, joka kuvaa kuolleisuutta vain muutaman parametrin avulla. Jos malli kuvaa todellisuutta riittävän hyvin niin väestön kehitys voidaan luonnehtia näiden parametrien avulla. Blogissamme parametrina käytettiin elinaikaodotusta, joka sopii hyvin (hieman joustamattomiin) yksiparametrisiin malleihin kuten Coale-Demeny ja YK:n uusi malli.

Vaikka mallit ovat antaneet meille hyvän käsityksen väestönkehityksestä, niin ne eivät silti aina anna kehitysmaissa tarkkaa kuvaa väestön tilasta. Varsinkin jos malleja pyritään soveltamaan jatkuvasti ilman sen suurempia empiirisiä tarkistuslaskelmia (edes rajoitetulle väestölle). Tämä osittain johtuu siitä, että mallien kehittäminen perustuu historialliseen dataan. Monet uudet ilmiöt kuten AIDS/HIV:n leviäminen sellaiseen suuruuteen minkä se nykyään on saavuttanut vääristää kuolleisuuden ikärakennetta. Koska sairaus iskee ”parhaimillaan” hedelmällisimpään väestönosaan niin väestön kehittyminen ei aina tahdo seurata mallin antamia projektioita tulevaisuuteen. Poikkeuksen tässä tekee Brass logit järjestelmään perustuvat malli, kun se ei perustu historiaalliseen dataan. Tosin se vaatii parametrikseen alle 5 vuotiaiden kuolleisuuden q(5,0) ja aikuisiän kuolleisuuden q(45,15). Seikkoja, joita emme aina tunne.

Ehkä ensimmäinen malli oli ns. YK:n varhainen elinaikataulumalli. Se julkaistiin jo vuonna 1955. Malli perustuu empiirisesti eri paikoista ja eri ajankohdista kerättyihin 158 elinaikataulun huolellisiin erittelyihin. Mallit laadittiin erikseen kummallekin sukupuolelle käyttämällä tilastollisia menetelmiä, joilla voitiin liittää yhden ikäluokan kuolleisuus laajalle joukolle kuolleisuutta. Mallissa oletetaan, että jokaisen elinaikataulussa esitetty intervallin kuolleisuus q(x,n) on toisen asteen funktio aikaisemman intervallin kuolleisuudesta q(x-n,5).. Intervallin koon oletetaan tässä olevan 5 vuotta lukuun ottamatta kahta pienintä intervallia (q(1,0) ja q(4,1)). Näin tuntemalla yksi kuolleisuusparametri q(1,0) saadaan koko taulu laskettua. Tämän vuoksi mallia kutsutaan yksiparametriseksi malliksi.

Mallissa käytetyn toisen asteen (neliöllisen) funktion kertoimet laadittiin tutkimalla todellisia 158 elinaikatauluja. Laatimisen alussa arvattiin mielivaltainen q(1,0), jota sitten käytettiin estimoimaan q(1,4), jota taasen käytettiin generoimaan q(5,5) jne. Tällaisella iteratiivisella ketjuttamisella saatiin laadittua koko taulu ja korjattua kaikki parametrit oikeiksi.

Ehkä nykyään eniten käytetty malli on Coale-Demneyn mallitaulu. Nämä julkaistiin vuonna 1966 ja oli johdettu 192 todellisen rekisteridatan pohjalta. Datan tarkkuus oli niin hyvä kuin siihen aikaan oli mahdollista muodostaa. Data oli kerätty eri aikakausilta, joiden pohajalta muodostettiin todelliset elintaulut. 39 taulun data oli kerätty ennen 1900 luvun alkua ja 69 toisen maailmansodan jälkeen. Data oli pääasiassa länsimaista eli Euroopasta, Pohjois-Amerikasta, Australiasta, ja Uudesta Seelannista. Kaiken kaikkiaan näiden osuus oli 176 taulua. Kolme kerättiin Israelista , Japanista kuusi, kolme Taiwanista ja 4 Etelä-Afrikan valkoisesta väestöstä.

Tarkempi datan analyysi paljasti datan edustavan 4 kuolleisuuden ikäjakaumaa eri maantieteellisillä alueilla. Niinpä näitä alettiin kutsua: pohjoiseksi, eteläiseksi, itäiseksi ja läntiseksi malleiksi:

Pohjoinen malli perustuu pitkälle pohjoismaihin, joiden luonteenomaisena piirteenä on alhainen imeväisyyskuolleisuus, korkea lapsikuolleisuus suhteessa imeväiskuolleisuuteen ja alhainen varttuneen ja vanhemman väen (yli 50 vuotiaiden) kuolleisuus.

Eteläinen malli taasen perustuu Etelä-Euroopan maihin (Espanja, Portugali, Etelä-Italia).Tämän luonteenomaisena piirteenä on a) korkea lapsikuoleisuus suhteessa imeväsyykuolleisuuteen kun kokonaiskuolleisuus on suuri ja b) alhainen lapsikuolleisuus suhteessa imeväisyyskuolleisuuteen kun kokonaiskuolleisuus on alhainen.

Itäinen malli taasen perustuu Itävallan, Saksan, Pohjois-Italian, Unkarin ja Puolan datoihin, luonrteenomaisen piirteenä korkea kuolleisuus erityisesti 50 vuotta täyttäneillä.

Läntinen malli: kaikki muut. Yleensä kaikissa laskentaohjelmissa läntinen malli on oletusarvona.

Coale Demeney on myös yksiparametrinen malli. Usein miten sitä käytetään kun tunnetaan tai oletetaan elinajanodote syntymässä ja tämän pohjalta muodostetaan koko taulu kummallekin sukupuolelle erikseen. Yksiparametrisuus on sekä rajoite että etu. Etu sikäli, että mallin soveltaminen on kohtalaisen suoraviivaista. Rajoite taasen sikäli, että kuolleisuus erityisesti vanhemilla ikäluokilla monissa maissa ei aina seuraa sitä kaavaa mitä malli antaisi. Läntistä mallia sovelletaan kun ei tarkkaan pystytä hahmottamaan ikäspesifiä kuolleisuutta.

YK:n uusi malli kehitysmaille vuodelta 1981. Kun Coale Demeney oli pitkälle johdettu ”valkoisen miehen” maailmasta niin se ei lähtökohdiltaan kovin hyvin soveltunut kehitysmaiden väestön tarpeisiin. Näin syntyi tarve uudelle YK:n mallille. Mallin perusteena oleva data kerättiin 36 kehitysman elintaulusta kumallekkin sukupuolelle erikseen. 16 paria elintauludataa saatiin kymmenestä latinalaisesta maasta, 19 paria Aasian 10:stä maasta ja yksi pari Afrikasta. Näistä tunnistettiin 5 malliperhettä, joissa elinikäodotukset vaihtelivat 35:stä 75:een vuoteen. Nämä mallit kattavat viisi maantieteellistä aluetta Latinalainen-Amerikka, Chile, Etelä-Aasia, Kauko-Itä ja yleinen. Yleinen malli on muodostettu kaikkien arvojen keskiarvoista.

Emme sen enempää tässä (muutoinkin aivan liian pitkässä postauksesssa) pohdi näitä malleja etuja ja sovelluksia. Erinomaisena lähteenä kehotetaan lukijaa perehtymään vaikka julkaisuun Murray et al.: WHO system of Model life tables [213] monien muiden julkaisujen ohella. Kiinnostunut lukija varmaan lukee joitakin väestötieteen peruskirjoja ja artikkeleita (monia näitä on saatavissa ilmaiseksikin). Ne on helppo löytää googlaamalla.

Käytetyt lähteet löydät täältä.

Hae tästä blogista

matka jakartaan