In een artikel over het stijgend aantal coronabesmettingen in het Brussels Gewest voert VRT NWS twee mogelijke verklaringen op, namelijk de bevolkingsdichtheid en de kansarmoede in een gemeente. Terwijl de tweede factor wel degelijk relevant is, vertoont de eerste factor weinig samenhang met de besmettingsgraad. Bovendien vertonen andere factoren die niet opgevoerd worden, zoals het aandeel van personen met een migratieachtergrond in een gemeente, een veel sterkere correlatie met de besmettingsgraad dan de bevolkingsdichtheid.

Indien we deze cijfers onder de loep nemen blijkt het verband tussen de bevolkingsdichtheid de besmettingsgraad echter klein te zijn. Zo bedraagt de Pearson-correlatiecoëfficiënt (PCC) slechts 0,34131, wat wijst op een lage graad van correlatie. De PCC is een cijfer tussen 0 en 1. Hoe dichter dit cijfer bij 1 ligt, hoe meer correlatie er is tussen de verschillende parameters.

Bevolkingsdichtheid vertoont weinig verband met besmettingsgraad

De p-waarde bedraagt in dit geval 0,15269. Deze p-waarde ligt net als de PCC steeds tussen 0 en 1. Indien de p-waarde kleiner is dan 0,05 wordt de correlatie als significant beschouwd. Dit betekent dat er slechts 5 procent kans is dat de waargenomen correlatie niet echt is. De p-waarde ligt hier in dit geval ruim boven, wat dus duidt op een insignificante correlatie.

VRT NWS erkent ook met zoveel woorden dat het verband tussen de bevolkingsdichtheid en het aantal coronabesmettingen in Brussel niet altijd duidelijk is: “De bevolkingsdichtheid is dus zeker niet de enige verklaring.” Maar waarom dan de bevolkingsdichtheid in de eerste plaats als verklarende factor opvoeren?

Kansarmoede en personen van vreemde origine

Indien we het aantal coronabesmettingen per gemeente vergelijken met het aandeel inwoners van buitenlandse origine bedraagt de PCC 0,63974, wat duidt op een vrij sterke correlatie. Ook de p-waarde blijkt ‘significant’ te zijn: 0,00318. Er lijkt dus een veel sterker verband te zijn met het aantal inwoners van buitenlandse origine, dan met de bevolkingsdichtheid.

Een tweede verklarende factor die door VRT NWS wordt aangevoerd, namelijk kansarmoede, lijkt van alle gebruikte parameters wél het meeste verband te vertonen met de besmettingsgraad. De PCC en p-waarde bedragen hier respectievelijk 0,72215 en 0,00048.

Maar daarmee is nog niet alles gezegd. Los van de coronabesmettingsgraad blijkt ook de correlatie tussen de kansarmoede-index en het aandeel inwoners van vreemde origine erg hoog te liggen, met een PCC van 0,79305 en een p-waarde van 0,00005. Met andere woorden: er is slechts 0,005 procent kans dat deze correlatie op toeval berust.

Één van de stelregels in de statistiek luidt dat correlatie niet noodzakelijk een causaal verband inhoudt. Toch is het vreemd dat men enerzijds bevolkingsdichtheid – iets wat statistisch geen sterk verband lijkt te vertonen – aanhaalt als mogelijke verklarende factor voor het hoge aantal besmettingen, terwijl men nalaat dit te doen voor het aandeel personen van vreemde origine in een gemeente – iets wat statistisch wél een sterk verband lijkt te vertonen met zowel het aantal besmettingen en de kansarmoede.