Prédire le nombre de décès pour les 30 prochaines années, voilà un beau challenge ! Je m’y étais risqué à travers un article sur la pyramide des âges en reprenant les prévisions de l’INSEE. Cette fois-ci, je me lance ce défi en utilisant non seulement des méthodes traditionnelles, mais aussi des outils d’Intelligence Artificielle (IA). Je vais essayer d’être le moins technique possible, tout en m’appuyant sur les meilleurs outils pour l’étude des séries temporelles.
L’avantage de cette analyse est que vous n’avez besoin d’aucune compétence technique pour lire cet article. J’utilise un maximum de graphiques pour vous permettre de vous faire une opinion. Comme d’habitude, je m’appuie sur les données de l’INSEE pour mener cette étude. (19 746 403 lignes, sachant que chaque ligne correspond à un défunt).
I. Mortalité : historique et prédictions
A. Analyse au niveau national
1) Historique depuis 1990
Base mensuelle
Ce graphique nous permet d’identifier les fortes variations mensuelles sur une longue période de 35 ans. On constate qu’à partir de l'année 2012, les mois où l’on dépasse les 60 000 décès sont de plus en plus fréquents, même avant les vagues de la Covid. Par ailleurs, les paliers bas, autour de 40 000 décès mensuels, disparaissent à partir de cette même année. Enfin, depuis 2020, le nombre de décès ne descend quasiment plus en dessous de 50 000.
Base annuelle
Cette approche annuelle permet d’observer que, durant la période 1990-2011, à l’exception de 1999, le nombre de décès fluctue dans une fourchette réduite autour de 540 000 décès par an. Il y a une rupture en 2012, suivie d’une croissance continue. Les années 2020 et 2021 doivent être analysées en tenant compte de l’impact de la Covid, et l’année 2022, des épidémies de grippe. En 2023, pour la première fois, le nombre de décès a chuté de manière significative, et les données jusqu’à fin juillet 2024 restent dans la même tendance.
Analyse des composants d’une série chronologique
Ce graphique décompose les données observées selon 3 critères : la tendance, la saisonnalité et le résiduel. La tendance est stable entre 1992 et 2012, avant de connaître une croissance continue. Elle atteint un plateau entre 2020 et 2022, puis montre un déclin en 2023. La saisonnalité est très marquée : les mois de décembre et janvier enregistrent sensiblement plus de décès que les mois d’été, de juin à septembre.
Enfin, le résiduel met en évidence des anomalies notables. On observe ainsi les effets de la canicule de 2003, quelques pics souvent associés à des épidémies de grippe, ainsi que les différentes vagues de la Covid en 2020 et 2021, elles-mêmes suivies d’une importante vague de grippe en 2023. Cette décomposition en 3 critères distincts permet de mieux comprendre l’évolution des décès et sera essentielle pour l’implémentation des prédictions.
Coefficient de variation
Les variations mensuelles diffèrent-elles beaucoup d’un département à l’autre ? Y observe-t-on un phénomène de saisonnalité ? Par exemple, observe-t-on dans certains départements où le climat est plus continental, des amplitudes de décès plus marquées en hiver ? Grâce à l’agrégat du coefficient de variation, nous serons en mesure de comparer ces différences et d’identifier les départements où les variations saisonnières sont les plus prononcées.
Le Coefficient de Variation (CV) est le rapport entre l’écart-type (qui mesure la dispersion ou la volatilité) et la moyenne. Cela permet de comprendre à quel point les variations du nombre moyen de décès sont importantes selon chaque zone.
Cette formule donne un pourcentage, ce qui facilite la comparaison entre des territoires ayant des taux de mortalité moyens différents. Un CV plus élevé indique une plus grande variation des décès dans une zone donnée, tandis qu’un CV plus bas met en évidence une variation plus faible par rapport à la moyenne des décès.
Nombre de déc!s par mois : France métropolita
Grâce à ce graphique, on observe que les fluctuations sont nettement plus marquées dans certains départements que dans d’autres. Le Finistère, par exemple, présente des variations annuelles beaucoup plus faibles, contrairement à la Martinique ou au Territoire de Belfort. Cela peut s’expliquer par le fait que les données disponibles pour ces zones sont plus limitées. En revanche, des départements comme les Bouches-du-Rhône ou la Haute-Savoie affichent des fluctuations plus importantes.
Pour approfondir l’analyse, j’ai souhaité explorer si une étude par région pouvait apporter davantage de clarté, notamment en suivant une logique climatique. Je m’attendais à observer de faibles amplitudes en Bretagne, et de fortes variations dans les régions à climat plus continental, comme l’Est de la France. Cependant, cette hypothèse climatique ne semble pas pertinente, car c’est en Provence et dans les Pays de la Loire que les variations sont les plus importantes. Finalement, il apparaît encore une fois que la relation entre la météo et les décès n’est pas concluante.
II. Évolution du taux de mortalité en France
Les données relatives à la population proviennent de l’INSEE (https://www.insee.fr/fr/outil- interactif/6798992/pyramide.htm#!y=2018&a=20,60&v=2&t=2&c=0), et nous avons utilisé la même source pour l’année 2020. Nous avons choisi cette base de données afin de garantir la cohérence des informations entre 2013 et 2070. Cette source permet également de sélectionner la population par département, ce qui renforce la précision de notre analyse.
1) Pyramide des âges en France
Cet autre article sur la pyramide des âges en France fait un premier état des lieux (https://meilleures-pompes-funebres.com/publications/nl-pyramide-ages-esperance-vie-france-08062023). Ici, il est nécessaire de rappeler que pour se lancer dans la prédiction, il est essentiel de disposer d’une base de données fiable. J’ai choisi cette base de données, certes datant de 2020, mais qui présente deux avantages majeurs : elle couvre la période de 2013 à 2070 et les données sont disponibles au niveau départemental, ce qui permet d’établir des prédictions spécifiques à chaque département.
Comme vous le savez, la pyramide des âges est en pleine transformation, avec un vieillissement de la population marqué par une augmentation significative du nombre de personnes âgées de plus de 60 ans (génération du baby-boom à partir de 1946) et une forte baisse du nombre de naissances.
2) Calcul du taux de mortalité
Le taux de mortalité est un indicateur clé pour évaluer la santé publique et le bien-être d’une population, ainsi que l’impact des maladies, des conditions socio-économiques et des politiques de santé.
Le taux de mortalité plutôt constant n’a connu une hausse que pendant les années de la Covid, où le nombre de décès a été particulièrement élevé. En dehors de cette période, le taux est relativement stable. En effet, la croissance du nombre de décès suit globalement celle de la population.
3) Évolution du nombre de décès dans la population des 60 ans et plus
À l’inverse du graphique précédent, celui-ci montre une moindre stabilité. Dans ce graphique, on a rapporté le nombre de décès à la population des plus de 60 ans et on observe une baisse du ratio.
En effet, le nombre de décès est légèrement inférieur à l’évolution du nombre de personnes âgées de plus de 60 ans. Ainsi, on peut en déduire que cet écart s’explique en grande partie par l’augmentation de l’âge moyen des défunts, l’immigration dans cette population étant très faible.
4) Évolution de l’âge moyen des défunts
L’âge moyen des défunts a connu une croissance continue de 1990 à 2019. La Covid a donc eu un impact majeur : cet âge moyen n’avait pas augmenté depuis plus de 50 ans.
La question qui se pose désormais est la suivante : l’âge moyen des défunts repartira-t-il à la hausse ? C’est une question complexe à aborder, car elle dépend de nombreux facteurs, notamment des lois sur la fin de vie, des progrès médicaux ou encore de l’accès aux soins.
III. Projection sur l’évolution du nombre de décès
Pour prévoir les décès des 10 prochaines années, nous avons testé plusieurs modèles avec différentes variables (population, âge des défunts, etc.) : les modèles SARIMAX et Prophet de Facebook.
1) Le modèle SARIMAX
Le modèle SARIMAX (Seasonal AutoRegressive Integrated Moving Average with eXogenous variables) nous semble le plus pertinent, car il permet d’intégrer la saisonnalité et de neutraliser certaines valeurs résiduelles.
Il est une extension du modèle ARIMA qui prend en compte à la fois les composantes saisonnières et les variables exogènes. Il permet de modéliser les séries temporelles en intégrant des phénomènes de saisonnalité, des tendances, ainsi que des relations avec des facteurs externes (variables exogènes). Ce modèle est utilisé pour effectuer des prévisions en tenant compte des fluctuations saisonnières et de l’influence d’autres variables sur la série étudiée.
a. Prévisions mensuelles
Cette modélisation par SARIMAX valide visuellement l’augmentation du nombre de décès sur la période 1988-2033, en montrant clairement que la tendance observée depuis 2012 se poursuit.
b. Prévisions annuelles correspondantes
Le modèle SARIMAX propose des estimations en augmentation continue depuis 2012, atteignant 745 000 décès en 2033. L’article publié dans Résonance n° 192 de juin 2023 (https://www.resonance-funeraire.com/magazine/dossiers/44-dossiers/6640-pyramide-des-ages.html) sur les projections pour 2033 annonçait 720 000 décès dans l’hypothèse basse, donc un nombre important, et 660 000 dans l’hypothèse centrale. Pour rappel, voici les données de l’INSEE de l’époque illustrées dans ce graphique :
Le modèle SARIMAX prédit donc un nombre de décès nettement plus élevé que prévu en 2020. L’élément qui diffère le plus par rapport aux prévisions de l’INSEE est l’âge moyen du défunt, qui a nettement moins augmenté que prévu. La plupart des modèles de l’INSEE prévoyaient une augmentation continue de l’espérance de vie, en cohérence avec les tendances observées au cours des 5 dernières décennies.
c. Modèle avec intégration avec l’âge des défunts
Pour approfondir notre analyse, et compte tenu de l’importance de cet indicateur, nous avons souhaité enrichir notre modèle SARIMAX en y intégrant un autre agrégat : l’âge moyen des défunts. En résultent deux graphiques, l’un avec les prédictions de l’âge moyen au décès ; l’autre, en y ajoutant le nombre de décès.
Ici, est mis en évidence l’impact d’une croissance moins forte de l’âge moyen des défunts sur les prévisions des décès. En effet, lorsque l’augmentation de l’âge moyen des défunts est plus modérée, cela réduit les prédictions de décès pour 2035, avec une estimation à 722 885 décès, contre 744 770 dans le modèle SARIMAX standard. Cela montre que l’exogène (l’âge moyen des défunts) influence directement les résultats, en ajustant à la baisse les prévisions de mortalité, par rapport au modèle sans exogène, où cette variable n’est pas prise en compte.
2) Le modèle Prophet de Facebook
a. Modèle analyse
On entend beaucoup parler de l’IA et de ce qu’elle peut produire sur des données temporelles. Le modèle en vogue actuellement est Prophet de Facebook (https://facebook.github.io/prophet/). Ce modèle est bien plus simple à utiliser que SARIMAX : il suffit de lui fournir les données, et il se charge du reste. L’outil permet avant tout de présenter les données selon une logique proche du modèle SARIMAX, tout en isolant les valeurs extrêmes.
b. Résultats du modèle
Le modèle génère des prédictions plus élevées que celles de SARIMAX, avoisinant les 780 000 décès en 2033. Étant donné qu’il s’agit d’une boîte noire, les possibilités de paramétrage sont limitées. On peut supposer que le modèle accorde une plus grande importance aux données récentes, ce qui n’est pas incohérent en soi.
Conclusion
La prédiction des décès sur les 10 prochaines années est un exercice passionnant qui nécessite une bonne compréhension des données historiques, telles que l’évolution des décès sur une longue période de 35 années, l’évolution de l’âge moyen du défunt et de celle de la population des 60 ans et plus. L’évolution des décès a été fortement impactée par la pandémie de la Covid-19, qui a perturbé tous les modèles.
Cependant, avec 3 ans de recul, nous commençons à y voir plus clair. Il est certain que le nombre de décès va augmenter, en raison d’une dynamique directement liée à la pyramide des âges. Les modèles actuels, qui intègrent l’effet de la Covid, suggèrent une augmentation plus rapide du nombre de décès que celle anticipée par le modèle de l’INSEE. Affaire à suivre…
Charles Simpson
Fondateur de Meilleures Pompes Funèbres
Résonance n° 208 - Octobre 2024
Résonance n° 208 - Octobre 2024
Suivez-nous sur les réseaux sociaux :