Estimation of the national number of injured in a road traffic crash in France: benefits from using data from the fire and rescue services

Updated: about 1 month ago
Location: Bron, RHONE ALPES
Job Type: FullTime
Deadline: 29 Jun 2024

21 Mar 2024
Job Information
Organisation/Company

Université Gustave Eiffel - Site de Lyon-Bron
Research Field

Computer science » Database management
Medical sciences
Researcher Profile

Recognised Researcher (R2)
Leading Researcher (R4)
First Stage Researcher (R1)
Established Researcher (R3)
Country

France
Application Deadline

29 Jun 2024 - 22:00 (UTC)
Type of Contract

Temporary
Job Status

Full-time
Is the job funded through the EU Research Framework Programme?

Not funded by an EU programme
Is the Job related to staff position within a Research Infrastructure?

No

Offer Description

Context 

The European Commission requests its Member States to provide it annually with the number of injured and seriously injured individuals (defined by the MAIS3+ criterion based on the Abbreviated Injury Scale or AIS) from road traffic accidents. In France, several systems are in place to collect information on road traffic injuries, including healthcare services, law enforcement, and departmental fire and rescue services (DFRS). None of these sources provide a comprehensive count. Therefore, annual figures on road morbidity must be estimated from incomplete data. For the past 15 years, these estimations have been conducted at Umrestte using a capture-recapture (CRC) modeling approach [1], which allows for the analysis of data common to multiple sources, and for the extrapolation of what is being observed in terms of recording practices, to estimate the number of individuals being recorded by none of these sources.

To carry out this modeling, the Umrestte team have relied up to now on data from law enforcement and on the Rhône (medical) Registry of road traffic accident victims. This Registry records road accident victims in the department almost exhaustively, by gathering data from all public and private healthcare services in Rhône or neighboring departments. This includes both hospitalized victims and those visiting emergency units, and comes with by a detailed description of injuries and their severity coded with the AIS, therefore with the severity criterion MAIS3+. Note that the medical data from the Medicalization of Information Systems Program (PMSI), which is available at the national level, can hardly be used since the road accident victims are identified with the "external cause" variable, which is missing at 60% [2]. On the law enforcement side, the BAAC data are available at the departmental and national levels. This data contains specific information about the accident and the injured road user; the severity of the injuries is not characterized according to the MAIS3+ criterion, but according to the following categorization: unharmed/hospitalized/injured but not hospitalized/deceased. The estimation approach carried out at Umrestte is the following: modeling by CRC is carried out at the Rhône department level using data from the Registry and BAAC, which allows estimating the underreporting rate of BAAC, and deducing correction factors. These correction factors are then applied to the BAAC data at the national level, accounting for the biases associated with them; in other words, we are adjusting these data in order to estimate the total number of injured and seriously injured road users in mainland France [3].

Yet, we have observed for several years an underestimation of our national estimates: the estimated figures are lower than the national number of road casualties reported by the departmental fire and rescue services.

This underestimation may have several causes, the most likely being the following. Among the six conditions that need to be met for the CRC method to be valid [1,4,5], one is unlikely to be met: the assumption of homogeneity of capture (i.e. the same probability of recording all casualties). Some recording biases have indeed been observed in the BAAC data (e.g. the probability of recording depends on certain characteristics of the accidents and the casualties: cyclists, motorcyclists, casualties without third parties, and minor injuries in particular are under-recorded [6]); these biases can be accounted for in the modeling. Though, the recording practices of the police (and their biases) need to be consistent throughout the national territory for the projection at the national level to be valid. In recent years, modifications in the BAAC data collection method have created heterogeneities: a recording rate increase was observed in 2017 in the military police zone, much stronger in the Rhône than overall in France; and in 2018, an alteration of the classification hospitalized/non-hospitalized was identified in the data reported by all military police, national police and municipal police forces, with classification practices varying from one department to another (this alteration has led this criteria to being no longer labeled by the public statistics authorities). Ultimately, the low recording rate of casualties in the BAAC heightens the error that can result from these biases, since these biases are multiplied by the proportion of casualties that need to be estimated (estimated to be 75% at the national level).

This leads us to consider using other data sources for carrying these estimations. The data from the departmental fire and rescue services seem to be an interesting option. Like the BAAC, they are available at the national level, at least in an aggregated form; they are much closer to completeness than the BAAC (279,413 victims recorded in 2019 by the DFRS compared to 70,490 in the BAAC), and they seem to reveal much more consistent recording practices over time (annual variations below 3% besides the Covid-19 period, compared to -10% observed between 2012 and 2013 in the BAAC for instance), which may allow to stabilize the estimation parameters which have been up to now constantly evolving. At the Rhône level, the DFRS data has already been linked to the Registry data. Yet, extrapolation to the national level could be hindered by the fact that several variables that are included in the Rhône DFRS databases are not necessarily reported in all departmental databases (for instance, mode of transport, presence of a third party, or age of the casualty are not always recorded).

For this PhD proposal, the research hypotheses are as follows:

  • The BAAC data display significant limitations in terms of completeness, recording homogeneity, and recording biases, which, when used as a basis for estimating the national number of injured and seriously injured road users, lead to substantial estimation errors.
  • The DFRS data are more robust (i.e. stable, complete, and possibly with small bias) than the BAAC data. Using these data would allow significantly improving the national estimates of the number of injured and seriously injured road users.

 [1] Hook & Regal (1995). Capture-recapture methods in epidemiology: methods and limitations. Epid. Reviews.

[2] Zullo et al. (2021). Estimated number of seriously injured road users admitted to hospital in France between 2010 and 2017, based on medico-administrative data. BMC Public Health.

[3] Amoros et al. (2022). Linked police and health data: how to apply capture-recapture to correct for under-reporting and bias. 7th IRTAD Conference.

[4] Gallay et al. (2002). The capture-recapture applied to epidemiology: Principles, limits and application. Revue d’Épid. et de Santé Pub.

[5] IWGDMF (1995). Capture-recapture and multiple-record systems estimation I: History and theoretical development. Intern. Working Group for Disease Monitoring and Forecasting. Am J Epidemiol.

[6] Amoros (2007). Les blessés par accidents de la route : estimation de leur nombre et de leur gravité lésionnelle, France, 1996-2004. Thèse université Lyon 1.

 

Objectives of the thesis

The objectives of the thesis are as follows:

  • Develop an R program that allows for the parameterization of the capture-recapture modeling; this would facilitate its application to various databases and enable to easily change the list of variables included in the models.
  • Estimate the national number of injured and seriously injured road users using a two-source capture-recapture method, relying on DFRS and the Rhône Registry databases.
  • Estimate the national number of injured and seriously injured road users using a three-source capture-recapture method, relying on DFRS, BAAC, and the Rhône Registry databases.
  • Compare the results obtained and estimate the benefit of using the DFRS data.
  •  

    Timeline

    We plan the following timeline for this thesis:

    Year 1:

    • Literature review
    • Preparatory work before applying the twosource CRC method to the DFRS and Registry data: (1) identify the variables that can be used for data linkage between the two sources; (2) estimate the quality of data linkage; (3) ensure the conditions for applying the CRC method are met; (4) identify the variables that influence the probability of recording casualties; and (5) adapt the method for predicting the proportion of MAIS3+, which was developed originally on the BAAC database, to the DFRS database.
    • Implementation of the twosource CRC method in R.

    Year 2:

    • Application of the twosource CRC method to the DFRS and Registry data, and extrapolation to national DFRS data.
    • Preparatory work before applying the threesource CRC method to the DFRS, BAAC, and Registry data: estimation of the quality of data linkage between the three sources, and ensuring the conditions for applying the CRC method are met.
    • Implementation of the threesource capture-recapture method in R.

    Year 3:

    • Application of the threesource CRC method to the DFRS, BAAC, and Registry data, and extrapolation to national DFRS data, and to the BAAC date.
    • Comparison of the road morbidity estimates obtained from two sources and from three sources of data.
    • Thesis writing.

    --------------------- FRANCAIS

    Contexte

    La Commission Européenne demande à ses États Membres de lui fournir annuellement le nombre de blessés et de blessés graves (définis par le critère MAIS3+ reposant sur l’échelle Abbreviated Injury Scale, ou AIS) de la circulation routière. En France, plusieurs dispositifs permettent de recueillir des informations sur les blessés de la circulation : les services de soins, les forces de l’ordre, et les services départementaux d’incendie et de secours (SDIS). Aucune de ces sources n’effectue un décompte exhaustif. Les chiffres annuels de la morbidité routière doivent donc être estimés à partir de données parcellaires. Depuis 15 ans, ces estimations sont réalisées à l’Umrestte en utilisant une modélisation par approche capture-recapture (CRC) [1] qui permet d’analyser les données communes à plusieurs sources, et d’extrapoler ce qui est observé en termes de pratiques d’enregistrement, pour estimer le nombre de blessés n’étant enregistrés par aucune de ces sources.

    Pour réaliser cette modélisation, l’Umrestte se base sur les données des forces de l’ordre, et sur les données du Registre (médical) du Rhône des victimes d’accidents de la circulation routière. Ce Registre recense les victimes d’accidents de la route survenus dans le département de manière quasi-exhaustive, auprès de tous les services hospitaliers, publics et privés, du Rhône ou limitrophes; ce recensement concerne aussi bien les victimes hospitalisées que celles qui consultent aux Urgences, et est accompagné d’une description précise des lésions, et de leur gravité codée avec l’AIS, donc du critère de gravité MAIS3+. Notons que les données médicales du Programme de Médicalisation des Systèmes d’Information (PMSI), disponibles au niveau national, sont difficilement utilisables puisque l’identification des blessés de la route s’y fait avec la « cause externe », qui n’est renseignée qu’à 40% [2]. Côté forces de l’ordre, les BAAC sont disponibles à l’échelle départementale et nationale. Ces données contiennent des informations précises sur l’accident et l’accidenté; la gravité des blessures n’y est pas caractérisée selon le critère MAIS3+, mais selon la catégorisation : indemne/blessé hospitalisé/blessé non hospitalisé/décédé. L’approche d’estimation réalisée à l’Umrestte est la suivante: la modélisation par CRC est réalisée au niveau du département du Rhône en utilisant les données du Registre et des BAAC, ce qui permet d’estimer le sous-enregistrement des BAAC, et d’en déduire des facteurs correcteurs. Ces facteurs correcteurs sont alors appliqués au niveau national aux données BAAC, après prise en compte des biais qui leur sont associés; autrement dit, on effectue un redressement de ces données afin d’estimer le nombre total de blessés et de blessés graves en France métropolitaine [3].

    Or, nous observons depuis plusieurs années une sous-évaluation de nos estimations nationales : les chiffres estimés sont inférieurs aux effectifs annuels de blessés de la route remontés par les SDIS.

    Cette sous-estimation peut avoir plusieurs causes, dont la plus vraisemblable est la suivante. Parmi les six conditions d’application de la méthode CRC [1,4,5], une n’est pas vérifiée : l’hypothèse d’homogénéité de capture (i.e. une même probabilité d’enregistrement pour tous les blessés). Certains biais d’enregistrement sont en effet observés dans les données BAAC (eg. la probabilité d’enregistrement dépend de certaines caractéristiques des accidents et des accidentés : les cyclistes, les motards, les accidentés sans tiers, et les blessés légers sont notamment faiblement enregistrés [6]); ces biais peuvent être pris en compte dans la modélisation. Il faut cependant que les pratiques d’enregistrement par les forces de l’ordre (et leurs biais) soient homogènes sur tout le territoire national pour que la projection au niveau national soit valide. Or, ces dernières années, des modifications dans le mode de recueil des données BAAC ont généré des hétérogénéités : une hausse du taux d’enregistrement a été constatée en 2017 en zone gendarmerie, bien plus forte dans le Rhône que dans l’ensemble de la France; et en 2018, pour les trois forces de l’ordre, une altération du classement hospitalisé / non-hospitalisé a été identifiée, avec des pratiques de classification variant d’un département à l’autre (cette altération a par ailleurs conduit ce critère à ne plus être labélisé par l’autorité de la statistique publique). En dernière instance, le faible taux d’enregistrement des blessés dans les BAAC décuple l’erreur qui peut découler de ces biais, puisque ces biais sont multipliés par la part des blessés qui doit être estimée (que l’on évalue à 75% au niveau national).

    Cela nous pousse à envisager d’utiliser d’autres données pour réaliser nos estimations. Les données des SDIS sont une piste intéressante. Comme les BAAC, elles sont disponibles à l’échelle nationale, à minima sous forme agrégée; elles sont bien plus proches de l’exhaustivité que les BAAC (279 413 victimes enregistrées en 2019, contre 70 490 dans les BAAC), et semblent de plus indiquer des pratiques d’enregistrement plus homogènes dans le temps (variations annuelles inférieures à 3% hors période Covid-19, contre -10% observé entre 2012 et 2013 dans les BAAC par exemple), ce qui pourrait permettre de stabiliser les paramètres d’estimation (à ce jour en constante évolution). Au niveau du Rhône, les données des services incendies et secours ont déjà été liées aux données du Registre. Certaines variables présentes dans la base de données du Rhône ne sont cependant pas disponibles dans toutes les bases départementales (le mode de déplacement, la présence d’un tiers, ou l’âge du blessé par exemple), ce qui pourrait gêner l’extrapolation au niveau national.

    Pour la thèse que nous proposons, les hypothèses de recherche sont les suivantes :

    • Les données BAAC présentent des limites importantes en termes de complétude, d’homogénéité d’enregistrement, et de biais d’enregistrement, qui, lorsqu’elles sont utilisées comme base pour l’estimation nationale du nombre de blessés et de blessés graves de la circulation routière, génèrent d’importantes erreurs d’estimation.
    • Les données SDIS sont plus robustes (i.e. stables, complètes, et possiblement peu biaisées) que les données BAAC. Utiliser ces données permettrait d’améliorer considérablement les estimations nationales du nombre de blessés et de blessés graves de la circulation routière.

    [1] Hook & Regal (1995). Capture-recapture methods in epidemiology: methods and limitations. Epid. Reviews.

    [2] Zullo et al. (2021). Estimated number of seriously injured road users admitted to hospital in France between 2010 and 2017, based on medico-administrative data. BMC Public Health.

    [3] Amoros et al. (2022). Linked police and health data: how to apply capture-recapture to correct for under-reporting and bias. 7th IRTAD Conference.

    [4] Gallay et al. (2002). The capture-recapture applied to epidemiology: Principles, limits and application. Revue d’Épid. et de Santé Pub.

    [5] IWGDMF (1995). Capture-recapture and multiple-record systems estimation I: History and theoretical development. Intern. Working Group for Disease Monitoring and Forecasting. Am J Epidemiol.

    [6] Amoros (2007). Les blessés par accidents de la route : estimation de leur nombre et de leur gravité lésionnelle, France, 1996-2004. Thèse université Lyon 1.

     

    Objectifs de la thèse

    Les objectifs de la thèse sont:

  • Développer une programmation sous R permettant un paramétrage de la modélisation par approche capture-recapture, afin de faciliter son application à diverses bases de données et de pouvoir aisément faire varier la liste de variables prises en compte dans les modéles.
  • Estimer le nombre national de blessés et de blessés graves de la circulation routière par une méthode capture–recapture à 2 sources en utilisant les données SDIS et Registre du Rhône.
  • Estimer le nombre national de blessés et de blessés graves de la circulation routière par une méthode capture–recapture à 3 sources en utilisant les données SDIS, BAAC et Registre du Rhône.
  • Comparer les résultats obtenus, et estimer le bénéfice apporté par l’utilisation des données SDIS.
  •  

    Calendrier de thèse

    Il est prévu le calendrier suivant :

    Année 1 :

    • Revue de la littérature
    • Travail préparatoire à l’application de la méthode CRC sur données SDIS et Registre : (1) identifier les variables utilisables pour le chainage des données entre les deux sources; (2) estimer la qualité du chainage; (3) vérifier les conditions d’application de la méthode CRC; (4) identifier les variables influençant la probabilité d’enregistrement des blessés; et (5) adapter la méthode de prédiction de la proportion de MAIS3+, conçue pour les données BAAC, aux données SDIS
    • Implémentation de la méthode CRC à 2 sources sous R

    Année 2 :

    • Application de la méthode CRC sur données SDIS et Registre, et extrapolation sur données SDIS nationale
    • Travail préparatoire à l’application de la méthode CRC sur données SDIS, BAAC et Registre : estimation de la qualité du chainage entre les 3 sources, et vérification des conditions de validité de la méthode CRC
    • Implémentation sous R de la méthode de capturerecapture à 3 sources

    Année 3 :

    • Application de la méthode CRC sur données SDIS, BAAC et Registre, et extrapolation sur données SDIS nationales, et BAAC nationales
    • Comparaison des estimations de morbidité routière obtenues à partir de 2 sources et à partir de 3 sources de données
    • Rédaction de la thèse

     

     

    Funding category: Contrat doctoral

    PHD title: Doctorat en épidémiologie
    PHD Country: France


    Requirements
    Specific Requirements

    Master's degree or Engineer in Epidemiology, Statistics, or Biostatistics with:

    - A professional experience in statistics, biostatistics, clinical research, epidemiology

    - Proficiency in statistical software and data management tools (SAS, R, STATA, etc.)

    - A good level of written and spoken English

    - Analytical, synthesis, and scientific writing skills in French and English

    - Rigor and ability to collaborate with team members and partners

    - Interest in research work

    Knowledge in medical field and/or accidentology and/or transportation is a plus.


    Additional Information
    Work Location(s)
    Number of offers available
    1
    Company/Institute
    Université Gustave Eiffel - Site de Lyon-Bron
    Country
    France
    City
    Bron
    Geofield


    Where to apply
    Website

    https://www.abg.asso.fr/fr/candidatOffres/show/id_offre/121495

    Contact
    Website

    http://www.univ-gustave-eiffel.fr

    STATUS: EXPIRED