La professeure Roberta Wichmann, du programme de maîtrise en économie, a publié un article intitulé « …sous la forme de… » en collaboration avec des chercheurs de l’USP et des membres du réseau IACOV-BR. Améliorer les performances des algorithmes d'apprentissage automatique pour la prédiction des résultats de santé dans les cohortes multicentriques dans la revue Nature Scientific ReportsScientific Reports est la cinquième revue la plus citée au monde, avec plus de 696 000 citations en 2021, et bénéficie d’une large attention dans les documents de politique générale et les médias.https://www.nature.com/srep/).
L'idée de cette recherche est née d'une interrogation : les auteurs se demandaient si, dans le domaine de la santé, il était possible d'améliorer les performances prédictives des modèles d'apprentissage automatique en enrichissant simplement leur entraînement avec davantage de données. Autrement dit, serait-il possible de généraliser un modèle à différents hôpitaux d'un même État ou à différentes régions du Brésil ? Les auteurs ont donc testé différentes stratégies d'entraînement, en commençant par un entraînement local à partir des données d'un seul hôpital, puis en progressant vers différentes formes d'agrégation avec des données provenant d'autres hôpitaux. L'objectif était d'évaluer la performance prédictive du modèle quant à l'identification du risque de décès lié à la COVID-19 et, par conséquent, de déterminer s'il serait possible de généraliser cette prédiction à l'ensemble du pays.
Comment l'étude a-t-elle été menée ? Huit stratégies différentes ont été créées, et les données de 18 hôpitaux répartis dans toutes les régions du Brésil ont été utilisées pour entraîner trois modèles d'apprentissage automatique (xgboost, catboost et lightgbm) afin d'identifier la meilleure stratégie pour maximiser les performances prédictives.
"Dans notre étude, la meilleure stratégie consistait à s'entraîner avec les données d'un seul hôpital, obtenant les meilleures performances dans 11 (61 %) des 18 hôpitaux, bien que dans quelques cas, de meilleures performances prédictives aient été obtenues en ajoutant plus de données. », dit l'enseignant RobertaPar conséquent, l'utilisation des données d'un seul hôpital peut donner de meilleurs résultats que l'addition de données provenant de différents hôpitaux ayant des protocoles et des différences socio-économiques différents.
Félicitations à la professeure Roberta et à tous les auteurs et partenaires impliqués !
[vc_column_text][/vc_column][/vc_row][vc_row][vc_column][vc_btn title="ACCÉDER À L'ARTICLE ICI" color="primary" link="url:https%3A%2F%2Fwww.nature.com%2Farticles%2Fs41598-022-26467-6||target:%20_blank|"][/vc_column][/vc_row]