Défi sur le Higgs : le gagnant est l'apprentissage automatique

Le gagnant du défi intitulé Higgs Machine Learning Challenge (Apprentissage automatique et boson de Higgs), lancé le 12 mai pour une durée de quatre mois, est maintenant connu : il s’agit de Gábor Meli, de Hongrie. Tim Salimans, des Pays-Bas, et Pierre Courtiol, de France, complètent le podium. Le défi consistait à étudier les possibilités offertes par des méthodes d'apprentissage automatique évoluées pour améliorer le niveau de signification de la découverte de bosons de Higgs.

 

Gagnants du défi Higgs Machine Learning Challenge : Gábor Melis et Tim Salimans (en haut) et Tianqi Chen et Tong He (en bas).

Les participants au défi Higgs Machine Learning Challenge avaient pour mission d'élaborer un algorithme destiné à améliorer la détection de signaux correspondant à la désintégration de bosons de Higgs en deux particules tau, au moyen d'un échantillon de données d'ATLAS simulées* contenant peu de signaux et une majorité d'événements de bruit de fond non liés à des bosons de Higgs. Ce défi ne demandait aucune connaissance en physique des particules, mais il était essentiel de posséder des compétences dans le domaine de l’apprentissage automatique, en sachant entraîner des ordinateurs à reconnaître des motifs parmi des données. Le défi, organisé par le site Kaggle, a attiré cette année 1785 équipes, un record.

« L’énorme succès du défi montre que le public est fasciné par la découverte du boson de Higgs, y compris par les outils statistiques qui ont été utilisés à cette fin, fait observer Andreas Hoecker, coordinateur pour la physique de l’expérience ATLAS. Il montre aussi que la physique des particules expérimentale, malgré sa complexité, peut grandement tirer profit de l’apprentissage automatique. »

Gábor Melis, le gagnant, possède un diplôme en génie logiciel et en mathématiques. Il a mis au point un algorithme représentant un ensemble de réseaux neuronaux profonds entraînés sur des sous-ensembles aléatoires de données, faisant appel à un minimum d’ingénierie des caractéristiques (feature engineering) et ne demandant aucune connaissance en physique. Le candidat qui s’est classé deuxième, Tim Salimans, est titulaire d’un doctorat en économétrie et travaille comme consultant en science des données. Il a élaboré une solution qu’il décrit lui-même comme la combinaison de plusieurs ensembles d'arbres de décision boostés, comportant des astuces améliorant l'efficacité statistique.

À côté des récompenses principales, le prix Special High Energy Physics meets Machine Learning a été remis à Tianqi Chen et Tong He, de l’équipe Crowwork. Ces derniers ont obtenu moins de points que Gábor Melis (3,72 contre 3,81), mais un examen attentif a montré que l’algorithme qu’ils ont mis au point, appelé XG Boost, offre un excellent compromis entre performance et simplicité, et pourrait améliorer certains outils utilisés en physique des hautes énergies. L’équipe a été invitée au CERN l’année prochaine pour participer à un atelier consacré aux techniques d'apprentissage automatique utilisées en physique des hautes énergies.


Celles et ceux qui souhaitent mettre à l'épreuve de nouvelles idées trouveront sur le site opendata.cern.ch les données simulées utilisées pour le défi.

par Abha Eli Phoboo