Un moteur de recherche pour trouver les meilleures données ?

Que diriez-vous de pouvoir visualiser les résultats de votre expérience classés selon le fonctionnement du « page rank » ? Quel serait l’impact sur votre flux de travail si vous pouviez collaborer avec vos collègues grâce à une plateforme unique ? Et si vous pouviez rechercher certaines spécifications dans toutes vos données d’évènements ? Voilà quelques-unes des nombreuses idées étudiées par l’expérience LHCb en collaboration avec le géant d'internet Yandex.

 

Un événement extrêmement rare de désintégration B0s → μμ observé dans le détecteur LHCb.

Premier moteur de recherche en Russie, avec plus de 60 % des parts de marché, Yandex est à l'Est ce que Google est à l’Ouest. La collaboration entre Yandex et le CERN a débuté en 2011, lorsque Ilya Ségalovtich, co-fondateur de Yandex, a été approché par Andreï Goloutvin, alors porte-parole de LHCb. « À l’instar des moteurs de recherche de Yandex, qui parcourent des milliers de sites web pour dénicher la page souhaitée, nos expérimentateurs appliquent des algorithmes afin de trouver le meilleur résultat dans nos données, explique Andreï Goloutvin. Peut-être que la technique utilisée pour hiérarchiser les pages web pourrait aussi être appliquée au classement des données ? »

C’est une idée que Yandex a décidé d’exploiter, et le géant d’internet travaille à présent en collaboration avec l'Organisation sous les auspices de CERN openlab. Yandex a développé un algorithme de recherche et de sélection d’évènements en coopération avec l’expérience LHCb. Cet algorithme utilise la technologie brevetée d’apprentissage automatique MatrixNet, qui s’enrichit des précédentes expériences pour fournir des résultats plus pertinents. L’algorithme semble particulièrement adapté à la recherche d'évènements extrêmement rares (tels que celui montré sur l'image) et il est aujourd’hui utilisé dans plusieurs analyses afin d’aider à améliorer les performances de sélection, défiant ainsi les techniques statistiques standard.  

Cependant, l’innovation la plus utile de Yandex n’est pas là où on l’attendait : « Nous avons constaté que ce n’était pas l’algorithme proprement dit qui apportait un plus réel, mais plutôt l'interface conviviale que nous avons développée autour de celui-ci, explique Andreï Oustioujanine, employé de Yandex et membre de la collaboration LHCb. Elle permet aux scientifiques d’interagir facilement lorsqu’ils travaillent ensemble sur un même groupe de données. La plateforme fonctionne comme une sorte de Wikipédia, grâce auquel vous pouvez accomplir des calculs et les partager avec d’autres utilisateurs. » De plus, la plateforme interactive ne se limite pas uniquement aux algorithmes créés par Yandex : n’importe quel procédé de sélection d’événements peut être appliqué.  

Bien que le projet soit encore à ses débuts, Yandex encourage les expérimentateurs du CERN à explorer le potentiel de sa plateforme. « Un tel outil peut constituer un mode de collaboration beaucoup plus efficace, souligne Andreï Oustioujanine. En unifiant le procédé d’analyse, dans un esprit de libre accès à la science, les scientifiques peuvent partager leurs idées concernant l’amélioration des codes ou encore réutiliser un même logiciel d’analyse sur un autre ensemble de données. Quand bien même notre propre plateforme ne serait pas adoptée, nous avons l'espoir que de plus en plus d'expériences prendront en considération ce modèle de collaboration virtuel. »

Mais ce n’est pas tout. Alors que la collaboration entre Yandex et l’Organisation continue de se renforcer, un nombre croissant d’idées avant-gardistes sont étudiées. Pourrions-nous créer un outil de recherche capable de passer au crible les données pour trouver un événement particulier ? Ou une plateforme à même de démontrer comment améliorer les résultats sur la base de différentes analyses ? Pourrions-nous automatiser l’optimisation des algorithmes d'analyse pour qu'ils s’adaptent à la constante évolution des paramètres ? Voilà quelques-unes des nombreuses idées qui sont à l’étude. 

par Katarina Anthony