« Avec ECLAT, nous travaillons au contact direct des développeurs d’applications scientifiques »

Comment le calcul haute performance peut-il répondre aux défis liés aux données de la radioastronomie de nouvelle génération ? Dans cet entretien, François Tessier, chercheur à l’Inria et spécialiste des E/S, explique comment ECLAT offre une occasion unique de collaborer directement avec les développeurs d’applications scientifiques, de tester la recherche sur de véritables pipelines liés au SKA et de préparer les futures infrastructures de calcul, de NumPEx à l’ère de l’exascale.

Entretien avec François Tessier, chercheur Inria, spécialiste des E/S pour le calcul haute performance

Bonjour François ! Peux-tu rappeler ton parcours et ton domaine de recherche ?

J’ai soutenu ma thèse en 2015 à l’Université de Bordeaux (rattaché à une équipe Inria), puis j’ai passé près de trois ans en post-doctorat à l’Argonne National Laboratory, près de Chicago aux États-Unis, avant de rejoindre le Centre National de Calcul Suisse, le CSCS. J’ai ensuite été recruté à Inria, il y a bientôt six ans. Aujourd’hui, je travaille au sein de l’équipe KerData, qui s’intéresse à la gestion de données dans les systèmes distribués et le calcul haute performance.

Historiquement, l’équipe était très orientée vers les entrées-sorties (E/S), le stockage à large échelle et les systèmes de fichiers parallèles. Ces sujets restent au cœur de mon activité, même si l’équipe s’est élargie vers d’autres thématiques comme les workflows, l’apprentissage fédéré ou encore certains aspects du calcul quantique. Le point commun entre tous ces sujets reste la donnée : comment elle circule, comment elle est stockée, comment elle est exploitée efficacement.

Qu’est-ce qu’ECLAT t’apportes concrètement dans tes recherches ?

ECLAT constitue pour nous un cas d’usage particulièrement précieux. Dans le domaine du HPC, nous développons souvent des modèles, des algorithmes ou des méthodes d’optimisation, mais il est difficile de les tester sur de vraies applications scientifiques. On dispose parfois de benchmarks, de versions simplifiées ou de traces d’exécution, mais rarement d’un accès direct aux applications et aux personnes qui les développent.

Avec ECLAT, c’est différent : nous pouvons échanger directement avec les scientifiques et les ingénieurs qui écrivent les codes utilisés pour traiter les données en provenance des radiotélescopes, comprendre les choix faits et exécuter les applications. Cette proximité est rare et très précieuse pour la recherche expérimentale.

« Avec ECLAT, nous pouvons échanger directement avec les scientifiques et les ingénieurs qui écrivent les codes. »

« L’objectif est de mieux comprendre les comportements des applications, puis de produire des recommandations. »

Concrètement, que cherches-tu à optimiser ?

Déjà, nous ne touchons pas au matériel : nous composons avec. Nous travaillons plutôt entre l’application et les systèmes de stockage. Une partie importante de notre recherche consiste à analyser comment les applications lisent et écrivent leurs données. Nous récupérons des traces d’exécution produites par les centres de calcul, puis nous cherchons à identifier des motifs récurrents.

L’objectif est de mieux comprendre les comportements des applications, de les classifier, puis de produire des recommandations ou des prédictions. Un objectif est de transmettre ces informations à l’ordonnanceur d’un supercalculateur afin qu’il alloue plus intelligemment les ressources de calcul et de stockage.

ECLAT permet-il d’aller plus loin que cette analyse générale ?

Oui, c’est précisément son intérêt. Dans ECLAT, nous ne travaillons pas seulement sur des traces abstraites. Nous avons un pipeline scientifique concret, lié au traitement des données radioastronomiques, avec des composants comme DDFacet et KillMS. Un stagiaire financé par ECLAT, Pietro Mani, travaille actuellement avec moi sur le monitoring des entrées-sorties du pipeline complet. Il est désormais capable de produire des graphiques montrant l’évolution des usages de ressources et des accès aux données pendant l’exécution. C’est une étape importante : elle permet de passer d’une compréhension théorique à une mesure précise sur une application réelle.

François Tessier à la conférence NHR, 2025, Copyrights photo: NHR-Verein e.V

Comment ce travail s’articule-t-il avec le projet NumPEx ?

Il y a une forte continuité entre ECLAT et NumPEx. NumPEx vise à préparer la pile logicielle française pour l’ère de l’Exascale, c’est-à-dire pour des machines capables d’atteindre des puissances de calcul colossales. Dans ce cadre, certains cas d’usage jouent un rôle structurant, dont le SKA. En pratique, lorsque nous parlons de SKA dans NumPEx, nous parlons aussi et surtout du travail conduit dans ECLAT autour des pipelines de traitement radioastronomique. Cela nous permet de faire le lien entre une infrastructure de recherche internationale, le SKA, un laboratoire commun national, ECLAT, et les enjeux plus larges de préparation de l’écosystème HPC français à l’Exascale.

L’intelligence artificielle change-t-elle aussi votre domaine ?

Oui, à deux niveaux. D’abord, elle change nos méthodes : nous commençons à utiliser des techniques d’IA pour analyser de grands volumes de traces d’exécution et extraire automatiquement des motifs d’accès.

Ensuite, elle change les applications elles-mêmes. Les charges de travail liées à l’IA lisent souvent de très grands volumes de données parfois avec des motifs d’accès qu’on rencontrait peu auparavant, alors que les simulations numériques classiques étaient plutôt dominées par les écritures, notamment pour les checkpoints (protection/reprise). Cette évolution transforme les profils d’usage des supercalculateurs et rend l’analyse des entrées-sorties encore plus stratégique.

« L’IA transforme les profils d’usage des supercalculateurs et rend l’analyse des E/S encore plus stratégique. »

Que représente ECLAT pour toi au-delà de l’aspect technique ?

ECLAT est un formidable espace de dialogue entre deux mondes : celui de l’astronomie et celui du calcul haute performance. Pour nous, informaticiens, travailler sur le SKA est très motivant. C’est un cas d’usage scientifique majeur, visible, ambitieux, et qui donne du sens à des recherches parfois perçues comme très techniques. Les entrées-sorties et le stockage ne font pas toujours rêver les étudiants ; mais lorsqu’on explique que ces travaux contribuent à préparer l’exploitation du plus grand radiotélescope du monde, cela change immédiatement la perception du sujet. ECLAT joue donc aussi un rôle d’attractivité, de structuration et de cohésion scientifique. C’est un laboratoire qui rend possible une recherche plus appliquée, plus connectée aux besoins des scientifiques, et potentiellement plus utile pour les futures infrastructures de calcul.

« Travailler sur le SKA est très motivant. C’est un cas d’usage scientifique qui donne du sens à des recherches parfois perçues comme très techniques. »

Vous pourriez être intéressé...

Interview avec Chiara et Damien sur le bilan 2025

Interview avec Chiara et Damien sur le bilan 2025

2025 marque un tournant pour le laboratoire ECLAT. Il clôt son deuxième exercice sur une belle dynamique et entame son troisième cycle. Damien Gratadour, directeur d’ECLAT, et Chiara Ferrari, directrice de SKA France, dressent un bilan résolument positif :...

lire plus
Dans les coulisses du premier hackathon GPU ECLAT

Dans les coulisses du premier hackathon GPU ECLAT

Organisé du 20 au 24 octobre 2025 à l'Observatoire de Paris-PSL, le premier hackathon GPU ECLAT a marqué une étape importante pour relever le défi du déluge de données à venir, en lançant officiellement une nouvelle initiative internationale visant à accélérer les...

lire plus