Working groups of GDR

Design of numerical experiments

Coordinators : Luc Pronzato (Université Nice Sophia Antipolis, France) and Emmanuel Vazquez (SUPELEC, Gif sur Yvette, France)

The extensive use of numerical simulations opens the ways for new types of experimentations and designs of experiments: more intensive explorations become possible, more hazardous configurations can be tested and, hopefully, better understanding and optimized responses can be achieved together with more accurate statements about risk and failures. At the same time, complex simulations require long computations, which sets a limitation on what can be learnt in reasonable time. The domain of design and analysis of computer experiments aims at defining what should be chosen for the inputs of a numerical model in order to achieve a prescribed objective. In particular, one may want to: (i) predict the behavior of a numerical model from the results of a small number of runs; (ii) optimize the response of a numerical model; that is, determine the values ​​of inputs corresponding, for example, to the highest performance or smallest cost; (iii) estimate the variability of a response as a function of that of the inputs (also known as sensitivity analysis); (iv) estimate a probability of failure in presence of uncertainties when some inputs are randomized with a given probability measure.

Whereas space-filling designs are commonly used for the first objective, different types of designs may be more relevant in other situations. Sequential strategies (or active learning) that construct a model of the numerical simulator step by step, are especially attractive. The topics considered in this Working Group cover the definition of design criteria related to a given objective, the construction of efficient algorithms for the determination of optimal experiments, the investigation of asymptotic properties of designs, the construction of designs for dealing with simulators with several levels of predictive accuracy. Experiments for real physical systems, where in general purely random errors corrupt the observations, are also considered.

Avec l'usage de plus en plus répandu des outils de simulation numérique et de planification d'expériences, de nouvelles possibilités d'expérimentation voient le jour : il devient ainsi possible d'explorer plus intensivement les configurations possibles pour un système, y compris des configurations dangereuses. Ces nouvelles possibilités d'exploration permettent d'une part de mieux comprendre les phénomènes physiques en jeu et d'autre part d'obtenir des configurations optimisées. Dans le même temps, le recours à des simulations complexes est souvent synonyme de calculs longs, ce qui fixe une limite à ce qu'on peut apprendre en un temps raisonnable. Le domaine de la conception et de l'analyse d'expériences numériques vise à définir quelles sont les expériences numériques à réaliser afin d'atteindre un objectif prescrit. En particulier, on peut vouloir : (i) prévoir le comportement d'un modèle numérique à partir d'un petit nombre de simulations ; (ii) optimiser la réponse d'un modèle numérique, par exemple pour obtenir une performance maximale ou un coût minimal ; (iii) quantifier la variabilité de la réponse d'un modèle en fonction de celle des entrées (on parle aussi d'analyse de sensibilité) ; (iv) estimer une probabilité de défaillance d'un système en présence d'incertitudes sur les entrées du modèle. Les techniques classiques de remplissage d'espace sont couramment utilisées pour le premier objectif. Cependant, il est sans doute plus pertinent d'envisager d'autres techniques pour les autres cas. Ainsi par exemple, les stratégies séquentielles (ou d'apprentissage actif) qui construisent un modèle d'un simulateur numérique étape par étape sont particulièrement attrayantes. Les thèmes abordés dans ce Groupe de Travail comprennent le problème de la définition de critères de planification liés à un objectif donné, la construction d'algorithmes efficaces pour la détermination d'expériences optimales, l'étude des propriétés asymptotiques de plans d'expériences, la planification d'expériences pour des simulateurs numériques comportant plusieurs niveaux de prédictivité réglable. Le problème de la planification d'expériences dans le cas de systèmes physiques réels, où des erreurs purement aléatoires peuvent corrompre les observations, est également considéré.

Computer code approximation via metamodels

Coordinators : Josselin Garnier (Université Paris VII, France) and Anthony Nouy (Ecole Centrale de Nantes, France)

Statistical techniques or stochastic numerical methods can be used to build approximations of expensive computer codes. These statistical approximations, or metamodels, or response surfaces, are computationally cheap and they can then be used to replace the actual computer codes to tackle problems such as uncertainty analysis, sensitivity analysis, probabilistic inverse problems or multiobjective optimization. A wide variety of response surfaces exist: linear, polynomial, spline-based, fitted with neural networks or with kernel functions lying in Reproducing Kernel Hilbert Spaces (RKHS) like SVM, kriging functions or Gaussian processes (bayesian framework). Each model is more or less well-suited to the different practical problems. However, applications to real and/or industrial problems raise several problems: • What can we do when the number of input variables is really large? • How to simultaneously deal with several output variables? • How can we deal with multi scale-problems? • How to consider the anisotropy problems? • What can we do when the code outputs are curves (functional data)?

Il est possible d'utiliser des techniques statistiques ou des méthodes numériques stochastiques pour construire des approximations de codes numériques coûteux. Ces approximations statistiques, ou métamodèles, ou surfaces de réponses, sont peu coûteuse et peuvent alors être utilisés pour remplacer les vrais codes pour résoudre des problèmes du type propagation d'incertitudes, analyse de sensibilité, problèmes probabilistes inverses ou optimisation multi-objectifs. Il existe une grande variété de surfaces de réponses, qu'elles soient linéaires, polynomiales, à base de splines, construites à l'aide de réseaux de neurones ou basées sur des fonctions noyaux figurant dans des espaces de Hilbert à noyaux auto-reproduisants (RKHS), comme les SVM ou les fonctions de krigeage et les processus gaussiens (point de vue bayésien). Cependant, outre que les qualités de chaque technique les rendent plus ou moins adaptées aux différentes situations rencontrées en pratique, la confrontation aux problèmes industriels soulèvent plusieurs questions d'adéquation des hypothèses : • que faire quand le nombre de paramètres d'entrées est réellement important ? • comment traiter le cas où on étudie plusieurs réponses simultanément ? • comment traiter les problèmes multi-échelles ? • comment traiter les problèmes d'anisotropie ? • que faire quand les réponses sont des courbes (données fonctionnelles) ?

Uncertainty and sensitivity analyses

Coordinators : Fabrice Gamboa (Université Paul Sabatier, Toulouse, France) and Bruno Sudret (Ecole des Ponts ParisTech)

Uncertainty analysis aims to understand the impact of input variables or noise on these input variables on the code output variables. Usually, deterministic tools of differential calculus are used. For example, a basic index is obtained via the derivative of one output respective to one imput. Such approach remains local because derivatives are generally computed at specific points. In this deterministic approach, we are interested by the automatic differentiation tools which aim at efficiently compute complex code derivatives.

The stochastic approach of uncertainty analysis aims at studying global criteria based on joint pdf modelisation of the problem variables. The obtained sensitivity indices describe the global variabilities of the phenomena. For example, the Sobol sensitivity index is given by the ratio between the ouput variance conditionally to one input and the total output variance. Computation of such quantities leads to very interesting statistical problems that we propose to study. For example, the efficient estimation of sensitivity indices from a few runs relates to semi or non-parametric estimation techniques. The stochastic modelisation of the input/output relation ship is another solution. We can look for models with specific properties (parcimonious representation using ad hoc response surfaces, having remarkable algebraic properties as orthogonality, etc).

L’analyse d’incertitudes consiste à comprendre l’influence de certaines variables d’entrée ou du bruit sur ces variables sur les sorties du code. Traditionnellement, cette analyse s’effectue à l’aide d’outils déterministes de calcul différentiel. Un indice basique est par exemple obtenu à l’aide de la dérivée d’une des sorties par rapport à l’une des entrées. Ce type d’approche reste très locale car les dérivées sont généralement évaluées numériquement pour des points de fonctionnement typiques. Dans le cadre de cette approche déterministe, on s’intéressera à la problématique des codes de dérivation automatique dont l’objectif est d’évaluer efficacement les dérivées d’un code complexe. L’approche stochastique de l’analyse d’incertitudes consiste quant à elle à étudier des critères globaux bâtis sur une modélisation des distributions conjointes des variables du problème. Elle fournit des indices qui décrivent les variabilités globales des phénomènes. Par exemple, l’indice de sensibilité de Sobol quantifie l’influence d’une variable d’entrée sur une sortie par le calcul du ratio entre la variance de la variable de sortie conditionnelle à l’entrée et la variance de la sortie. Le calcul de ce type de quantité conduit à des problèmes statistiques très intéressants que nous nous proposons d’étudier. Certains de ces problèmes relèvent de techniques d’estimation semi ou non paramétrique. C’est par exemple le cas de l’estimation efficace à partir de peu d’essais d’indices de sensibilité. D’autres conduisent à une réflexion amont sur la modélisation stochastique des relations entrées sorties. Par exemple, en cherchant des modèles qui possèdent des propriétés remarquables particulières (représentations parcimonieuses utilisant des surfaces de réponse ad hoc, représentations possédant des propriétés algébriques remarquables comme l’orthogonalité,etc).

Industrial problems

Coordinators : Fabien Mangeant (EADS CCR, France) and Mark Asch (Université de Picardie, France)

Uncertainty spans over a wide-encompassing spectrum of science and practical knowledge : economics, physics, decision theory and risk assessment are the traditional sources, and more recently modelling, numerical analysis, advanced statistics and computer science; but it even reaches epistemology, management science, psychology or public debate and democracy. The subject has a strategic interest in modelling, either driven by regulatory demands (e.g., in safety, security or environmental control in the certification or licensing processes), or by markets (e.g., industrial process optimization or business development), whereby a better understanding of the margins of uncertainty and possible actions for their reduction are being increasingly investigated for associated risks and opportunities. As modelling and simulations are more and more popular in the industrial pratice, many industrial challenges arise when pratictioners want to deal with uncertainty and sensitivity analysis.

Within this group, the first goal is to guarantee the applicability and the transfer of the previous scientific techniques to current difficulties encountered by industrial practitioners. On the other hand, the different industrial partners will propose current challenges to the scientific community. This concerns for example: high dimensionality, computational times, coupling between different codes, scarcity of observational data, special repartition in the space of the factors.

Workshops and dedicated sessions will be organised to ease a fruitful dialog between the different communities.

Ce thème a pour objectif de garantir l'application des techniques précédentes à des difficultés réellement rencontrées dans le monde industriel. La taille des problèmes, les temps de calcul, le couplage des codes sont autant de circonstances compliquant la mise en oeuvre des algorithmes. La rareté des données expérimentales, ou leurs répartitions particulières dans l'espace des facteurs conduisent également à des difficultés de résolution. Enfin, face à une réalité complexe étudiée de plus en plus finement, les modèles eux-mêmes sont questionnables.
En problématiques industrielles, on s'attachera principalement à bien poser les problèmes, et à rendre compte des solutions mises en oeuvre. Le format des ateliers devrait permettre une interaction particulièrement fructueuse et féconde, puisqu'au cours de ces sessions, des problèmes amenés par des industriels seront examinés en détail.

Environmental problems

Coordinators : Clémentine Prieur (Université Joseph Fourier, Grenoble, France) and Hervé Monod (INRA, France)

The scientific backdrop of this working group is the design, modelling and analysis of complex models and/or forecasting systems for environmental applications: climate change, regional forecasting systems for the ocean and the atmosphere, evolution of air and water quality, agri-environment interactions, … The overall applicative aim is to contribute to a better understanding, forecasting and possibly control of such systems.

A number of specific features may arise in such applications :

  • A fundamental aspect of many geophysical phenomena is the strong interactions between scales (spatial and temporal), and the associated cascade of energy, which of course complicates their modelling.
  • An additional source of complexity may arise when the stochastic nature of some parts of the systems cannot be neglected, in particular when rare and extreme events must be detected and allowed for.
  • Most of the time, the model is discretized over a huge grid (sometimes with millions of points). We need therefore to perform efficient model reduction methods, in particular to be able to implement a sensitivity analysis on these models.
  • Moreover, forecasting systems often combine different sources of information (numerical model, direct observations, statistics, images…) with the help of data assimilation techniques. Such techniques improve the forecasting skill of the system, but make it more complex to analyze.
  • Performing and studying models which take into account the spatio-temporal dynamic of the phenomena is of great importance. Such models often involve functional inputs and/or outputs. Various methods should be developed in that sense.

The development of efficient methods to study environmental problems requires taking these features into account, a goal which implies pluridisciplinarity. A key aspect of this working group is namely to gather specialists from different domains, coming either from the applied mathematics world (numerical tools, stochastic point of view, data base management), or from the many fields of expertise associated with environment applications (in particular geophysicists, biophysicists, hydrologists, …).

Les intérêts scientifiques de ce groupe de travail sont la conception, la modélisation et l'analyse de modèles complexes et/ou de modèles de prévision dans un contexte environnemental : changement climatique, systèmes régionaux de prévision pour l'océan et l'atmosphère, évolution de la qualité de l'air et de l'eau, interactions entre agriculture, environnement, et biodiversité, … L'objectif est de contribuer à la compréhension, la prévision et éventuellement au contrôle de tels systèmes. Lorsqu'on s'intéresse à de telles applications, on voit apparaître un certain nombre de problèmes spécifiques : * L'un des aspects fondamentaux pour l'étude des phénomènes géophysiques est la prise en compte des interactions spatio-temporelles souvent considérables, pouvant entrainer de surcroît des manifestations de cascade d'énergie. * Une source supplémentaire de complexité peut surgir quand la nature stochastique de certaines parties des systèmes ne peut pas être négligée, en particulier quand des événements rares et/ou extrêmes doivent être détectés et pris en compte. * La plupart du temps, les modèles sont discrétisés sur des grilles gigantesques (parfois de plusieurs millions de points). C'est pourquoi il faut développer des méthodes de réduction efficaces, en particulier pour être capable ensuite de réaliser une analyse de sensibilité. * De plus, les systèmes de prévision combinent souvent des sources d'information de différentes natures (modèles numériques, observations directes, données statistiques, images, …) à l'aide de techniques d'assimilation de données, ce qui rend ces systèmes encore plus difficiles à analyser. * L'étude et la mise au point de systèmes prenant en compte la dynamique spatio-temporelle est très important. Il peut être judicieux de travailler avec des systèmes à entrées et/ou sorties fonctionnelles pour la modélisation de cette dynamique. Le développement de méthodes efficaces pour étudier les problèmes environnementaux nécessite de prendre en considération les problèmes soulevés ci-dessus. Un aspect clef de ce groupe de travail est de réunir des spécialistes de différents domaines des mathématiques appliquées (numériciens, spécialistes de l'aléatoire, gestion de bases de données), mais aussi des experts des différents champs d'applications impliqués (géophysiciens, biophysiciens, hydrologistes, …).

Software aspects

Coordinators : Christophe Prud'hommme (Université Joseph Fourier, Grenoble, France) and Anne Dutfoy (EDF R&D, France)

CNRS