Working thesis meeting. The goal is to create cooperations between GDR members, under thesis co-directions or other projects.
Coordinator : Luc Pronzato (Université Nice Sophia Antipolis, France)
It is generally well accepted that an experimental design for numerical simulations should be of the space-filling type, that is, points chosen for calculations should be fairly spread over the factor (input) space. This is motivated by the idea that a model built on a suitable interpolation of the responses at those points should yield a reasonable reproduction of the behaviour of the computer code. When the dimension of the factor space is low, experimental design of the LH (Latine Hypercube) or OA (Orthogonal Array) type can be used. For a larger number of factors, by optimising a maximin, or minimax, or discrepancy criterion, or a criterion based on mean-squared prediction error, one can ensure that the experimental domain is suitably covered by a design with a small number of points. The optimisation can be performed in the class of LH designs, and rely for instance on a stochastic algorithm of the simulated-annealing type. It can also be performed sequentially, new design points being chosen after the results of simulations at previous points are available. These algorithmic issues form a very active field of research.
Il est généralement admis qu'un plan d'expériences pour codes numériques doit être de type space filling, c'est-à-dire que les points choisis pour le calcul doivent se répartir le plus équitablement possible dans l'espace des facteurs. L’idée est que dans ce cas un modèle reposant sur une interpolation appropriée des réponses en ces points devrait donner une assez bonne représentation du comportement du code de calcul. Quand l'espace des facteurs est de petite dimension, on a recours à des plans expérimentaux de type LH (Latin Hypercube) ou OA (Orthogonal Array). Quand le nombre de facteurs augmente, l’optimisation d’un critère de type maximin ou minimax, ou de discrépance, ou d’erreur quadratique moyenne de prédiction, permet de garantir qu’un plan d'expériences avec un faible nombre de points couvre suffisamment le domaine expérimental. Cette optimisation peut être effectuée dans la classe des plans de type LH, éventuellement en utilisant un algorithme stochastique de type recuit simulé. Elle peut aussi se faire séquentiellement, les nouveaux points étant placés après que soient connus les résultats des simulations aux points précédents. Ces réflexions algorithmiques forment un domaine de recherche très actif.
Coordinator : Jean-Marc Azaïs (Université Paul Sabatier, Toulouse, France)
A wide variety of response surfaces exist: linear, polynomial, spline-based, fitted with neural networks or with kernel functions lying in Reproducing Kernel Hilbert Spaces (RKHS) like SVM, kriging functions or Gaussian processes (bayesian framework). Each model is more or less well-suited to the different practical problems. However, applications to industrial problems raise several problems: • What can we do when the number of input variables is really large ? • How to simultaneously deal with several output variables? • How to consider the anisotropy problems? • What can we do when the code outputs are curves (functional data)?
Il existe une grande variété de surfaces de réponses, qu'elles soient linéaires, polynomiales, à base de splines, construites à l'aide de réseaux de neurones ou basées sur des fonctions noyaux figurant dans des espaces de Hilbert à noyaux auto-reproduisants (RKHS), comme les SVM ou les fonctions de krigeage et les processus gaussiens (point de vue bayésien). Cependant, outre que les qualités de chaque technique les rendent plus ou moins adaptées aux différentes situations rencontrées en pratique, la confrontation aux problèmes industriels soulèvent plusieurs questions d'adéquation des hypothèses : • que faire quand le nombre de paramètres d'entrées est réellement important ? • comment traiter le cas où on étudie plusieurs réponses simultanément ? • comment traiter les problèmes d'anisotropie ? • que faire quand les réponses sont des courbes (données fonctionnelles) ?
Coordinator : Anestis Antoniadis (Université Joseph Fourier, Grenoble, France)
Uncertainty analysis aims to understand the impact of input variables or noise on these input variables on the code output variables. Usually, deterministic tools of differential calculus are used. For example, a basic index is obtained via the derivative of one output respective to one imput. Such approach remains local because derivatives are generally computed at specific points. In this deterministic approach, we are interested by the automatic differentiation tools which aim at efficiently compute complex code derivatives.
The stochastic approach of uncertainty analysis aims at studying global criteria based on joint pdf modelisation of the problem variables. The obtained sensitivity indices describe the global variabilities of the phenomena. For example, the Sobol sensitivity index is given by the ratio between the ouput variance conditionally to one input and the total output variance. Computation of such quantities leads to very interesting statistical problems that we propose to study. For example, the efficient estimation of sensitivity indices from a few runs relates to semi or non-parametric estimation techniques. The stochastic modelisation of the input/output relation ship is another solution. We can look for models with specific properties (parcimonious representation using ad hoc response surfaces, having remarkable algebraic properties as orthogonality, etc).
L’analyse d’incertitudes consiste à comprendre l’influence de certaines variables d’entrée ou du bruit sur ces variables sur les sorties du code. Traditionnellement, cette analyse s’effectue à l’aide d’outils déterministes de calcul différentiel. Un indice basique est par exemple obtenu à l’aide de la dérivée d’une des sorties par rapport à l’une des entrées. Ce type d’approche reste très locale car les dérivées sont généralement évaluées numériquement pour des points de fonctionnement typiques. Dans le cadre de cette approche déterministe, on s’intéressera à la problématique des codes de dérivation automatique dont l’objectif est d’évaluer efficacement les dérivées d’un code complexe. L’approche stochastique de l’analyse d’incertitudes consiste quant à elle à étudier des critères globaux bâtis sur une modélisation des distributions conjointes des variables du problème. Elle fournit des indices qui décrivent les variabilités globales des phénomènes. Par exemple, l’indice de sensibilité de Sobol quantifie l’influence d’une variable d’entrée sur une sortie par le calcul du ratio entre la variance de la variable de sortie conditionnelle à l’entrée et la variance de la sortie. Le calcul de ce type de quantité conduit à des problèmes statistiques très intéressants que nous nous proposons d’étudier. Certains de ces problèmes relèvent de techniques d’estimation semi ou non paramétrique. C’est par exemple le cas de l’estimation efficace à partir de peu d’essais d’indices de sensibilité. D’autres conduisent à une réflexion amont sur la modélisation stochastique des relations entrées sorties. Par exemple, en cherchant des modèles qui possèdent des propriétés remarquables particulières (représentations parcimonieuses utilisant des surfaces de réponse ad hoc, représentations possédant des propriétés algébriques remarquables comme l’orthogonalité,etc).
Coordinator : Fabien Mangeant (EADS CCR, France)
Uncertainty spans over a wide-encompassing spectrum of science and practical knowledge : economics, physics, decision theory and risk assessment are the traditional sources, and more recently modelling, numerical analysis, advanced statistics and computer science; but it even reaches epistemology, management science, psychology or public debate and democracy. The subject has a strategic interest in modelling, either driven by regulatory demands (e.g., in safety, security or environmental control in the certification or licensing processes), or by markets (e.g., industrial process optimization or business development), whereby a better understanding of the margins of uncertainty and possible actions for their reduction are being increasingly investigated for associated risks and opportunities. As modelling and simulations are more and more popular in the industrial pratice, many industrial challenges arise when pratictioners want to deal with uncertainty and sensitivity analysis.
Within this group, the first goal is to guarantee the applicability and the transfer of the previous scientific techniques to current difficulties encountered by industrial practitioners. On the other hand, the different industrial partners will propose current challenges to the scientific community. This concerns for example: high dimensionality, computational times, coupling between different codes, scarcity of observational data, special repartition in the space of the factors.
Workshops and dedicated sessions will be organised to ease a fruitful dialog between the different communities.
Ce thème a pour objectif de garantir l'application des techniques précédentes à des difficultés réellement rencontrées dans le monde industriel. La taille des problèmes, les temps de calcul, le couplage des codes sont autant de circonstances compliquant la mise en oeuvre des algorithmes. La rareté des données expérimentales, ou leurs répartitions particulières dans l'espace des facteurs conduisent également à des difficultés de résolution. Enfin, face à une réalité complexe étudiée de plus en plus finement, les modèles eux-mêmes sont questionnables.
En problématiques industrielles, on s'attachera principalement à bien poser les problèmes, et à rendre compte des solutions mises en oeuvre. Le format des ateliers devrait permettre une interaction particulièrement fructueuse et féconde, puisqu'au cours de ces sessions, des problèmes amenés par des industriels seront examinés en détail.
Coordinator : Clémentine Prieur (Université Joseph Fourier, Grenoble, France) and Hervé Monod (INRA, France)
The scientific backdrop of this working group is the design, modelling and analysis of complex models and/or forecasting systems for environmental applications: climate change, regional forecasting systems for the ocean and the atmosphere, evolution of air and water quality, agri-environment interactions, … The overall applicative aim is to contribute to a better understanding, forecasting and possibly control of such systems.
A number of specific features may arise in such applications :
The development of efficient methods to study environmental problems requires taking these features into account, a goal which implies pluridisciplinarity. A key aspect of this working group is namely to gather specialists from different domains, coming either from the applied mathematics world (numerical tools, stochastic point of view, data base management), or from the many fields of expertise associated with environment applications (in particular geophysicists, biophysicists, hydrologists, …).
Les intérêts scientifiques de ce groupe de travail sont la conception, la modélisation et l'analyse de modèles complexes et/ou de modèles de prévision dans un contexte environnemental : changement climatique, systèmes régionaux de prévision pour l'océan et l'atmosphère, évolution de la qualité de l'air et de l'eau, interactions entre agriculture, environnement, et biodiversité, … L'objectif est de contribuer à la compréhension, la prévision et éventuellement au contrôle de tels systèmes. Lorsqu'on s'intéresse à de telles applications, on voit apparaître un certain nombre de problèmes spécifiques : * L'un des aspects fondamentaux pour l'étude des phénomènes géophysiques est la prise en compte des interactions spatio-temporelles souvent considérables, pouvant entrainer de surcroît des manifestations de cascade d'énergie. * Une source supplémentaire de complexité peut surgir quand la nature stochastique de certaines parties des systèmes ne peut pas être négligée, en particulier quand des événements rares et/ou extrêmes doivent être détectés et pris en compte. * La plupart du temps, les modèles sont discrétisés sur des grilles gigantesques (parfois de plusieurs millions de points). C'est pourquoi il faut développer des méthodes de réduction efficaces, en particulier pour être capable ensuite de réaliser une analyse de sensibilité. * De plus, les systèmes de prévision combinent souvent des sources d'information de différentes natures (modèles numériques, observations directes, données statistiques, images, …) à l'aide de techniques d'assimilation de données, ce qui rend ces systèmes encore plus difficiles à analyser. * L'étude et la mise au point de systèmes prenant en compte la dynamique spatio-temporelle est très important. Il peut être judicieux de travailler avec des systèmes à entrées et/ou sorties fonctionnelles pour la modélisation de cette dynamique. Le développement de méthodes efficaces pour étudier les problèmes environnementaux nécessite de prendre en considération les problèmes soulevés ci-dessus. Un aspect clef de ce groupe de travail est de réunir des spécialistes de différents domaines des mathématiques appliquées (numériciens, spécialistes de l'aléatoire, gestion de bases de données), mais aussi des experts des différents champs d'applications impliqués (géophysiciens, biophysiciens, hydrologistes, …).