Cours

Trois cours de douze heures chacun sont prévus.
Ils se dérouleront du 18 au 28 Mars à raison de 4h par jour

JAMAL NAJIM : Grandes matrices aléatoires et applications (du 20 au 25 Mars)

On présentera une introduction à la théorie des grandes matrices aléatoires, ainsi que certaines applications aux télécommunications. La théorie des grandes matrices aléatoires consiste à décrire les éléments caractéristiques (valeurs propres, vecteurs propres, etc.) de matrices dont les entrées sont aléatoires et quand les dimensions de ces matrices tendent vers l'infini. Il se passe alors des phénomènes de régularisation tout à fait intéressants, à l'instar de la loi classique des grands nombres. En statistiques, la théorie des grandes matrices aléatoires présente un intérêt car elle décrit précisément le régime où la dimension des observations est du même ordre que la taille de l'échantillon. Ce régime, autrefois très marginal (on considérait préférentiellement des observations de petite dimension et un échantillon de très grande taille), s'est récemment avéré particulièrement intéressant en communications numériques et en traitement statistique du signal. L'objectif de ce cours sera de présenter certains résultats emblématiques de cette théorie, de décrire les outils techniques nécessaires pour les démontrer, et de montrer comment ces résultats interviennent dans certains problèmes en télécommunications.

Jamal Najim, est directeur de recherche au CNRS, rattaché à l'Université de Paris Est Marne La Vallée. Il travaille sur les matrices aléatoires et leurs applications, en particulier aux télécommunications.


GREGORY NUEL : Introduction aux chaînes de Markov cachées (du 18 au 21 Mars)

Résumé: L'objectif de ce cours est une première approche des chaînes de Markov cachées discrètes vues comme une généralisation naturelle des modèles de mélange. On introduit d'abord le mélange gaussien homoscédastique et le problème d'optimisation par maximum de vraisemblance. On présente ensuite l'approche SEM sur ce problème et présentons l'algorithme EM comme un passage à la limite de cette approche. Nous introduisons ensuite l'extension du mélange gaussien au modèle HMM simple. Les algorithmes forward et backward, et l'algorithme de Baum-Welch (algorithme EM pour les HMM).
Toutes ces notions sont à la fois présentées de manière théorique et pratique, avec l'usage omniprésent de la programmation R sous la forme de cours/TD intégrés.

Grégory Nuel, est directeur de recherche au CNRS au Laboratoire de Probabilité et Modèles Aléatoires. C'est un spécialiste des modèles graphiques probabilistes et des algorithmes statistiques. Ses domaines d'applications sont essentiellement biomédicaux: génétique humaine, génomique, bioinformatique, épidémiologie, cancérologie, biologie des systèmes, etc.

 

AMANDINE VEBER : Arbres aléatoires et génétique des populations (du 23 au 28 Mars)

L'objectif de ce cours est de donner un aperçu de la manière dont les arbres généalogiques au sein d'une population sont modélisés puis utilisés pour étudier comment la diversité génétique de cette population évolue au cours du temps. Nous verrons en particulier le modèle de Wright-Fisher et le coalescent de Kingman, objets mathématiques très utilisés par les biologistes pour leur simplicité et leur robustesse (aux déviations du cadre assez strict dans lequel ils sont définis). Si le temps le permet, nous aborderons également différents modèles de populations ayant une structure spatiale. Les prérequis sont les probabilités de base, éventuellement les processus markoviens à temps continu pour une compréhension plus en profondeur de certains points.

Amandine Véber est chargée de recherche au CNRS, au Centre de mathématiques appliquées de l'Ecole Polytechnique. Ses recherches concernent principalement la modélisation probabiliste de l'évolution de la diversité génétique au sein d'une population ayant une structure spatiale.

Ateliers

- Initiation à R par Dhafer Malouche (4 seances de 3heures)
Séance 1 : Installation de RSudio et des packages Rcmdr, graphR
Séance 2 : L'analyse en composantes principales sous R : découverte des packages FactoMineR et ade4
Séance 3 : L'anova et le test de tTuckey sous R : package agricolae
Séance 4 : Quelques graphiques pour des données multivariees

 

Partager cet article