أعمال و مشوار مهني


التدريس


الرياضيات : [TD] أستاذ مساعد (مسؤول عن الأعمال الموجهة)
[Cours] أستاذ رئيسي
  • الإختبارات الإحصائية : السنة الثانية من الإجازة في العلوم الاقتصادية (L2) (2020ـ2021) [TD]
  • الإحصاء الوصفي: السنة الأولى من الإجازة في علم النفس (L1) (2020ـ2021) [TD]
  • الإحصائيات المطبقة على إدارة المشاريع: السنة الثالثة من الإجازة في الأعمال الإدارية (L3) (2018ـ2021) [TD]
  • الإحصائيات: السنة الأولى و الثانية و الثالثة من الإجازة في علم النفس (L1) (2020ـ2022) [TD]
  • التحليل: السنة الأولى من الإجازة في العلوم الاقتصادية (L1) (2017ـ2018 و 2020ـ2021) [TD]
  • التحليل الدلالي للبيانات النصية أو المعطيات اللفظية: السنة الثانية من الماجستير (M2) في علم البيانات (2021ـ2023) [Cours]

Colloque, Conférence et Séminaires


Big Data is watching you - Photo by Franki Chamaki on Unsplash


مجالات البحث


    الرياضيات - تكنولوجيا المعلومات - علم اللغة
  • الإحصائيات
    • La vraisemblance empirique généralisée et la Hotelling T2 régularisée (tests de moyennes en multidimensionnel, en grande dimension)
    • Pénalisation de la matrice de variance-covariance empirique en grande dimension
    • Inégalités de concentration en grande dimension, à horizon fini et en asymptotique
    • Modèles paramètriques, modèles non paramètriques et séries temporelles
    • La régression logistique pénalisée (normes L1 et L2 et combinaisons de LP), Les chaînes de Markov cachées (plus appliqué que théorique)
  • المعلوميات :
    • Les algorithmes de descente de gradient classique et stochastique
    • Programmation Python (pyspark, sklearn, keras, tensorflow, scipy, numpy, numba, nltk, pandas, gensim, word2vec embedding)
    • Extraction de corpus, nettoyage et pré-traitement, exploration. Extraction de bitextes (corpus parallèles), alignements et modélisations (Traducteur automatique)
  • اللغويات :
    • Traitement automatique du langage naturel (Découpage des textes en morceaux, Étiquetage morpho-syntaxique, Fragmentation en syntagmes, arbre syntaxique)
    • Traitements "bas niveau", niveau lexical, niveau morphologique, syntaxique, sémantique et pragramtique
Photo de Júnior Ferreira sur Unsplash
  • Apprentissage automatique
    • Apprentissage supervisé (Classification, Régression)
    • Apprentissage non-supervisé (Réduction de la dimension ACP-ACM-AFC, Clustering, Arbre de décision)
    • Apprentissage profond
    • Réseaux de neurones profonds Convolutifs (CNN), Récurrents (RNN), Génératifs (GAN) etc. (GRU, LSTM, GAN, Encoder-Decoder)

Projets professionnels


Fevrier 2017 CDD (4 mois)

Reponsable projet chez
Dalink Conseil
Direction «R&D»

  • Gestion de projet en transformation digitale et intégration de nouveaux produits innovants
  • Analyse du marché : étude de l’impact économique et de la faisabilité
    • - Comptes rendus des réunions avec les investisseurs, les fournisseurs et les clients
    • - Gouvernance : Découpage du projet en chantiers, répartition de tâches et estimation de la charge
    • - Pilotage et tableaux de bords : Budget, suivi des comités de pilotage, reportings
  • Outils utilisés : Excel, VBA, R et InDesign

Avril 2016 Stage (6 mois)
Chargé d’études actuarielles à La Mutuelle Générale
Direction technique - Département «Prévoyance individuelle et Contrats Collectifs»

  • Étude des dérives des coûts moyens en santé collective sur un compte clé :
    • - Construction, traitement et gestion de bases de données (BO et SQL)
    • - Statistiques : Analyses et explorations de données – Data Mining (SAS, R)
    • - Étude des dépenses des assurés, Modélisation probabiliste de la sinistralité
    • - Automatisation de reportings (VBA), mesure de performance et amélioration
  • Outils : BO, SQL, SAS Guide, Excel, VBA

Photo de Alina Grubnyak sur Unsplash



Ressources

MOOC et gamification

À venir (en cours de préparation)

Analyse sémantique des données textuelles

Getting textual data from different resources, processing these data, building models. For beginners, it's better to start with the Python and nltk introduction file.
Extracting and reading data (Source)
Reading PDF (numerical documents)
Reading image (scanned documents)
Extracting texts from the web (using urllib and re packages, using beautifulsoup)
Precessing data
Python and nltk introduction
Acessing corpora
Functions
Little applications : Dictionnary and synonym Word embedding (transforming words to vectors: discrete-sparse, and continuous-dense methods)
Modelisation
Classical methods
Deep Neural Networks