- Page d'accueil
- Recherche et innovation
- Annuaire des chercheurs
- Delaborde Marine
Delaborde Marine
Type de personnel : Enseignant-chercheur
Structure / Laboratoire de rattachement : IDHN – Institut des humanités numériques, LT2D - Lexiques, textes, discours, dictionnaires
Fonction : CPJ
Composante de rattachement : CY lettres et sciences humaines
Télécharger le CV - PDF (34,15Ko)Domaines d'expertise
Linguistique de corpus
Humanités numériques
Traitement automatique des langues
Discipline enseignée
Sciences du langage :
- Traitement qualitatif des données textuelles en contexte professionnel (M2 Sciences du langage) (2022 - ...)
- Algorithmie et intelligence artificielle (M2 Sciences du langage) (2022 - ...)
- Constitution et exploration de corpus numériques (M2 Sciences du langage) (2022 - ...)
- Méthodologie (M1 Sciences du langage) (2022 - ...)
- Analyse du discours (L2 Lettres) (2022 - ...)
- Pratiques rédactionnelles (L1 Lettres) (2022/2023)
Activités / CV
- Directrice adjointe du Master Sciences du Langage (19/06/23 - ... )
- Directrice adjointe de l'IDHN (01/07/25 - ... )
- Membre du conseil de direction de l'IDHN (13/07/23 - ... )
- Référente égalité femmes-hommes pour l'UFR Lettres et Sciences Humaines (25/04/23 - ... )
Informations complémentaires
RECHERCHE

Projet de recherche CPJ « Ressources numériques en SHS »
Partie 1 : « Valorisation des ressources disponibles au laboratoire LT2D »
- Recrutement de Thomas Gervais d'Aldin, ingénieur d'études au LT2D (2024) :
- Recrutement de Luc Massip, ingénieur d'études au LT2D (2025/2026) :
- Valorisation de ressources lexicographiques et métalexicographiques
- Le musée virtuel des dictionnaires :
- Le petit Larousse 1905 : remise en état de fonctionnement
- Valorisation de ressources lexicographiques et métalexicographiques
Partie 2 : « Constitution de ressources numériques »
- Humour
- AliGator et les jeux de mots à base de prénoms (collaboration avec Mathieu Dehouck, chargé de recherche CNRS au Lattice (UMR 8094) :
- Génération automatique de jeux de mots pour la création de ressources annotées pour le TAL
- Jeu de plateau réalisé avec Émilie Compain-Delfosse (CY Cergy Paris Université) pour une animation lors de la fête de la science
- Organisation de la journée d'études "Humour et IA" (juin 2026)
- AliGator et les jeux de mots à base de prénoms (collaboration avec Mathieu Dehouck, chargé de recherche CNRS au Lattice (UMR 8094) :
- Corpus CMC
- Territoire : corpus de communications médiées par ordinateur à propos de Cergy-Pontoise : recrutement de Pierre Chartier, chercheur post-doctoral (2025/2026)
- Phraséologie : corpus de communications médiées par ordinateur pour le phraséologisme [SN + t'as peur] (collaboration avec Auphélie Ferreira, MCF contractuelle au LiLPa à l'Université de Strasbourg)
- Coréférence
- Organisation de la journée d'étude "Regards croisés sur la coréférence : linguistique, TAL et SIC" (financement CY Advanced Studies) - 26 juin 2025
- Étude de la possession (collaboration avec Hélène Manuélian, MCF au LT2D à CY Cergy Paris Université) : corpus annoté sémantiquement + outil de calcul de distance entre les mentions
- Outil de calcul de cooccurrences pour les chaînes de référence (collaboration avec Yoann Dupont)
- Stage de Kaoussou Cissé, M2 Master SDL (juin/juillet 2024) - récolte de données orales
Groupes de travail
- Membre actif du groupe « Scripts de traitement de données » du GT-3 « Outils et pratiques éditoriales » de l'axe 1 « Éditions numériques de qualité » du consortium Huma-num Ariane :
- Membre du GT-5 « Métadonnées et modélisation des données » de l'axe 2 « Deep reading » du consortium Huma-num Ariane
- Membre du consortium CORLI pour le LT2D
- Co-organisation des séminaires "Outils numériques au service de la langue (ONuSeL) - LT2D / IDHN avec Christophe Coupé et Hélène Manuélian
Projets
- Projet ANR STREAMédia (membre)
- Projet ANR AMI SHS DemoCIS (membre)
ENCADREMENT
Thèse (Doctorat)
- Mohammed Amin BOUZIANI (Thèse débutée en 2023 - co-encadrement à partir de septembre 2024) - Étude terminologique multilingue (anglais-français-arabe) du vocabulaire médical dans les textes de l'OMS : vers une méthodologie pour la création d'un dictionnaire électronique multilingue du domaine médical basé sur corpus. (Co-encadrement avec M. Christophe Rey, LT2D, CY Cergy Paris Université - ENCADREMENT 50%)
Mémoires (Master)
- Tierrou Medard DOBE - ... - 2025/ ...
- Wenqi SU - (Co-encadrement avec M. Mathias Quoy, ETIS, CY Cergy Paris Université - ENCADREMENT 50%) 2025/ ...
- Claudia TIMOCI - Analyse de sentiments concernant les cryptomonnaies autour des élections aux États-Unis en 2024 - 2024/2025 (ENCRADREMENT 100%) - abandon de la formation
- Silia AZOUZ - Analyse en corpus d'images de marques : discours d'engagement de Coca Cola Company et PepsiCo au sujet des enjeux environnementaux et sociétaux- 2023/2024 (ENCADREMENT 100%) - soutenu le 24/06/2024
- Maria SAFI - Entretiens politiques en français : analyse linguistique de transcriptions automatiques - 2022/2023 + 2023/2024 (ENCADREMENT 100%) - soutenu le 23/09/2024
Stages
- Kaoussou CISSÉ - Récolte de données en contexte professionnel - juin / juillet 2024 (ENCADREMENT 100%) - Financement CPJ "Ressources numériques en SHS"
- Jana DE MATTOS - Conception de ressources numériques pour l'analyse en corpus de phénomènes linguistiques en français - mars / juillet 2025 (ENCADREMENT 100%) - Financement CPJ "Ressources numériques en SHS"
Ouvrages
- CV HAL (plus bas) : https://cv.archives-ouvertes.fr/marine-delaborde
- Google Scholar : https://scholar.google.com/citations?user=KOvNpIcAAAAJ&hl=fr&oi=ao