Sources de données et constitution des corpus.
Les modèles d'apprentissage utilisés par PSYNUM ont été entraînés sur des corpus issus de la pratique clinique en santé mentale, de la recherche universitaire et d'archives linguistiques anonymisées multilingues.
- Verbatims patients issus d'entretiens cliniques de psychiatrie, psychologie clinique et orthophonie.
- Transcriptions d'évaluations diagnostiques (entretiens semi-structurés, échelles cliniques).
- Corpus longitudinaux de séances de TCC et de thérapie d'exposition.
- Études de cas documentées dans la littérature scientifique en psycholinguistique et neurolinguistique.
Chaque verbatim a été prétraité, anonymisé et codé selon une grille de marqueurs lexicaux, syntaxiques, sémantiques, pragmatiques et émotionnels validée par des spécialistes de chaque langue couverte.
