Cartographie des relations entre personnages, détectées par analyse de co-occurrence statistique. Les liens révèlent la proximité narrative — qui apparaît aux côtés de qui dans le texte.
Les personnages sont identifiés par reconnaissance d'entités nommées (NER) à l'aide du modèle camembert-ner, un transformeur CamemBERT fine-tuné pour le français. Le modèle détecte les entités de type PER (personnes) dans le texte, qui sont ensuite résolues vers des noms canoniques via une table d'alias couvrant plus de 50 personnages de l'univers vernien.
Les co-occurrences sont calculées par fenêtre glissante de 150 mots : deux personnages qui apparaissent dans la même fenêtre sont considérés comme liés. Le poids d'une arête correspond au nombre de fenêtres partagées.
Les métriques présentées sont issues d'analyses statistiques computationnelles sur les textes français du Project Gutenberg. Les comptages peuvent différer des éditions Hetzel de référence. Ce projet est une exploration numérique, non un outil de référence bibliographique.
Découvrez nos autres collections d'analyse littéraire par l'IA
thot.deep-5.com