02

Les mots de Verne

Frequences lexicales dans les Voyages extraordinaires

« Ce qui est admirable, ce n'est pas que le champ des etoiles soit si vaste, c'est que l'homme l'ait mesure. »

Les 50 mots les plus frequents

Les mots les plus recurrents dans l'ensemble du corpus vernien, classes par frequence et colores selon leur champ semantique. Les mots sans champ specifique apparaissent en gris.

Chargement des donnees

La loi de Zipf

En linguistique quantitative, la loi de Zipf predit que la frequence d'un mot est inversement proportionnelle a son rang. En echelle logarithmique, cette relation forme une droite. Le corpus de Verne suit remarquablement cette loi universelle.

Chargement des donnees

Comparaison par roman

Selectionnez un ou deux romans pour comparer leurs vocabulaires les plus frequents. Chaque oeuvre possede sa propre signature lexicale, refletant ses themes et personnages.

Analyse

Sur un corpus de 1,7 million de mots repartis dans 18 romans, l'analyse frequentielle revele les structures profondes de l'ecriture vernienne.

Le mot le plus frequent — hors mots outils — est , employe fois. Ce choix n'est pas anodin : il revele la nature fondamentalement dialogique du recit vernien, ou l'action passe par la parole des personnages.

La distribution des frequences suit fidelement la loi de Zipf, confirmant que le corpus vernien se comporte comme un systeme linguistique naturel mature. La pente de la regression en echelle log-log est proche de −1, valeur theorique attendue pour tout grand corpus de langue naturelle.

La comparaison inter-romans met en evidence la singularite lexicale de chaque oeuvre : les noms de personnages dominent systematiquement, mais au-dela, chaque roman developpe un champ semantique propre — la mer pour Vingt mille lieues, le calcul pour Le Tour du monde, la geologie pour le Voyage au centre de la Terre.

Les métriques présentées sont issues d'analyses statistiques computationnelles sur les textes français du Project Gutenberg. Les comptages peuvent différer des éditions Hetzel de référence. Ce projet est une exploration numérique, non un outil de référence bibliographique.

Découvrez nos autres collections d'analyse littéraire par l'IA

culture.deep-5.com