Comment utiliser l'outil Ngram Viewer dans Google Books

Image illustrant : Comment utiliser loutil Ngram Viewer dans Google Books
  1. Accueil
  2. Tutoriels
  3. Internet & Réseaux
  4. Comment utiliser l'outil Ngram Viewer dans Google Books

Apprenez à effectuer des recherches à l'aide de ce didacticiel Google Books Ngram Viewer

Un Ngram, également appelé N-gram, est une analyse statistique du contenu du texte ou de la parole pour trouver n (un nombre) d'une sorte d'élément dans le texte.

L'élément de recherche peut être toutes sortes de choses, y compris des phonèmes, des préfixes, des phrases et des lettres. Bien qu'un Ngram soit obscur en dehors de la communauté des chercheurs, il est utilisé dans divers domaines et a de nombreuses implications pour les développeurs qui codent des programmes informatiques qui comprennent et répondent au langage parlé naturel .

Dans le cas de Google Books Ngram Viewer, le texte à analyser provient du grand nombre de livres du domaine public que Google a scannés pour alimenter son moteur de recherche Google Books . Pour Google Books Ngram Viewer, Google désigne le corps de texte que vous allez rechercher comme corpus . Le Ngram Viewer agrège par langue, bien que vous puissiez analyser séparément l'anglais britannique et américain ou les regrouper.

Visionneuse Ngram

Comment fonctionne la visionneuse Ngram

  1. Accédez à Google Books Ngram Viewer à l' adresse books.google.com/ngrams .

  2. Tapez la ou les phrases que vous souhaitez analyser. Séparez chaque phrase par une virgule. Google suggère "Albert Einstein,Sherlock Holmes,Frankenstein" pour vous aider à démarrer.

    Dans les recherches NGram Viewer, les éléments sont sensibles à la casse, contrairement aux recherches Web Google.

  3. Sélectionnez une plage de dates. La valeur par défaut est de 1800 à 2000.

  4. Choisissez un corpus. Vous pouvez rechercher des textes en langue étrangère ou des textes en anglais, et en plus des choix standard, vous remarquerez peut-être des entrées telles que "English (2009)" ou "American English (2009)" au bas de la liste. Ce sont des corpus plus anciens que Google a mis à jour depuis, mais vous pouvez avoir une raison de faire vos comparaisons avec d'anciens ensembles de données. La plupart des utilisateurs peuvent les ignorer et se concentrer sur les corpus les plus récents.

  5. Réglez le niveau de lissage. Le lissage fait référence à la régularité du graphique à la fin. La représentation la plus précise reflète un niveau de lissage de 0, mais ce paramètre peut être difficile à lire. La valeur par défaut est 3. Dans la plupart des cas, vous n'avez pas besoin de l'ajuster.

  6. Appuyez sur Rechercher de nombreux livres .

En utilisant Ngram Viewer de Google, vous pouvez explorer les données. Si vous souhaitez rechercher le verbe poisson au lieu du nom poisson , vous pouvez le faire en utilisant des balises. Dans ce cas, vous recherchez fish_VERB.

Google fournit une liste complète de commandes et d' autres documentations avancées à utiliser avec Ngram Viewer sur son site Web. 

Que montre Ngram ?

Google Books Ngram Viewer génère un graphique qui représente l'utilisation d'une phrase particulière dans les livres au fil du temps. Si vous avez saisi plus d'un mot ou d'une phrase, chacun est représenté par une ligne codée par couleur pour contraster avec les autres termes de recherche. Ceci est similaire à Google Trends , seule la recherche couvre une période plus longue.

Étude de cas

Considérez l'étude de cas des tartes au vinaigre. Ils sont mentionnés dans la série Little House on the Prairie de Laura Ingalls Wilder . Exploration avec la recherche Web de Google pour en savoir plus sur les tartes au vinaigre révèle qu'elles sont considérées comme faisant partie de la cuisine du sud de l'Amérique et sont en effet faites avec du vinaigre. Ils rappellent l'époque où tout le monde n'avait pas accès à des produits frais à tout moment de l'année, mais est-ce toute l'histoire ?

Recherchez la tarte au vinaigre dans Google Ngram Viewer et vous rencontrerez des mentions de la tarte au début et à la fin des années 1800, de nombreuses mentions dans les années 1940 et un nombre croissant de mentions ces derniers temps. Cependant, avec un niveau de lissage de 3, vous voyez un plateau sur les mentions dans les années 1800. Parce qu'il n'y a pas eu beaucoup de livres publiés pendant cette période et parce que les données sont réglées pour être lissées, l'image est déformée. Probablement un seul livre mentionnait la tarte au vinaigre, et il a été moyenné pour éviter un pic. En réglant le lissage à 0, vous pouvez voir que c'est précisément le cas. Le pic est centré sur 1869, et il y a un autre pic en 1897 et 1900.

Il est peu probable que personne ne parle de tartes au vinaigre le reste du temps : il y avait probablement des recettes qui flottaient un peu partout, mais les gens n'en parlaient pas dans les livres, et c'est une limitation importante des recherches Ngram.

Partager Tutoriel

Autres Tutoriels sur (Google, Books) ...