Com utilitzar l'eina Ngram Viewer a Google Books

Taula de continguts:

Com utilitzar l'eina Ngram Viewer a Google Books
Com utilitzar l'eina Ngram Viewer a Google Books
Anonim

Què cal saber

  • A Google Books Ngram Viewer, escriviu una frase, trieu un interval de dates i un corpus, establiu el nivell de suavització i feu clic a Cerca molts llibres.
  • Podeu aprofundir en les dades. Per exemple, per cercar la forma verbal de peix, en comptes del substantiu peix, utilitzeu una etiqueta: cerca fish_VERB.
  • Ngram Viewer mostra un gràfic que representa l'ús de la frase al llarg del temps. Per a diverses frases, cadascuna es representa amb una línia codificada per colors.

Aquest article explica com s'utilitza l'eina Ngram Viewer a Google Books per dur a terme investigacions i fer cerques potenciades.

Image
Image

Com funciona el visualitzador de Ngram

Un Ngrama, també anomenat N-grama, és una anàlisi estadística del contingut de text o de veu per trobar n (un nombre) d'algun tipus d'element al text.

L'element de cerca pot ser tot tipus de coses, inclosos fonemes, prefixos, frases i lletres. Tot i que un Ngram és obscur fora de la comunitat investigadora, s'utilitza en diversos camps i té moltes implicacions per als desenvolupadors que estan codificant programes informàtics que entenen i responen al llenguatge parlat natural.

En el cas de Google Books Ngram Viewer, el text a analitzar prové de la gran quantitat de llibres de domini públic que Google va escanejar per omplir el seu motor de cerca de Google Books. Per a Google Books Ngram Viewer, Google fa referència al cos del text que voleu cercar com a corpus. L'Ngram Viewer agrega per idioma, tot i que podeu analitzar l'anglès britànic i americà per separat o agrupar-los.

  1. Vés a Google Books Ngram Viewer a books.google.com/ngrams.
  2. Escriviu qualsevol frase o frases que vulgueu analitzar. Separa cada frase amb una coma. Google suggereix "Albert Einstein, Sherlock Holmes, Frankenstein" per començar.

    A les cerques de NGram Viewer, els elements distingeixen entre majúscules i minúscules, a diferència de les cerques web de Google.

  3. Seleccioneu un interval de dates. El valor predeterminat és de 1800 a 2000.
  4. Tria un corpus. Podeu cercar textos en llengües estrangeres o en anglès i, a més de les opcions estàndard, podeu veure entrades com ara "Anglès (2009)" o "Anglès americà (2009)" al final de la llista. Aquests són corpus antics que Google ha actualitzat des de llavors, però és possible que tingueu algun motiu per fer les vostres comparacions amb conjunts de dades antics. La majoria dels usuaris poden ignorar-los i centrar-se en els corpus més recents.
  5. Defineix el nivell de suavització. La suavització fa referència a la suavitat del gràfic al final. La representació més precisa reflecteix un nivell de suavització de 0, però aquesta configuració pot ser difícil de llegir. El valor predeterminat és 3. En la majoria dels casos, no cal que l'ajusteu.

  6. Premeu Cerca molts llibres.

Mitjançant l'Ngram Viewer de Google, podeu aprofundir en les dades. Si voleu cercar el verb peix en comptes del substantiu peix, podeu fer-ho utilitzant etiquetes. En aquest cas, cercaries fish_VERB.

Google ofereix una llista completa d'ordres i altres documentació avançada per utilitzar-les amb Ngram Viewer al seu lloc web.

Conclusió

Google Books Ngram Viewer genera un gràfic que representa l'ús d'una frase concreta als llibres a través del temps. Si heu introduït més d'una paraula o frase, cadascuna es representa amb una línia codificada per colors per contrastar amb els altres termes de cerca. Això és similar a Google Trends, només la cerca cobreix un període més llarg.

Estudi de cas

Considereu l'estudi de cas dels pastissos de vinagre. S'esmenten a la sèrie Little House on the Prairie de Laura Ingalls Wilder. L'exploració amb la cerca web de Google per obtenir més informació sobre els pastissos de vinagre revela que es consideren part de la cuina del sud dels Estats Units i que, de fet, estan fets amb vinagre. Es remunten a èpoques en què no tothom tenia accés a productes frescos en totes les èpoques de l'any, però aquesta és tota la història?

Cerqueu a Google Ngram Viewer el pastís de vinagre i trobareu algunes mencions del pastís tant a principis com a finals del 1800, moltes mencions a la dècada de 1940 i un nombre creixent de mencions en els últims temps. Tanmateix, amb un nivell de suavització de 3, es veu un altiplà sobre les mencions al segle XIX. Com que no hi havia molts llibres publicats durant aquest temps i com que les dades estan configurades per suavitzar, la imatge es distorsiona. Probablement només un llibre esmentava el pastís de vinagre i es va fer una mitjana per evitar un pic. En establir el suavització a 0, podeu veure que aquest és precisament el cas. L'espiga se centra el 1869, i hi ha un altre pic el 1897 i el 1900.

És poc probable que ningú parlés de pastissos de vinagre la resta del temps: probablement hi havia receptes flotant per tot arreu, però la gent no n'escriuva als llibres, i això és una limitació important de les cerques de Ngram.

Recomanat: