Nessuna sciocchezza, per ora

Posted on 5 settembre 2013

0


Il mio amico sparidinchiostro scrive:

(e qui dovrebbe intervenire quel mio amico linguista computazionale e spiegare che sto dicendo sciocchezze.)

Il contesto è il suo ultimo articolo:

Sai cos’è google ngram viewer?

È un prodotto, rilasciato da google a metà del 2010, che permette di visualizzare dei grafici con l’andamento nell’uso delle parole specificate. Un motore di ricerca effettua la scansione degli oltre 5 milioni di libri presenti in google books (fino al 2008), verifica la presenza di quelle parole, le conta e le butta su un grafico. Ci sono un po’ di approssimazioni. Innanzi tutto, la base dati di libri è quella di google e mica c’è tutto. Poi sappiamo bene che i programmi di acquisizione digitale del testo – OCR – mica ce la fanno sempre a riconoscere le parole (se così non fosse, non potremmo godere delle mirabilie dei captcha). E, infine, l’idea stessa di ricercare del testo ha tutti i limiti di una ricerca di una stringa: è un’operazione sintattica e non semantica e, proprio per questo, priva di contesto.

L’articolo continua poi così:

Ho fatto due esperimenti stupidini (e tardivi). Magari li avevi già fatti anche tu.

Ho provato a cercare le occorrenze delle parole “comics”, “comic book”, “comic strip” e “graphic novel” sui libri in inglese. Guarda un po’ cosa è successo.

Il risultato lo trovate sul suo post: http://sparidinchiostro.com/2013/09/05/fumetto-quante-volte/

Annunci
Posted in: Facetiae