Quali sono tutte le parole collegate a quella che ho in mente?

Posted on 11 luglio 2011

5


E’ sempre utile avere a disposizione alcuni strumenti con cui identificare quelle parole che hanno a che fare con un determinato ambito semantico.
Utile per i giornalisti, per scrivere racconti e per fare ricerche online: voi conoscete uno o due indizi e vi serve individuare quali altre parole sono semanticamente correlate a questi.

Alla pagina Come risalire ad una parola partendo da concetti che le sono vicini ho già trattato di Google Sets e di una mia idea per guardare i link di Wikipedia “al contrario”; ora sul social network Quora un utente ha chiesto più o meno la stessa cosa (“Is there a good online “database” that will help you build lists of words based on relationship?“), e qualcuno gli ha risposto indicando alcuni strumenti.

Tra cui la pagina http://corpora.informatik.uni-leipzig.de/, che vi elenca tutte le parole che ricorrono più di frequente accanto alla parola (inglese) data.

Ecco fatto, questo mio articolo è finito. Ma per completezza vi lascio con qualche simpatico esempio.
Se provate con cryptography (che appare 203 volte nella loro collezione di testi) otterrete questi risultati:

quantum (854.92), encryption (200.87), security (147.47), Quantum (130.55), secure (93.41), technology (85.42), Mifare (82.19), researchers (77.41), RSA (76.1), network (75.95), data (74.65), 140-2 (74.63), FIPS (68.25), decrypt (65.51), elliptic (64.87), Security (62.51), public-key (60.93), key (60.41), applications (59.7), sensitive (58.2), Schneier (57.19), encrypt (54.64), QKD (53.44), ciphers (51.73), uses (50.49), sender (49.12), chip (48.99), algorithm (44.72), transmissions (44.24), cryptographic (43.88), information (42.01), used (41.37), photons (41.12), Voltage (40.59), software (40.15), computer (36.2), persistently (34.12), such (34.06), NSA (33.99), use (31.8), encrypted (31.61), Vienna (30.96), relies (30.91), code (30.86), nodes (30.55), systems (30.12), Researchers (29.48), computing (29.11), researcher (28.49), Classic (28.4), keys (27.53), technique (27.47), experts (26.66), developed (26.38), , (26.13), demonstrated (25.73), flaw (25.47), a (25.42), integrated (24.53), IBM (24.52), requires (23.94), digital (23.74), regulated (23.2), fiber (23.11), exploit (22.99), integrate (22.76), using (22.73), of (22.41), technologies (22.13), verify (21.77), communication (21.3), curve (21.14), domain (20.54), Swedish (20.54), communications (20.51), networks (20.24), expert (20.19), messages (19.89), is (19.6), public (19.53)

Se provate con Samuel otterrete questo elenco:

Eto (11586), Asante (9638.77), o (8551.95), Dalembert (7954.9), Alito (6377.23), L (4253.21), Bodman (3580.12), Barcelona (3354.41), Jackson (3005.05), cornerback (2201.99), Cameroon (1823.32), Wurzelbacher (1748.01), Justice (1571.06), Jlloyd (1524.21), Roberts (1492.31), striker (1343.99), Philadelphia (1221.93), , (1126.09), Eagles (1122.69), Justices (1118.32), Beckett (1112.02), Secretary (1100.24), Vitali (1093.78), Sheppard (1067.07), 76ers (1051.81), WBC (1046.49), Messi (1024.22), Iguodala (1009.94), Peter (998.88), Sixers (979.36), Klitschko (965.49), Energy (959.77), his (916.58), Champlain (888.37), Scalia (863.28), Pahlsson (850.31), J (840.86), Dieteman (824.31), III (818.29), Andre (796.77), Patriots (795.51), heavyweight (791.69), Goldwyn (778.32), Antonin (765.97), ACCC (744.31), and (719.92), Lionel (715.52), Kivuitu (709.17), Wanjiru (687.63), Clarence (682.23), Dumoulin (670.87), Jr. (660.35), Thierry (650.33), Ronaldinho (604.13), Kobia (582.1), Maskaev (570.67), Barca (561.39), Thaddeus (552.54), who (524.98), Plumber (519.19), John (517.91), Judge (516.2), Guardiola (511.31), rebounds (510.16), Chief (504.29), Sanchez (495.55), Eto’o (486.57), Lito (483.27), Bernie (449.79), Graeme (434.89), Hausner (433.59), Adams (431.67), Israel (425.54), Soul (418.41), Court (416.91), Henry (416.4), Thomas (412.48), Nou (398.96), Palmisano (390.77), Golubchuk (386.49).

Se invece provate con Einsturzende avrete meno fortuna: con 2 sole occorrenze non è possibile ottenere risultati significativi :)

Buon divertimento.