quaderni di management 
bimestrale di cultura managerialeE.G.V.
  
  < Torna all'indice

Text Mining

Scarica l'articolo in PDF Articolo

Alessandro Zanasi


 

Gli sviluppi dell´Information Technology hanno rivoluzionato il concetto di intelligence e della sua realizzazione. Grazie infatti ai motori di ricerca e alle nuove tecnologie dei database, la quantità di informazione disponibile online cresce quotidianamente, mentre la nostra capacità di leggerla ed analizzarla è rimasta praticamente immutata. Per risolvere il problema che ne deriva (information overload) una delle tecnologie più innovative al servizio dell´analista di intelligence è, oggi, quella del Text Mining. Tale tecnologia permette di analizzare in pochi secondi, on line, l´informazione recuperata da centinaia di siti web, agenzie stampa, e-mail, forum, mailing 
list, newsgroup. Grazie al text mining possono essere identificati i temi trattati, le relazioni significative che esistono tra tali temi, possono essere evidenziati i segnali deboli, possono essere costruite statistiche sulle informazioni reperite automaticamente, possono essere fatte previsioni. Quest´approccio permette anche di comprendere le opinioni, i gusti, le tendenze del gruppo sociale di cui si sta analizzando la produzione documentale.
Attraverso il text mining si possono analizzare volumi immensi di informazioni, sia in tempo reale che in differita e si possono identificare relazioni e strutture che altrimenti sfuggirebbero alla capacità analitica umana.
Il text mining permette di trattare i documenti con strumenti di analisi automatica. 
Questi strumenti variano considerevolmente tra di loro ma, in generale, riassumono e categorizzano i documenti, identificano la lingua in cui sono scritti, ne estraggono concetti, nomi propri e frasi, riportano frequenze di parole e frasi, classificano un documento in funzione della rilevanza rispetto ad uno specifico argomento. 
Alcuni incorporano capacità di web-crawling, recuperano testi in vari formati, collegano le informazioni in relazioni spaziali o temporali, scoprono legami o catene di informazioni legate fra di loro, raggruppano documenti in funzione del loro contenuto, effettuano analisi incrociate e permettono l´inclusione di packages statistici.