english | español

contatti

Text Mining: teoria e applicazioni

la copertina del libro

Per estrarre conoscenza dai dati numerici, prodotti dalle transazioni aziendali, commerciali e dalle diverse forme di tariffazione, da tempo sono stati introdotti algoritmi e tecnologie inerenti il data mining.

Cresce ora la necessità di estrarre conoscenza dal resto dei dati, quelli non strutturati, che risiedono in file di testo, e-mail, pagine internet, forum di discussione, call centre, reclami, articoli, verbali, brevetti, cartelle cliniche, ricette, diagnosi, referti, relazioni, questionari. Da qui la sempre maggiore importanza del text mining, che, per mezzo di una componente linguistica scompone e comprende la struttura del testo, generando variabili numeriche sulle quali applicare algoritmi ‘classici’ di data mining.

Questo volume vuole sopperire alla mancanza di testi di riferimento in lingua italiana, completi e strutturati, che descrivano la teoria e la pratica dell’elaborazione dei documenti.

L’obiettivo è fornire concetti fondamentali quali l’elaborazione del linguaggio naturale, la rappresentazione della conoscenza e l’analisi statistica. Si vuole quindi sottolineare come questi concetti possano essere applicati con successo nella pratica, se affiancati a software performanti come SAS® Text Miner, il software utilizzato per i casi studio descritti nel volume.
Con l’analisi dei testi si aprono nuovi ambiti di applicazione che oggi possiamo solo intuire: marketing, ricerca e sviluppo, sanità, e, perché no, gastronomia.

Il testo si rivolge al mondo accademico e ai professionisti che vogliono cogliere nuove opportunità di mercato, sfruttando tecnologie innovative.

Susi Dulli, docente alla Facoltà di Scienze Statistiche dell’Università di Padova e al Master universitario in Business Analysis, di cui è responsabile per l’area informatica. I suoi interessi di ricerca negli ultimi anni riguardano il Data Mining e il Data Warehousing. È autore di articoli scientifici e di alcuni testi tra cui: Il problema del Data Mining: algoritmi e applicazioni (Cleup 1998), Modelli e Strutture per il Data Warehousing (Diade 2000), Il Datawarehouse al centro del sistema informativo (Diade 2000), Metodi di Data Mining per il CRM (FrancoAngeli 2000).

Paola Polpettini, laureata in Economia e Commercio all’Università degli Studi di Perugia, ricopre dal 2004 il ruolo di specialista per le tecnologie Analitiche e di Customer Intelligence in SAS. Negli ultimi anni ha curato progetti di Data Mining per importanti aziende nei settori servizi e telecomunicazioni.

Massimiliano Trotta, dottore in Scienze Statistiche Demografiche e Sociali, si è laureato presso la Facoltà di Scienze Statistiche dell’Università di Padova discutendo la tesi Text Mining e Knowledge Discovery in Text. Da un’analisi teorica a un’applicazione. Attualmente svolge l’attività di analista quantitativo presso Nunatac. In questa veste ha partecipato alla realizzazione di progetti di Data Mining presso importanti aziende del settore bancario, finanziario e assicurativo.