Text Mining: teoria e applicazioni
Indice
Presentazione di Alberto Saccardi
Presentazione di Walter Lanzani
Introduzione di Massimiliano Trotta
1. Verso una definizione di KDT e di TM,
di Massimiliano Trotta, Susi Dulli
- 1.1. Dal KDD al KDT
- 1.2. Le fasi del processo
- 1.3. Rassegna critica di alcune definizioni
2. Analisi di un processo KDT,
di Massimiliano Trotta, Susi Dulli
- 2.1. Un approfondimento
- 2.2. Text Refining (TR)
- 2.2.1. Natural Language Processing (NLP)
- 2.2.2. Information Extraction (IE)
- 2.2.2.1. Processo ideale di IE
- 2.2.2.2. La valutazione
- 2.2.2.3. Le sfide
- 2.2.2.4. IE per KDT
- 2.2.3. Information Retrieval (IR)
- 2.2.3.1. Processo ideale di IR
- 2.2.3.2. Operazioni sul testo
- 2.2.3.3. Vector Model (VM)
- 2.2.3.4. Latent Semantic Indexing Model (LSIM)
- 2.2.3.5. La valutazione
- 2.2.3.6. IR per KDT
- 2.3 Text Mining (TM)
- 2.3.1. Clustering
- 2.3.1.1. Clustering gerarchico agglomerativo
- 2.3.1.2. K-means
- 2.3.2. Classificazione/Categorizzazione
- 2.3.3. Scoperta di associazioni
- 2.3.4. Metodi originali di TM
- 2.3.1. Clustering
- 2.4. Risorse
- 2.4.1. Machine Learning (ML)
- 2.4.1.1 Text Categorization (TC)
- 2.4.1.1.1. Trasformazione del testo
- 2.4.1.1.2. Algoritmi di training
- 2.4.1.1.3. La valutazione
- 2.4.1.1 Text Categorization (TC)
- 2.4.2. Basi di conoscenza
- 2.4.1. Machine Learning (ML)
3. Lo scenario attuale,
di Massimiliano Trotta, Susi Dulli
- 3.1. Sequenze lunghe più frequenti
- 3.1.1. Il problema
- 3.1.2. Le soluzioni
- 3.1.2.1. Lent-Agrawal-Srikant
- 3.1.2.2. Ahonen
- 3.2. TM in presenza di Conoscenza Specifica di Settore
- 3.2.1. Il problema
- 3.2.2. La soluzione
- 3.2.2.1. Il sistema KDT
- 3.2.2.2. Il sistema FACT
- 3.2.3. I risultati
- 3.3. Autorship Categorization
- 3.3.1. Lo scenario
- 3.3.2. Il problema
- 3.3.3. La soluzione
- 3.3.4. I risultati
- 3.4. Content-Based Collaborative Filtering
- 3.4.1. Lo scenario
- 3.4.2. Il problema
- 3.4.3. La soluzione
- 3.4.4. I risultati
- 3.5. Mining e finanza
- 3.5.1. Lo scenario
- 3.5.2. Il problema
- 3.5.3. La soluzione
- 3.5.4. I risultati
- 3.6. Mining su conoscenza estratta dal Web
- 3.6.1. Lo scenario
- 3.6.2. Il problema
- 3.6.3. La soluzione
- 3.6.4. I risultati
- 3.7. Ricerca di bibliografie scientifiche complementari
- 3.7.1. Lo scenario
- 3.7.2. Il problema
- 3.7.3. La soluzione
- 3.7.3.1 Procedura I
- 3.7.3.2 Procedura II
- 3.7.4. I risultati
- 3.8. Ricerca di regole causali
- 3.8.1. Lo scenario
- 3.8.2. Il problema
- 3.8.3. La soluzione
- 3.8.4. I risultati
- 3.9. Tavola riassuntiva
4. Conclusioni
4. Metodologia SAS per il Text Mining,
di Paola Polpettini – SAS
- 4.1. Introduzione
- 4.2. File pre-processing: preparazione dei documenti per l’analisi
- 4.3. Text parsing: inizia l’analisi dei documenti
- 4.4. Trasformazione: dimension reduction
- 4.5. Clustering: classificazione e previsione
- 4.6. Scoring: applicazione del processo di text mining ad una
nuova raccolta di documenti
5. Dal testo non strutturato all’informazione: text mining su PubMed,
di Andrea Rizzi – Università degli studi di Padova
- 5.1. Introduzione
- 5.2. Acquisire, sviluppare ed esplicare conoscenza
- 5.3. Prima fase del progetto: indirizzamento automatico di documenti
- 5.3.1. Raccolta e predisposizione dei dati per l’analisi
- 5.3.2. Processo di analisi
- 5.3.3. Risultati
- 5.4. Seconda parte del progetto: cluster analysis e indirizzamento nelle classi tematiche
6. Metodologia SAS per il Text Mining,
di Roberta Fontana – Osservatorio del Turismo della Regione Piemonte
- 6.1. Introduzione
- 6.2. Raccolta e predisposizione dati per l’analisi
- 6.3. Processo di analisi
- 6.4. Text parsing
- 6.5. Singular Value Decomposition
- 6.6. Cluster analysis
- 6.7. Report e profiling
- 6.8. Risultati e considerazioni finali
7. Metodologia SAS per il Text Mining,
di Norma Sanga – Università degli Studi di Bergamo
- 7.1. Introduzione
- 7.2. Raccolta e predisposizione dei dati per l’analisi
- 7.3. Processo di text mining
- 7.4. Risultati e considerazioni finali
8. Metodologia SAS per il Text Mining,
di Patrizia Cerrito – Università di Louisville
- 8.1. Introduzione
- 8.2. Fattori di rischio dei pazienti
- 8.3. Utilizzo del text mining
Glossario
Bibliografia

