english | español

contatti

Text Mining: teoria e applicazioni

la copertina del libro

Indice

Presentazione di Alberto Saccardi

Presentazione di Walter Lanzani

Introduzione di Massimiliano Trotta

1. Verso una definizione di KDT e di TM,
di Massimiliano Trotta, Susi Dulli

  • 1.1. Dal KDD al KDT
  • 1.2. Le fasi del processo
  • 1.3. Rassegna critica di alcune definizioni

2. Analisi di un processo KDT,
di Massimiliano Trotta, Susi Dulli

  • 2.1. Un approfondimento
  • 2.2. Text Refining (TR)
    • 2.2.1. Natural Language Processing (NLP)
    • 2.2.2. Information Extraction (IE)
      • 2.2.2.1. Processo ideale di IE
      • 2.2.2.2. La valutazione
      • 2.2.2.3. Le sfide
      • 2.2.2.4. IE per KDT
    • 2.2.3. Information Retrieval (IR)
      • 2.2.3.1. Processo ideale di IR
      • 2.2.3.2. Operazioni sul testo
      • 2.2.3.3. Vector Model (VM)
      • 2.2.3.4. Latent Semantic Indexing Model (LSIM)
      • 2.2.3.5. La valutazione
      • 2.2.3.6. IR per KDT
  • 2.3 Text Mining (TM)
    • 2.3.1. Clustering
      • 2.3.1.1. Clustering gerarchico agglomerativo
      • 2.3.1.2. K-means
    • 2.3.2. Classificazione/Categorizzazione
    • 2.3.3. Scoperta di associazioni
    • 2.3.4. Metodi originali di TM
  • 2.4. Risorse
    • 2.4.1. Machine Learning (ML)
      • 2.4.1.1 Text Categorization (TC)
        • 2.4.1.1.1. Trasformazione del testo
        • 2.4.1.1.2. Algoritmi di training
        • 2.4.1.1.3. La valutazione
    • 2.4.2. Basi di conoscenza

3. Lo scenario attuale,
di Massimiliano Trotta, Susi Dulli

  • 3.1. Sequenze lunghe più frequenti
    • 3.1.1. Il problema
    • 3.1.2. Le soluzioni
      • 3.1.2.1. Lent-Agrawal-Srikant
      • 3.1.2.2. Ahonen
  • 3.2. TM in presenza di Conoscenza Specifica di Settore
    • 3.2.1. Il problema
    • 3.2.2. La soluzione
      • 3.2.2.1. Il sistema KDT
      • 3.2.2.2. Il sistema FACT
    • 3.2.3. I risultati
  • 3.3. Autorship Categorization
    • 3.3.1. Lo scenario
    • 3.3.2. Il problema
    • 3.3.3. La soluzione
    • 3.3.4. I risultati
  • 3.4. Content-Based Collaborative Filtering
    • 3.4.1. Lo scenario
    • 3.4.2. Il problema
    • 3.4.3. La soluzione
    • 3.4.4. I risultati
  • 3.5. Mining e finanza
    • 3.5.1. Lo scenario
    • 3.5.2. Il problema
    • 3.5.3. La soluzione
    • 3.5.4. I risultati
  • 3.6. Mining su conoscenza estratta dal Web
    • 3.6.1. Lo scenario
    • 3.6.2. Il problema
    • 3.6.3. La soluzione
    • 3.6.4. I risultati
  • 3.7. Ricerca di bibliografie scientifiche complementari
    • 3.7.1. Lo scenario
    • 3.7.2. Il problema
    • 3.7.3. La soluzione
      • 3.7.3.1 Procedura I
      • 3.7.3.2 Procedura II
    • 3.7.4. I risultati
  • 3.8. Ricerca di regole causali
    • 3.8.1. Lo scenario
    • 3.8.2. Il problema
    • 3.8.3. La soluzione
    • 3.8.4. I risultati
  • 3.9. Tavola riassuntiva

4. Conclusioni

4. Metodologia SAS per il Text Mining,
di Paola Polpettini – SAS

  • 4.1. Introduzione
  • 4.2. File pre-processing: preparazione dei documenti per l’analisi
  • 4.3. Text parsing: inizia l’analisi dei documenti
  • 4.4. Trasformazione: dimension reduction
  • 4.5. Clustering: classificazione e previsione
  • 4.6. Scoring: applicazione del processo di text mining ad una
    nuova raccolta di documenti

5. Dal testo non strutturato all’informazione: text mining su PubMed,
di Andrea Rizzi – Università degli studi di Padova

  • 5.1. Introduzione
  • 5.2. Acquisire, sviluppare ed esplicare conoscenza
  • 5.3. Prima fase del progetto: indirizzamento automatico di documenti
    • 5.3.1. Raccolta e predisposizione dei dati per l’analisi
    • 5.3.2. Processo di analisi
    • 5.3.3. Risultati
  • 5.4. Seconda parte del progetto: cluster analysis e indirizzamento nelle classi tematiche

6. Metodologia SAS per il Text Mining,
di Roberta Fontana – Osservatorio del Turismo della Regione Piemonte

  • 6.1. Introduzione
  • 6.2. Raccolta e predisposizione dati per l’analisi
  • 6.3. Processo di analisi
  • 6.4. Text parsing
  • 6.5. Singular Value Decomposition
  • 6.6. Cluster analysis
  • 6.7. Report e profiling
  • 6.8. Risultati e considerazioni finali

7. Metodologia SAS per il Text Mining,
di Norma Sanga – Università degli Studi di Bergamo

  • 7.1. Introduzione
  • 7.2. Raccolta e predisposizione dei dati per l’analisi
  • 7.3. Processo di text mining
  • 7.4. Risultati e considerazioni finali

8. Metodologia SAS per il Text Mining,
di Patrizia Cerrito – Università di Louisville

  • 8.1. Introduzione
  • 8.2. Fattori di rischio dei pazienti
  • 8.3. Utilizzo del text mining

Glossario

Bibliografia