Data |
Ora |
Luogo |
Argomenti |
Pagine |
Giovedí 1 marzo 2007 |
9-13 |
Lab T |
Il problema dell'analisi dei gruppi (cluster analysis).
Omogeneità e separazione. Requisiti di un algoritmo di cluster
analysis ideale. Coefficienti di somiglianza e dissomiglianza. Metodi
gerarchici e aggregativi. Single linkage, complete linkage, group-average
cluster analysis. Inconvenienti dei metodi gerarchici. L'algoritmo BIRCH.
Clustering feature e CF tree. Stime di densità istogramma e naive.
|
c.pdf: 1-26; 28-29; 42-44 |
Giovedí 8 marzo 2007 |
9-13 |
Lab T |
Stime di densità kernel. Algoritmo DENCLUE. Funzioni di
influenza e densità. Attrattori di densità e cluster
definiti da un centro. Proprietà e confronto con DBSCAN.
Vantaggi e svantaggi di DENCLUE. Algoritmo DBSCAN. Epsilon-intorno di un
punto. Raggiungibilità diretta e per densità. Connessione
per densità e definizione di cluster. Algoritmo in notazione
object-oriented. Esempi di cluster riconosciuti da DBSCAN.
|
c.pdf: 45-58; 61-65; 67. dc-dbscan.pdf: 1-7. |
Giovedí 15 marzo 2007 |
9-11:30 |
Lab T |
Microsoft SQL Server 2005: importazione di dati da file testuali,
clustering di dati, visualizzazione e analisi dei diagrammi e profili
dei cluster. |
|
Giovedí 22 marzo 2007 |
9–13; 14:30–17 |
Lab T |
Complessità computazionale degli algoritmi: O-grande,
Omega-grande, Theta-grande, o-piccolo. Clustering di stream di dati:
l'algoritmo CluStream. Data mining distribuito: cenni. Data Warehouse
Editition: procedure Easy Mining. Esempi di estrazione di outlier,
riconoscimento di cluster, estrazione di regole associative con IBM
Intelligent Miner Modeling 9.1 e visualizzazione dei modelli con IBM
Intelligent Miner Visualization 9.1. |
stream_ddm_2006_05_23.pdf: 1–11; 22–37 |