?? ?? ?? Pattern Miner? ?? ? ?? ???, ???, ???, ??? - PowerPoint PPT Presentation

1 / 17
About This Presentation
Title:

?? ?? ?? Pattern Miner? ?? ? ?? ???, ???, ???, ???

Description:

Pattern Miner ... : i = {i1, i2, , im ... Apriori, DHP, AprioriAll : Synthetic data, ... – PowerPoint PPT presentation

Number of Views:56
Avg rating:3.0/5.0
Slides: 18
Provided by: 6649732
Category:
Tags: data | miner | pattern

less

Transcript and Presenter's Notes

Title: ?? ?? ?? Pattern Miner? ?? ? ?? ???, ???, ???, ???


1
?? ?? ?? Pattern Miner??? ? ?????, ???, ???, ???
??????? 98 ??????
  • 1998? 10? 10?

2
(No Transcript)
3
?? ??(Association Rule)
  • ??
  • ???? ?? ???? ???.
  • ?? ?
  • ?? ??
  • ????? ??????? ??? ?? ?? ??.
  • ??? ?????? ????? ?? ?? ??.
  • WWW???? ??? ?? ?? ??.

4
?? ??? ??
  • X ? Y support, confidence
  • X ? I, Y ? I and X ?Y ø.
  • X antecedent (?? ???), Y consequent (???).
  • I a set of literals called items (???? ??).
  • Measurement
  • ?? ??
  • 1. ?? ?? ??(Large itemsets ) ??
  • 2. ?? ?? ????


5
???? Apriori
  • ?? (Lk Set of Large k-itemsets, CkSet of
    Candidate k-itemsets)
  • ??
  • Apriori-gen ???? ?? ???? ??.
  • Join Step Ck LK-1 LK-1
  • Prune Step Ck? ?? (k-1)-subset? LK-1? ??? Ck?
    ??.
  • Subset function ?? ????? ??? ??
  • Hash Tree ??

6
???? DHP
  • ??
  • ??
  • Hash Table ? ??? ?? ?? ? ??
  • Transaction pruning ? ?? DB ?? ?? ??
  • ? ???? ?? ??

7
?? ??
  • ? ??? ????? ?? Hash Tree ??.
  • ? C2 A,B, A,C, A,T, B,C, B,D,
    C,D ??,

C2
A
B
C
Level 1
B
C
C
D
C,D
Level 2
????
A,B
A,C
B,C
B,D
A,T

???
8
?? ??(Sequential Pattern)
  • ??
  • ???? ??? ??? ????? ?? ??? ??? ??? ??? ?
  • Video ????? ?? ?? ?? ?
  • ??? ? ?? ? ???? support 25
  • ??
  • ???? i i1, i2, , im, ij ??
  • ??? s s1, s2, , sn, sj ????
  • ??? lta1a2angt is contained in ??? ltb1b2bngt
  • ?? i1 lt i2 lt i3 ? ?? a1?bi1, a2?bi2, , an?bin?
    ???? ??.
  • ? lt(3) (4 5) (8)gt is contained in lt(7) (3 8)
    (9) (4 5 6) (8)gt
  • Maximal sequence
  • Large sequence ?? ? ?? Large sequence?? ????
    ? ? sequence

9
?? ??? ?? ? ????
  • ?????? ??
  • ???? AprioriAll
  • ? Sort Phase ?? ??
  • ? Litemset Phase ?? ???? ?? ??
  • ? Transformation Phase Litemset?? ??????? ???
  • ? Sequence Phase ?? ??? ?? ??
  • ? Maximal Phase ?? ??? ?? ??

10
Pattern Miner
Rule(SpreadSheet)
Postprocessing
Mining Rules
Code Table (Item, Customer)
Preprocessed Data
Preprocessing
Raw Data
11
Environment
  • ????
  • IBM PC(with PII 233MHz and 64MB main memory)
  • OS Windows NT workstation 4.0
  • Language C
  • Tool Visual C 5.0
  • ?? ?? ?? ??, ?? ??
  • ?? ???? Apriori, DHP, AprioriAll
  • ?? ??? Synthetic data, ???? DB Access log data
  • ??
  • MDB Handling(DAO class), ActiveX Control ??.

12
Main Menu
13
Raw Data
14
Association Rule
(?? ??? 2, ?? ??? 50)
15
Association Rule Matrix
(?? ??? 2.5, ?? ??? 40)
16
Sequential Pattern
(?? ??? 11)
17
?? ?? ??
  • ?? ?? ??
  • Taxonomy? ??? ???? ?? ??.
  • Taxonomy? ??? ???? ?? ??.
  • Interactive User Interface
  • ??? ??? ?? ?? ??.
  • ?? ??? ?? ?? ?? ??.
  • ???? ?? ?? ??.
  • Graphic Display of the Patterns.
  • ?? ??? ???? ??
Write a Comment
User Comments (0)
About PowerShow.com