JUMAN/KNP???? ????? - PowerPoint PPT Presentation

About This Presentation
Title:

JUMAN/KNP???? ?????

Description:

Title: JUMAN/KNP Author: Last modified by: Created Date – PowerPoint PPT presentation

Number of Views:15
Avg rating:3.0/5.0
Slides: 54
Provided by: 9518
Category:
Tags: juman | knp

less

Transcript and Presenter's Notes

Title: JUMAN/KNP???? ?????


1
JUMAN/KNP????????????? - ?? -
  • ???? ???? ????
  • ????

???????????????? ???????????????????????
(2005/8/30)
2
??
  1. ????????
  2. ????
  3. JUMAN/KNP???????
  4. JUMAN/KNP???/??????(??????)
  5. ??
  6. Perl???
  7. JUMAN/KNP?Perl?????????????????

3
??????????
  • C\juman-knp-20050830
  • Install
  • juman-5.1.exe, knp-2.0.exe, Perl??
  • src (Perl?????)
  • cut.pl, grep.pl, phrase.pl, sort.pl, uniq.pl
  • text (????????)
  • ??cook_small.txt, cook_middle.txt,
    cook_large.txt
  • Webweb_small.txt, web_middle.txt, web_large.txt
  • small 1,000?, middle 5,000?, large 20,000?

4
1.????????
  • ???????
  • C\juman-knp-20050830
  • JUMAN
  • C\Program Files\juman
  • KNP
  • C\Program Files\knp
  • Perl(ActivePerl)
  • Perl?????

5
JUMAN/KNP?????????
  • ?????Linux??
  • ?????????EUC
  • ????????????EUC
  • ??????Windows
  • ?????????SJIS
  • ????????????EUC
  • ?????????????
  • Linux ???EUC
  • Windows ???SJIS

6
2.????
  • PATH???
  • ????????????????????????

(Windows XP???)
7
2.????
  • PATH???
  • ??????????

8
2.????
  • PATH???
  • ???????

9
2.????
  • PATH???
  • Path????????????????

10
2.????
  • PATH???
  • Path????????????????
  • ??????????????????(?????????????????????)

C\Program Files\jumanC\Program Files\knp
11
3.1 JUMAN???????
  • ???? ????????
  • ????????????????????????? ?????

12
3.1 JUMAN???????
  • ???? ????????

13
3.1 JUMAN???????
  • juman???

14
3.1 JUMAN???????
  • ?????????????

15
3.1 JUMAN???????
  • ?????????????????

Tips
Alt??/???IME????? ?????????
16
3.1 JUMAN???????
  • ?????????????????

Tips
???????????????????????? ? ?????????????????????
? ?????????
17
3.1 JUMAN???????
  • ??????Z ???? ???

18
3.1 JUMAN???????
  • ???juman B e2

Tips
?????????????? ????????
19
juman B e2 ??????
??
??
??
??
?????
????
? ?? ? ?? 6 ???? 10 0 0 "????? ?????" ??
??? ?? ?? 2 0 ?????? 9 ????? 7 "??????" ? ? ?
?? 9 ??? 2 0 0 NIL _at_ ? ? ? ?? 9 ???? 3 0
0 NIL ?? ??? ?? ?? 6 ???? 10 0 0 "??????" _at_
?? ?? ?? ?? 6 ???? 10 0 0 "??????" ? ? ? ??
9 ??? 1 0 0 NIL ?? ??? ?? ?? 6 ???? 1 0 0
"??????" ?? ?? ? ??? 4 0 ??? 25 ?????? 24
NIL ? ? ? ?? 1 ?? 1 0 0 NIL EOS
???
???
????????????
20
3.2 KNP???????
  • juman B e2 knp ???

21
3.2 KNP???????
  • juman B e2 knp tab ???

22
knp tab ??????
0?????
????????
S-ID1 KNP2005/08/30 2D lt??gtlt?gtlt??gtlt??gtlt???gt
lt???ST2.5?gtlt??1-4gtltRID1238gtlt???gt ? ?? ?
?? 6 ???? 10 0 0 "????? ?????"
lt?????gtlt?????gtlt??gt ?? ??? ?? ?? 6 ???? 1 0
0 "??????" lt??????gtlt????gt ? ? ? ?? 9 ??? 2 0
0 NIL lt??gtltALT-?-?-?-9-3-0-0-NILgtlt??-???gtlt??-???
gt 2D lt??gtlt???gtlt????gtlt?gtlt?gtlt??gtlt??gtlt???gtlt??0-
0gtltRID1200gtlt???gt ?? ??? ?? ?? 6 ???? 10 0 0
?????? lt??????gtlt??gt ? ? ? ?? 9 ??? 1 0 0
NIL lt????gtlt????gtlt??gt -1D lt??gtlt??gtlt??gtlt???gtlt???
Cgtlt??5-5gtltID(??)gtltRID112gtlt???30gt ?? ??? ?? ??
6 ???? 1 0 0 "??????" lt??????gtlt??gtlt????gt ??
?? ? ??? 4 0 ??? 25 ?????? 24 NIL
lt????gtlt????gtlt????gtlt???gtlt??gt ? ? ? ?? 1 ?? 1 0
0 NIL lt??gtlt???gtlt??gtlt??gt EOS
1?????
2?????
23
????????????
  • cd c\juman-knp-20050830\text
  • juman B e2 lt cook_small.txt gt cook_small.jmn
  • knp tab lt cook_small.jmn gt cook_small.knp

Tips
???????????? Tab???????
24
4.1 JUMAN?????
25
??????
????(??????????????)
(????????????)
??
?
??
??
??
? ? ?
26
????
27
ContentW.dic(?????)
  • (?? (???? ((?? ????)(???? ?? (??? 1.6) (????
    1.6))(???? "??????"))))
  • (?? (???? ((?? ????)(???? ?? (??? 1.6) (????
    1.6))(???? "??????"))))
  • (?? ((?? ????)(???? ??? ????)(???? "???????")))
  • (?? (???? ((?? ????)(???? ????)(????
    "????????"))))
  • (?? ((?? ???)(???? ??? ???)(??? ??????)(????
    "???????")))
  • (?? (???? ((?? ???)(???? ? ??? (??? 1.6))(????
    "?????"))))
  • (?? (???? ((?? ???)(???? ?? ? (??? 1.6))(????
    "??????"))))
  • (?? (???? ((?? ?????)(???? ??? ?? ??? (?????
    1.6))(???? "???????"))))
  • (?? (???? ((?? ?????)(???? ??? (????? 1.6))(????
    "???????"))))
  • (?? ((?? ?????)(???? ?????)(???? "?????????")))

28
JUMAN.connect.c(??????)
  • ((BunsetsuEndSentenceEnd
  • BunsetsuEnd
  • (?? ???? ?))
  • ((??))
  • 4 )
  • ((VerbBasicForm
  • IAdjBasicForm
  • NaAdjAllBasicForm
  • AuxBasicForm
  • NaAdjGuessForm
  • ( ?????)
  • (?? ??????)
  • (??? ?????? ??????))
  • ((?? ???? ??)))

29
4.2 KNP??????
30
?????
0. JUMAN B e2 ???????
  1. ????????(mrph_home.rule60) ? ??????????
  2. ?????feature??(mrph_basic.rule300) ? ??????
  3. ????feature??(bnst_.rule200,650)
  4. ??????
  5. ??????(kakari_uke.rule40)
  6. ???

31
?????(bnst_type.rule)
? 30?? ??? ??????????????
( ( ? ) ( lt ( ? ?? ? ) ((??)) gt ) ( lt
( ?? (? ? ?) ? ) gt ? ) ?? )
32
??????
30?? ?? ??? ??? ??????
33
JUMAN???????
  • ?????????
  • ?????????????????
  • ??????????????????
  • C\Program Files\juman\dic???usr.dic??????????????
    ???????
  • C\Program Files\juman\dic???makedic.bat?????
  • ??????

(?? (???? ((?? ??????) (???? ?????? ??????
????))))
34
??
35
??
  1. ????????
  2. ????
  3. JUMAN/KNP???????
  4. JUMAN/KNP???/??????(??????)
  5. ??
  6. Perl???
  7. JUMAN/KNP?Perl?????????????????

36
6.Perl???
  • Perl??????????????????

???????????????100??4??????? ?????????????????????
??????? ??????????? ??????????????50? ?????????C?
???????????? ??????? ?????????????????????????????
?
636 ?597 ? 583 ?45 ?42 ??42 ??? 39 ? 38
?? 37 ?
????
?????????
37
6.Perl???
  • ?????????????????????(?????)???
  • C\juman-knp-20050830\src\test.pl???
  • cd C\juman-knp-20050830\src
  • ???? ???????perl test.pl???

?????
use encoding shiftjisprint ??????\n
??????????
???????
38
6.Perl???
  • ?????????????????????(src\grep.pl)

use encoding shiftjisARGV0
Encodedecode(shiftjis, ARGV0)while
(ltSTDINgt) print if (/ARGV0/)
????????????
1?????
??
?//????????????
39
6.Perl???
  • ??????????(src\sort.pl)

while (ltSTDINgt) push(_at_buffer, _)if
(rflag) print reverse sort _at_buffer else
print sort _at_buffer
baa aa cccc aa
aa aa baa cccc
_at_...???
??????????
???????
40
6.Perl???
  • ???????????????????????????(src\uniq.pl)

use encoding shiftjispre ltSTDINgtcount
1while (ltSTDINgt) if (pre eq _)
count else printf 6d
pre, count pre _ count
1 printf 6d pre, count
aa aa baa cccc
2 aa 1 baa 1 cccc
41
6.Perl???
  • ?????????????????????(src\cut.pl)

? ?? ? ?? 6 ???? 10 0 0 "????? ?????" ??
??? ?? ?? 2 0 ?????? 9 ????? 7 "??????" ? ? ?
?? 9 ??? 2 0 0 NIL ?? ??? ?? ?? 6 ???? 10 0
0 "??????" ? ? ? ?? 9 ??? 1 0 0 NIL ?? ???
?? ?? 6 ???? 1 0 0 "??????" ?? ?? ? ??? 4
0 ??? 25 ?????? 24 NIL ? ? ? ?? 1 ?? 1 0 0
NIL EOS
use encoding shiftjisif (ARGV0
/\-(\d)/ 1 gt 0) cnum 1 1
else die Usage cut.pl n\nwhile
(ltSTDINgt) _at_data split print
datacnum, \n if (data gt cnum)
1?????????????
42
6.Perl???
  • ?????????????????????(src\cut.pl -3)

? ?? ? ?? 6 ???? 10 0 0 "????? ?????" ??
??? ?? ?? 2 0 ?????? 9 ????? 7 "??????" ? ? ?
?? 9 ??? 2 0 0 NIL ?? ??? ?? ?? 6 ???? 10 0
0 "??????" ? ? ? ?? 9 ??? 1 0 0 NIL ?? ???
?? ?? 6 ???? 1 0 0 "??????" ?? ?? ? ??? 4
0 ??? 25 ?????? 24 NIL ? ? ? ?? 1 ?? 1 0 0
NIL EOS
use encoding shiftjisif (ARGV0
/\-(\d)/ 1 gt 0) cnum 1 1
else die Usage cut.pl n\nwhile
(ltSTDINgt) _at_data split print
datacnum, \n if (data gt cnum)
1?????????????
43
6.Perl???
  • ?????????????????????(src\cut.pl)

use encoding shiftjisif (ARGV0
/\-(\d)/ 1 gt 0) cnum 1 1
else die Usage cut.pl n\nwhile
(ltSTDINgt) _at_data split print
datacnum, \n if (data gt cnum)
1?????????????
44
??
  1. ????????
  2. ????
  3. JUMAN/KNP???????
  4. JUMAN/KNP???/??????(??????)
  5. ??
  6. Perl???
  7. JUMAN/KNP?Perl?????????????????

45
7.1 ?????????
  • cd c\juman-knp-20050830\text
  • ?????????cook_small.txt????

???????????????100??4??????? ?????????????????????
??????? ??????????? ??????????????50? ?????????C?
???????????? ??????? ?????????????????????????????
????????????????? ????????????????????????????????
?????
46
7.1 ?????????
  • ?????
  • juman B e2 lt cook_small.txt gt cook_small.jmn
  • ??????????
  • perl ..\src\cut.pl -3 lt cook_small.jmn more

3???????
???????????????100??4???????
47
7.1 ?????????
  • ?????????????
  • perl ..\src\cut.pl -3 lt cook_small.jmn perl
    ..\src\sort.pl perl ..\src\uniq.pl perl
    ..\src\sort.pl r more

636 ?597 ? 583 ?45 ?42 ??42 ??? 39 ? 38
?? 37 ?
?? ?? ?? ???? ?? ?? ?? ??
1 ?????52 ??1 ????1 ???? 1 ???? 1 ??? 6 ?? 1
???? 1 ????
48
src\phrase.pl
  • ?????????????????
  • ?????phrase.pl -1
  • ???????phrase.pl -2
  • cook_large.knp??????
  • perl ..\src\phrase.pl -1 knp\cook_large.knp gt
    cook_large.dat1
  • perl ..\src\phrase.pl -2 knp\cook_large.knp gt
    cook_large.dat2

!/usr/bin/perl ???????????????????
UNIX?OS???????????????????????????????????? use
KNP KNP new KNP while (ltSTDINgt)
result KNP-gtparse(_) for my bnst
(result-gtbnst) ... use
KNPFile use encoding 'shiftjis' if (ARGV0
/\-(12)/ -f ARGV1) type 1
????????????? KNP new
KNPFile(ARGV1) die else
49
7.2 ?????????
  • ?????????????
  • perl ..\src\sort.pl lt cook_large.dat1 perl
    ..\src\uniq.pl perl ..\src\sort.pl -r more

1618 ??1001 ??? 518 ???511 ?315 ?296 ??292
?? 284 ??? 269 ???
50
7.3 ???????????
  • ???????????????
  • perl ..\src\sort.pl lt cook_large.dat2 perl
    ..\src\uniq.pl perl ..\src\sort.pl r more

188 ??? ??? 188 ???? NTT?????? 97 ?? ??? 77 1???
?? 59 ?? ?? 59 ?????? ?? 57 ?? ??? 56 ?? ?? 53
???? ??
51
?????
  • ???????
  • perl ..\src\sort.pl lt cook_large.dat2 perl
    ..\src\uniq.pl perl ..\src\sort.pl r perl
    ..\src\grep.pl ?? more

53 ???? ?? 33 ??? ?? 31 ???? ?? 29 ??? ?? 16 ???
?? 12 ?? ?? 11 ???? ?? 10 ??? ?? 10 ?? ??
52
?????
  • ?? ??????
  • perl ..\src\sort.pl lt cook_large.dat2 perl
    ..\src\uniq.pl perl ..\src\sort.pl r perl
    ..\src\grep.pl ? ?? more

16 ??? ?? 7 ?? ?? 5 ??? ?? 4 ??? ?? 3 ????? ?? 3
??? ?? 3 ?? ?? 3 ?? ?? 2 ?? ??
53
??????
  • ????????????
  • ????????????????
Write a Comment
User Comments (0)
About PowerShow.com