Title: FONAMENTS DE PROCESSAMENT DEL LLENGUATGE NATURAL 13305
1FONAMENTS DE PROCESSAMENT DEL LLENGUATGE
NATURAL13305 Lingüística - UPF
- nuria.bel_at_upf.edu
- Classe 8
2El programa
- 4. Les oracions
-
- Sintaxi Lestructura de loració
- x Categories, constituents i funcions.
- x Gramàtiques, regles lliures de context i
arbres. - x Analitzadors algoritmes i tècniques de
cerca. -
- Processament dinformació sintàctica.
- x Concordança. Coordinació. Subcategorització.
- x Trets i unificació. Formalismes
dUnificació. - x Gramàtiques lliures de context augmentades
amb unificació.
3Informació sintàctica ?
- concordança
- la nena canten cançons
- el nena simpàtica canta cançons
- subcategorització
- la nena va cançons
- la nena depèn amb els seus pares
4el fenomen de la subcategorització
- Informació/restriccions que determinen la
combinatòria delements - vol pomes sap matemàtiques
- vol venir/venint sap cantar
- vol que vinguis/vine sap que vens
- No solament els verbs
- labocament de deixalles als contenidors
- el violí és difícil de tocar
- és independent dels seus pares
- independenment de qualsevol consideració ....
5Subcategorització verbal en una gramàtica
dunificació
- Cada verb demana complements duna certa
categoria, lèxicament determinats i/o amb unes
certes característiques morfosintàctiques (mode,
temps, ...) - Havíem fet diferents regles per a uns
tipus/models de complementació - ara els prendrem com a models per fer patrons de
subcategorització. - però les regles de la gramàtica seran daplicació
tan general com sigui possible - la informació específica queda al lèxic
-
6Subcategorització i unificació (1)
- Plantegem-nos el fenomen
- Regles bàsiques dels patrons de subcategorització
- SV ? V (intransitius)
- SV ? V SN (transitius)
- SV ? V SN SPa (ditransitus)
- SV ? V SPx (de règim prep.)
- Pensem ... hi ha V de règim preposicional que
tenen una preposició diferent. - basar en, pensar en,
- dependre de, parlar de,
- abocar a, forçar a
7Subcategorització i unificació (2)
- Com podem expressar el règim preposicional en un
formalisme dunificació per tal que les regles
siguin el més generals possibles? - primer posar la informació on la puguem trobar
- mot(W,en) -
- Wcatp,
- Wforma_pen.
- regla(r5, SP ---gt P,SN)-
- SPcatsp,
- Pcatp,
- SNcatsn,
- SPforma_pPforma_p. compartir estructura
- compartir informació
8Subcategorització i unificació (3)
- si hem fet una regla per a cada tipus de verb,
ara haurem de fer una regla per a cada
preposició? - regla(r7, SV ---gt V,SP)-
- SVcatsv,
- Vcatv,
- Vtipus_vprep_en
- SPcatsp,
- SPforma_pen.
- afegirem també la informació al verb?
- mot(W,pensa) -
- Wcatv,
- Wtipus_vprep_en.
9Subcategorització i unificació (4)
- La resposta a les preguntes és no. Perquè
- No volem repetir informació el tipus de V i la
regla adequada per al tipus de V. - Cada verb té les seves restriccions, i aquestes
han destar al lèxic. - La gramàtica ha de ser tan general com sigui
possible. - Què podem fer?
- posar tota la informació específica a les
entrades del lèxic - fer regles que puguin trobar a la informació
lèxica del verb que estan analitzant quines són
les seves restriccions particulars. - Evitar la redundància al lèxic.
10Subcategorització i unificació (5)
- La resposta a les preguntes és no. Perquè
- No volem repetir informació el tipus de V i la
regla adequada per al tipus de V. - Cada verb té les seves restriccions, i aquestes
han destar al lèxic. - La gramàtica ha de ser tan general com sigui
possible. - Què podem fer?
- posar tota la informació específica sobre els
complements a les entrades del lèxic - fer regles que puguin trobar a la informació
lèxica del verb que estan analitzant quines són
les seves restriccions particulars. - Evitar la redundància al lèxic.
11Subcategorització i unificacióel lèxic (1)
- com ha de ser una entrada verbal?
- mot(W,pensa) -
- Wcatv,
- Wsubcatcatsp, creem un tret subcat
- Wsubcatf_pen. afegim restriccions
12Subcategorització i unificacióel lèxic (2)
- Hem de pensar en més dun complement
- abocar lt SN, SPagt
- Podem representar-ho com una llista de
complements, el primer és el CD, el segon és el
CP, etc. - mot(W,aboca) -
- Wcatv,
- Wsubcatprimercatsn,
- Wsubcatsegoncatsp,
- Wsubcatsegonf_pa.
13Subcategorització i unificació (6)
- La resposta a les preguntes és no. Perquè
- No volem repetir informació el tipus de V i la
regla adequada per al tipus de V. - Cada verb té les seves restriccions, i aquestes
han destar al lèxic. - La gramàtica ha de ser tan general com sigui
possible. - Què podem fer?
- posar tota la informació específica a les
entrades del lèxic - fer regles que puguin trobar a la informació
lèxica del verb que estan analitzant quines són
les seves restriccions particulars. - Evitar la redundància al lèxic.
14Subcategorització i unificació,les regles (1)
- mot(W,aboca) -
- Wcatv,
- Wsubcatprimercatsn,
- Wsubcatsegoncatsp,
- Wsubcatsegonf_pa.
- regles (versió provisional)
- regla(r8, SV ---gt V,Primer,Segon)-
- SVcatsv,
- Vcatv,
- PrimercatVsubcatprimercat,
- SegoncatVsubcatsegoncat,
- Segonf_pVsubcatsegonf_p.
15Subcategorització i unificació,les regles (2)
- Hem guanyat una sola regla per a tots els verbs
que tinguin 2 complements. - Però, amb el mateix principi (anar a buscar la
informació al verb) podríem pensar de tenir una
regla que sapliqués amb independència del nombre
darguments? és a dir, que sapliqués tantes
vegades com complements subcategoritzi el verb
...? - Pensem en la llista de complements com una pila
de la qual traiem el primer element per verificar
les restriccions, mentre deixem tota la resta de
complements a la pila. Si unifica, prenem la
resta com a llista i tornem a treure el primer,
fins al final.
16Subcategorització i unificació, les regles (3)
- Primer pensem en fer aquesta llista en forma de
pila a lentrada lèxica - durà un paquet de Barcelona a Madrid
- Wsubcatprimercatsn,
- Wsubcatrestaprimercatsp,
- Wsubcatrestaprimerf_pde,
- Wsubcatrestarestaprimercatsp,
- Wsubcatrestarestaprimerf_pa,
- Wsubcatrestarestarestafinal
17Subcategorització i unificació,les regles (4)
és la informació que compte
regla(r8, SV ---gt V,SX)- SVcatsv,
Vcatv, SXcatVsubcatprimercat,
SVsubcatVsubcatresta.
variable
18Subcategorització i unificació,les regles (5)
regla(r8, SV ---gt V,SX)- SVcatsv,
Vcatv, SXcatVsubcatprimercat,
SVsubcatVsubcatresta.
subcat
cat
sv
primer
19Subcategorització i unificacióles regles (6)
vsubcatrestafinal.
SV
vsubcatprimercatsp, vsubcatprimerf_pa
, vsubcatrestafinal.
SV
la noia dóna una poma al nen
vsubcatprimercatsn vsubcatrestaprimercat
sp, vsubcatrestaprimerf_pa, vsubcatrest
arestafinal.
20Subcategorització i unificació,les regles (7)
- regla(r7, SV ---gt V)-
- SVcatsv,
- SVsubcatVsubcat,
- Vcatv.
- regla(r8, SV ---gt V,SX)-
- SVcatsv,
- Vcatsv,
- SXcatVsubcatrestaprimercat,
- SXnucliVsubcatrestaprimernucli,
- SVsubcatprimerVsubcatprimer,
- SVsubcatrestaVsubcatrestaresta.
recursivitat !!
21Subcategorització i unificació,les regles (8)
- regla(r7, SV ---gt V)-
- SVcatsv,
- SVsubcatVsubcat,
- Vcatv.
- regla(r8, SV ---gt V,SX)-
- SVcatsv,
- Vcatsv,
- SXcatVsubcatrestaprimercat,
- SXnucliVsubcatrestaprimernucli,
- SVsubcatprimerVsubcatprimer
- SVsubcatrestaVsubcatrestaresta.
la preposició i tota informació que sigui
restricció
22Subcategorització i unificació,les regles (9)
- regla(r7, SV ---gt V)-
- SVcatsv,
- SVsubcatVsubcat,
- Vcatv.
- regla(r8, SV ---gt V,SX)-
- SVcatsv,
- Vcatsv,
- SXcatVsubcatrestaprimercat,
- SXnucliVsubcatrestaprimernucli,
- SVsubcatprimerVsubcatprimer,
- SVsubcatrestaVsubcatrestaresta.
el subjecte és el primer
23Subcategorització i unificacióel subjecte al
lèxic
- Entrada léxica verbal amb subjecte
- mot(W,pensa) -
- Wcatv,
- Wsubcatprimercatsn,
- Wsubcatprimernucliconcper3,
- Wsubcatprimernucliconcnomsing,
- Wsubcatrestaprimercatsp,
- Wsubcatrestaprimernuclif_pen,
- Wsubcatrestarestafinal.
24Subcategorització i unificació (7)
- La resposta a les preguntes és no. Perquè
- No volem repetir informació el tipus de V i la
regla adequada per al tipus de V. - Cada verb té les seves restriccions, i aquestes
han destar al lèxic. - La gramàtica ha de ser tan general com sigui
possible. - Què podem fer?
- posar tota la informació específica a les
entrades del lèxic - fer regles que puguin trobar a la informació
lèxica del verb que estan analitzant quines són
les seves restriccions particulars. - Evitar la redundància al lèxic.
25Subcategorització i unificacióorganitzant el
lèxic (1)
- És veritat que cada verb té singularitats, però
també, des del punt de vista sintàctic, es poden
fer generalitzacions, com havíem fet en parlar de
verbs transitius, intransitius, preposicionals,
etc. - Són tipus de verbs que es poden declarar una
sola vegada i afegir la informació addicional.
26Subcategorització i unificació,organitzant el
lèxic (2)
- mot(W,canta)-
- Wcatv,
- macro(subj3s,W),
- macro(vintr,W).
- macro(vintr,W)-
- Wsubcatrestafinal.
- macro(subj3s,W)-
- Wsubcatprimercatsn,
- Wsubcatprimernucliconcper3,
- Wsubcatprimernucliconcnoms.
Identificador un nom
Pot tenir tants arguments com faci falta
27Resum
- Unificació i poder compartir estructura ens
permeten - Tractar la subcategorització amb una llista de
complements que buidem com una pila (primer i
resta aplicat de forma recursiva) - A la llista de subcategorització, indicar totes
les restriccions morfosintàctiques de cada verb
sobre cada un dels seus complements, inclòs el
subjecte. - Poder agrupar les restriccions com a valors
conjunts datributs concrets (informació a
nucli). - Poder definir tipus de elements