Anotao multilingue - PowerPoint PPT Presentation

1 / 25
About This Presentation
Title:

Anotao multilingue

Description:

Ser poss vel establecer universais com bases nestes conceitos? ... ACC (accusative), DAT (dative), PIV (prepositive), ACC/DAT, NOM/PIV [for: PERS] ... – PowerPoint PPT presentation

Number of Views:63
Avg rating:3.0/5.0
Slides: 26
Provided by: wind897
Category:

less

Transcript and Presenter's Notes

Title: Anotao multilingue


1
Anotação multilingue
  • Belinda Maia

2
Quem descobriu America?
  • Os Vikings?
  • Os Croatos?
  • Os Portugueses?
  • Os Chineses?
  • Cristoval Colon? E era espanhol, genovês ou
    português
  • -------?
  • Mas a nossa história é Euro-cêntrica

3
Quem criou a terminologia linguística
  • Latino-cêntrica?
  • Euro-cêntrica?
  • Anglo-cêntrica?
  • Será possível establecer universais com bases
    nestes conceitos?
  • Será possível criar terminologia linguística que
    oferece anotação aceitável em 1 língua?
  • . Ou para várias línguas?

4
Viagem à volta da anotação
  • PoS - Part-of-speech
  • Análise morfosintá(c)tica
  • Análise sintá(c)tica
  • Parsing
  • Analíse semântica
  • Análise do discurso
  • Análise pragmática
  • ..

5
Anotação
  • Manual?
  • Qual teoria?
  • Qual nível?
  • Quem tem razão?
  • Automática?
  • Possibilidades?
  • Problemas?
  • Semi-automática ou automática correcção

6
Vamos ver
  • Em inglês EN
  • BNC
  • CLAWS 5
  • CLAWS 6
  • Em Português PT
  • Projecto AC/DC
  • PALAVRAS
  • Cintil
  • REPENTINO

7
Substantivo / noun
  • EN
  • Masculino / feminino sexo gt léxico
  • PT
  • Masculino / feminino género gt léxico sintâxe
  • EN
  • Singular / plural
  • PT
  • Singular / plural género

8
BNC
  • NN0
  • Common noun, neutral for number (e.g. aircraft,
    data, committee)
  • NN1
  • Singular common noun (e.g. pencil, goose, time,
    revelation)
  • NN2
  • Plural common noun (e.g. pencils, geese, times,
    revelations)
  • NP0
  • Proper noun (e.g. London, Michael, Mars, IBM)

9
CLAWS6
  • ND1 singular noun of direction (e.g. north,
    southeast)
  • NN common noun, neutral for number (e.g. sheep,
    cod, headquarters)
  • NN1 singular common noun (e.g. book, girl)
  • NN2 plural common noun (e.g. books, girls)
  • NNA following noun of title (e.g. M.A.)
  • NNB preceding noun of title (e.g. Mr., Prof.)
  • NNL1 singular locative noun (e.g. Island, Street)
  • NNL2 plural locative noun (e.g. Islands, Streets)
  • NNO numeral noun, neutral for number (e.g. dozen,
    hundred)
  • NNO2 numeral noun, plural (e.g. hundreds,
    thousands)
  • NNT1 temporal noun, singular (e.g. day, week,
    year)
  • NNT2 temporal noun, plural (e.g. days, weeks,
    years)
  • NNU unit of measurement, neutral for number (e.g.
    in, cc)
  • NNU1 singular unit of measurement (e.g. inch,
    centimetre)

10
BYU
  • BNC at BYU - BNC tagset
  • Corpus de Português, BYU
  • gtgt

11
(No Transcript)
12
PALAVRAS
  • WORD CLASS TAGS
  • N Nouns PROP Proper nouns (names)
  • INFLECTION TAGS
  • Gender M (male), F (female), M/F for N',
    PROP', SPEC', DET, PERS, ADJ, V PCP, NUM
    Number S (singular), P (plural), S/P for N,
    PROP', SPEC', DET, PERS, ADJ, V PCP, V VFIN, INF,
    NUM Case NOM (nominative), ACC (accusative),
    DAT (dative), PIV (prepositive), ACC/DAT, NOM/PIV
    for PERS

13
Casos / Cases
  • Case NOM (nominative), ACC (accusative), DAT
    (dative), PIV (prepositive), ACC/DAT, NOM/PIV
    for PERS
  • Pergunta
  • Casos sintâxe ou semântica?

14
PALAVRAS Semantic tags for nouns
  • Ver ficheiro

15
USAS Semantic Tagset
  • SEMTAG

16
(No Transcript)
17
Pergunta
  • Semantic tags ????
  • Organização do léxico?
  • Tesaurus?
  • Ontologias?
  • Será possível traduzir Wordnet?

18
EN Verb (BNC)
  • VBB the "base forms" of the verb "BE" (except the
    infinitive), i.e. AM, ARE
  • VBD past form of the verb "BE", i.e. WAS, WERE
  • VBG -ing form of the verb "BE", i.e. BEING
  • VBI infinitive of the verb "BE"
  • VBN past participle of the verb "BE", i.e. BEEN
  • VBZ -s form of the verb "BE", i.e. IS, 'S
  • VDB base form of the verb "DO" (except the
    infinitive), i.e.
  • VDD past form of the verb "DO", i.e. DID
  • VDG -ing form of the verb "DO", i.e. DOING
  • VDI infinitive of the verb "DO"
  • VDN past participle of the verb "DO", i.e. DONE
  • VDZ -s form of the verb "DO", i.e. DOES
  • VHB base form of the verb "HAVE" (except the
    infinitive), i.e. HAVE
  • VHD past tense form of the verb "HAVE", i.e. HAD,
    'D
  • VHG -ing form of the verb "HAVE", i.e. HAVING
  • VHI infinitive of the verb "HAVE"
  • VHN past participle of the verb "HAVE", i.e. HAD
  • VHZ -s form of the verb "HAVE", i.e. HAS, 'S
  • VM0 modal auxiliary verb (e.g. CAN, COULD, WILL,
    'LL)

19
EN Verb (BNC)
  • VVB base form of lexical verb (except the
    infinitive) (e.g. TAKE, LIVE)
  • VVD past tense form of lexical verb (e.g. TOOK,
    LIVED)
  • VVG -ing form of lexical verb (e.g. TAKING,
    LIVING)
  • VVI infinitive of lexical verb
  • VVN past participle form of lex. verb (e.g.
    TAKEN, LIVED)
  • VVZ -s form of lexical verb (e.g. TAKES, LIVES)

20
PT Verbos (AC/DC)
  • PR_IND presente do indicativo
  • INF infinitivo
  • GER gerúndio
  • IMPF_IND imperfeito do indicativo
  • PCP particípio passado
  • IMPF_SUBJ imperfeito do conjuntivo
  • FUT_IND futuro do indicativo
  • PR_SUBJ presente do conjuntivo
  • FUT_SUBJ futuro do conjuntivo
  • FUT_IND futuro do indicativo
  • COND condicional
  • MQP_IND mais que perfeito simples
  • PS_IND perfeito do indicativo
  • PS/MQP_IND perfeito ou mais que perfeito

21
PT Verbos Corpus de Português
  • gtgt

22
(No Transcript)
23
..etc
  • Verbos auxiliares /modais
  • Pronomes
  • Possessivos
  • Preposições e sua semântica
  • Sujeito nulo - sintâxe?
  • Artigos ou falta deles
  • Determinadores
  • Clíticos
  • Pontuação
  • Etc.

24
E depois
  • Boato
  • Uma lista de PoS que sirva todas as línguas
  • Debate
  • Normalização das classificações
  • Alerta
  • Todos os corpora / corpos que vamos ver foram
    feitos e etiquetados segundo diferentes
  • Conceitos
  • Teorias
  • Prioridades
  • ou falta dos mesmos

25
Para acabar
  • Conclusões não há
  • Vamos abrir um debate construtivo
Write a Comment
User Comments (0)
About PowerShow.com