Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/38383
Registro completo de metadados
Campo DCValorIdioma
dc.creatorRocha, Dárcio Santos-
dc.date.accessioned2023-11-10T07:35:11Z-
dc.date.available2023-11-10T07:35:11Z-
dc.date.issued2023-08-14-
dc.identifier.citationROCHA, Dárcio Santos. Identificação de tipos de relações temporais Event-Time em português: uma abordagem baseada em regras com classificação associativa. 2023. 171 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador (Bahia), 2023.pt_BR
dc.identifier.urihttps://repositorio.ufba.br/handle/ri/38383-
dc.description.abstractTemporal understanding in natural language plays a fundamental role in communication effectiveness, enabling the comprehension of sequence of event and their order. This study aims to develop a computational method for identifying types of temporal relations between event and temporal expression in Portuguese texts. The adopted approach is rule-based and incorporates linguistic elements, including lexical, morphosyntactic, and contextual information, Reichenbach’s tenses, temporal signals, and prior world knowledge, in addition to TimeML annotations from the TimeBankPT corpus. The method consisted in creating a comprehensive set of relevant features used to construct rule sets. We explore rule learning algorithms such as CBA, CN2, IDS, RIPPER, and manual rules. The rule sets were applied individually, as well as in combination, to pairs composed of an event and a temporal expression, using two application strategies: the first triggered rule and a voting system. It is worth noting that this is the first work we are aware of to employ rule-learning techniques to solve this specific task. The statistical results showed the effectiveness of the rule-based approach, with the rule set generated by the RIPPER algorithm standing out and achieving the best performance. This rule set outperformed the baseline method, achieving an accuracy of 69.2% and an F1-score of 66.1%. There was a significant increase of 2.3 percentage points in accuracy and 3.6 percentage points in F1-score on the test data. The application of rules by the voting system was more effective on unseen data. The significant difference between the rule sets and the baseline used highlights the importance of the additional features employed by the rules in identifying temporal relations. These features provided complementary information and allowed for a more precise analysis of the data. Furthermore, the rule sets demonstrated generalization ability, capturing patterns and regularities in the data that can be applied to new instances, enabling accurate predictions. This underscores the utility and effectiveness of rule sets as a robust approach to dealing with the complexity of temporal relations in texts. This research contributes to the advancement of natural language processing, providing an enhanced and explainable understanding of temporal relations. It also has practical applications in areas such as scene description, story comprehension, document summarization, representation of temporal structure in medical records, and news analysis. The continuation of this work can unveil new possibilities for temporal understanding in texts.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal da Bahiapt_BR
dc.subjectRelações Temporaispt_BR
dc.subjectEvent-Timept_BR
dc.subjectTimeBankPTpt_BR
dc.subjectExtração de Informaçãopt_BR
dc.subjectBaseada em Regraspt_BR
dc.subjectAprendizagem de Regraspt_BR
dc.subjectClassificação Associativapt_BR
dc.subject.otherTemporal Relationspt_BR
dc.subject.otherEvent-Timept_BR
dc.subject.otherTimeBankPTpt_BR
dc.subject.otherInformation Extractionpt_BR
dc.subject.otherRule-basedpt_BR
dc.subject.otherRule Learningpt_BR
dc.subject.otherAssociative Classificationpt_BR
dc.titleIdentificação de tipos de relações temporais event-time em português: uma abordagem baseada em regras com classificação associativa.pt_BR
dc.title.alternativeIdentification of types of event-time temporal relation in Portuguese: a rule-based approach with associative classification.pt_BR
dc.typeDissertaçãopt_BR
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação (PGCOMP) pt_BR
dc.publisher.initialsUFBApt_BR
dc.publisher.countryBrasilpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.contributor.advisor1Souza, Marlo Vieira dos Santos e-
dc.contributor.advisor1IDhttps://orcid.org/0000-0002-5373-7271pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/8734792579019380pt_BR
dc.contributor.advisor-co1Claro, Daniela Barreiro-
dc.contributor.advisor-co1IDhttps://orcid.org/0000-0001-8586-1042pt_BR
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/9217378047217370pt_BR
dc.contributor.referee1Souza, Marlo Vieira dos Santos e-
dc.contributor.referee1IDhttps://orcid.org/0000-0002-5373-7271pt_BR
dc.contributor.referee1Latteshttp://lattes.cnpq.br/8734792579019380pt_BR
dc.contributor.referee2Araújo, Rerisson Cavalcante de-
dc.contributor.referee2IDhttps://orcid.org/0000-0002-7255-5422pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/9546551094655305pt_BR
dc.contributor.referee3Pita, Robespierre Dantas da Rocha-
dc.contributor.referee3IDhttps://orcid.org/0000-0002-0616-620Xpt_BR
dc.contributor.referee3Latteshttp://lattes.cnpq.br/9031151666715654pt_BR
dc.creator.IDhttps://orcid.org/0000-0001-7313-5537pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/1007492078131463pt_BR
dc.description.resumoA compreensão temporal em linguagem natural desempenha um papel fundamental na eficácia da comunicação, permitindo a compreensão da sequência e ordem dos eventos. Este estudo tem como objetivo desenvolver um método computacional para a identificação de tipos de relações temporais entre evento e expressão temporal em textos em português. A abordagem adotada baseia-se em regras e incorpora elementos linguísticos, incluindo informações lexicais, morfossintáticas e contextuais, tempos verbais de Reichenbach, sinais temporais e conhecimento prévio sobre o mundo, além das anotações TimeML presentes do corpus TimeBankPT. O método consistiu na criação de um conjunto abrangente de features relevantes, que foram utilizadas na construção de conjuntos de regras. Foram explorados algoritmos de aprendizagem de regras, como CBA, CN2, IDS e RIPPER, além de regras manuais. Os conjuntos de regras foram aplicados individualmente, bem como em combinação, aos pares compostos por evento e expressão temporal, utilizando duas estratégias de aplicação: a primeira regra acionada e um sistema de votação. Destaca-se que este é o primeiro trabalho que conhecemos a empregar técnicas de aprendizagem de regras para solucionar essa tarefa específica. Os resultados estatísticos mostraram a eficácia da abordagem baseada em regras, destacando-se o conjunto de regras gerado pelo algoritmo RIPPER, que obteve o melhor desempenho. Esse conjunto de regras superou o método de referência, alcançando uma acurácia de 69,2% e um F1-score de 66,1%. Houve um aumento significativo de 2,3 pontos percentuais em acurácia e 3,6 pontos percentuais em F1-score nos dados de teste. A aplicação dos conjuntos de regras pelo sistema de votação foi mais eficaz em dados desconhecidos. A diferença significativa entre os conjuntos de regras e o baseline utilizado destaca a importância das features adicionais empregadas pelas regras na identificação das relações temporais. Essas features forneceram informações complementares e permitiram uma análise mais precisa dos dados. Além disso, os conjuntos de regras demonstraram capacidade de generalização, capturando padrões e regularidades nos dados que podem ser aplicados a novas instâncias, possibilitando previsões precisas. Isso evidencia a utilidade e eficácia dos conjuntos de regras como uma abordagem robusta para lidar com a complexidade das relações temporais em textos. Essa pesquisa contribui para o avanço do processamento de linguagem natural, proporcionando uma compreensão aprimorada e explicável das relações temporais. Também possui aplicações práticas em áreas como descrição de cenas, compreensão de histórias, resumo de documentos, representação da estrutura temporal de prontuários médicos e análise de notícias. A continuidade desse trabalho pode desvendar novas possibilidades para a compreensão temporal em textos.pt_BR
dc.publisher.departmentInstituto de Computação - ICpt_BR
dc.type.degreeMestrado Acadêmicopt_BR
Aparece nas coleções:Dissertação (PGCOMP)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2023.10.23_Dissertacao_Darcio_Rocha_Versao_Final_PDF_A.pdfDissertação de mestrado de Dárcio Santos Rocha1,34 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.