logo.jpg

Linguística Computacional

3ºCíclo de Engenharia Informática - UBI 2020/21

[Programa]    

Objetivos

A linguagem humana constituí um vasto e significativo espaço, no universo do tratamento automático da informação, sendo a forma primordial de comunicação entre os humanos. Atualmente existe um enorme repositório de informação textual armazenado em meios eletrónicos, distribuídos pela Internet, e este cresce consistentemente. Estima-se que a cada ano seja acrescentado à Internet cerca de um exabyte (10^18 bytes -- aprox. 250 milhões de DVDs) de informação não estruturada, maioritariamente sob a forma de texto. Este cenário levanta grandes desafios ao tratamento inteligível da informação, mas abre também novas e poderosas perspectivas para o conhecimento humano e sua interação com sistemas que queremos cada vez mais inteligentes. Não podemos ignorar que no cerne da inteligência máquina estará sempre alguma forma de linguagem, em especial a linguagem humana. Bastará considerar o desafio colocado por Alan Turing, em 1950.

Conhecer os fundamentos mais relevantes do domínio da Linguística Computacional (LC), ao nível das suas vertentes: morfológica, sintática, semântica e pragmática, com especial enfase nos níveis semântico e pragmático. Conhecer as principais abordagens, técnicas e recursos associados à LC. Aptidões: Ter a capacidade de identificar a relevância da LC em problemas gerais e utilizá-la com vista à obtenção de melhorias. Por exemplo, melhorar a interação Homem-Máquina de um sistema, através do uso da LC. Competências: No final o aluno deve ter a capacidade de pegar num problema em aberto de LC, desenhar e implementar um plano experimental que combine conhecimento, recursos e dados, almejando a obtenção de novos resultados e subsequente divulgação científica dos mesmos. O aluno deve ser também capaz de aplicar os conceitos de LC, bem como as suas técnicas e recursos mais relevantes, a qualquer problema científico ou industrial, com vista à sua resolução ou melhoria.


"(...) A linguagem humana é um sistema singularmente complexo. Conseguir conhecê-la seria uma extraordinária proeza intelectual da parte de uma criatura não especificamente designada para tal tarefa (...)"

Noam Chomsky, 1975.

Tutorias


Recursos Gerais


Elementos Experimentais


Bibliografia

  1. Jurafsky, D., Martin, J. (2008/2019?). SPEECH and LANGUAGE PROCESSING: An Introduction to Natural Language Processing Computational Linguistics, and Speech Recognition, Second/Third Edition. McGraw Hill. ISBN: 978-0131873216.
  2. Vieira, R., & Lima, V. L. (2001). Lingüística computacional: princípios e aplicações. In Anais do XXI Congresso da SBC. I Jornada de Atualização em Inteligência Artificial (Vol. 3, pp. 47-86). sn.
  3. Bird, S., Klein, E., Loper, E. (2009). Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit. O'Reilly Media. ISBN: 978-0596516499.
  4. Reese, R. (2015). Natural Language Processing with Java (Community Experience Distilled). Packt Publishing. ISBN: 978-1784391799.
  5. Sowa, J. (2000) Knowledge Representation: Logical, Philosophical, and Computational Foundations. Brooks/Cole, 2000. ISBN: 9780534949655
  6. Manning, D., Schütze, H. (1999). Foundations of Statistical Natural Language Processing. The MIT Press. ISBN: 978-0262133609.
  7. Clark, A., Fox, C., & Lappin, S. (Eds.). (2013). The handbook of computational linguistics and natural language processing. John Wiley & Sons.