Recuperação de Informações Multilíngues

Status: concluído

Vigência: 2008 – 2009

Financiamento: CNPQ – Edital Universal 2007

Resumo: O objetivo deste projeto de pesquisa é contribuir para o desenvolvimento da Recuperação de Informações Multilíngües envolvendo a língua Portuguesa. A motivação vem da crescente necessidade que experienciamos atualmente de explorar documentos em outros idiomas. Com a disseminação da Internet, a distância física entre o usuário e a informação foi removida. Contudo, a barreira da linguagem ainda precisa ser ultrapassada. A pesquisa nesta área tem se desenvolvido rapidamente desde o final dos anos 90. Apesar dos recentes avanços, ainda existem muitos aspectos não explorados, em especial sobre a utilização da língua portuguesa. Espera-se como resultado deste projeto gerar um sistema de recuperação de informações que aceite consultas na língua portuguesa e busque documentos em inglês. Além disso, algumas questões atuais relativas a estes sistemas serão investigadas: (i) desenvolvimento de algoritmos de stemming para português; (ii) extração de técnicas de mapeamento de conceitos entre idiomas por meio da utilização de corpus comparável e paralelo; (iii) estudo do processo de realimentação de relevantes em um contexto de sistemas multilíngües e (iv) desenvolvimento de técnicas para identificação de termos compostos.

  • Viviane Moreira Orengo (coordenadora)
  • Luciana Buriol (pesquisador II/UFRGS)
  • Aline Villavicencio (pesquisador II/UFRGS)
  • Leandro Krug Wives (pesquisador II/UFRGS)