Gestão de grandes volumes de documentos textuais

Status: concluído

Vigência: 2008 – 2009

Financiamento: MCT/CNPq/CT-INFO nº 07/2007

Resumo: O projeto está inserido no grande desafio da Sociedade Brasileira de Computação (SBC) Gestão da informação em grandes volumes de dados multimídia distribuídos . Dentro deste desafio, o projeto trata especificamente da gestão de documentos textuais, como páginas WEB ou documentos eletrônicos, gerados em organizações públicas ou privadas. Um problema central na gestão de documentos eletrônicos, tanto na WEB, quanto em computadores pessoais ou servidores organizacionais, é o de estabelecer relações e associações entre documentos. Neste projeto dois tipos de relacionamentos são considerados: (1) o versionamento de documentos, com o objetivo de determinar grupos de documentos que podem ser considerados como diferentes versões de uma mesma informação, e (2) o da semelhança de conteúdo, com o objetivo de agrupar documentos que tratam de mesmo assunto em conglomerados.

Equipe (principais integrantes):

  • José Palazzo Moreira de Oliveira (Coordenador)
  • Maria Aparecida Martins Souto
  • Carlos Alberto Heuser
  • Leandro Krug Wives
  • Mirella Moura Moro
  • Renata de Matos Galante
  • Viviane Moreira Orengo