Tese de Doutorado - Recuperação Vertical de Informação: um estudo de caso na área jurídica

Carmem Terezinha Leal


PALAVRAS-CHAVE
Recuperação vertical de Informação – Tesauros – Redes Bayesianas – Área jurídica.


RESUMO

Os sistemas de Recuperação de Informação (RI) foram criados para facilitar o acesso à informa-ção em bibliotecas digitais modernas. Esses sistemas permitem organizar, indexar e recuperar informação sobre os documentos de uma coleção. Nesse processo, a tarefa de indexação tem importância central. Para indexar os documentos é necessário identificar termos de indexação que reflitam o conteúdo semântico dos documentos e que possam ser lembrados pelos usuários no momento de efetuar as consultas. Para normatizar o processo de seleção de termos de indexação, foram criados tesauros. Tesauros são ferramentas desenvolvidas tanto para controlar e padronizar a linguagem de indexação, quanto para facilitar a construção e reformulação de consultas pelos usuários. Tesauros são, em geral, específicos para uma dada área do saber, tais como a médica e a jurídica, dentre outras. Dado um tesauro para uma área específica, pergunta-se: é possível cons-truir um sistema de RI especializado para aquela área do saber que permita a obtenção de resulta-dos de qualidade superior? O objetivo deste trabalho é produzir uma resposta para essa questão. Nossa proposta se baseia no projeto de um sistema de Recuperação Vertical de Informação que, utilizando-se do conhecimento codificado em um tesauro, facilite ao usuário encontrar informa-ção de seu interesse. Para combinar informação evidencial proveniente da consulta do usuário (isto é, as palavras-chave especificadas pelo usuário) com informação evidencial proveniente do tesauro, adotamos o arcabouço teórico das redes Bayesianas. O resultado é um modelo de rede de crenças que leva a uma nova fórmula de ordenação dos documentos na resposta. Para validar nosso sistema, realizamos um estudo de caso voltado para a área jurídica. Utilizando uma coleção de referência composta por jurisprudências dos tribunais federais brasileiros e o Tesauro da Justiça Federal, avaliamos nosso sistema de recuperação vertical de informação. Nossos resultados indi-cam que a combinação de informação proveniente das consultas com informação proveniente do tesauro possibilita ganhos médios em precisão da ordem de 31%.