Os sistemas de Recuperação de Informação (RI) foram criados para facilitar o acesso à informa-ção
em bibliotecas digitais modernas. Esses sistemas permitem organizar, indexar e recuperar
informação sobre os documentos de uma coleção. Nesse processo, a tarefa de indexação tem
importância central. Para indexar os documentos é necessário identificar termos de indexação que
reflitam o conteúdo semântico dos documentos e que possam ser lembrados pelos usuários no
momento de efetuar as consultas. Para normatizar o processo de seleção de termos de indexação,
foram criados tesauros. Tesauros são ferramentas desenvolvidas tanto para controlar e padronizar
a linguagem de indexação, quanto para facilitar a construção e reformulação de consultas pelos
usuários. Tesauros são, em geral, específicos para uma dada área do saber, tais como a médica e a
jurídica, dentre outras. Dado um tesauro para uma área específica, pergunta-se: é possível cons-truir
um sistema de RI especializado para aquela área do saber que permita a obtenção de resulta-dos
de qualidade superior? O objetivo deste trabalho é produzir uma resposta para essa questão.
Nossa proposta se baseia no projeto de um sistema de Recuperação Vertical de Informação que,
utilizando-se do conhecimento codificado em um tesauro, facilite ao usuário encontrar informa-ção
de seu interesse. Para combinar informação evidencial proveniente da consulta do usuário
(isto é, as palavras-chave especificadas pelo usuário) com informação evidencial proveniente do
tesauro, adotamos o arcabouço teórico das redes Bayesianas. O resultado é um modelo de rede de
crenças que leva a uma nova fórmula de ordenação dos documentos na resposta. Para validar
nosso sistema, realizamos um estudo de caso voltado para a área jurídica. Utilizando uma coleção
de referência composta por jurisprudências dos tribunais federais brasileiros e o Tesauro da Justiça
Federal, avaliamos nosso sistema de recuperação vertical de informação. Nossos resultados indi-cam
que a combinação de informação proveniente das consultas com informação proveniente do
tesauro possibilita ganhos médios em precisão da ordem de 31%.