Identificación de tópicos en dictamenes jurídicos : aplicación del modelo LDA de clasificación automática de textos

Miniatura

Fecha

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad de Buenos Aires. Facultad de Ciencias Económicas. Escuela de Negocios y Administración Pública

Resumen

Para una organización dedicada a emitir opinión jurídica sobre temáticas diversas, una tarea fundamental es la búsqueda de jurisprudencia y antecedentes sobre lo ya escrito en la materia, para consultar los criterios vertidos en casos análogos y utilizarlos como referencia para la elaboración del dictamen. Esta búsqueda puede resultar dificultosa si los dictámenes de la organización no se encuentran guardados o categorizados por tópicos o voces que permitan identificar con exactitud los temas sobre los que versan. La tarea de categorizar los dictámenes suscriptos en algunas organizaciones la realiza equipos especializados dedicados a la guarda de estos documentos por voces o temas, no solo para la búsqueda interna sino también para búsquedas académicas. En el caso analizado la base de datos de la Organización cuenta con aproximadamente un millón de dictámenes jurídicos en formato digital. En su labor diaria los y las agentes requieren la búsqueda de jurisprudencia, para lo cual utilizan un sistema interno que cuenta con un buscador, en el que pueden filtrar por fecha y tema, siendo el tema una etiqueta cargada de forma manual por cada agente según un criterio personal, y no por un equipo especializado. Esta particularidad dificulta en reiteradas ocasiones la efectividad del buscador, haciendo depender el éxito de la búsqueda de la coincidencia de criterios entre quien puso el tema del dictamen y quien lo está buscando, y representa además un obstáculo para la apertura de los dictámenes en un buscador público para investigadores y su consulta por voces. Para solucionar este problema surge la posibilidad de explotar los textos de la base de datos con técnicas de Procesamiento de Lenguaje Natural (NPL o PLN) y analizarlos aplicando metodologías de aprendizaje automático que permitan identificar los tópicos o temas que componen cada documento sin depender del criterio de los y las agentes, posibilitando además en un solo proceso categorizar todos los documentos de la base de datos.

Descripción

Fil: Prandini, Santiago. Universidad de Buenos Aires. Facultad de Ciencias Económicas. Buenos Aires, Argentina.
Fil: Vietri, Silvia. Universidad de Buenos Aires. Facultad de Ciencias Económicas. Buenos Aires, Argentina.

Palabras clave

Dictamen jurídico, Tópicos, Procesamiento de Lenguaje Natural, Asignación latente de Dirichlet

Citación

item.page.endorsement

item.page.review

item.page.supplemented

item.page.referenced