Revealing gender biases in court decisions with natural language processing [recurso eletrônico] = Revelando vieses de gênero em decisões judiciais com processamento de linguagem natural
DISSERTAÇÃO
Inglês
T/UNICAMP B431r
[Revelando vieses de gênero em decisões judiciais com processamento de linguagem natural]
Campinas, SP : [s.n.], 2023.
1 recurso online (72 p.) : il., digital, arquivo PDF.
Orientadores: Esther Luna Colombini, Sandra Eliza Fontes de Avila
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação
Resumo: Dados oriundos das ciências sociais são comumente produzidos em forma de texto digital, o que motiva seu uso como fonte para métodos de processamento de linguagem natural. Pesquisadores e profissionais vêm desenvolvendo e utilizando técnicas de inteligência artificial para coletar, processar...
Resumo: Dados oriundos das ciências sociais são comumente produzidos em forma de texto digital, o que motiva seu uso como fonte para métodos de processamento de linguagem natural. Pesquisadores e profissionais vêm desenvolvendo e utilizando técnicas de inteligência artificial para coletar, processar e analisar documentos no campo jurídico, especialmente em tarefas como sumarização e classificação de textos. Neste cenário, identificamos um potencial subexplorado do uso de processamento de linguagem natural para lidar com questões de direitos humanos, no contexto da inteligência artificial voltada ao bem social. Métodos qualitativos e quantitativos das ciências sociais têm sido utilizados para estudar questões como a presença de estereótipos de gênero em instituições legais; contudo, abordagens baseadas em processamento de linguagem natural poderiam auxiliar a ampliar a escala de alcance de tais tarefas. Neste trabalho, apresentamos um protocolo de automatização da detecção de estereótipos de gênero institucionais em cortes brasileiras, que inclui: (a) um pipeline de coleta, anotação, e preparo de textos extraídos de decisões judiciais emitidas pelo Tribunal de Justiça de São Paulo em casos de violência doméstica e alienação parental, resultando em dois datasets; (b) um protocolo experimental de classificação binária supervisionada sobre as decisões, executado com redes derivadas do modelo BERTimbau; (c) métodos para avaliação e validação desse protocolo. Mostramos que técnicas baseadas em semântica, como classificação com mecanismos de atenção, são satisfatoriamente adequadas para aprender a identificar automaticamente vieses de gênero em decisões judiciais; no entanto, restam questões de validação, escalabilidade e explicabilidade a serem exploradas. Também elaboramos diretrizes éticas e legais para o uso e disponibilização de decisões judiciais como dado de entrada para modelos de aprendizado automático. Nossa abordagem pode auxiliar especialistas de áreas como Direito, Estudos de Gênero e Políticas Públicas a explorar novas possibilidades de análise em seu domínio --- além de fornecer insights sobre o uso de técnicas e ferramentas de processamento de linguagem natural
Abstract: Data derived from the realm of the social sciences is often produced in digital text form, which motivates its use as a source for natural language processing methods. Researchers and practitioners have developed and relied on artificial intelligence techniques to collect, process, and...
Abstract: Data derived from the realm of the social sciences is often produced in digital text form, which motivates its use as a source for natural language processing methods. Researchers and practitioners have developed and relied on artificial intelligence techniques to collect, process, and analyze documents in the legal field, especially for tasks such as text summarization and classification. In this scenario, we identify an underexplored potential of natural language processing used to delve into human rights issues in the context of artificial intelligence for social good. Qualitative and quantitative social science methods have been used to study matters such as institutional gender biasing in legal settings; however, natural language processing-based approaches can help analyze the issue on a larger scale. In this work, we present a protocol to address the automatic detection of institutional gender biasing in Brazilian courts, which comprises: (a) a pipeline of collection, annotation, and preparation of text extracted from court decisions issued by the São Paulo state Court of Justice in cases of domestic violence and parental alienation, which resulted in two datasets; (b) an experimental protocol of supervised binary classification over the decisions, performed with BERTimbau-based models; (c) methods for evaluating and validating such protocol. We show that semantics-based techniques, like attention-based classification, are satisfactorily adequate to learn to reveal gender biases in judicial decisions automatically; however, validation, scalability, and explainability issues remain to be addressed. We also design legal and ethical guidelines on the use and availability of court decisions as a data input for automatic learning models. Our approach might help experts from fields such as Law, Gender Studies, and Public Policy to explore new analysis possibilities in their domain. It also provides insights into natural language processing techniques and tools
Requisitos do sistema: Software para leitura de arquivo em PDF