Failure detectors [recurso eletrônico] : testbed and comparative study = Detetores de falhas: plataforma de testes e estudo comparativo
Valdomiro Luis Scannapieco Neto
DISSERTAÇÃO
Inglês
T/UNICAMP Sca63f
[Detetores de falhas]
Campinas, SP : [s.n.], 2021.
1 recurso online (66 p.) : il., digital, arquivo PDF.
Orientador: Luiz Eduardo Buzato
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação
Resumo: Há quase trinta anos atrás, entre 1991-1992, Chandra, Toueg e Hadzilacos introduziram o conceito de detetores de falhas e mostraram como usá-los para resolver consenso em sistemas distribuídos assíncronos sujeitos a falhas parciais. Durante os anos seguintes, a abstração de detetores de...
Ver mais
Resumo: Há quase trinta anos atrás, entre 1991-1992, Chandra, Toueg e Hadzilacos introduziram o conceito de detetores de falhas e mostraram como usá-los para resolver consenso em sistemas distribuídos assíncronos sujeitos a falhas parciais. Durante os anos seguintes, a abstração de detetores de falhas provou ser uma ferramenta essencial para a engenharia de sistemas distribuídos de alta disponibilidade. Resumidamente, os detetores de falhas representam uma ferramenta elegante que permite aos projetistas de sistemas distribuídos fatorar as suposições de tempo usadas para detetar falhas em algoritmos de consenso distribuído. Atualmente, um número significativo de algoritmos de deteção de falhas já foi publicado; cada um deles trazendo, supostamente, uma melhor solução para deteção de falhas; geralmente com base em uma avaliação ad hoc do algoritmo proposto. A falta de um benchmark ou plataforma de testes comum para detetores de falhas representa um obstáculo extra para engenheiros de sistemas quando eles precisam escolher um detetor de falha adequado para sua aplicação. Nesse contexto, parece razoável fazer a seguinte pergunta: qual o melhor detetor de falhas para uma determinada aplicação, executada em um determinado sistema distribuído? Neste trabalho, uma aplicação é um sistema de replicação ativa desenvolvido sobre transmissão de difusão totalmente ordenada baseada em consenso (DTOC). DTOC é o denominador comum para um grande número de aplicações reais. Chen, Toueg e Aguilera (CTA) propuseram métricas para caracterizar a qualidade do serviço prestado por um detetor de falhas. As métricas quantificam: i) quão rápido um detetor de falhas deteta falhas reais e ii) quão bem ele evita falsas deteções. Esta dissertação propõe, implementa e avalia uma plataforma de testes para detetores de falhas com base nas métricas amplamente aceitas de CTA. Em seguida, utiliza essa plataforma para buscar uma resposta para a questão feita acima. As contribuições desta pesquisa são: (i) a proposta de um método experimental para avaliar uniformemente o comportamento dos detetores de falhas, (ii) a implementação de uma plataforma de testes para apoiar o método, e (iii) um estudo comparativa de quatro detetores de falhas conhecidos
Ver menos
Abstract: Almost thirty years ago, during the years of 1991-1992, Chandra, Toueg and Hadzilacos introduced the concept of failure detectors and showed how to use them to solve consensus in asynchronous distributed systems subject to partial failures. During the following years, the failure detector...
Ver mais
Abstract: Almost thirty years ago, during the years of 1991-1992, Chandra, Toueg and Hadzilacos introduced the concept of failure detectors and showed how to use them to solve consensus in asynchronous distributed systems subject to partial failures. During the following years, the failure detector abstraction proved to be a key tool for the engineering of highly available distributed systems. Briefly, failure detectors represent an elegant tool that allows designers of distributed systems to factor out the timing assumptions used to detect failures in distributed consensus algorithms. Today, a substantial number of failure detection algorithms have already been published; each one of them supposedly bringing a better solution for the detection of failures; usually based on an ad hoc assessment of the failure detector proposed. The lack of a benchmark or common testbed for failure detectors represents an extra hurdle for system engineers when they have to choose a failure detector that is well suited for their application. In this context, it seems reasonable to ask the following question: what is the best failure detector for a given application, executed on a given distributed system? In this work, an application is an active replicated system developed atop a consensus-based total order broadcast (CTOB). CTOB is the common denominator for a large number of practical applications. Chen, Toueg, and Aguilera (CTA) have proposed metrics to characterize the quality of service provided by a failure detector. The metrics quantify: i) how fast a failure detector detects actual failures and ii) how well it avoids false detections. This dissertation proposes, implements and evaluates a testbed for failure detectors based on the extensively accepted CTA metrics. Then, it uses the testbed to seek an answer for the aforementioned question. The contributions of the research are: (i) the proposal of an experimental method to uniformly assess the behavior of failure detectors, (ii) the implementation of a testbed to support the method, and (iii) a comparative evaluation of four well-known failure detectors
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Failure detectors [recurso eletrônico] : testbed and comparative study = Detetores de falhas: plataforma de testes e estudo comparativo
Valdomiro Luis Scannapieco Neto
Failure detectors [recurso eletrônico] : testbed and comparative study = Detetores de falhas: plataforma de testes e estudo comparativo
Valdomiro Luis Scannapieco Neto