Nunes, Célia Maria PintoFerreira, Dário Jorge da ConceiçãoAndrade, Gilberto Capistrano Cunha de2016-02-042016-02-042015http://hdl.handle.net/10400.6/3994A Análise de variância (ANOVA) é utilizada em muitas áreas de investigação, nomeadamente em investigação médica, agricultura ou psicologia, para citar apenas algumas, onde as dimensões das amostras podem não ser previamente conhecidas. Esta situação ocorre com frequência quando o intervalo de tempo para a recolha das observações é fixado à partida. Um bom exemplo corresponde à recolha de observações para um estudo onde se pretende comparar várias patologias de pacientes que chegam às urgências de um hospital num determinado período de tempo. Neste trabalho iremos estender a ANOVA, com um e mais fatores, ao caso em que as dimensões das amostras são desconhecidas, devendo ser tratadas como realizações de variáveis aleatórias. Esta abordagem deve ser baseada na escolha adequada da distribuição destas variáveis. No presente trabalho são consideradas duas situações distintas: No primeiro caso assumiremos que as variáveis aleatórias seguem distribuições de Poisson, situação em que a ocorrência das observações corresponde a processos de contagem e não existem limites superiores para as dimensões das amostras (tal como ilustrado no exemplo anterior, referente à comparação de patologias); No segundo caso, consideraremos a distribuição Binomial, quando existe um limite superior para as dimensões das amostras, que nem sempre é atingido uma vez que podem ocorrer falhas nas observações. Como resultados, serão obtidas as estatísticas de teste e suas distribuições, condicional e não condicional assumindo as dimensões das amostras como aleatórias, para modelos de efeitos fixos, modelos de efeitos aleatórios e modelos mistos. Adicionalmente, serão apresentadas várias aplicações com registos do cancro no Brasil que nos permitirão ilustrar a utilidade da nossa abordagem assim como comparar os resultados obtidos com os da ANOVA usual.The analysis of variance (ANOVA) is routinely used in several research areas, namely in medical research, agriculture or psychology, to name just a few, where the sample sizes may not be previously known. This often occurs when there is a fixed time span for collecting the observations. An illustrative example of this corresponds to the collection of observations during a given time period for the comparison of pathologies from patients arriving at a hospital. In this work, we aim to extend the one-way and multi-way ANOVA to the case where the sample sizes are unknown. We will assume the sample sizes as realizations of random variables. This approach must be based on an adequate choice of the distribution of these variables. For this, we will consider two distinct situations: • In the first case, we will assume the Poisson distribution when the occurrence of the observations corresponds to a counting process and there is no upper bound for the sample sizes (as illustrated in the example concerning the comparison of pathologies); • In the second case, we will consider the Binomial distribution if there is an upper bound for the sample sizes, which is not always achieved since we may have observations failures. As results, we will obtain the test statistics and their conditional distribution and unconditional distribution under the assumption that we have random sample sizes, for fixed effects models, random effects models and mixed models. This new approach will be illustrated through several applications on cancer registries from Brazil. This will enable us to show the usefulness of our approach as well as to compare the obtained results with the usual ANOVA results.porMétodo estatístico - Análise de variância - ANOVAANOVA - Técnica estatísticaAplicações de registo de cancro - Comparação de resultados - BrasilAnálise de variância com amostras de dimensão aleatória e suas aplicaçõesdoctoral thesis101439822