Estudio de homogeneidad de la dispersión en diseño a una vía de clasificación para datos de proporciones y conteos

Study of Homogeneity of the Dispersion in one way Classification Models with Proportions and Counts Data

MARIO ALFONSO MORALES1, LUIS ALBERTO LÓPEZ2

1Universidad de Córdoba, Departamento de Matemáticas y Estadística, Montería, Colombia. Profesor asistente. Email: mmorales@sinu.unicordoba.edu.co
2Universidad Nacional de Colombia, Facultad de Ciencias, Departamento de Estadística, Bogotá, Colombia. Profesor asociado. Email: lalopezp@unal.edu.co


Resumen

En el modelamiento de datos donde se evidencia la presencia de sobredispersión, usualmente se asume que para todos los efectos de tratamiento el parámetro de sobredispersión es común. Esta situación no siempre se satisface antes; por el contrario, puede ser más frecuente que la variabilidad exhibida por los datos sea mayor que la variación teórica del modelo; debiendo incorporarse en el modelamiento esta situación. En este artículo se llevan a cabo desarrollos teóricos con los cuales se evidencia si es aceptable o no la hipótesis de homogeneidad del parámetro de dispersión entre tratamientos, cuando estos se ensayan en condiciones de uniformidad del material experimental y la respuesta de interés sea conteos o de proporciones, las cuales se modelan a través de la distribución Binomial Negativa (BN) y Beta Binomial (BB), respectivamente. Se usó la Prueba de Razón de Verosimilitud como criterio para decidir acerca de la hipótesis nula de homogeneidad en el parámetro de dispersión. Para determinar la eficiencia de la prueba propuesta, mediante simulación, con procedimientos algorítmicos desarrollados en R, se evaluó la potencia de las pruebas frente al supuesto de homogeneidad del parámetro de dispersión. Bajo el supuesto que los modelos BB y BN son correctos, se propone el ajuste de un modelo lineal generalizado ponderado como una alternativa para el análisis de datos de conteo y proporción con sobredispersión.

Palabras clave: sobredispersión, distribución beta-binomial, distribuciónbinomial negativa, modelo lineal generalizado ponderado, razón deverosimilitud.


Abstract

When analyzing data in the presence of over dispersion, the usual practice is to assume a common dispersion parameter to all observations. However, there are situations where the assumption of homogeneity of the dispersion parameter does not hold. In this paper we present theoretical developments that allow contrasting the assumption of homogeneity of the dispersion parameter between treatments, in a completely randomized design, with the responses of proportions and counts, modeled through the distributions beta-binomial and negative binomial respectively. The hypothesis is contrasted through the proof of the likelihood ratio.
Under the assumption that the beta-binomial and the negative binomial models are correct, it is proposed an adjustment of a generalized linear weight ed model as an alternative for the data analysis of counts and proportions when over dispersion is present. It is also evaluated, through simulation, the performance of the proposed proofs in terms of its power.

Key words: Overdispersion, Proportions, Beta-binomial distribution, Negative binomial distribution, Likelihood ratio, Generalized linearmodels.


Texto completo disponible en PDF


Referencias

1. Agresti, A. (2002), Categorical Data Analysis, John Wiley & Sons, New Jersey, United States.

2. Atkinson, A. C. (1981), `Two Graphical Displays for Outlying and Influential Observations in Regression´, Biometrika 68, 13-20.

3. Crowder, M. J. (1978), `Beta-Binomial Anova for Proportions´, Applied Statistics 27(1), 34-37.

4. Crowder, M. J. (1979), `Inference About the Intraclass Correlation Coefficient in the Beta-binomial ANOVA for Proportions´, Journal The Royal Statistical Society 41(2), 230-234.

5. Dobson, A. J. (2002), An Introduction to Generalized Linear Models, Chapmann & Hall/CRC, New York, United States.

6. García, Y. B. & Pérez, J. A. (2008), Efecto de la densidad de siembra en la larvicultura de bagre blanco (sorubim cuspicaudus), Tesis de Pregrado, Departamento de Acuicultura, Facultad de Medicina Veterinaria y Zootecnia, Universidad de Córdoba, Montería, Colombia.

7. Hinde, J. & Demétrio, C. (1998), Overdispersion: Models and Estimation, ABE, S\tilde{a}o Paulo, Brazil.

8. McCullagh, P. & Nelder, J. A. (1989 edition second edition), Generalized Linear Models, Chapmann & Hall/CRC, New York, United States.

9. Morales, M. A. (2008), Estudio de homogeneidad de la dispersión en un diseño completamente al azar con datos de proporciones y conteos, Tesis de Maestría, Departamento de Estadística, Universidad Nacional de Colombia, Bogotá, Colombia.

10. Nelder, J. A. & Wedderburn, D. W. M. (1972), `Generalized Linear Models´, Journal The Royal Statistical Society: Series A 135(3), 370-384.

11. Prentice, R. L. (1986), `Binary Regresion Using an Extended Beta-Binomial Distribution with Discussion of Correlation Induced by Covariate Measurement Errors´, Journal of the American Statistical Association 81(394), 321-327.

12. Ravishanker, N. & Dey, D. K. (2001), A First Course in Linear Model Theory, Chapmann & Hall/CRC, New York, United States.

13. Sudhir, P. & Saha, K. (2007), `The Generalized Linear Model and Extensions: a Review and some Biological and Environmental Applications´, Environmetrics 18, 421-443.

14. Team, R Development Core (2007), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0. *http://www.R-project.org


[Recibido en abril de 2008. Aceptado en enero de 2009]

Este artículo se puede citar en LaTeX utilizando la siguiente referencia bibliográfica de BibTeX:

@ARTICLE{RCEv32n1a04,
    AUTHOR  = {Morales, Mario Alfonso and López, Luis Alberto},
    TITLE   = {{Estudio de homogeneidad de la dispersión en diseño a una vía de clasificación para datos de proporciones y conteos}},
    JOURNAL = {Revista Colombiana de Estadística},
    YEAR    = {2009},
    volume  = {32},
    number  = {1},
    pages   = {59-78}
}