Valores críticos de 33 variantes de pruebas de discordancia para los datos desviados en muestras normales con tamaños muy grandes de 1,000 a 30,000 y evaluación de diferentes modelos de regresión para la interpolación y extrapolación de valores críticos

Verma, Surendra P.; Quiroz-Ruiz, Alfredo

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

Similares em SciELO

Permalink

Revista mexicana de ciencias geológicas

versão On-line ISSN 2007-2902versão impressa ISSN 1026-8774

Resumo

VERMA, Surendra P. e QUIROZ-RUIZ, Alfredo. Valores críticos de 33 variantes de pruebas de discordancia para los datos desviados en muestras normales con tamaños muy grandes de 1,000 a 30,000 y evaluación de diferentes modelos de regresión para la interpolación y extrapolación de valores críticos. Rev. mex. cienc. geol [online]. 2008, vol.25, n.3, pp.369-381. ISSN 2007-2902.

En este trabajo final de una serie de cuatro, usando nuestro procedimiento de simulación bien establecido reportamos nuevos valores críticos o puntos porcentuales, precisos y exactos (con cuatro a ocho puntos decimales) de 15 pruebas de discordancia con 33 variantes y cada uno con siete niveles de significancia α = 0.30, 0.20, 0.10, 0.05, 0.02, 0.01 y 0.005, para muestras normales de tamaños muy grandes n de 1,000 a 30,000, viz., 1,000 (50)1, 500(100)2,000 (500) 5,000(1,000)10,000(10,000)30,000, esto es, 1,000 (pasos de 50) 1,500 (pasos de 100) 2,000 (pasos de 500) 5,000 (pasos de 1,000) 10,000 (pasos de 10,000) 30,000. Se reporta también el error estándar de la media en forma explícita e individual para cada valor critico. Como consecuencia, la aplicabilidad de estas pruebas de discordancia ha sido extendida a prácticamente cualquier tamaño de muestra estadística (hasta 30,000 observaciones o aún mayores). Este conjunto final de valores críticos para tamaños muy grandes cubrirá cualquier necesidad presente o futura de aplicación de estas pruebas de discordancia en todos los campos de las ciencias e ingenierías. Dado que los valores críticos fueron simulados para pocos tamaños de muestra entre 1,000 y 30,000, seis modelos de regresión diferentes fueron evaluados para la interpolación y extrapolación de los datos y se demostró que un modelo combinado de logaritmo natural-cúbico es el más apropiado. Es la primera vez en la literatura mundial que se demuestra que una transformación logarítmica del tamaño de muestra n antes de un ajuste polinomial resulta mejor que los ajustes convencionales desde lineal hasta polinomial de tercer grado usados a la fecha. Finalmente, usamos 1,402 conjuntos de datos de laproteómica cuantitativa con el fin de demostrar que nuestro método de pruebas múltiples funciona más eficientemente que el método robusto MAD_Z usado para procesar estos datos y, de esta manera, ilustrar la utilidad de nuestro trabajo final en estas líneas.

Palavras-chave : métodos de valores desviados; muestra normal; simulaciones Monte Carlo; tablas de valores críticos; pruebas de Dixon; pruebas de Grubbs; sesgo; curtosis; estadística; ecuaciones de regresión; transformación-log; proteómica.

· resumo em Inglês · texto em Inglês · Inglês (

pdf )