Cómo analizar tendencias estadísticamente

En realidad, cuanto más sepas sobre esto, más complicado será hacerlo.
Lo que quieres evitar es conectar los puntos. Es decir, no tienes información sobre los fenómenos entre observaciones, pero aún pegas un punto en el medio de las dos observaciones allí para conectar la línea. Eso es un no no. O si eres un estadístico, es “interpolar”. Si agrega un punto final, es aún más incompleto, una extrapolación. De cualquier forma que decida mentir, lo justificará asumiendo: “las tendencias existentes continuarán”, o “se aplicarán métodos similares”, o “el público nunca verá esto”.

Así que ahora sabes cómo engañar al público, has dado datos y tu pregunta es “¿Existe una tendencia?” Tienes una tendencia. Una tendencia es una “dirección general en la que algo se está moviendo, desarrollando o cambiando”. En realidad, lo que tienes realmente se llama un “vector” matemático, con dimensiones de dirección y magnitud.

Es importante cómo etiquetar su eje y (el vertical). Sugiero nombrar sus QUEJAS del eje y, y poner tiempo en su eje x. La escala de tiempo es MUY importante para ti. Digamos que tiene informes de quejas de hace mucho tiempo, digamos septiembre de 1993. Esto cambiaría su idea de tendencia, ¿no? Del mismo modo, y aquí es donde la pregunta se vuelve interesante, ¿puede existir el tiempo como prueba de la identificación de tendencias? La prueba Cochran-Armitage para tendencias reordena sus números, pero no controla el tiempo. Probablemente podría usar los pesos para exponer su hipótesis de prueba específica, pero el uso de expectativas iterativas me parece arbitrario. Simplemente no veo una manera de obtener una definición única de “tendencia”. No, no hay una definición uniforme posible para ello.

Hay muchas formas de analizar datos de series temporales.

La forma más sencilla de detectar una tendencia es calcular una línea de regresión y coeficiente de correlación en los datos más recientes. El gradiente de la línea de regresión le dirá si las quejas son tendencia y el coeficiente de correlación le dirá qué tan en serio debe mirar esta tendencia. Debería establecer un valor mínimo para este coeficiente de correlación antes de que se active una alarma.

Un análisis más sofisticado dividiría sus datos en 4 componentes diferentes: ciclos (verano, invierno, etc.), estaciones (por ejemplo, de lunes a viernes), tendencias a corto plazo y variaciones aleatorias. Cómo aislar estos componentes es un tema demasiado largo para el espacio provisto aquí, pero básicamente, los componentes cíclicos y estacionales pueden aislarse promediando sus datos durante los períodos de tiempo correspondientes y restando los promedios de sus datos sin procesar. Lo que queda debe revelar si se manifiesta una tendencia a corto plazo. (Cabe señalar que sus datos pueden no ser tan fáciles de dividir en compartimientos como he sugerido).

Los estadísticos profesionales probablemente podrán proporcionar un mejor análisis de los datos y existe un software de análisis de tendencias que probablemente servirá mejor que los métodos manuales crudos que he sugerido.

Puedes usar una prueba de permutación.

Lo básico: haces una regresión lineal para tus puntos de datos.
Usted mide la tendencia, por ejemplo, por la inclinación de la línea (entonces, ¿qué tan grande es a, si la regresión es y = at + b)
desea una prueba para detectar si esta inclinación a es significativamente grande.

Ahora permuta sus puntos de datos, en realidad solo una columna (por ejemplo, las coordenadas de tiempo) muchas veces, y ejecuta la misma regresión nuevamente. El resultado a le da una distribución y una forma natural de calcular el valor p para los puntos originales reales.

Luego puede establecer un límite para los valores p, ordenar sus tiendas de acuerdo con los valores p, de lo que desee.

La mejor manera es invertir en software de análisis de tendencias como Watson o Tableau. Cuestan alrededor de $ 30 por mes en los EE. UU., Pero son bastante fáciles de usar y crean imágenes que son fáciles de entender.