Se busca una línea de tendencia cuando se trata de datos bidimensionales, es decir, puntos [matemáticos] (x, y) [/ matemáticos]. Entonces depende de si considera que los datos [matemática] x [/ matemática] están libres de errores, o si tanto [matemática] x [/ matemática] como [matemática] y [/ matemática] podrían ser alterados por errores.
Si [math] x [/ math] está libre de errores, se minimizará la suma de los cuadrados de las diferencias entre sus datos [math] y_i [/ math] y su estimación de la línea de tendencia [math] ax_i + b [ / math], es decir, minimiza
[matemáticas] S (a, b) = \ sum_i (ax_i + b-y_i) ^ 2 [/ matemáticas]
Para hacerlo, uno toma ambas derivadas [matemática] \ parcial S / \ parcial a [/ matemática] y [matemática] \ parcial S / \ parcial b [/ matemática] como [matemática] 0 [/ matemática].
[matemática] \ frac {\ parcial S} {\ parcial a} = 2 \ sum_i x_i (ax_i + b-y_i) = 0 [/ matemática]
[matemática] \ frac {\ partial S} {\ partial b} = 2 \ sum_i ax_i + b-y_i = 0 [/ matemática]
De donde se obtiene el sistema de ecuaciones ([math] \ langle x ^ 2 \ rangle [/ math] es el valor medio de [math] x_i ^ 2 [/ math] s, [math] \ langle xy \ rangle [ / math] el de los productos [math] x_iy_i [/ math] …)
[matemáticas] \ begin {align} a \ langle x ^ 2 \ rangle + b \ langle x \ rangle & = \ langle xy \ rangle \\ a \ langle x \ rangle + b & = \ langle y \ rangle \ end {align} [/mates]
cuya solución es
[matemáticas] a = \ frac {\ langle xy \ rangle- \ langle x \ rangle \ langle y \ rangle} {\ langle x ^ 2 \ rangle- \ langle x \ rangle ^ 2} [/ math]
[matemáticas] b = \ frac {\ langle y \ rangle \ langle x ^ 2 \ rangle- \ langle x \ rangle \ langle xy \ rangle} {\ langle x ^ 2 \ rangle- \ langle x \ rangle ^ 2} [ /mates]
lo que lleva a
[matemáticas] y = \ frac {\ langle xy \ rangle- \ langle x \ rangle \ langle y \ rangle} {\ langle x ^ 2 \ rangle- \ langle x \ rangle ^ 2} (x- \ langle x \ rangle ) + \ langle y \ rangle [/ math]
Algo más complicado es el caso de los sujetos x e y sujetos a errores; ¿Cómo podría uno encontrar la línea de tendencia adecuada? Una respuesta es minimizar la suma de las distancias entre los puntos y la línea, o la suma de los cuadrados de estas distancias.
Siendo este último más fácil de tratar analíticamente, será mi elección: la ecuación de la línea de tendencia es [matemática] x \ sin \ theta-y \ cos \ theta + d = 0 [/ matemática], y uno quiere minimizar (la cantidad entre paréntesis es la distancia desde la línea al punto [matemáticas] (x_i, y_i) [/ matemáticas]):
[matemáticas] S = \ sum_i (x_i \ sin \ theta-y_i \ cos \ theta + d) ^ 2 [/ matemáticas]
jugando el mismo juego que antes, uno establece las dos derivadas parciales a [matemáticas] 0 [/ matemáticas], para encontrar la ecuación de la línea de tendencia:
[matemáticas] y = \ tan \ theta (x- \ langle x \ rangle) + \ langle y \ rangle [/ math]
donde [math] \ theta [/ math] viene dado por
[matemáticas] \ tan2 \ theta = 2 \ frac {\ langle xy \ rangle- \ langle x \ rangle \ langle y \ rangle} {\ langle x ^ 2 \ rangle- \ langle x \ rangle ^ 2- \ langle y ^ 2 \ rangle + \ langle y \ rangle ^ 2} [/ math]