Множественная регрессия - уравнение связи с несколькими независимыми переменными:多元回归是具有多个自变量的关系方程:
y
=
f
(
x
1
,
x
2
,
…
,
x
p
)
,
y
=
f
x
1
,
x
2
,
…
,
x
p
,
y=f(x_(1),x_(2),dots,x_(p)), y=f\left(x_{1}, x_{2}, \ldots, x_{p}\right),
где
y
y
y quad y \quad - зависнмая переменная (результативный призвак);
在哪里
y
y
y quad y \quad - 因变量(结果调用);
x
1
,
x
2
,
…
,
x
p
x
1
,
x
2
,
…
,
x
p
x_(1),x_(2),dots,x_(p) x_{1}, x_{2}, \ldots, x_{p} - независимые переменные (факторы).
x
1
,
x
2
,
…
,
x
p
x
1
,
x
2
,
…
,
x
p
x_(1),x_(2),dots,x_(p) x_{1}, x_{2}, \ldots, x_{p} - 自变量(因素)。
Для построения уравнения множественной регрессии чаще используются следующие функции:
为了建立多元回归方程,最常使用以下函数:
линейная
−
y
=
a
+
b
1
⋅
x
1
+
b
2
⋅
x
2
+
…
+
b
p
⋅
x
p
+
ε
−
y
=
a
+
b
1
⋅
x
1
+
b
2
⋅
x
2
+
…
+
b
p
⋅
x
p
+
ε
-y=a+b_(1)*x_(1)+b_(2)*x_(2)+dots+b_(p)*x_(p)+epsi -y=a+b_{1} \cdot x_{1}+b_{2} \cdot x_{2}+\ldots+b_{p} \cdot x_{p}+\varepsilon ; 线性
−
y
=
a
+
b
1
⋅
x
1
+
b
2
⋅
x
2
+
…
+
b
p
⋅
x
p
+
ε
−
y
=
a
+
b
1
⋅
x
1
+
b
2
⋅
x
2
+
…
+
b
p
⋅
x
p
+
ε
-y=a+b_(1)*x_(1)+b_(2)*x_(2)+dots+b_(p)*x_(p)+epsi -y=a+b_{1} \cdot x_{1}+b_{2} \cdot x_{2}+\ldots+b_{p} \cdot x_{p}+\varepsilon ;
степенная -
y
=
a
⋅
x
1
b
1
⋅
x
2
b
2
…
⋅
x
p
b
p
⋅
ε
1
y
=
a
⋅
x
1
b
1
⋅
x
2
b
2
…
⋅
x
p
b
p
⋅
ε
1
y=a*x_(1)^(b_(1))*x_(2)^(b_(2))dots*x_(p)^(b_(p))*epsi_(1) y=a \cdot x_{1}^{b_{1}} \cdot x_{2}^{b_{2}} \ldots \cdot x_{p}^{b_{p}} \cdot \varepsilon_{1} 力量 -
y
=
a
⋅
x
1
b
1
⋅
x
2
b
2
…
⋅
x
p
b
p
⋅
ε
1
y
=
a
⋅
x
1
b
1
⋅
x
2
b
2
…
⋅
x
p
b
p
⋅
ε
1
y=a*x_(1)^(b_(1))*x_(2)^(b_(2))dots*x_(p)^(b_(p))*epsi_(1) y=a \cdot x_{1}^{b_{1}} \cdot x_{2}^{b_{2}} \ldots \cdot x_{p}^{b_{p}} \cdot \varepsilon_{1}
экспонента
−
y
=
e
a
+
b
1
⋅
x
1
+
b
2
⋅
x
2
+
…
+
b
p
⋅
x
p
+
ε
−
y
=
e
a
+
b
1
⋅
x
1
+
b
2
⋅
x
2
+
…
+
b
p
⋅
x
p
+
ε
-y=e^(a+b_(1)*x_(1)+b_(2)*x_(2)+dots+b_(p)*x_(p)+epsi) -y=e^{a+b_{1} \cdot x_{1}+b_{2} \cdot x_{2}+\ldots+b_{p} \cdot x_{p}+\varepsilon} ;
指数
−
y
=
e
a
+
b
1
⋅
x
1
+
b
2
⋅
x
2
+
…
+
b
p
⋅
x
p
+
ε
−
y
=
e
a
+
b
1
⋅
x
1
+
b
2
⋅
x
2
+
…
+
b
p
⋅
x
p
+
ε
-y=e^(a+b_(1)*x_(1)+b_(2)*x_(2)+dots+b_(p)*x_(p)+epsi) -y=e^{a+b_{1} \cdot x_{1}+b_{2} \cdot x_{2}+\ldots+b_{p} \cdot x_{p}+\varepsilon} ;
гипербола
−
y
=
1
a
+
b
1
⋅
x
1
+
b
2
⋅
x
2
+
…
+
b
p
⋅
x
p
+
ε
−
y
=
1
a
+
b
1
⋅
x
1
+
b
2
⋅
x
2
+
…
+
b
p
⋅
x
p
+
ε
-y=(1)/(a+b_(1)*x_(1)+b_(2)*x_(2)+dots+b_(p)*x_(p)+epsi) -y=\frac{1}{a+b_{1} \cdot x_{1}+b_{2} \cdot x_{2}+\ldots+b_{p} \cdot x_{p}+\varepsilon} . 双曲线
−
y
=
1
a
+
b
1
⋅
x
1
+
b
2
⋅
x
2
+
…
+
b
p
⋅
x
p
+
ε
−
y
=
1
a
+
b
1
⋅
x
1
+
b
2
⋅
x
2
+
…
+
b
p
⋅
x
p
+
ε
-y=(1)/(a+b_(1)*x_(1)+b_(2)*x_(2)+dots+b_(p)*x_(p)+epsi) -y=\frac{1}{a+b_{1} \cdot x_{1}+b_{2} \cdot x_{2}+\ldots+b_{p} \cdot x_{p}+\varepsilon} 。
Можно использовать и другие функции, приводимые к линейному виду.您可以使用其他可以简化为线性形式的函数。
Для оценки параметров уравнения множественной регрессии применяют метод наименьиих квадратов (МНК). Для линейных уравнений и нелинейных уравнений, приводимых к линейным, строится следующая система нормальных уравнений, решение которой позволяет получить оценки параметров регрессии:为了估计多元回归方程的参数,使用最小二乘法(OLS)。对于线性方程和可简化为线性方程的非线性方程,构造以下正规方程组,其解使我们能够获得回归参数的估计:
{
∑
y
=
n
a
+
b
1
∑
x
1
+
b
2
∑
x
2
+
…
+
b
p
∑
x
p
∑
y
x
1
=
a
∑
x
1
+
b
1
∑
x
1
2
+
b
2
∑
x
1
x
2
+
…
+
b
p
∑
x
p
x
1
∑
y
x
p
=
a
∑
x
p
+
b
1
∑
x
1
x
p
+
b
2
∑
x
2
x
p
+
…
+
b
p
∑
x
p
2
∑
y
=
n
a
+
b
1
∑
x
1
+
b
2
∑
x
2
+
…
+
b
p
∑
x
p
∑
y
x
1
=
a
∑
x
1
+
b
1
∑
x
1
2
+
b
2
∑
x
1
x
2
+
…
+
b
p
∑
x
p
x
1
∑
y
x
p
=
a
∑
x
p
+
b
1
∑
x
1
x
p
+
b
2
∑
x
2
x
p
+
…
+
b
p
∑
x
p
2
{[sum y=na+b_(1)sumx_(1)+b_(2)sumx_(2)+dots+b_(p)sumx_(p)],[sum yx_(1)=a sumx_(1)+b_(1)sumx_(1)^(2)+b_(2)sumx_(1)x_(2)+dots+b_(p)sumx_(p)x_(1)],[sum yx_(p)=a sumx_(p)+b_(1)sumx_(1)x_(p)+b_(2)sumx_(2)x_(p)+dots+b_(p)sumx_(p)^(2)]:} \left\{\begin{array}{l}
\sum y=n a+b_{1} \sum x_{1}+b_{2} \sum x_{2}+\ldots+b_{p} \sum x_{p} \\
\sum y x_{1}=a \sum x_{1}+b_{1} \sum x_{1}^{2}+b_{2} \sum x_{1} x_{2}+\ldots+b_{p} \sum x_{p} x_{1} \\
\sum y x_{p}=a \sum x_{p}+b_{1} \sum x_{1} x_{p}+b_{2} \sum x_{2} x_{p}+\ldots+b_{p} \sum x_{p}^{2}
\end{array}\right.
Для ее решения может быть применён метод определителей:为了解决这个问题,可以使用行列式的方法:
a
=
Δ
a
Δ
,
b
1
=
Δ
b
1
Δ
,
…
,
b
p
=
Δ
b
p
Δ
,
a
=
Δ
a
Δ
,
b
1
=
Δ
b
1
Δ
,
…
,
b
p
=
Δ
b
p
Δ
,
a=(Delta a)/(Delta),quadb_(1)=(Deltab_(1))/(Delta),dots,b_(p)=(Deltab_(p))/(Delta), a=\frac{\Delta a}{\Delta}, \quad b_{1}=\frac{\Delta b_{1}}{\Delta}, \ldots, b_{p}=\frac{\Delta b_{p}}{\Delta},
где
Δ
=
|
n
Σ
x
1
Σ
x
2
…
Σ
x
p
Σ
x
1
Σ
x
1
2
Σ
x
2
x
1
…
Σ
x
p
x
1
Σ
x
2
Σ
x
1
x
2
Σ
x
2
2
…
Σ
x
p
x
2
…
x
p
Σ
x
1
x
p
Σ
x
2
x
p
…
Σ
x
p
2
|
Δ
=
n
Σ
x
1
Σ
x
2
…
Σ
x
p
Σ
x
1
Σ
x
1
2
Σ
x
2
x
1
…
Σ
x
p
x
1
Σ
x
2
Σ
x
1
x
2
Σ
x
2
2
…
Σ
x
p
x
2
…
x
p
Σ
x
1
x
p
Σ
x
2
x
p
…
Σ
x
p
2
Delta=|[n,Sigmax_(1),Sigmax_(2),dots,Sigmax_(p)],[Sigmax_(1),Sigmax_(1)^(2),Sigmax_(2)x_(1),dots,Sigmax_(p)x_(1)],[Sigmax_(2),Sigmax_(1)x_(2),Sigmax_(2)^(2),dots,Sigmax_(p)x_(2)],[dotsx_(p),Sigmax_(1)x_(p),Sigmax_(2)x_(p),dots,Sigmax_(p)^(2)]| \Delta=\left|\begin{array}{ccccc}n & \Sigma x_{1} & \Sigma x_{2} & \ldots & \Sigma x_{p} \\ \Sigma x_{1} & \Sigma x_{1}^{2} & \Sigma x_{2} x_{1} & \ldots & \Sigma x_{p} x_{1} \\ \Sigma x_{2} & \Sigma x_{1} x_{2} & \Sigma x_{2}^{2} & \ldots & \Sigma x_{p} x_{2} \\ \hdashline \ldots x_{p} & \Sigma x_{1} x_{p} & \Sigma x_{2} x_{p} & \ldots & \Sigma x_{p}^{2}\end{array}\right| - определитель системы;
在哪里
Δ
=
|
n
Σ
x
1
Σ
x
2
…
Σ
x
p
Σ
x
1
Σ
x
1
2
Σ
x
2
x
1
…
Σ
x
p
x
1
Σ
x
2
Σ
x
1
x
2
Σ
x
2
2
…
Σ
x
p
x
2
…
x
p
Σ
x
1
x
p
Σ
x
2
x
p
…
Σ
x
p
2
|
Δ
=
n
Σ
x
1
Σ
x
2
…
Σ
x
p
Σ
x
1
Σ
x
1
2
Σ
x
2
x
1
…
Σ
x
p
x
1
Σ
x
2
Σ
x
1
x
2
Σ
x
2
2
…
Σ
x
p
x
2
…
x
p
Σ
x
1
x
p
Σ
x
2
x
p
…
Σ
x
p
2
Delta=|[n,Sigmax_(1),Sigmax_(2),dots,Sigmax_(p)],[Sigmax_(1),Sigmax_(1)^(2),Sigmax_(2)x_(1),dots,Sigmax_(p)x_(1)],[Sigmax_(2),Sigmax_(1)x_(2),Sigmax_(2)^(2),dots,Sigmax_(p)x_(2)],[dotsx_(p),Sigmax_(1)x_(p),Sigmax_(2)x_(p),dots,Sigmax_(p)^(2)]| \Delta=\left|\begin{array}{ccccc}n & \Sigma x_{1} & \Sigma x_{2} & \ldots & \Sigma x_{p} \\ \Sigma x_{1} & \Sigma x_{1}^{2} & \Sigma x_{2} x_{1} & \ldots & \Sigma x_{p} x_{1} \\ \Sigma x_{2} & \Sigma x_{1} x_{2} & \Sigma x_{2}^{2} & \ldots & \Sigma x_{p} x_{2} \\ \hdashline \ldots x_{p} & \Sigma x_{1} x_{p} & \Sigma x_{2} x_{p} & \ldots & \Sigma x_{p}^{2}\end{array}\right| - 系统决定因素;
Δ
a
,
Δ
b
1
,
…
,
Δ
b
p
Δ
a
,
Δ
b
1
,
…
,
Δ
b
p
Delta a,Deltab_(1),dots,Deltab_(p) \Delta a, \Delta b_{1}, \ldots, \Delta b_{p} - частные определители; которые получаются путем замены соответствующего столбца матрицы определителя системы данными левой части системы.
Δ
a
,
Δ
b
1
,
…
,
Δ
b
p
Δ
a
,
Δ
b
1
,
…
,
Δ
b
p
Delta a,Deltab_(1),dots,Deltab_(p) \Delta a, \Delta b_{1}, \ldots, \Delta b_{p} - 私人决定因素;将系统行列式矩阵的相应列替换为系统左侧的数据即可得到。
Другой вид уравнения множественной регрессии - уравнение регрессии в стандартизованнам маситабе:另一种多元回归方程是标准化 Masitaba 中的回归方程:
t
y
=
β
1
t
x
1
+
β
2
t
x
2
+
…
+
β
p
t
x
p
t
y
=
β
1
t
x
1
+
β
2
t
x
2
+
…
+
β
p
t
x
p
t_(y)=beta_(1)t_(x_(1))+beta_(2)t_(x_(2))+dots+beta_(p)t_(x_(p)) t_{y}=\beta_{1} t_{x_{1}}+\beta_{2} t_{x_{2}}+\ldots+\beta_{p} t_{x_{p}}
где
t
y
=
y
−
y
¯
σ
y
,
t
x
i
=
x
i
−
x
¯
i
σ
x
i
t
y
=
y
−
y
¯
σ
y
,
t
x
i
=
x
i
−
x
¯
i
σ
x
i
t_(y)=(y-( bar(y)))/(sigma_(y)),t_(x_(i))=(x_(i)- bar(x)_(i))/(sigma_(x_(i))) t_{y}=\frac{y-\bar{y}}{\sigma_{y}}, t_{x_{i}}=\frac{x_{i}-\bar{x}_{i}}{\sigma_{x_{i}}} - стандартизованные переменные;
在哪里
t
y
=
y
−
y
¯
σ
y
,
t
x
i
=
x
i
−
x
¯
i
σ
x
i
t
y
=
y
−
y
¯
σ
y
,
t
x
i
=
x
i
−
x
¯
i
σ
x
i
t_(y)=(y-( bar(y)))/(sigma_(y)),t_(x_(i))=(x_(i)- bar(x)_(i))/(sigma_(x_(i))) t_{y}=\frac{y-\bar{y}}{\sigma_{y}}, t_{x_{i}}=\frac{x_{i}-\bar{x}_{i}}{\sigma_{x_{i}}} - 标准化变量;
β
i
β
i
beta_(i) \beta_{i} - стандартизованные коэффициенты регрессии.
β
i
β
i
beta_(i) \beta_{i} - 标准化回归系数。
К уравнению множественной регрессии в стандартизованном масштабе применим МНК. Стандартизованные коэффициенты регрессии (
β
β
beta \beta -коэффициенты) определяются из следующей системы уравнений:
我们将 OLS 应用于标准化尺度的多元回归方程。标准化回归系数(
β
β
beta \beta -系数)由以下方程组确定:
Связь коэффициентов множественной регрессии
b
i
b
i
b_(i) b_{i} со стандартизованными коэффициентами
β
i
β
i
beta_(i) \beta_{i} описывается соотношением
多元回归系数之间的关系
b
i
b
i
b_(i) b_{i} 标准化赔率
β
i
β
i
beta_(i) \beta_{i} 由关系式描述
b
i
=
β
i
σ
y
σ
x
i
b
i
=
β
i
σ
y
σ
x
i
b_(i)=beta_(i)(sigma_(y))/(sigma_(x_(i))) b_{i}=\beta_{i} \frac{\sigma_{y}}{\sigma_{x_{i}}}
Параметр
a
a
a a определяется как
a
=
y
¯
−
b
1
x
¯
1
−
b
2
x
¯
2
−
…
−
b
p
x
¯
p
a
=
y
¯
−
b
1
x
¯
1
−
b
2
x
¯
2
−
…
−
b
p
x
¯
p
a= bar(y)-b_(1) bar(x)_(1)-b_(2) bar(x)_(2)-dots-b_(p) bar(x)_(p) a=\bar{y}-b_{1} \bar{x}_{1}-b_{2} \bar{x}_{2}-\ldots-b_{p} \bar{x}_{p} .
范围
a
a
a a 定义为
a
=
y
¯
−
b
1
x
¯
1
−
b
2
x
¯
2
−
…
−
b
p
x
¯
p
a
=
y
¯
−
b
1
x
¯
1
−
b
2
x
¯
2
−
…
−
b
p
x
¯
p
a= bar(y)-b_(1) bar(x)_(1)-b_(2) bar(x)_(2)-dots-b_(p) bar(x)_(p) a=\bar{y}-b_{1} \bar{x}_{1}-b_{2} \bar{x}_{2}-\ldots-b_{p} \bar{x}_{p} 。
Средние коэффичиенты эластичности для линейной регрессии рассчитываются по формуле线性回归的平均弹性系数使用以下公式计算
Э
¯
y
x
j
=
b
j
x
¯
j
y
¯
.
Э
¯
y
x
j
=
b
j
x
¯
j
y
¯
.
bar(Э)_(yx_(j))=b_(j)( bar(x)_(j))/(( bar(y))). \bar{Э}_{y x_{j}}=b_{j} \frac{\bar{x}_{j}}{\bar{y}} . Э
Для расчета частных коэффициентов эластичности применяется следующая формула:为了计算部分弹性系数,使用以下公式:
Э
y
x
i
=
b
i
x
i
y
^
x
i
⋅
x
1
,
x
2
,
…
,
x
i
−
1
,
x
i
+
1
,
…
,
x
p
.
Э
y
x
i
=
b
i
x
i
y
^
x
i
⋅
x
1
,
x
2
,
…
,
x
i
−
1
,
x
i
+
1
,
…
,
x
p
.
Э_(y_(x_(i)))=b_(i)(x_(i))/( hat(y)_(x_(i)*x_(1),x_(2),dots,x_(i-1),x_(i+1),dots,x_(p))). Э_{y_{x_{i}}}=b_{i} \frac{x_{i}}{\hat{y}_{x_{i} \cdot x_{1}, x_{2}, \ldots, x_{i-1}, x_{i+1}, \ldots, x_{p}}} . Э
Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции:通过多重相关指数来评估因素对结果的共同影响的强弱:
R
y
x
1
x
2
,
…
,
x
p
=
1
−
σ
y
o
CT
2
σ
y
2
R
y
x
1
x
2
,
…
,
x
p
=
1
−
σ
y
o
CT
2
σ
y
2
R_(yx_(1)x_(2),dots,x_(p))=sqrt(1-(sigma_(y_(oCT))^(2))/(sigma_(y)^(2))) R_{y x_{1} x_{2}, \ldots, x_{p}}=\sqrt{1-\frac{\sigma_{y_{o \mathrm{CT}}}^{2}}{\sigma_{y}^{2}}}
Значение индекса множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции:多重相关指数值的范围为 0 到 1,并且必须大于或等于最大成对相关指数:
R
y
x
1
x
2
,
…
,
x
p
≥
r
y
x
i
(
i
=
1
,
p
―
)
.
R
y
x
1
x
2
,
…
,
x
p
≥
r
y
x
i
(
i
=
1
,
p
¯
)
.
R_(yx_(1)x_(2),dots,x_(p)) >= r_(yx_(i))quad(i= bar(1,p)). R_{y x_{1} x_{2}, \ldots, x_{p}} \geq r_{y x_{i}} \quad(i=\overline{1, p}) .
Индекс множественной корреляции для уравнения в стандартизованном мастітабе можно записать в виде标准化尺度方程的多重相关指数可以写为
R
y
x
1
x
2
,
…
,
x
p
=
∑
β
i
r
y
x
i
.
R
y
x
1
x
2
,
…
,
x
p
=
∑
β
i
r
y
x
i
.
R_(yx_(1)x_(2),dots,x_(p))=sqrt(sumbeta_(i)r_(yx_(i))). R_{y x_{1} x_{2}, \ldots, x_{p}}=\sqrt{\sum \beta_{i} r_{y x_{i}}} .
При линейной зависимости коэффициент множественной корреляции можно определить через матрицу парных коэффициентов корреляции:具有线性相关性,可以通过成对相关系数矩阵确定多重相关系数:
R
y
x
1
x
2
,
…
,
x
p
=
1
−
Δ
r
Δ
r
11
R
y
x
1
x
2
,
…
,
x
p
=
1
−
Δ
r
Δ
r
11
R_(yx_(1)x_(2),dots,x_(p))=sqrt(1-(Delta r)/(Deltar_(11))) R_{y x_{1} x_{2}, \ldots, x_{p}}=\sqrt{1-\frac{\Delta r}{\Delta r_{11}}}
4*