Skip to content

Linear Regression

Published: at 03:01 AMSuggest Changes

Table of contents

Open Table of contents

1. Khái niệm liên quan

1.1. Linear

Linear hay tuyến tính để chỉ những function được biểu diễn là đường thẳng trên đồ thị

2. Khái niệm chính

2.1. Dạng cơ bản

XθˉyˉX \bar{\theta} \approx \bar{y}

Với:

X: data matrix or featuresθˉ: parameter vector\mathbf{X} \text{: data matrix or features} \quad \bar{\boldsymbol{\theta}} \text{: parameter vector}

Xét XRm×n,θˉRn×l,yˉRm×lX \in R^{m \times n}, \quad \bar{\theta} \in R^{n \times l}, \quad \bar{y} \in R^{m \times l}

Xθˉ=yˉθˉ=XTyˉX \bar{\theta} = \bar{y} \leftrightarrow \bar{\theta} = X^{T}\bar{y} XTXθˉ=(XTX)1XTyˉ=X+yˉvới(XTX)1XT=X+\begin{align} X^T X \bar{\theta} &= (X^TX)^{-1}X^T \bar{y} \\ &= X^{+} \bar{y} \quad \text{với} \quad (X^TX)^{-1}X^T = X^{+} \end{align}

2.2. Kiểm tra độ chính xác?

2.2.1. Error

Khái niệm: error = actual - prediction

Kiểm tra dấu:

Do đó cần một mô hình khác

2.2.2. MSE

Mean Square Error tức trung bình của bình phương error. Khi bình phương thì không còn lạc loài trường hợp ngược dấu. Từ đó giúp cho quá trình evaluation

Để giúp ích cho việc tìm ra giá trị weight sát nhất. Ta để MSE nhỏ nhất, tức đạo hàm của nó sẽ bằng 0. Xét:

J(θˉ)=1nt=1n12[y(t)θˉxˉ(t)]2J(\bar{\theta}) = \frac{1}{n} \sum_{t=1}^{n} \frac{1}{2} \left[ y^{(t)} - \bar{\theta} \cdot \bar{x}^{(t)} \right]^2

Thực hiện đạo hàm phần θiJ(θˉ)\frac{\partial}{\partial \theta_{i}}J(\bar{\theta}) , suppose g()=θˉxˉ(t)g() = \bar{\theta}\bar{x}^{(t)}

θiJ(θˉ)=Jg(θi)gθi=1nt=1n[y(t)(x1(t)θ1+x2(t)θ2++xd(t)θd)](xi(t))=1nt=1n[y(t)(xˉ(t))Tθˉ](xi(t))\begin{align} \\ \frac{\partial}{\partial \theta_i} J(\bar{\theta}) &= \frac{\partial J}{\partial g(\theta_{i})} \frac{\partial g}{\partial \theta_{i}} \\ &= \frac{1}{n} \sum_{t=1}^n \left[ y^{(t)} - \left( x_1^{(t)} \theta_1 + x_2^{(t)} \theta_2 + \cdots + x_d^{(t)} \theta_d \right) \right] \left( -x_i^{(t)} \right) \\ &= \frac{1}{n} \sum_{t=1}^n \left[ y^{(t)} - \left( \bar{x}^{(t)} \right)^T \bar{\theta} \right] \left( -x_i^{(t)} \right) \end{align}

Khi đó:

1nt=1n(xi(t)(xˉ(t))Tθˉ)=1nt=1nxi(t)y(t)\frac{1}{n}\sum_{t=1}^n (x_{i}^{(t)} \left(\bar{x}^{(t)} \right) ^T \bar{\theta}) = \frac{1}{n} \sum_{t=1}^n x_{i}^{(t)}y^{(t)}

Rút gọn:

t=1n(xi(t)(xˉ(t))Tθˉ)=t=1nxi(t)y(t)\sum_{t=1}^n (x_{i}^{(t)} \left(\bar{x}^{(t)} \right) ^T \bar{\theta}) = \sum_{t=1}^n x_{i}^{(t)}y^{(t)}

Ta có (xˉ(t))TRd\left( \bar{x}^{(t)} \right)^T \in R^d , để ý xi(t)x_i^{(t)} có thể viết lại dưới dạng xˉ(t)\bar{x}^{(t)}:

t=1nxˉ(t)(xˉ(t))Tθˉ=t=1nxˉ(t)y(t)\sum_{t=1}^n \bar{x}^{(t)} \left(\bar{x}^{(t)}\right)^T \bar{\theta}= \sum_{t=1}^n \bar{x}^{(t)}y^{(t)}

Ma trận XT=x(t)Rd×n,X=(xˉ(t))TRn×dX^T = x^{(t)} \in R^{d\times n}, \quad X = \left(\bar{x}^{(t)}\right)^T \in R^{n\times d} Giống với:

XTXθˉ=XTyˉ(t)X^TX \bar{\theta} = X^T \bar{y}^{(t)}

Previous Post
t-SNE
Next Post
1 phút để dành sự tôn trọng cho Self 2