Table of contents
Open Table of contents
1. Khái niệm liên quan
1.1. Linear
Linear hay tuyến tính để chỉ những function được biểu diễn là đường thẳng trên đồ thị
2. Khái niệm chính
2.1. Dạng cơ bản
Xθˉ≈yˉ
Với:
X: data matrix or featuresθˉ: parameter vector
Xét X∈Rm×n,θˉ∈Rn×l,yˉ∈Rm×l
Xθˉ=yˉ↔θˉ=XTyˉ
- Nếu m<n: thiếu data so với số lượng feature
XTXθˉ=(XTX)−1XTyˉ=X+yˉvới(XTX)−1XT=X+
2.2. Kiểm tra độ chính xác?
2.2.1. Error
Khái niệm: error = actual - prediction
Kiểm tra dấu:
- Error = 0: biểu diễn đúng độ lệch của mô hình
- Error > 0: biểu diễn đúng độ lệch của mô hình
- Error < 0: biểu diễn sai độ lệch của mô hình vì hai giá trị error ngược dấu nhau
Do đó cần một mô hình khác
2.2.2. MSE
Mean Square Error tức trung bình của bình phương error. Khi bình phương thì không còn lạc loài trường hợp ngược dấu. Từ đó giúp cho quá trình evaluation
Để giúp ích cho việc tìm ra giá trị weight sát nhất. Ta để MSE nhỏ nhất, tức đạo hàm của nó sẽ bằng 0. Xét:
J(θˉ)=n1t=1∑n21[y(t)−θˉ⋅xˉ(t)]2
Thực hiện đạo hàm phần ∂θi∂J(θˉ) , suppose g()=θˉxˉ(t)
∂θi∂J(θˉ)=∂g(θi)∂J∂θi∂g=n1t=1∑n[y(t)−(x1(t)θ1+x2(t)θ2+⋯+xd(t)θd)](−xi(t))=n1t=1∑n[y(t)−(xˉ(t))Tθˉ](−xi(t))
Khi đó:
n1t=1∑n(xi(t)(xˉ(t))Tθˉ)=n1t=1∑nxi(t)y(t)
Rút gọn:
t=1∑n(xi(t)(xˉ(t))Tθˉ)=t=1∑nxi(t)y(t)
Ta có (xˉ(t))T∈Rd , để ý xi(t) có thể viết lại dưới dạng xˉ(t):
t=1∑nxˉ(t)(xˉ(t))Tθˉ=t=1∑nxˉ(t)y(t)
Ma trận XT=x(t)∈Rd×n,X=(xˉ(t))T∈Rn×d
Giống với:
XTXθˉ=XTyˉ(t)