Table of contents
Open Table of contents
1. K-mean và K-nearest neighbors
1.1. K-mean
K-mean là một thuật toán clustering.
Input: Những nhóm dữ liệu
Output: K clusters phân biệt dựa trên sự tương đồng giữa những đặc trưng.
Algorithms:
- Chọn K cụm trung tâm.
- Gán những điểm dữ liệu vào cụm trung tâm gần nhất
- Tính toán lại cụm trung tâm dựa trên means của những điểm được gán vào.
- Lặp lại đến khi convergence.
1.2. K-nearest neighbors
Mục đích: Phân loại điểm dữ liệu mới dựa trên K nearest neighbors \
Input: Một điểm chưa được phân loại
Output: Trả về phân loại cho điểm đó. Ví dụ: “Dog”, “Cat”
Algorithms:
- Chọn K, số neighbors muốn chọn
- Tính khoảng cách giữa điểm đầu vào và dữ liệu được train
- Xác định K điểm gần nhất
- Gán nhãn dựa trên nhãn phổ biến nhất trong K điểm được chọn