Thông tin liên hệ
- 036.686.3943
- admin@nguoicodonvn2008.info
Các cụm là tập hợp dữ liệu dựa trên sự tương đồng.
Các điểm dữ liệu được nhóm lại với nhau trong biểu đồ thường có thể được phân loại thành những cụm.
Trong biểu đồ bên dưới, chúng ta có thể phân biệt 3 cụm khác nhau:

Các cụm có thể chứa rất nhiều thông tin có giá trị, nhưng những cụm có nhiều hình dạng khác nhau, vậy làm thế nào chúng ta có thể nhận ra chúng?
Hai phương pháp chính là:
Sử dụng trực quan hóa
Sử dụng thuật toán phân cụm
Phân cụm là một loại học không giám sát.
Phân cụm nhằm mục đích:
Thu thập dữ liệu tương tự vào các nhóm
Thu thập dữ liệu không tương tự vào các nhóm khác
Phương pháp mật độ
Phương pháp phân cấp
Phương pháp phân vùng
Phương pháp dựa trên lưới
Phương pháp mật độ xem xét các điểm trong vùng có mật độ cao có nhiều điểm tương đồng và khác biệt hơn so với những điểm trong vùng có mật độ thấp hơn. Phương pháp mật độ có độ chính xác tốt. Nó cũng có khả năng hợp nhất các cụm. Hai thuật toán phổ biến là DBSCAN và OPTICS.
Phương pháp phân cấp tạo thành các cụm theo cấu trúc dạng cây. Các cụm mới được hình thành bằng cách sử dụng những cụm đã được hình thành trước đó. Hai thuật toán phổ biến là CURE và BIRCH.
Phương pháp dựa trên lưới định dạng dữ liệu thành một số hữu hạn các ô tạo thành cấu trúc dạng lưới. Hai thuật toán phổ biến là CLIQUE và STING
Phương pháp phân vùng chia các đối tượng thành k cụm và mỗi phân vùng tạo thành một cụm. Một thuật toán phổ biến là CLARANS.
Hệ số tương quan (r) mô tả độ mạnh và hướng của mối quan hệ tuyến tính giữa các biến x/y trên biểu đồ phân tán.
Giá trị của r luôn nằm giữa -1 và +1:
| -1.00 | Dốc xuống hoàn toàn | Mối quan hệ tuyến tính nghịch đảo. |
| -0.70 | Dốc xuống mạnh | Mối quan hệ tuyến tính nghịch đảo. |
| -0.50 | Dốc xuống vừa phải | Mối quan hệ tuyến tính nghịch đảo. |
| -0.30 | Dốc xuống nhẹ | Mối quan hệ tuyến tính nghịch đảo. |
| 0 | Không có mối quan hệ tuyến tính. | |
| +0.30 | Dốc lên nhẹ | Mối quan hệ tuyến tính thuận. |
| +0.50 | Dốc lên vừa phải | Mối quan hệ tuyến tính thuận. |
| +0.70 | Dốc lên mạnh | Mối quan hệ tuyến tính thuận. |
| +1.00 | Dốc lên hoàn toàn | Mối quan hệ tuyến tính thuận. |
Dốc lên hoàn toàn +1.00:

Dốc xuống hoàn toàn -1.00:

Dốc lên mạnh +0.61:

Không có mối quan hệ tuyến tính:

Nguồn tin: Quantrimang.com
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Cách tạo API Key Perplexity
Hướng dẫn tạo poster sản phẩm cao cấp phong cách tối giản
Cách tạo ảnh du lịch selfie hành tinh thu nhỏ
Prompt tạo ảnh iPhone phong cách Apple cực chuyên nghiệp bằng AI
TOP công cụ AI phân tích dữ liệu tốt nhất
Đề môn Tin thi tốt nghiệp THPT 2026
Đề Giáo dục Kinh tế và pháp luật thi tốt nghiệp THPT 2026
Đề thi môn Sinh học tốt nghiệp THPT 2026
Đề thi Địa lý kỳ thi tốt nghiệp THPT năm 2026
Đề thi môn Lịch sử thi tốt nghiệp THPT năm 2026
Đề thi môn Hóa học THPT 2026 (mã đề 0340)
Đề thi môn Vật lý thi tốt nghiệp THPT năm 2026
Đề thi tiếng Anh tốt nghiệp THPT 2026
Prompt tạo ảnh trang sức cao cấp như quảng cáo chuyên nghiệp
TOP công cụ AI thiết kế logo miễn phí và chuyên nghiệp đáng dùng nhất
Prompt biến ảnh chân dung thành tranh minh hoạ phong cách Nhật Bản
5 ứng dụng có thể thay thế bằng Claude AI
TOP công cụ AI đổi khuôn mặt trong ảnh và video chân thực nhất
Hướng dẫn tạo ảnh chân dung thương hiệu cá nhân Typography
NotebookLM: Cẩm nang sử dụng kèm ví dụ thực tiễn