Trong máy học, bạn dạy máy tính đưa ra các dự đoán hoặc suy luận. Đầu tiên, bạn sử dụng thuật toán và dữ liệu ví dụ để đào tạo một mô hình. Sau đó, bạn tích hợp mô hình đó vào ứng dụng của mình để tạo ra suy luận theo thời gian thực và trên quy mô lớn. Học có giám sát và không có giám sát là hai loại thuật toán khác biệt.
Học có giám sát
Trong học có giám sát, bạn đào tạo mô hình với một tập hợp dữ liệu đầu vào và một tập hợp dữ liệu đầu ra có gắn nhãn được ghép nối tương ứng. Việc gắn nhãn thường được thực hiện thủ công. Tiếp theo là một số loại kỹ thuật máy học có giám sát.
Hồi quy logistic
Hồi quy logistic dự đoán một đầu ra phân loại dựa trên một hoặc nhiều đầu vào. Phân lớp nhị phân là khi đầu ra phù hợp với một trong hai hạng mục, chẳng hạn như có hoặc không và đạt hoặc trượt. Phân loại nhiều lớp là khi đầu ra phù hợp với hơn hai hạng mục, ví dụ như mèo, chó hoặc thỏ. Một ví dụ về hồi quy logistic là dự đoán một học sinh sẽ đạt hoặc trượt một đơn vị dựa trên số lần đăng nhập của họ vào chương trình dạy học.
Đọc về hồi quy logistic »
Hồi quy tuyến tính
Hồi quy tuyến tính đề cập đến các mô hình học có giám sát, dựa trên một hoặc nhiều đầu vào, dự đoán một giá trị từ thang đo liên tục. Một ví dụ về hồi quy tuyến tính là dự đoán giá nhà. Bạn có thể dự đoán giá của một ngôi nhà dựa trên vị trí, số năm tuổi và số phòng của nó, sau khi bạn đào tạo một mô hình trên một tập hợp dữ liệu đào tạo bán hàng trong lịch sử với các biến số đó.
Đọc về hồi quy tuyến tính »
Cây quyết định
Kỹ thuật máy học có giám sát của cây quyết định lấy một số đầu vào nhất định và áp dụng cấu trúc if-else để dự đoán kết quả. Một ví dụ về vấn đề cây quyết định là dự báo tỷ lệ rời bỏ của khách hàng. Ví dụ: nếu khách hàng không truy cập ứng dụng sau khi đăng ký, mô hình có thể dự báo tỷ lệ rời bỏ. Hoặc nếu khách hàng truy cập ứng dụng trên nhiều thiết bị và thời gian phiên trung bình cao hơn một ngưỡng nhất định, mô hình có thể dự báo khả năng duy trì.
Mạng nơ-ron
Giải pháp mạng nơ-ron là một kỹ thuật học có giám sát phức tạp hơn. Để tạo ra một kết quả nhất định, nó cần một số đầu vào nhất định và thực hiện một hoặc nhiều lớp biến đổi toán học dựa trên việc điều chỉnh trọng số dữ liệu. Một ví dụ về kỹ thuật mạng nơ-ron là dự đoán một chữ số từ một hình ảnh viết tay.
Tìm hiểu về mạng nơ-ron »
Học không có giám sát
Máy học không có giám sát là khi bạn cung cấp dữ liệu đầu vào thuật toán mà không có bất kỳ dữ liệu đầu ra được gắn nhãn nào. Sau đó, tự nó, thuật toán xác định các mẫu và mối quan hệ trong và giữa dữ liệu. Tiếp theo là một số loại kỹ thuật học không có giám sát.
Phân cụm
Kỹ thuật học không có giám sát phân cụm sẽ nhóm các đầu vào dữ liệu nhất định lại với nhau, vì vậy chúng có thể được phân loại thành một tổng thể. Có nhiều loại thuật toán phân cụm khác nhau phụ thuộc vào dữ liệu đầu vào. Một ví dụ về phân cụm là xác định các loại lưu lượng truy cập mạng khác nhau để dự đoán các sự cố bảo mật tiềm ẩn.
Học quy tắc liên kết
Các kỹ thuật học quy tắc liên kết sẽ khám phá các mối quan hệ dựa trên quy tắc giữa các đầu vào trong tập dữ liệu. Ví dụ, thuật toán Apriori tiến hành phân tích giỏ thị trường để xác định các quy tắc như cà phê và sữa thường được mua cùng nhau.
Mật độ xác suất
Các kỹ thuật mật độ xác suất trong học không có giám sát sẽ dự đoán khả năng hoặc tiềm năng của giá trị đầu ra nằm trong phạm vi của những điều được coi là bình thường đối với đầu vào. Ví dụ, một nhiệt kế trong phòng máy chủ thường ghi dữ liệu giữa một phạm vi mức độ nhất định. Tuy nhiên, nếu nhiệt kế đột ngột đo một số thấp dựa trên phân phối xác suất, nó có thể chỉ ra sự cố thiết bị.
Giảm kích thước
Giảm kích thước là một kỹ thuật học không có giám sát giúp giảm số lượng các tính năng trong tập dữ liệu. Nó thường được sử dụng để xử lý trước dữ liệu cho các chức năng máy học khác và giảm độ phức tạp và tổng chi phí. Ví dụ: nó có thể làm mờ hoặc cắt các tính năng nền trong ứng dụng nhận dạng hình ảnh.