TheứngdụngtuyệtvờicủaMachinelearningđốivớicácdoanhnhâsoi kèo trận barcelonao một khảo sát gần đây được thực hiện bởi Forrester, các khoản đầu tư vào machine learning đã tăng 300% trong năm nay so với năm ngoái. Machine learning hiện đã đánh dấu được vị thế của mình trong một số lĩnh vực như xe hơi tự lái, cá nhân hóa nội dung gợi ý hay thậm chí bộ lọc nhận diện khuôn mặt.
Rõ ràng rằng machine learning có thể làm được nhiều hơn là chỉ gợi ý nội dung và lái xe ô tô. Nhưng bài viết này sẽ tập trung xoay quanh một loại hình con của machine learning, có tên gọi “deep learning”, hứa hẹn sẽ thay đổi hoàn toàn cách chúng ta quảng bá, sản xuất và bán sản phẩm.
Không giống như các mô hình khác yêu cầu phải có những quy tắc cụ thể và bộ tính năng để có thể trích xuất ý nghĩa từ dữ liệu, mô hình deep learning tự động đưa ra kết luận và tạo ra các quy tắc phân loại của riêng mình từ dữ liệu phi cấu trúc.
Dữ liệu phi cấu trúc (unstructured data) chính là mấu chốt vấn đề. Trái ngược với dữ liệu cấu trúc (structured data) - vốn dĩ là những bảng thống kê hay biểu đồ với số liệu rõ ràng - dữ liệu phi cấu trúc bao gồm thông tin “hằng ngày” của người dùng như âm thanh hoặc hình ảnh và loại dữ liệu này, đối với máy tính, khó phân tích hơn rất nhiều. Việc trí thông minh nhân tạo, có thể tấn công vào dạng thông tin phi cấu trúc này đã là cả một bước đột phá.
Để hiểu rõ hơn về vấn đề này, hãy tưởng tượng bạn dạy cùng lúc một em bé và một máy tính cách nhận biết loài mèo trong các bức ảnh.
Với machine learning truyền thống, máy tính cần được dạy về những đặc điểm nhận dạng của mèo - chẳng hạn ria, móng vuốt hay đuôi mèo - để bắt đầu tìm kiếm trong những bức hình trước khi đưa ra dự đoán dựa trên những đặc điểm nhận dạng được học. Nếu một bức hình không tuân theo những quy tắc được dạy, máy tính sẽ không thích nghi được: Chẳng hạn, nếu đuôi của chú mèo nằm ngoài khung hình, máy tính có thể sẽ không nhận ra nổi con vật.
Trái lại, một em bé không cần những dạng chỉ dẫn như vậy. Sau khi được cho xem đủ hình ảnh, em bé sẽ xây dựng lên trong đầu một bộ khung nhận thức để phân biệt đâu là mèo và đâu không phải mèo. Tương tự, bằng cách thu nhận các dữ liệu đầu vào mà không cần chỉ dẫn và tự mình xác định, cùng lúc xem xét các giá trị điểm ảnh, deep learning có thể lọc ra những bức ảnh chứa hình mèo trong một xấp ảnh. Nếu được đầu tư đủ thời gian và dữ liệu nền, các mô hình deep learning có thể hiểu được gần như bất kỳ bộ dữ liệu phi cấu trúc nào.
Giờ đây, với khoảng 2,5 tỷ tỷ bytes dung lượng thông tin được tạo ra mỗi ngày - một phần lớn trong số đó có thể truy cập công khai qua Google và YouTube - cùng với những tiến bộ vượt bậc của công nghệ điện toán đám mây, deep learning không chỉ "đáng giá” nữa, mà trở thành một lựa chọn không thể thiếu, một lựa chọn sinh lời.