Những suy nghĩ sai lầm về machine learning

1381

30-03-2022

Hiện nay, nhiều doanh nghiệp vẫn liên tục mắc phải những suy nghĩ sai lầm về Machine Learning. Điều này khiến cho chi phí, công sức tăng cao cũng như hoạt động ứng dụng trở nên kém hiệu quả hơn. Cùng Bizfly Cloud theo dõi bài viết dưới đây để tránh những sai lầm này và sử dụng Machine Learning đúng cách!

Cho rằng Machine Learning và AI là một

Sai lầm đầu tiên mà nhiều người thường mắc phải chính là đánh đồng Machine Learning với AI. Machine Learning là một kỹ thuật được sử dụng nhiều trong các phòng thí nghiệm còn AI chỉ là một mảng lớn dữ liệu bao gồm các lĩnh vực như Computer Vision, Robot, xử lý ngôn ngữ tự nhiên,... AI không bao gồm Machine Learning như một kỹ thuật mà chúng là cách học các mô hình và dự đoán kết quả từ các tập lớn dữ liệu.

Toàn bộ dữ liệu đều hữu ích

Data là yếu tố cần thiết cho Machine Learning nhưng không phải bất cứ dữ liệu nào cũng đều hữu ích và cần thiết. Muốn đào tạo hệ thống của bạn, bạn cần các dữ liệu đại diện gồm các patterns và các kết quả mà hệ thống Machine Learning cần xử lý.

Mô hình Machine Learning sẽ phản ánh các patterns cụ thể và tìm lại chúng trong dữ liệu bạn có. Vì thế, các dữ liệu mà bạn sử dụng trong đào tạo cần phải được phân loại tốt hơn. Mặt khác, nó cần được dán nhãn các tính năng bạn hỏi Machine Learning nên tốn rất nhiều công sức.

Càng nhiều data càng tốt

Trong thời gian gần đây có những cải tiến lớn về đọc hiểu máy tính, khả năng nhận diện hình ảnh, dịch thuật,... nhờ có sự hỗ trợ từ các công cụ tốt hơn. Điển hình là computing hardware như GPUs giúp xử lý một lượng lớn dữ liệu và các tập dữ liệu lớn được gắn nhãn, gồm cả ImageNet và Stanford Question Answering.

Tuy nhiên, không phải lúc nào bạn cũng cần một tập dữ liệu lớn để đạt được kết quả tốt trong một lĩnh vực cụ thể nhờ một mẹo là transfer learning. Thay vào đó, hệ thống Machine Learning có thể được đào tạo cách sử dụng dữ liệu với một tập data nhỏ hơn.

Ai cũng có thể xây dựng một hệ thống Machine Learning

Một trong những suy nghĩ sai lầm về Machine Learning phổ biến nhất hiện nay là cho rằng bất cứ ai cũng đều có thể xây dựng nó. Bạn có thể sử dụng rất nhiều công cụ mã nguồn mở và framework dành riêng cho Machine Learning.

Tuy nhiên, không phải ai cũng có thể xây dựng hệ thống học máy bởi đây là một kỹ thuật chuyên ngành. Muốn tạo ra nó, bạn cần thực sự am hiểu, thành thạo các kỹ năng cũng như nắm bắt được các yếu tố khác từ thị trường. Do đó, chỉ những người được đào tạo bài bản về Machine Learning mới có thể xây dựng một hệ thống hoàn chỉnh và vận hành nó hiệu quả.

Ai-cung-co-the-xay-dung-mot-he-thong-Machine-Learning

Toàn bộ patterns trong data đều hữu ích với người dùng

Trong lĩnh vực chăm sóc sức khỏe, Machine Learning được thiết để nhập hồ sơ bệnh án tự động và gửi về tận nhà. Hệ thống này tìm kiếm các patterns phù hợp trong dữ liệu và ní không phải là một patterns hữu ích để lựa chọn bệnh nhân vào viện. Thậm chí, trong một số trường hợp nguy hiểm hơn, bạn có thể không biết rằng patterns không hiệu quả đó được cài đặt trong tập dữ liệu của bạn.

Một số mô hình Black Box thực chất khá hiệu quả nhưng chúng cũng không thể làm rõ đã học được patterns nào. Các thuật toán thông minh như Generalized Additive Models có thể làm rõ các kiểu mẫu đã học được những gì. Từ đó bạn có quyết định xem liệu nó có hữu ích nếu triển khai hay không.

Reinforcement Learning luôn có sẵn để dùng

Hầu hết hệ thống Machine Learning hiện nay đều đang sử dụng công cụ Supervised Learning. Tuy nhiên, trong khá nhiều trường hợp, chúng lại được đào tạo trên các tệp dữ liệu đã được người dùng gắn mác. Việc quản lý các tập dữ liệu này khá mất thời gian nên các loại Unsupervised Learning thường được ưu tiên hơn cả. Trong đó Reinforcement Learning (RL) được ưa chuộng nhất. Tuy vậy, RL chỉ phổ biến trong các trường hợp nghiên cứu cụ thể chứ không có sẵn để sử dụng.

Machine Learning không thiên vị hay ưu tiên

Machine Learning học từ các dữ liệu nên nó có thể sao chép toàn bộ, thậm chí là bất cứ sai lệch nào trong dữ liệu. Hệ thống Machine Learning có thể tạo ra các thiên hướng sai lệch cho thông tin được cung cấp. Một Machine Learning được đào tạo cùng với các frameworks và hệ thống sẽ yêu cầu các định kiến sai lệch. Tình trạng này thường xảy ra khi bạn sử dụng hệ thống này với một hệ thống dịch giữa các ngôn ngữ có các đại từ phân biệt nam-nữ.

Machine Learning chỉ được ứng dụng trong các nhu cầu chính đáng

Một trong những suy nghĩ sai lầm về Machine Learning mà nhiều người mắc phải là cho rằng nó chỉ được ứng dụng trong các nhu cầu chính đáng. Nó được ứng dụng vào các tools chống virus, theo dõi nhất cử nhất động của các vụ tấn công để phát hiện ngay khi chúng bùng phát. Mặt khác, nhiều hacker cũng lợi dụng Machine Learning để nghiên cứu ra các công cụ phòng chống virus và tấn công lừa đảo với quy mô lớn. Chúng thực hiện bằng cách phân tích các vụ lừa đảo đã thành công trước đó hoặc một lượng lớn public data của các công ty.

Machine Learning sẽ dần thay thế con người trong tương lai

Nhiều người lo lắng rằng sự phát triển của Machine Learning có thể sẽ thay thế con người trong các công việc thông thường. Trên thực tế, Machine Learning sẽ nâng cao hiệu quả công việc và giảm thiểu chi phí tối đa. Tuy nhiên, Machine Learning không thể thực hiện bất cứ công việc nào bởi quy mô và độ phức tạp khác nhau. Vì thế bạn không cần quá lo lắng về việc học máy sẽ thay thế hoàn toàn con người.

Mô hình Machine Learning không cần cung cấp đủ dữ liệu vẫn có thể chạy tốt

Nếu không có gì để học, Machine Learning sẽ trở nên vô dụng nên ý kiến cho rằng không cần cung cấp đủ dữ liệu, mô hình vẫn chạy tốt là hoàn toàn sai. Bạn cần cung cấp đầy đủ các thuật toán với lượng dữ liệu lớn để xác định các bài học cho ứng dụng dựa trên Machine Learning.

Những suy nghĩ sai lầm về machine learning - Ảnh 4.

Bất cứ lĩnh vực nào cũng có thể sử dụng Machine Learning

Đây là một sai lầm khá phổ biến ở rất nhiều doanh nghiệp hiện nay khiến cho chi phí tăng lên nhiều lần mà không giúp ích gì. Ví dụ như áp dụng Machine Learning cho các công việc logic theo quy trình. Bởi đơn giản, các công việc này có thể hoạt động tốt và xây dựng được kho data cho hệ thống kế toán nên việc ứng dụng Machine Learning là hoàn toàn vô dụng.

Machine Learning không gây ảnh hưởng xấu tới hoạt động của ứng dụng

Ứng dụng Machine Learning vào ứng dụng đôi khi có thể gây ra nhiều tác động tiêu cực. Machine Learning khi chạy thuật toán trên kho dữ liệu thường có độ trễ nên đưa ra các phản hồi chậm, làm mất tín mấu chốt của sản phẩm.

Thông qua bài viết trên, Bizfly Cloud đã gửi tới bạn đọc toàn bộ thông tin về những suy nghĩ sai lầm về Machine Learning mà nhiều người mắc phải. Hiện nay, nó được áp dụng nhiều trong các lĩnh vực và mang đến nhiều lợi ích nhất định. Tuy nhiên, trước khi áp dụng vào sản phẩm của mình, bạn cần tìm hiểu thật kỹ và đánh giá hiệu quả mà nó mang lại.