ReCAPTCHA và những tranh cãi về reCAPTCHA
ReCAPTCHA dùng để ngăn chặn những request không xuất phát từ con người. Tuy nhiên sau khi áp dụng reCAPTCHA, mặt tiêu cực mà reCAPTCHA mang lại còn nhiều hơn rất nhiều so với việc ngăn chặn đó. Cùng Bizfly Cloud tìm hiểu những thông tin cần biết về reCAPTCHA ngay tại bài viết này nhé.
3. Tranh cãi về reCAPTCHA là gì
Như đã nói ở bài viết trước, reCAPTCHA dùng để ngăn chặn những request không xuất phát từ con người. Tuy nhiên sau khi áp dụng reCAPTCHA, mặt tiêu cực mà reCAPTCHA mang lại còn nhiều hơn rất nhiều so với việc ngăn chặn đó.
a. reCAPTCHA làm tiêu tốn thời gian của người dùng
Mỗi lần giải một bài test reCAPTCHA, thời gian trung bình được ghi nhận được là 20 giây, chưa kể có thể người dùng sẽ phải giải lại nếu như không qua bài test. Đặc biệt, thời gian để giải bài test tăng lên rất nhiều nếu như Google nghi ngờ người dùng không phải người mà là chương trình tự động, các bài test trở nên khó hơn rất nhiều và thời gian giải xong bài test có thể kéo dài hơn 1 phút. Nếu như mỗi lần truy cập vào một trang web nào đó mà phải giải reCAPTCHA thì chính reCAPTCHA là một nguyên nhân làm giảm lượng truy cập của người dùng do làm người dùng cảm thấy khó chịu.
Thêm nữa, reCAPTCHA càng ngày càng khó làm thời gian giải càng tăng, dẫn đến việc giải các bài test reCAPTCHA càng làm mất thời gian của người dùng hơn.
b. reCAPTCHA là "một công việc không được trả lương"
Trái ngược lại việc mất thời gian của người dùng, Google lại được hưởng lợi từ việc người dùng kiểm tra các bài test đó. Với reCAPTCHA v1 và v2, kết quả của những bài test sẽ được Google sử dụng để luyện tập (training) cho những AI nhận diện chữ viết và hình ảnh của mình. Ngay cả ở những tổ chức khác, công việc này hoàn toàn được trả lương với các vị trí đại loại như "chuyên viên nhận diện hình ảnh", "chuyên viên phân loại hình ảnh" hay "chuyên viên gắn tag hình ảnh". Đối lập với tiền lương của các vị trí đó, việc test reCAPTCHA không hề mang lại một đồng lương nào cho người dùng.
c. reCAPTCHA loại bỏ một số người dùng đặc biệt ra khỏi thế giới web
reCAPTCHA v1 và v2 chỉ có hai cách để người dùng thực hiện test duy nhất là: nhận diện hình ảnh (nhìn) và nhận diện từ (nghe). Điều đó đã làm một số người dùng không thể thực hiện hai hình thức test đó như người khiếm thị, người khiếm thính, chấn thương,… Do vậy, reCAPTCHA được mong muốn sẽ loại bỏ các chương trình tự động và cho phép con người vượt qua bài test lại đang loại bỏ chính con người.
d. reCAPTCHA và việc đánh giá
reCAPTCHA v2 và v3 đánh giá người dùng thông qua cả một số thông tin của người dùng như cookie, số lần kích chuột hoặc nhấn trên màn hình, ngôn ngữ hiển thị, trình duyệt đang sử dụng, máy tính, tablet hay smartphone,… Tất cả những dữ liệu đấy đều là các dữ liệu cá nhân và đều được gửi đến Google khi test. Sau một số lần thay đổi chính sách về dữ liệu thu thập được từ reCAPTCHA [2], giờ đây người dùng không thể biết được dữ liệu đó Google sẽ làm gì. Nếu như người dùng cố tình không cung cấp các thông tin đó cho Google bằng một cách nào đó, thuật toán sẽ đánh giá rằng người dùng đó có tính "máy" hơn dẫn đến việc người dùng phải chọn "dữ liệu người dùng hoặc reCAPTCHA".
Với reCAPTCHA v3, Google lại càng có các quyền và các phương pháp để thu thập dữ liệu của người dùng hơn mà Google tuyên bố sử dụng cho việc đánh giá. Các chủ trang web khi muốn áp dụng v3 vào trang web của mình phải thêm các đoạn code có tính chất thu thập hành vi người dùng để tăng thêm khả năng đánh giá. Đương nhiên, các thông tin được thu thập sẽ được gửi cho Google.
Thuật toán của Google còn một số đánh giá theo đúng như câu nói sau: "Nếu bạn có tài khoản Google thì bạn có tỉ lệ cao không phải là chương trình tự động." Câu nói đó cũng đồng nghĩa với việc "Nếu bạn không có tài khoản Google thì bạn sẽ có khả năng là chương trình tự động cao hơn những người có tài khoản Google." Điều đó đồng nghĩa với việc nếu bạn có tài khoản Google, bạn sẽ gặp reCAPTCHA ít hơn, bạn sẽ không phải mất thời gian cho những bài test đó nữa. Vì vậy, hãy dùng các dịch vụ như Google Chrome, Gmail, Youtube,… để không bị làm phiền bởi reCAPTCHA. Không rõ là cố tình hay vô tình, Google như đang cố gắng bắt ép người dùng sử dụng các dịch vụ của Google bằng reCAPTCHA.
Việc sử dụng quyển lực mềm bắt người dùng sử dụng dịch vụ của mình được gọi là Vendor lock-in, mà một số những Vendor được nhắc đến nhiều nhất về vấn đề này là Apple và Google.
4. Nguyên nhân gặp reCAPTCHA và một số cách giảm tần suất gặp reCAPTCHA
Dưới đây sẽ là một số nguyên nhân dẫn đến tình trạng gặp reCAPTCHA. Đồng thời, một số giải pháp để giảm thiểu tình trạng gặp phải reCAPTCHA khi duyệt web trên trình duyệt. Lưu ý rằng các giải pháp không phải là hoàn hảo 100%, đôi lúc hoàn toàn không có tác dụng và bạn sẽ vẫn gặp phải reCAPTCHA khi áp dụng các giải pháp trên, nhưng tần suất gặp phải sẽ ít hơn so với việc không áp dụng giải pháp nào cả. Tuy nhiên, có một số giải pháp liên quan đến các dịch vụ và thói quen mà người dùng sử dụng cho nên việc lựa chọn giải pháp nào còn tùy thuộc vào nhu cầu của bản thân mỗi người.
a. Sử dụng các trình duyệt không phải là Google Chrome
Như đã nói ở trên, nếu như không sử dụng trình duyệt Google Chrome, Google sẽ đánh giá bạn không phải là người sử dụng bình thường thấp hơn so với khi bạn sử dụng trình duyệt của Google. Nếu như vấn đề trình duyệt nào không phải là vấn đề và bạn hay gặp phải reCAPTCHA, chuyển đổi sang Google Chrome có thể giảm thiểu tình trạng gặp reCAPTCHA thường xuyên.
Ngoài ra, Google Chrome còn đi kèm với việc đăng nhập tài khoản Google, nên việc đăng nhập vào tài khoản Google sẽ giúp người dùng ít gặp reCAPTCHA hơn.
Sử dụng dịch vụ của Google sẽ ít gặp phải reCAPTCHA hơn
b. Tắt các tính năng Cookie và các thiết lập thu thập dữ liệu người dùng
Nếu như trình duyệt được tắt Cookie, Google sẽ có ít thông tin hơn và việc đánh giá người dùng sẽ khó khăn hơn. Vì vậy, tỉ lệ gặp reCAPTCHA sẽ cao hơn so với việc bật Cookie và các thiết lập gửi dữ liệu người dùng trong trình duyệt cũng tương tự. Tương tự, tính năng trình duyệt ẩn danh cũng làm người dùng dễ gặp reCATPCHA hơn do việc ẩn danh hạn chế một số thông tin mà trình duyệt gửi đi khi duyệt web.
c. Vấn đề IP thứ nhất: IPv4
Một số nhà mạng (ISP) hiện tại đã hết các dải IPv4 cấp cho cá nhân và hộ gia đình, vì vậy một giải pháp giải quyết tạm thời mà ISP sử dụng là sử dụng NAT. Việc này không ảnh hưởng quá nhiều đến việc truy cập mạng của người dùng nhưng lại ảnh hưởng đến việc Google "nhìn" người dùng. Với NAT, một số hộ gia đình sẽ sử dụng chung một IPv4 public nên theo góc nhìn của Google, một địa chỉ IPv4 public đó truy cập vào rất nhiều trang web tích hợp reCAPTCHA nên "Hệ thống của chúng tôi đã phát hiện lưu lượng truy cập bất thường từ mạng máy tính của bạn."
Một trong những cách giải quyết được coi là đơn giản nhất là bật chế độ dual stack IPv4 và IPv6.
d. Vấn đề IP thứ hai: Hệ thống mạng nội bộ lớn
Do một số tính chất đặc thù của việc thiết lập hệ thống mạng, ví dụ như các hệ thống mạng cho công ty, tổ chức, tòa nhà, việc truy cập ra Internet chỉ sử dụng một số địa chỉ IP public nhất định cho rất nhiều máy tính, nên việc gặp reCAPTCHA khi sử dụng các hệ thống mạng đó, tương tự với trường hợp ở trên, sẽ nhiều hơn khi sử dụng các hệ thống mà sử dụng ít thiết bị truy cập.
Một số cách giải quyết có thể là reset địa chỉ IP định kì,… tuy nhiên vẫn phải đảm bảo không ảnh hưởng đến các chính sách và an toàn khi thiết lập các hệ thống mạng.
e. Vấn đề IP thứ ba: VPN
Một số VPN sẽ cho phép người dùng giấu đi rất nhiều thông tin của bản thân khi duyệt web. Tương tự với trường hợp b, Google sẽ khó đánh giá người dùng hơn. Điều này sẽ có thể trở nên rất xấu nếu như Google đánh giá IP của VPN là "bất thường" dẫn đến việc người dùng bắt gặp reCAPTCHA rất nhiều. Tuy nhiên, hầu như không có cách nào để khắc phục vấn đề VPN với reCAPTCHA.
f. Malware
Một số malware, đặc biệt là botnet sử dụng để DDoS, có thể gửi một số lượng rất lớn các request tự động mà người dùng không hay biết, dẫn tới việc lượng truy cập từ mạng của người dùng tăng lên một cách bất thường.
Để tránh trường hợp này, người dùng phải tăng cường các biện pháp nâng cao an toàn cho máy tính, dữ liệu và hệ thống mạng của mình. Một số cách có thể kể đến như: Diệt Malware trong máy tính, đặt mật khẩu an toàn cho router,…
Bizfly Cloud là nhà cung cấp dịch vụ điện toán đám mây với chi phí thấp, được vận hành bởi VCCorp.
Bizfly Cloud là một trong 4 doanh nghiệp nòng cốt trong "Chiến dịch thúc đẩy chuyển đổi số bằng công nghệ điện toán đám mây Việt Nam" của Bộ TT&TT; đáp ứng đầy đủ toàn bộ tiêu chí, chỉ tiêu kỹ thuật của nền tảng điện toán đám mây phục vụ Chính phủ điện tử/chính quyền điện tử.
Độc giả quan tâm đến các giải pháp của Bizfly Cloud có thể truy cập tại đây.
DÙNG THỬ MIỄN PHÍ và NHẬN ƯU ĐÃI 3 THÁNG tại: Manage.bizflycloud