Caching/Cache là gì? Website cache như thế nào?

Caching/Cache là gì? Website cache như thế nào?

Caching/Cache là gì?

Bộ nhớ đệm là quá trình lưu trữ các bản sao của tệp trong bộ đệm hoặc vị trí lưu trữ tạm thời, để chúng có thể được truy cập nhanh hơn. Về mặt kỹ thuật, bộ đệm là bất kỳ vị trí lưu trữ tạm thời nào cho các bản sao của tệp hoặc dữ liệu, nhưng thông thường thuật ngữ này được sử dụng để chỉ các công nghệ Internet. DNS server lưu trữ DNS record để tra cứu nhanh hơn, CDN server lưu trữ nội dung để giảm độ trễ, trình duyệt web lưu các tệp HTML, JavaScript và hình ảnh để tải trang web nhanh hơn.

Để hiểu hơn về cách thức hoạt động của bộ nhớ cache, hãy tưởng tượng đến một kho thực phẩm và các nguồn cung cấp thực phẩm khác trong tình huống sau đây. Khi nhà thám hiểm Roald Amundsen thực hiện hành trình trở về từ chuyến đi đến Nam Cực vào năm 1912, ông và các bạn đồng hành của mình đã sử dụng những kho chứa thức ăn mà họ đã cất giữ dọc đường trong quá trình thám hiểm. Điều này hiệu quả hơn nhiều so với việc chờ đợi nguồn cung thực phẩm được chuyển từ trại căn cứ. Bộ nhớ cache trên Internet phục vụ với mục đích tương tự như thế; Cache website tạm thời lưu trữ "nguồn cung cấp" hoặc nội dung cần thiết cho người dùng để thực hiện hành trình của người dùng trên website.

CDN Caching là gì?

CDN (mạng phân phối nội dung) lưu trữ nội dung (hình ảnh, video, webpage...) trong các proxy server được đặt gần người dùng cuối hơn so với server gốc. (Máy chủ proxy là máy chủ nhận request từ client và chuyển chúng đến các server khác.) Vì server gần với người dùng thực hiện yêu cầu hơn nên CDN có thể gửi nội dung nhanh hơn.

Caching/Cache là gì? Website cache như thế nào? - Ảnh 1.

Hãy nghĩ CDN cũng giống như một chuỗi các cửa hàng tạp hóa: Thay vì phải đi đến tất cả các trang trại nơi thực phẩm được nuôi trồng cách xa hàng trăm dặm, người mua hàng chỉ cần đi đến cửa hàng tạp hóa địa phương nơi gần hơn rất nhiều. Bởi vì các cửa hàng tạp hóa dự trữ thực phẩm từ các trang trại xa, việc mua sắm thực phẩm sẽ chỉ còn mất vài phút thay vì vài ngày di chuyển. Tương tự, CDN cache đóng vai trò như kho lưu trữ những nội dung sẽ xuất hiện trên Internet giúp các trang web tải nhanh hơn nhiều.

Nội dung được cache như thế nào?

Khi người dùng yêu cầu nội dung từ một trang web bằng CDN, CDN sẽ tìm nạp nội dung đó từ server gốc, sau đó lưu một bản sao nội dung cho các request trong tương lai. Nội dung được lưu trong cache CDN sẽ được tải xuống khi người dùng tiếp tục yêu cầu.

Cache hit và cache miss

Cache hit là khi thiết bị khách đưa ra request vào bộ đệm cho nội dung và bộ đệm đó có chứa nội dung được lưu. Cache miss xảy ra khi bộ đệm không có nội dung được yêu cầu. Trong trường hợp cache miss, CDN server sẽ chuyển request đến server gốc, sau đó lưu nội dung khi server gốc phản hồi, do đó các request tiếp theo sẽ dẫn đến cache hit.

>> Xem thêm: Cache hit và Cache miss là gì? Phân biệt như thế nào?

Dữ liệu được lưu trong bộ nhớ cache trong CDN server bao lâu?

Khi các website phản hồi CDN server với nội dung được yêu cầu, website sẽ đính kèm thông tin vào nội dung để thông báo các server biết thời gian lưu trữ. Thông tin này được lưu trữ trong một phần của phản hồi được gọi là HTTP header chỉ định việc nội dung sẽ được lưu trữ trong bao lâu, được gọi là TTL expire (TTL). Khi hết hạn, bộ đệm sẽ xóa nội dung. Một số CDN cũng sẽ lọc các tệp khỏi bộ đệm nếu nội dung không được yêu cầu trong một thời gian hoặc khách hàng CDN tự xóa nội dung nhất định.

Các bộ nhớ đệm khác hoạt động như thế nào?

Web cache diễn ra khi trình duyệt lưu một bản sao các tệp từ một website vào ổ cứng của người dùng. Khi một trang web được lưu vào bộ nhớ cache, trình duyệt chỉ cần tải các phần mới hoặc phần cập nhật của trang, điều này cho phép trình duyệt phân phối trang nhanh chóng ngay cả khi kết nối Internet chậm. Các trình duyệt lưu các tệp này cho đến khi hết hạn hoặc cho đến khi bộ nhớ cache của ổ cứng đầy. Người dùng cũng có thể xóa bộ nhớ cache của trình duyệt nếu muốn.

DNS caching diễn ra trên các DNS server. Các server lưu trữ các tra cứu DNS gần nhất trong bộ đệm để không phải truy vấn nameserver và có thể trả lời ngay lập tức bằng địa chỉ IP của domain.

Các công cụ tìm kiếm có thể lưu trữ các trang web thường xuyên xuất hiện trong kết quả tìm kiếm để trả lời các truy vấn của người dùng ngay cả khi trang web tạm thời bị hỏng hoặc không thể phản hồi.

Nguồn: tech.vccloud.vn

>> Có thể bạn quan tâm: Tỉ lệ Cache Hit (CHP) trong CDN là gì? Tầm quan trọng và cách đo lường

BizFly Cloud là hệ sinh thái điện toán đám mây được vận hành bởi VCCorp - Công ty dẫn đầu trong lĩnh vực công nghệ và truyền thông tại Việt Nam. Với đội ngũ kỹ thuật viên trình độ cao và kinh nghiệm lâu năm làm việc trên các công nghệ khác nhau như cloud, mobile, web..., chúng tôi có đủ khả năng để hỗ trợ đưa ra những giải pháp và công nghệ toàn diện giúp doanh nghiệp chuyển đổi số thành công. Dành cho độc giả quan tâm tới các dịch vụ đám mây do BizFly Cloud cung cấp có thể truy cập tại đây.