Tầm quan trọng và đo lường CDN Cache Hit ratio

901
20-06-2018
Tầm quan trọng và đo lường CDN Cache Hit ratio

Nhắc lại khái niệm chung cơ bản nhất về Cache hit: Cache hit xảy ra khi nội dung mà client yêu cầu được tìm thấy trong bộ nhớ cục bộ (local storage), và các dữ liệu này là cập nhật nhất khi so sánh với cùng một nội dung được lưu trữ trên máy chủ gốc (origin server).

Tỉ lệ Cache Hit 

Tỉ lệ Cache hit (tiếng Anh là Cache Hit Percentage, viết tắt: CHP) cung cấp thông tin chính xác về số lượng file được cung cấp từ CDN mà không có bất kỳ request nào đến máy chủ gốc (origin server). Trong bài này, Bizfly Cloud sẽ tập trung vào những yếu tố có ảnh hưởng đến CHP và các cách bạn nên thực hiện để cải thiện tỉ lệ này. Tỷ lệ truy cập bộ nhớ cache (The cache hit ratio) sẽ chỉ áp dụng cho các vùng kéo (pull zones).

CHP được đo trong tất cả các file được phân phối từ pull zones bất kể kích thước tệp hoặc loại tệp là gì. CHP có thể thay đổi đáng kể tùy thuộc vào môi trường và các thiết lập. Một CHP điển hình cho một trang web bình thường có thể dễ dàng đạt tới mức cao 95%.

Để hiểu rõ hơn về Cache hit và Cache miss, đừng bỏ lỡ bài viết sau trước khi bạn tìm hiểu sâu hơn về chúng ngay dưới đây nhé: Cache hit và Cache miss là gì? Phân biệt như thế nào?

Các yếu tố ảnh hưởng tới CDN Cache Hit ratio 

1. Chuỗi truy vấn (Query strings) hay qs là gì

Nếu chuỗi truy vấn (viết tắt là QS) không bị bỏ qua, mỗi QS sẽ tạo một cache entry mới. Đây là một tính năng quan trọng để phân biệt các phiên bản khác nhau của một tệp nhưng nó sẽ gây ra các cache entries bổ sung nếu không được sử dụng đúng cách. QS có thể được bỏ qua (xem zone settings) và bất kể chuỗi truy vấn, nó sẽ luôn được cache dưới dạng cùng một tệp.

2. Hết hạn tiêu đề (Expire headers) 

Expire headers quyết định thời gian tài nguyên được lưu trữ trong bộ nhớ đêm của máy chủ trung gian như CDN. Nếu cấu hình expire headers không đúng tài nguyên sẽ không được lưu trữ trong bộ nhớ đệm của CDN dẫn đến việc phải tải lại từ máy chủ gốc và giảm hiệu quả của CDN, do đó làm giảm CDN Cache Hit ratio.

BizFly CDN sẽ tôn trọng tất cả tiêu đề HTTP từ máy chủ gốc (và ghi đè chúng như được xác định trong dashboard). Việc xác định các giá trị hết hạn có ý nghĩa là thao tác vô cùng quan trọng giúp giảm việc sử dụng tài nguyên và giảm thời gian tải trang.

Xem thêm Bizfly CDN tại https://bizflycloud.vn/cdn

3. Purge (Lọc)

Mỗi lần thực hiện lọc (toàn bộ vùng hoặc một tệp cụ thể) sẽ xóa nội dung trên tất cả các POPs của CDN. (Các) tệp sẽ được cache một lần nữa.

4. Tệp mới (New files)

Mỗi khi tệp mới xuất hiện lần đầu tiên tại máy chủ gốc, chúng cần được tải xuống và được cache từ mỗi POP trên toàn bộ. Điều này sẽ dẫn đến một cache miss cho mỗi tệp và mỗi POP.

5. Nội dung do người dùng tạo (long tail content)

Mẫu lưu lượng truy cập cũng sẽ có tác động rất lớn đến CHP. Trong trường hợp nội dung được tạo bởi người dùng, các tệp mới luôn cần được lưu vào bộ nhớ cache mọi lúc (điều này sẽ dẫn đến CHP thấp hơn theo như phân tích ở mục 4 phía trên).

Tầm quan trọng và đo lường CDN Cache Hit ratio - Ảnh 1.

6. Nội dung không thể lưu vào bộ nhớ cache (Not cacheable content)

Thực tế không phải tất cả các tệp đều có thể lưu vào bộ nhớ cache. Các tệp sẽ chỉ được lưu trong bộ nhớ cache dựa trên tiêu đề kiểm soát lưu đệm (cache-control-header). Các tệp có cookie sẽ không được lưu vào bộ nhớ cache nếu cookie không bị tước đi (xem zone settings).

Cách kiểm tra một cache hit/miss

Một tiêu đề HTTP riêng biệt ("X-Cache") sẽ cho biết một request là một cache hit hay miss. Điều này có thể dễ dàng được kiểm tra bằng lệnh "curl" trên bất kỳ máy Linux/ Unix nào, bằng lệnh sau đây:

curl -I https://website-7.kxcdn.com/img/logo.png

HTTP/1.1 200 OK 

Server: nginx

Date: Sun, 02 Nov 2014 04:48:02 GMT 

Content-Type: image/png

Content-Length: 6396 

Connection: keep-alive

Vary: Accept-Encoding 

Last-Modified: Sat, 26 Apr 2014 12:11:29 GMT

ETag: "535ba271-18fc" 

Alternate-Protocol: 443:npn-spdy/3,443:npn-spdy/2

Strict-Transport-Security: max-age=31536000; includeSubdomains; preload 

Expires: Sun, 09 Nov 2014 04:48:02 GMT

Cache-Control: max-age=604800 

Link: ; rel="canonical"

X-Cache: MISS 

X-Edge-Location: nlam 

Access-Control-Allow-Origin: * 

Accept-Ranges: bytes

Ngoài ra, các tiêu đề HTTP cũng có thể được kiểm tra trực tuyến với các dịch vụ như Pingdom (http://tools.pingdom.com/)

Nếu CHP thấp hơn dự kiến, điều quan trọng bạn phải làm ngay đó là xem xét kỹ hơn và thu hẹp nguyên nhân gốc rễ có thể xảy ra. Trong hầu hết các trường hợp, tỉ lệ này luôn có thể được cải thiện với các bước được đề xuất ở trên.

Chúc các bạn thành công!

GIANG

Kể từ ngày 05/11/2018, VCCloud chính thức đổi tên thành BizFly Cloud - là nhà cung cấp các dịch vụ đám mây hàng đầu tại Việt Nam hiện nay với các dịch vụ nổi bật như: BizFly Cloud Server, BizFly CDN, BizFly Load Balancer, BizFly Pre-built Application, BizFly Business Mail, BizFly Simple Storage. Hãy tăng tốc thích nghi cho doanh nghiệp cùng các giải pháp công nghệ của BizFly Cloudtại đây.

SHARE