RAID là gì? Những điều phải biết về công nghệ RAID
RAID là gì?
Thuật ngữ RAID là viết tắt của Redundant Array of Inexpensive Disks (hoặc Redundant Arrays of Independent Disks), xuất hiện lần đầu tiên vào cuối những năm 1980. RAID là một kỹ thuật ảo hóa cho phép gom nhiều ổ đĩa cứng vật lý thành một hệ thống ổ đĩa logic nhằm mục đích gia tăng tốc độ truy xuất dữ liệu hoặc giảm nguy cơ mất, hỏng dữ liệu do lỗi đĩa phần cứng gây ra hoặc đôi khi kết hợp cả hai mục đích trên.
Cách thức hoạt động của RAID là sao chép dữ liệu lên hai hoặc nhiều ổ cứng vật lý được liên kết với nhau bằng 1 RAID Controller. RAID Controller có thể dựa trên một trong 2 nền tảng phần cứng hoặc phần mềm.
Hầu hết các loại RAID khác nhau đều sử dụng kỹ thuật hạn chế lỗi gọi là dữ liệu 'chẵn lẻ' cho phép khả năng chịu lỗi (fault tolerance) khi dữ liệu được nhân đôi Nhờ vậy mà có thể giảm tác động của việc mất dữ liệu khi gặp phải lỗi phần cứng.
RAID có thể được sử dụng cho các ổ đĩa SATA, SAS và SSD.
Có nhiều cách cài đặt RAID khác nhau. Mỗi một loại RAID lại phục vụ một mục tiêu khác nhau dựa trên những nhu cầu cụ thể để giải quyết các yêu cầu nhất định như:
- Độ tin cậy của dữ liệu/ Data Reliability - đảm bảo dữ liệu không có lỗi.
- Tính sẵn sàng của dữ liệu/ Data Availability – đảm bảo dữ liệu khả dụng ngay cả trong trường hợp lỗi phần cứng.
- Hiệu suất dữ liệu/ Data Performance – đảm bảo truy cập dữ liệu nhanh chóng cho cả hoạt động đọc và ghi.
- Dung lượng dữ liệu/ Data Capacity – đảm bảo khả năng lưu trữ lượng dữ liệu lớn.
RAID hoạt động như thế nào?
RAID ra mắt lần đầu tiên vào năm 1987 tại trường Đại học California - Berkeley. Công nghệ này được tạo ra với mục đích kết nối các ổ đĩa cứng nhỏ hơn để tạo thành một hệ thống lưu trữ dung lượng lớn hơn để tiết kiệm chi phí.
RAID có 3 phương thức hoạt động chính để lưu trữ dữ liệu như sau:
- Striping: Đây là phương pháp phân chia dải chia dữ liệu thành các khối theo kích thước nhất định. Chúng được lưu trữ trên mỗi RAID ảnh hưởng trực tiếp đến hiệu suất truy xuất dữ liệu về sau.
- Mirroring: Phương pháp này lưu trữ những bản sao chính xác của dữ liệu các thành viên trên cùng một RAID.
- Parity: Là kỹ thuật kiểm tra tổng và phân loại dữ liệu. Các kỹ thuật chẵn - lẻ, một hàm chẵn - lẻ sẽ sử dụng tính toán cho các khối dữ liệu. Nếu có một ổ đĩa có lỗi thì sẽ tính lại dữ liệu bị thiếu từ kiểm tra tổng.
Tìm hiểu cách thức triển khai RAID
Có thể triển khai RAID bằng 2 cách: bằng phần cứng (hardware RAID) hoặc bằng phần mềm (software RAID).
1. Hardware RAID
Hardware RAID yêu cầu một controller chuyên dụng được cài đặt trong máy chủ. Hardware RAID Controller có thể được cấu hình thông qua card BIOS hoặc ROM tùy chọn trước khi hệ điều hành được khởi động. Và sau khi hệ điều hành được khởi động, các tiện ích cấu hình độc quyền có sẵn từ mỗi nhà sản xuất controller.
Hardware RAID được tạo bằng phần cứng riêng biệt. Có hai lựa chọn:
- Một chip RAID giá thành rẻ có thể được tích hợp trong bo mạch chủ.
- Tùy chọn đắt tiền hơn với controller RAID độc lập phức tạp. Các controller này có thể được trang bị CPU, bộ nhớ đệm được dự phòng bằng pin và thường là hot-swap.
Hardware RAID card thực hiện tất cả việc quản lý các RAID array, cung cấp các logical disk cho hệ thống mà không cần chi phí cao cho một phần của chính hệ thống. Ngoài ra, hardware RAID có thể cung cấp đồng thời nhiều loại cấu hình RAID khác nhau cho hệ thống, bao gồm cung cấp RAID 1 array cho ổ đĩa boot & application và RAID-5 array cho storage array lớn.
Một số hệ điều hành khác đã triển khai các khuôn khổ chung của riêng mình để giao tiếp với bất kỳ RAID controller nào và cung cấp các công cụ để theo dõi trạng thái RAID volume. Hardware RAID có một số ưu điểm so với Software RAID, chẳng hạn như:
- Không sử dụng CPU của máy tính chủ.
- Cho phép người dùng tạo phân vùng boot.
- Xử lý lỗi tốt hơn vì nó giao tiếp với các thiết bị trực tiếp.
- Hỗ trợ hot-swap.
2. Software RAID
Software RAID là một trong những giải pháp RAID rẻ nhất. Software RAID sẽ kiểm soát một số sức mạnh điện toán của hệ thống để quản lý cấu hình RAID. Nếu bạn đang tìm cách tối đa hóa hiệu suất của hệ thống, chẳng hạn như với cấu hình RAID 5 hoặc 6, tốt nhất nên sử dụng hardware-based RAID card khi bạn đang sử dụng ổ cứng HDD tiêu chuẩn.
Nhiều hệ điều hành hiện đại cung cấp triển khai Software RAID. Software RAID có thể được thực hiện như:
- Một lớp trừu tượng hóa nhiều thiết bị, do đó cung cấp một máy ảo duy nhất.
- Một lớp nằm phía trên bất kỳ file system nào và cung cấp tính năng parity protection cho dữ liệu người dùng.
- Nếu một boot drive bị lỗi, hệ thống phải đủ phức tạp để khởi động từ các ổ đĩa còn lại.
Có một số hạn chế nhất định trong việc sử dụng Software RAID để khởi động hệ thống. Chỉ RAID 1 mới có thể chứa phân vùng boot, trong khi không thể khởi động hệ thống với software RAID 5 và RAID 0.
Trong hầu hết các trường hợp, Software RAID không thực hiện hoán hot-swap và vì vậy nó không thể được sử dụng khi cần tính khả dụng liên tục.
Các kiểu RAID phổ biến
RAID được phát triển theo theo nhiều chuẩn khác nhau, mỗi chuẩn lại có sự khác biệt về hiệu năng, dung lượng lưu trữ và độ tin cậy. Có thể gom thành hai hướng phát triển RAID như sau:
- RAID theo chuẩn chung
- RAID cải tiến và phát triển theo chuẩn riêng
Các chuẩn RAID
RAID 0:
Raid 0 cần tối thiểu hai đĩa cứng, RAID 0 cho phép máy tính ghi dữ liệu theo phương thức đặc biệt được gọi là Striping. Ví dụ bạn có 8 đoạn dữ liệu được đánh số từ 1 đến 8, các đoạn đánh số lẻ (1,3,5,7) sẽ được ghi lên đĩa cứng đầu tiên và các đoạn đánh số chẵn (2,4,6,8) sẽ được ghi lên đĩa thứ hai, giúp giảm một nửa thời gian làm việc theo lý thuyết
Tổng quát là với n đĩa cứng thì mỗi đĩa chỉ cần phải đọc/ghi 1/n lượng dữ liệu được yêu cầu. Lý thuyết thì tốc độ sẽ tăng n lần..
Tuy vậy RAID 0 lại có nguy cơ mất dữ liệu cao, nguyên nhân chính nằm ở cách ghi thông tin xé lẻ vì như vậy dữ liệu không nằm hoàn toàn ở một đĩa cứng nào và mỗi khi cần truy xuất thông tin (ví dụ một file nào đó), máy tính sẽ phải tổng hợp từ các đĩa cứng.
Chỉ cần một đĩa cứng gặp trục trặc thì thông tin (file) đó coi như không thể đọc được và hư hoàn toàn dữ liệu.
Dung lượng cuối cùng của hệ thống RAID 0 bằng tổng dung lượng của các ổ đơn (hai ổ 80GB chạy RAID 0 sẽ cho hệ thống nhìn thấy duy nhất một ổ RAID 160GB).
Có thể thấy RAID 0 thực sự thích hợp cho những người dùng cần truy cập nhanh khối lượng dữ liệu lớn, ví dụ các game thủ hoặc những người chuyên làm đồ hoạ, video số.
RAID 1
Đây là dạng RAID cơ bản nhất có khả năng đảm bảo an toàn dữ liệu.
Cũng giống như RAID 0, RAID 1 đòi hỏi ít nhất hai đĩa cứng để làm việc. Dữ liệu được ghi vào 2 ổ giống hệt nhau (Mirroring). Trong trường hợp một ổ bị trục trặc, ổ còn lại sẽ tiếp tục hoạt động bình thường. Bạn có thể thay thế ổ đĩa bị hỏng mà không phải lo lắng đến vấn đề thông tin hư hỏng.
Đối với RAID 1, hiệu năng không phải là yếu tố hàng đầu nên chẳng có gì ngạc nhiên nếu nó không phải là lựa chọn số một cho những người say mê tốc độ. Tuy nhiên đối với những nhà quản trị mạng hoặc những ai phải quản lý nhiều thông tin quan trọng thì hệ thống RAID 1 là lựa chọn không thể thiếu.
Dung lượng cuối cùng của hệ thống RAID 1 bằng dung lượng của ổ đơn (hai ổ 80GB chạy RAID 1 sẽ cho hệ thống nhìn thấy duy nhất một ổ RAID 80GB).
RAID 2
Cơ chế kiểm tra lỗi của loại raid này ở mức Bit sử dụng cơ chế Hamming code, nhưng gần như mặc định các ổ cứng hiện tại đều đã tích hợp kiểm tra mức Bit bằng Hamming code do vậy loại Raid này hiện nay không còn được sử dụng nữa.
RAID 3
Đây là loại RAID đầu tiên sử dụng cơ chế dự phòng dữ liệu bằng Parity.
Parity là kết quả được tạo ra bằng việc tính toán XOR giữa các bit trong block dữ liệu đã lưu trữ. Ví dụ một file dữ liệu được chia làm 1 block lưu trữ trong 6 phần, phần lưu trữ từ Block A1 – A3 lưu trên 3 ổ cứng thì Raid 3 sẽ tính toán XOR của các bit trong từ Block 1 à 3 này thành một block parity lưu trữ trên ổ cứng thứ 4.
Khi xảy ra hư hỏng thì hệ thống sẽ tính toán lại dữ liệu từ phép toán:
A-Parity(1-3) = Block A1 Ꚛ Block A2 Ꚛ Block A3
Tuy nhiên thực tế thì hiện này loại Raid này cũng không còn được sử dụng do hiệu năng quá thấp đặc biệt là với Database do việc xử lý theo từng Bit rất mất thời gian khi lưu trữ và truy xuất.
RAID 4
RAID 4 tương tự như RAID 3 nhưng ở một mức độ các khối dữ liệu lớn hơn chứ không phải đến từng byte. Chúng cũng yêu cầu tối thiểu 3 đĩa cứng (ít nhất hai đĩa dành cho chứa dữ liệu và ít nhất 1 đĩa dùng cho lưu trữ dữ liệu Parity)
Tuy nhiên, hiện loại raid này cũng không được sử dụng nhiều nữa.
RAID 5
Đây có lẽ là dạng RAID mạnh mẽ và thông dụng nhất. Dữ liệu và bản sao lưu được chia lên tất cả các ổ cứng. Nguyên tắc này khá phức tạp
Chúng ta quay trở lại ví dụ về 8 đoạn dữ liệu (1-8) và giờ đây là 3 ổ đĩa cứng. Đoạn dữ liệu số 1 và số 2 sẽ được ghi vào ổ đĩa 1 và 2 riêng rẽ, đoạn sao lưu của chúng được ghi vào ổ cứng 3. Đoạn số 3 và 4 được ghi vào ổ 1 và 3 với đoạn sao lưu tương ứng ghi vào ổ đĩa 2. Đoạn số 5, 6 ghi vào ổ đĩa 2 và 3, còn đoạn sao lưu được ghi vào ổ đĩa 1 và sau đó trình tự này lặp lại, đoạn số 7,8 được ghi vào ổ 1, 2 và đoạn sao lưu ghi vào ổ 3 như ban đầu.
Như vậy RAID 5 vừa đảm bảo tốc độ có cải thiện, vừa giữ được tính an toàn cao. Dung lượng đĩa cứng cuối cùng bằng tổng dung lượng đĩa sử dụng trừ đi một ổ. Tức là nếu bạn dùng 3 ổ 80GB thì dung lượng cuối cùng sẽ là 160GB.
RAID 6
RAID 6 phần nào giống như RAID 5 nhưng lại được sử dụng lặp lại nhiều hơn số lần sự phân tách dữ liệu để ghi vào các đĩa cứng khác nhau. Ví dụ như ở RAID 5 thì mỗi một dữ liệu được tách thành hai vị trí lưu trữ trên hai đĩa cứng khác nhau, nhưng ở RAID 6 thì mỗi dữ liệu lại được lưu trữ ở ít nhất ba vị trí (trở lên), điều này giúp cho sự an toàn của dữ liệu tăng lên so với RAID 5.
Trong RAID 6, ta thấy rằng khả năng chịu đựng rủi ro hư hỏng cứng được tăng lên rất nhiều. Nếu với 4 ổ cứng thì chúng cho phép hư hỏng đồng thời đến 2 ổ cứng mà hệ thống vẫn làm việc bình thường, điều này tạo ra một xác xuất an toàn rất lớn. Chính do đó mà RAID 6 thường chỉ được sử dụng trong các máy chủ chứa dữ liệu cực kỳ quan trọng.
Các RAID không tiêu chuẩn
RAID 10 & RAID 01
Đây là loại Raid kết hợp giữa Raid 1 và Raid 0 nhưng là hai cơ chế hoàn toàn khác.
Raid 10: Chia dữ liệu thành hai phần bằng cơ chế Raid 0, mỗi phần lại được mirror bằng cơ chế Raid 1
Raid 01: Dữ liệu được Mirror giống nhau ở lần ghi thứ nhất theo cơ chế raid 1 nhưng lại được chia thành hai phần ở lần ghi thứ hai theo cơ chế raid 0
Xét về hiệu năng thì rõ ràng Raid 10 có ưu thế hơn hẳn cả về tốc độ truy xuất đọc và ghi so với Raid 01. Với các hệ thống đòi hòi hiệu năng cao mà vẫn đảm bảo an toàn dữ liệu thì Raid 10 là lựa chọn tối ưu.
Raid 50
Là sự kết hợp hoàn hảo giữa Raid 5 và Raid 0, dữ liệu được ghi lần đầu theo cơ chế Raid 0 nhưng lại được chia theo cơ chế Raid 5 ở lần ghi thứ hai.
Nhờ vậy loại RAID này vẫn đảm bảo tốc độ truy vấn rất tốt tương tự như RAID 10 nhưng lại tận dụng dung lượng ổ cứng tốt hơn Raid 10 rất nhiều.
Hot spare disks
Đây là một ổ cứng mà chức năng chính chỉ để sử dụng dự phòng. Khi một ổ cứng trong nhóm Raid bị hư, hệ thống sẽ tự động lấy ổ cứng HotSpare để thay thế vào ổ cứng hư nhằm đảm bảo dữ liệu được bảo vệ tối ưu nhất. Hot spare disk có thể dùng cho 1 cụm raid hoặc có thể dụng share chung cho nhiều cụm raid khác nhau.
Ưu, nhược điểm của RAID là gì?
Hiện nay RAID đã được chuẩn hóa thành nhiều cấp độ khác nhau. Mỗi cấp độ sẽ cung cấp sự cân bằng giữa việc bảo vệ dữ liệu, hiệu suất làm việc và không gian lưu trữ.
Về ưu điểm
- Sử dụng nhiều ổ cứng giúp tăng hiệu suất hoạt động.
- Khả năng khắc phục sự cố có độ chính xác cao.
- Phương pháp chia dữ liệu thành nhiều đơn vị và phân phối trên các ổ đĩa giúp khả năng đọc, ghi được thực hiện nhanh hơn.
- Dữ liệu được chứa trên nhiều ổ đĩa khác nhau giúp giảm thiểu sự cố hệ thống.
- Chi phí sử dụng ổ cứng được tiết kiệm đáng kể.
Nhược điểm của RAID
- Nếu xảy ra các sự cố có tính lặp lại sẽ làm ảnh hưởng đến các dữ liệu của các ổ đĩa khác.
- Một số cấp độ RAID chỉ duy trì được một lỗi ổ đĩa duy nhất.
- Chi phí ban đầu để tích hợp các cấp độ RAID và thiết bị lưu trữ khá tốn kém do cần nhiều ổ đĩa.
- Việc sửa chữa các ổ đĩa bị hỏng cần nhiều thời gian và chi phí.
Hướng dẫn lựa chọn cấu hình phù hợp cho từng RAID
Sử dụng RAID giúp hệ thống của bạn được lên một tầm cao mới. Tuy nhiên mọi người cần chọn lựa kiểu RAID phù hợp với cấu hình để sử dụng hiệu quả và tiết kiệm chi phí. Tùy vào nhu cầu và mục tiêu lưu trữ mà mọi người có thể tham khảo hướng dẫn dưới đây:
2 ổ cứng 1TB
Sử dụng RAID 0 nếu bạn ưu tiên việc tăng dung lượng lưu trữ và tốc độ với 2TB không gian và hiệu suất nhanh. Tuy nhiên nếu có một ổ cứng hỏng thì toàn bộ dữ liệu sẽ mất.
Dùng RAID 1 để bảo vệ dữ liệu sao chép dữ liệu giữa hai ổ và giữ nguyên dung lượng 1TB. Dữ liệu của bạn vẫn được lưu trữ an toàn nếu một ổ bị hỏng.
3 ổ cứng 1TB
RAID 5 là lựa chọn tốt nếu bạn đang cân nhắc giữa hiệu suất và bảo mật. RAID 5 cung cấp dung lượng 2TB, dữ liệu không bị mất nếu một ổ cứng gặp sự cố.
4 ổ cứng 1TB
RAID 5: Dung lượng lưu trữ tăng lên 3TB và vẫn bảo toàn dữ liệu nếu có một ổ bị lỗi.
RAID 6: Giúp bạn tăng cường bảo mật hơn nữa với dung lượng 2TB và dữ liệu vẫn được bảo vệ nếu có 2 ổ cứng gặp sự cố.
RAID 10: Là sự kết hợp bảo mật và hiệu suất với 2TB dung lượng lưu trữ. RAID 10 có thể chịu đựng sự cố nếu một cặp ổ cứng gặp trục trặc.
5 hoặc 6 ổ cứng 1TB
Các bạn có thể chọn RAID 5 tùy thuộc vào mức độ bảo mật mong muốn với hiệu suất tốt. Nếu muốn có độ an toàn cao hơn thì mọi người chọn RAID 6.
Tham khảo: http://searchstorage.techtarget.com/definition/RAID