Ngày nay, khi mà khối lượng thông tin của con người ngày càng nhiều về lượng, phong phú về nội dung, đa dạng về hình thức thì nhu cầu về lưu trữ và đặc biệt là bảo vệ chúng cũng càng trở nên cấp thiết và nóng không kém. Hãy tưởng tượng một công ty đầu tư nước ngoài vào làm ăn ở Việt Nam, cuối năm kết toán sổ sách báo cáo về công ty mẹ xem lời lãi như nào. Nhưng rủi thay dữ liệu bị mất hết thì Giám đốc công ty có đáng đem ra trảm không? Rồi ăn nói sao với cơ quan thuế vụ? Càng vi tính hóa (paperless) thì càng chết nhiều. Còn riêng với anh em HD thì nhu cầu bảo vệ phim, nhạc, dữ liệu như thế nào thì có lẽ tôi không cần nhắc lại.




1/ Mất dữ liệu

Trước khi đi vào phần chính – phần bảo vệ dữ liệu HD, tôi nghĩ các bạn cũng cần nên biết một chút về thế nào là mất dữ liệu. Vì có biết về mất dữ liệu thì mới biết cách bảo vệ dữ liệu cho đúng đắn và hiệu quả. Cũng như khi ra trận đánh giặc thì phải biết giặc là ai thì mới đánh được chứ, chả nhẽ đánh vào không khí à? Có người nói tôi rườm rà, dài dòng, nhưng tính tôi nó thế. Khi làm thì phải biết mình đang làm cái gì, kết quả ra sao. Còn như không biết thì không làm, chứ không theo kiểu Thiên Lôi ai sai đâu đánh đó. Mong các bạn thông cảm.

Mất dữ liệu được xem là một tình trạng lỗi trong các hệ thống thông tin mà ở đó các dữ liệu bị mất sạch, không còn được truy xuất được nữa. Điều này xảy ra có thể trong quá trình thực thi tác vụ, truyền tải hoặc lưu trữ.





Ta phải cần phân biệt một điều là mất dữ liệu nó khác với trường hợp dữ liệu không sẵn sàng để sử dụng. Ta lấy ví dụ khi bạn đang xem phim qua Youtube giữa chừng thì bị đứt mạng. Bạn có thể truy cập được dữ liệu để coi tiếp không? Dĩ nhiên là không rồi, nhưng bạn có cho rằng bị mất dữ liệu không hay chỉ tạm thời thôi rồi khi nào nối mạng lại thì xem được tiếp?

Mặc dù cả hai trường hợp trên đều cho những hậu quả tương tự cho người dùng, tức không truy xuất được dữ liệu, nhưng dữ liệu không sẵn sàng chỉ mang tính là tạm thời, trong khi mất dữ liệu có thể được coi là mất vĩnh viễn.

Ngoài ra còn một trường hợp mất dữ liệu nữa mà ta thường hay nghe, đặc biệt trên các báo đài. Mất dữ liệu ở đây thật ra không phải là người chủ dữ liệu đó bị mất (vẫn còn nguyên vẹn trong tay ấy chứ) mà là các dữ liệu (nhạy cảm ấy) bị hack cho bên thứ 3 biết. Thiệt hại từ sự cố này cũng đáng kể chứ chẳng chơi. Ví dụ như dữ liệu nhạy cảm về công nghệ chế tạo máy bay tàng hình không người lái tác chiến trên tàu sân bay của Mỹ mà rơi vào tay nước “lạ” xem, chuyện sẽ không nhỏ đâu. Hoặc như các dữ liệu về hợp đồng mua bán thậm thụt với nước ngoài bị mất vào tay các phương tiện truyền thông xem, sẽ có khối anh Giám đốc vào nhà đá gỡ lịch hoặc về nhà đuổi gà cho vợ.

Các loại mất dữ liệu

Do hành động cố ý: Các dữ liệu bị xóa với sự chủ ý của người dùng.
Do hành động vô ý: gồm
- Tình cờ xóa một tập tin hoặc chương trình.
- Thất lạc phương tiện lưu trữ như ổ cứng, tape, đĩa CD hay thẻ nhớ
- Quản trị dữ liệu tồi
- Không đọc được dữ liệu chứa trong các định dạng lạ

Lỗi hư hỏng

- Mất điện , dẫn đến dữ liệu trong bộ nhớ tạm không được lưu kịp thời vào nơi lưu trữ lâu dài.
- Lỗi phần cứng, chẳng hạn như một vụ tai nạn của đầu đọc trong một đĩa cứng.
- Lỗi phần mềm bị sụp hoặc bị treo dẫn đến dữ liệu cũng không được lưu đúng đắn.
- Phần mềm bị lỗi trong quá trình viết hoặc khả năng sử dụng kém , chẳng hạn như không xác nhận lệnh xóa một tập tin.
- Dữ liệu tự nó bị hư hỏng ngầm – Xin xem về bài viết nói về Data Rot.

Các thảm họa

- Thiên tai, động đất, lũ lụt, lốc xoáy, v..v...
- Lửa

Tội phạm

- Trộm cắp, đột nhập, phá hoại, v..v...
- Các hành động ác ý chẳng hạn như lén lút thả virus, worm, và hacker cũng như hành động trộm cắp các phương tiện lưu trữ vật lý.

Tóm lại, trong một nghiên cứu được đăng trên Wiki cho thấy lỗi phần cứng và lỗi của con người là hai nguyên nhân phổ biến nhất gây mất mát dữ liệu, nó chiếm khoảng ba phần tư của tất cả các sự cố mất dữ liệu. Nguyên nhân nữa làm mất dữ liệu là các thảm họa tự nhiên. Tuy nhiên khả năng mất dữ liệu do thảm họa tự nhiên là nhỏ. Cách duy nhất để chuẩn bị cho một biến cố thương đau là mất dữ liệu, tôi và các bạn không biết phải làm gì hơn là chủ động chọn cho mình một phương pháp hữu hiệu nhằm bảo vệ lấy nhưng dữ liệu yêu quý của mình đã dày công sưu tầm trong bằng ấy năm nay.


2/ Chọn lựa phần mềm – Software

- Bám vào các tiêu chuẩn khi chọn lựa: So với việc chọn lựa phần cứng đòi hỏi sự tỉ mỉ cẩn thận ở bài 1, thì việc chọn lựa phần mềm ở đây khá đơn giản. Tuy nhiên nó vẫn không kém phần quan trọng. Cũng giống như ở phần cứng, ta vẫn phải bám chặt lấy những tiêu chuẩn được đề ra ngay từ đầu. Tôi lấy vì dụ tại sao nó quan trọng. Tiêu chuẩn đề ra là khi nghe nhạc hoặc xem phim thì một ổ cứng và chỉ có một ổ cứng làm việc thôi, những cái còn lại phải ở trong trạng thái nghỉ. Nếu như tôi chọn standard RAID 5 thì coi như phá sản rồi chứ gì nữa?!?!

- Ngoài ra, do tính chất đặc thù của một hệ thống chỉ chuyên lưu trữ dữ liệu, nên ta cố gắng càng ít cài các loại phần mềm vớ vẩn càng tốt. Chủ yếu nhằm tiết kiệm tài nguyên hệ thống, máy khởi động được nhanh, ngoài ra còn nhằm tránh các trường hợp xung đột phần mềm không đáng có.

Hệ Điều Hành

Dĩ nhiên rồi vì hệ thống lưu trữ nào mà không cần nó. Bạn có thể dùng HĐH Windows hay Linux (2 loại thông dụng hiện nay dành cho lưu trữ) là tùy nhu cầu, điều kiện và sở thích của bạn. Tôi chọn Windows vì sự phổ dụng của nó đối với người dùng gia đình. Ngoài ra nếu mình bị bí thì chạy lên mạng hỏi sẽ dễ được trả lời hơn. Giả dụ như tôi “lúa” không biết cách mount ổ cứng thì trong Windows sẽ có nhiều người biết và dễ dàng chỉ cho tôi so với Linux. Hay cái ổ cứng đã được format ở NTFS, thì khi nhổ phăng từ máy chủ có thể đem đi cắm vào bất cứ máy dùng HĐH Windows, khỏe re như bò kéo xe, khỏi lăn tăn suy nghĩ cách đổi định dạng. Đó là tôi đang nói chúng ta – những người dùng gia đình thôi. Còn đối với các doanh nghiệp lớn, lượng thông tin lưu trữ nhiều theo tôi biết ít ai dám can đảm như chúng ta mà dùng Windows lắm. Một điều dễ thấy là hệ điều hành mở quản lý dữ liệu mạnh mẽ và bảo mật hơn Windows nhiều lắm luôn và vì không thuộc phạm trù bài viết này nên tôi không tiện nói nhiều.

Đồng ý là Windows rồi nhưng mà là Windows gì? Theo kinh nghiệm cá nhân tôi thì dùng Windows nào cũng được. Từ Vista, 7, 8 cho đến Server Essential (thay thế cho WHS 2011), 2K3, 2K8, hay 2012. Nhưng ổn định nhất (mà tôi cũng thấy nhiều người đang sử dụng là Windows 7 và Windows Server 2012). Tôi hiện đang dùng Server 2012 (vì cho nó giống như mấy cái server của tôi ở chỗ làm ..hì..hì..)

Nếu bạn để ý thì sẽ thấy từ đầu đến giờ tôi phần nhiều hay dùng từ ‘hệ thống’ này ‘hệ thống’ nọ thay vì nói server cho nó gọn. Chỉ là một cái máy lưu trữ thôi chứ có gì đồ sộ lằng nhằng ghê gớm gì đâu mà dùng từ đao to búa lòe thiên hạ? Đó là do tôi đã tính trước sợ các bạn sẽ bối rối hỏi tôi vậy server lưu trữ thì phải dùng Windows server thôi chứ không được dùng các loại Windows khác hả.

Có người bảo tôi Windows server với cơ chế họat động chuyên biệt của nó có thể không cần reboot trong nhiều ngày, thậm chí nhiều tháng. Tôi biết và đồng ý chuyện đó. Tuy nhiên tôi có người bạn đang dùng Windows 7 để lưu trữ (xin nhớ chỉ dùng thuần túy lưu trữ à nghen) thế mà hơn 6 tháng không cần reboot vẫn chạy ngọt ngào phà phà. Còn như nếu bạn còn dùng nó để search web, bittorent, mấy thứ linh tinh, thậm chí chơi game thì tình huống sẽ khác.

Windows 32 hay 64 bit không quan trọng hay ảnh hưởng nhiều, nhưng do việc tính toán RAID sẽ cần nhiều bộ nhớ (> 4GB nếu dung lượng lưu trữ nhiều) khi tính toán parity nên tốt nhất bạn nên cài loại 64 bit. Ngoài ra có nhiều bạn thích dùng remote desktop control để truy cập vào máy từ xa (headless), trừ phi bạn sẽ dùng Windows Server, nếu dùng Windows 7 hoặc 8 thì lần cài lần khó ta nên “chơi lun” từ loại Pro trở lên.

Phần mềm bảo vệ dữ liệu

Để bảo vệ dữ liệu, như đã nói ở phần trên, ngày nay phổ biến có 3 cách hoặc là dùng backup, hoặc là dùng RAID và hoặc là … dẹp đi hổng xài nữa nên không cần bảo vệ (cái này mới chế ra…). Nói đùa vậy thôi, ít thì được chứ nhiều dữ liệu quá (như phim HD chẳng hạn) thì dùng phương án backup rõ ràng là không hiệu quả rồi. Xin xem những hạn chế của backup trong bài “RAID bạn biết gì về nó”.

Còn đối với RAID thì sao? Lựa loại RAID nào? Để có được sự lựa chọn chính xác, tôi đã dùng phương pháp loại suy.

Trước tiên là Hardware RAID. Anh này khỏe mạnh, nhanh nhẹn, gọn gàng rồi. Tuy nhiên vật cản lớn nhất là cái giá của nó. Vâng với cái giá chát như vậy khó lòng mà một người dùng gia đình với tới được. Hoặc giả có với tới được cũng … không ngu gì. Loại!

Còn Fake (hay Host) RAID thì sao? Những giới hạn cố hữu của nó là: thứ nhất chết theo với firmware. Firmware của nhà sản xuất cho phép mình thiết lập RAID như thế nào thì phải theo y chang như thế ấy, nếu có gặp bug thì cũng ráng chịu. Khả năng bug được sửa vừa chậm vừa ít. Thứ hai là chết theo board (ở đây là motherboard và card board Sata rời). Giả như cái mainboard hay cái card rời chán sống muốn quy tiên sớm, bạn còn không lo nhanh chân kiếm cái y chang vậy về thế liền. Nhưng nếu lỡ may hàng không có (sau vài năm hết nhập về vì không lời, hoặc nhà máy ngưng lâu rồi không sản xuất nữa), tôi chắc rằng có người đang kiếm cho mình sợi dây đặng treo cổ chết cho rồi! Vâng, loại luôn.

Cuối cùng là software RAID. Nói về software RAID thì một rừng cũng không khác gì thị trường smartphone ngày nay vậy. Vấn đề là lục trong đống hổ lốn đó thằng nào là thích hợp cho yêu cầu của mình mới là quan trọng: HTC One? iPhone 5S, Samsung Galaxy Note 3, hay Sony Xperia Z1…? Nếu như bên smartphones sẽ có sự tranh luận nảy lửa khi bênh vực cho loại phone mình đang xài thì bên software RAID cũng sẽ không khác gì.
Trên thị trường hiện này ngoài những software RAID được viết chuyên sâu đặc biệt cho một phần cứng nào đó ví dụ như Synology, Qnap, Buffalo hay cao cấp hơn dùng cho các doanh nghiệp là EMC, NetApp, DataDomain,..., ta còn có các loại software RAID viết mang tính phổ thông, đa dạng và tính tương thích cao đối với đa phần các loại máy lưu trữ gia đình. Trong đó phải kể đến các bậc cao thủ đã và đang làm mưa làm gió như unRAID, ZFS, FlexRAID, disParity,SnapRAID, Storage Spaces, and Btffs.

Dưới đây là bảng so sánh từng đặc điểm của chúng. Trong trường hợp bạn sẽ lựa một trong chúng (tôi cũng đang xài một trong chúng) thì bạn sẽ quyết định lựa thằng software RAID nào?




(còn tiếp)