Giữ gìn thông tin cho các thế hệ tương lai
Cuốn sổ tay của nhà danh họa Leonardo da Vinci thật vô cùng quí giá? Nó chứa đầy những bản phác thảo tinh xảo về những suy nghĩ và các ý tưởng. Không ai có thể phủ nhận rằng đó là một di tích quí giá và độc nhất vô nhị về một tư tưởng vĩ đại.
Nhưng đối với thời đại ngày nay, với những thế hệ sau, ai là Leonardo, Marie Curie hay John Lennon? Làm thế nào để chúng ta biết về những con người này? Ai sẽ là người bảo quản những ý tưởng sáng tạo của họ hay lưu giữ những trang web cá nhân của họ? Sau hết, các nhà tư tưởng lớn, các nhà phát minh và các bộ óc sáng tạo của thời đại ngày nay đang sử dụng công nghệ mới nhất để "viết" ra những suy nghĩ của họ, thay cho việc dùng mực và giấy. Bạn có thể làm được như vậy bằng những chữ số và bức tranh.
Có thể các tài liệu số hoá đã được sáng tạo ra từ 20 năm trước, nhưng liệu chiếc máy Commodore 64 cổ lỗ có còn làm việc không khi chúng ta lôi nó ra từ trên tầng áp mái để khám phá lại sự thiên tài của họ trong khoảng thời gian 15 hay 50 năm sau? Cuốn sổ ghi chép của Leonardo có thể mở được, nhưng liệu chiếc máy tính cũ kỹ có làm việc được không? Ngay cả khi nếu chúng ta có thể bật nó lên, các lệnh điều khiển và các chương trình ứng dụng phần mềm cũ có thể làm cho máy không thể đọc được các thông tin. Và như vậy là thiên tài sẽ bị mai một.
Tất nhiên là chúng ta có thể tin tưởng được rằng, chắc chắn có một ai đó sẽ biết được phải sử dụng nó như thế nào, hay thậm chí họ còn có một chiếc máy Comomdore tại nhà nữa. Tuy nhiên, chúng ta không thể dựa vào một số ít những người nhiệt huyết để tiếp tục bảo quản nguồn di sản tư liệu và những ghi chép lịch sử, đặc biệt là đối với khối lượng khổng lồ các tài liệu số hoá đang được sáng tạo ra trên thế giới trong thời đại hiện nay.
Chúng ta hãy xem xét một vấn đề tưởng như vô hại, đó là mối liên kết chết. Bạn bấm vào một siêu liên kết mà bạn đã cất giữ, nhưng tư liệu mà bạn muốn đọc đã biến mất. Việc nó có còn được lưu giữ hay đã bị xoá là một câu hỏi. Ngày hôm sau, khi bạn phát hiện ra mối liên kết đó quay trở lại, nhưng tài liệu đó dường như đã bị sửa đổi đi đôi chút. Bạn sẽ đón nhận điều đó ra sao? Những người theo chủ nghĩa xét lại thể sẽ mỉm cười, nhưng đối với các nhà nghiên cứu và lưu trữ tư liệu thì điều này có nghĩa là một thách thức đang ngày càng tăng. Và còn có những điều khác nữa.
Mạng diện rộng toàn cầu hiện nay được ước tính đang chứa trên 250 terabytes thông tin và dung tích này vẫn đang tăng lên một cách nhanh chóng. Số lượng này lớn gấp 17 lần so với khối lượng các bộ sưu tập in trên giấy được bảo quản tại Thư viện Quốc hội Mỹ. Riêng điều này nghe đã thấy giật mình và còn nữa, cũng theo cùng một nguồn nghiên cứu, e-mail (thư điện tử) đang tạo ra khoảng 400.000 terabytes thông tin mỗi năm. Cứ xét theo lượng thông tin được tạo ra tại cơ quan của bạn, thì chính e-mail và tài liệu làm việc đã tạo nên cơ sở cho tổ chức hay doanh nghiệp của bạn. Vậy bạn có thể đảm bảo được rằng bạn sẽ vẫn có phần cứng và phần mềm máy tính thích hợp để sử dụng các tư liệu và dữ liệu quan trọng này trong tương lai không? Điều này cần có một kế hoạch dài hạn.
Các hệ thống Quản lý lưu trữ điện tử đang cải thiện một cách rõ ràng việc quản lý tức thời nguồn tài liệu, nhưng chúng có thể thực sự duy trì bộ nhớ của các tổ chức của chúng ta được bao lâu?
Công nghệ đang phát triển với một nhịp độ rất lớn, nhằm đuổi kịp với những xu thế hiện tại và mới mẻ và điều này thường để lại những thông tin cũ hơn lại đằng sau. Các format (khuôn khổ) tệp dữ liệu và các ứng dụng phần mềm đều đang không ngừng tiến hoá. Chúng ta cần phải tính đến tất cả những vấn đề trên, trước khi chúng ta bắt đầu gặp phải chứng mất trí nhớ số hoá nặng nề. Việc lưu giữ một cách đơn giản tất cả các bit và byte thông tin là một sự khởi đầu tốt, nhưng điều này vẫn chưa đủ để chúng ta có thể sử dụng lại các thông tin đó trong tương lai. Việc quản lý những khối lượng dữ liệu lớn cũng là một thách thức đáng kể. Bạn cần phải hiểu tiểu sử kỹ thuật của toàn bộ bộ sưu tập của bạn, cũng như phải có khả năng tìm kiếm một cách có hiệu quả một mẩu thông tin đơn lẻ nào đó trong toàn bộ hệ thống lưu trữ đồ sộ, đó là một chiếc kim nằm lẫn trong một đống cỏ khô.
Các thư viện luôn lưu trữ những khối lượng thông tin lớn và những kho dữ liệu lớn chính là những nơi thích hợp làm nảy sinh ý tưởng trong việc giải quyết vấn đề. Chúng ta có thể lấy thư viện quốc gia của Anh để làm ví dụ điển hình, Thư viện Anh (British Library - BL) có nghĩa vụ về mặt luật pháp và đạo lý để thu thập, bảo quản và lưu giữ toàn bộ các ấn phẩm in trên giấy đã được xuất bản ở Anh. Điều này được thực thi thông qua một bộ luật về lưu trữ hợp pháp. Trong những năm gần đây, số lượng xuất bản phẩm đầu ra của quốc gia bao gồm cả phần số hoá đang ngày càng tăng, nhưng vẫn chưa được qui định bởi luật pháp. Việc mở rộng bộ luật lưu trữ hợp pháp để bao hàm cả các xuất bản phẩm không in trên giấy đã thực hiện được một bước tiến quan trọng thông qua Nghị viện Anh trong năm 2003 và đã đạt tới đỉnh điểm bằng bộ Luật Phê chuẩn Hoàng gia thông qua vào tháng 10, đây là một nỗ lực lớn của Anh để nhằm bảo đảm rằng các xuất bản phẩm điện tử được lưu giữ cho các thế hệ tương lai.
Bộ sưu tập các tài liệu số hoá của BL cũng đang phát triển vượt quá cả số lượng lưu trữ các xuất bản phẩm trên giấy. Thư viện tiếp nhận các bộ sưu tập số hoá thông qua một loạt các phương thức: vật gửi, mua, gìn giữ và sáng tạo. Chúng được bao gói trên đĩa hay trên mạng, dưới dạng các loại đĩa CD-ROM, CD-R, DVD, đĩa mềm, các ấn phẩm trên mạng và các trang web. Chúng còn có thể tồn tại ở vô số các format logic như hình ảnh, văn bản, âm thanh (audio), các cơ sở dữ liệu tương tác hay các hệ thống thông tin địa lý. Sự đa dạng này càng làm tăng thêm tính phức tạp cho việc tìm kiếm các giải pháp bảo quản số hoá.
Việc bảo quản cần được chú ý đến trong suốt chu kỳ sống của tài liệu số hoá nhằm đạt được hiệu quả. Cần áp dụng các bước tiến thích hợp để thu nhận và lập danh mục để đảm bảo việc gìn giữ và quản lý các thông tin lưu giữ và bảo đảm rằng các tệp dữ liệu số hoá sẽ không bị thay đổi theo bất cứ cách nào. Việc bỏ qua sự bảo quản và không thực hiện các nhiệm vụ trên ở giai đoạn này sẽ giống như khi chúng ta đặt một cuốn sách lên sai kệ và như vậy sẽ không bao giờ có thể tìm lại được nó nữa, điều này cũng tồi tệ không kém gì khi chúng ta đang bảo quản cuốn sách dưới một mái nhà luôn rò rỉ nước. Thông tin có thể vẫn còn nằm lại giữa các trang giấy hay ở trong một tệp dữ liệu, nhưng bạn không thể nhìn thấy hay sử dụng được nó nữa.
Hiện nay các hệ thống mới đang được triển khai, đặc biệt là để thu thập, quản lý và bảo quản các bộ sưu tập số hoá trong Thư viện, ví dụ như Chương trình Lưu trữ mạng Web mới được thành lập gần đây. Theo Chương trình này, Thư viện Anh sẽ đảm nhận vai trò dẫn đầu trong việc đàm phán xin phép các tác giả và chủ sở hữu để có thể thu thập các trang thông tin trên mạng (websites) của Anh cùng hợp tác với các tổ chức khác trong nước và quốc tế. Trước quy mô rộng lớn và bản chất động của mạng web, hiện nay, ở Anh có tới hơn 4 triệu websites có xuất xứ của Anh và Thư viện không đặt ra mục tiêu bao quát toàn diện. Cách tiếp cận sẽ được thực hiện theo hướng có lựa chọn và dựa trên cơ sở các điều kiện tự nguyện đàm phán với các chủ sở hữu các trang web.
Thư viện Anh cũng đang hướng tới cải tiến việc lưu trữ các nguồn số hoá như một phần trong Liên minh Bảo tồn Số hoá (Digital Preservation Coalition - DPC) ở Anh. Đây là một côngxoocxium bao gồm 25 tổ chức lớn của Anh, được thành lập vào năm 2001 nhằm thúc đẩy liên kết hành động để đối phó với những thách thức cấp bách đối với việc bảo đảm lưu giữ các nguồn số hoá của Anh và để hợp tác với các tổ chức quốc tế khác trong việc gìn giữ bộ nhớ số hoá toàn cầu và nền tảng tri thức của nhân loại. Các xúc tiến như vậy sẽ mở ra định hướng bảo quản ít nhất là một số thông tin số hoá, tuy vậy vẫn cần có thêm nhiều hành động của tất cả các nước nếu chúng ta muốn tránh gặp phải một "Kỷ nguyên đen tối" số hoá trong những năm tới.
Nguồn: Thông tin KH&CN Đồng Nai, 2/2004








