Nghiên cứu giới thiệu về phần mềm mã nguồn mở Dspace 5.4 và ứng dụng vào
xây dựng và quản lý tài nguyên số tại Trường Đại học Bách khoa, Đại học Đà Nẵng.
Nghiên cứu này phân tích những ưu điểm và hạn chế của phần mềm nhằm khai thác và ứng
dụng vào việc quản lý tài nguyên số tại Trung tâm Học liệu và truyền thông. Đồng thời đề
xuất phương pháp chuyển đổi kho dữ liệu số từ các hệ thống cũ sang hệ thống mới và chính
sách cập nhật dữ liệu dàng cho từng đối tượng, từng đơn vị. Với đề xuất nghiên cứu này sẽ
giúp cho việc quản lý hệ thống tài nguyên số được thuận tiện hơn, bảo đảm tính pháp lý của
tác giả và đơn vị sở hữu bản quyền của sản phẩm. Ngoài ra, hệ thống sẽ được kết nối với
nguồn tài liệu các đơn vị khác để được đồng bộ và triển khai rộng rãi.
6 trang |
Chia sẻ: Thục Anh | Ngày: 19/05/2022 | Lượt xem: 273 | Lượt tải: 0
Nội dung tài liệu Ứng dụng phần mềm mã nguồn mở DSPACE 5.4 trong xây dựng và quản lý tài nguyên số, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Võ Đức Hoàng 219
Ứng dụng phần mềm mã nguồn mở DSPACE 5.4
trong xây dựng và quản lý tài nguyên số
Võ Đức Hoàng1
1 Khoa Công nghệ Thông tin, Trường Đại học Bách khoa, Đại học Đà Nẵng
hoangvd.it@dut.udn.vn
Tóm tắt: Nghiên cứu giới thiệu về phần mềm mã nguồn mở Dspace 5.4 và ứng dụng vào
xây dựng và quản lý tài nguyên số tại Trường Đại học Bách khoa, Đại học Đà Nẵng.
Nghiên cứu này phân tích những ưu điểm và hạn chế của phần mềm nhằm khai thác và ứng
dụng vào việc quản lý tài nguyên số tại Trung tâm Học liệu và truyền thông. Đồng thời đề
xuất phương pháp chuyển đổi kho dữ liệu số từ các hệ thống cũ sang hệ thống mới và chính
sách cập nhật dữ liệu dàng cho từng đối tượng, từng đơn vị. Với đề xuất nghiên cứu này sẽ
giúp cho việc quản lý hệ thống tài nguyên số được thuận tiện hơn, bảo đảm tính pháp lý của
tác giả và đơn vị sở hữu bản quyền của sản phẩm. Ngoài ra, hệ thống sẽ được kết nối với
nguồn tài liệu các đơn vị khác để được đồng bộ và triển khai rộng rãi.
Từ khóa: Phần mềm mã nguồn mở, tài nguyên số, Dspace, kho dữ liệu.
1 Đặt vấn đề
Hoạt động đào tạo và nghiên cứu khoa học của Trường Đại học Bách khoa đã tạo ra một khối
lượng tài liệu đặc biệt có giá trị. Đó là các giáo trình, các tập bài giảng của giảng viên, các Khoá
luận Tốt nghiệp của sinh viên, các Luận văn Thạc sỹ của học viên, các Luận án Tiến sỹ của
nghiên cứu sinh, các công trình nghiên cứu khoa học của giảng viên và sinh viên đăng tải trên các
tạp chí khoa học, các kỷ yếu hội nghị khoa học Chúng được gọi chung là nguồn tài liệu nội sinh
và thông tin mà các nguồn tài liệu này cung cấp được gọi là nguồn thông tin nội sinh.
Nguồn thông tin nội sinh của trường đại học là yếu tố phản ánh đầy đủ và hệ thống các thành
tựu và tiềm năng khoa học của một trường đại học và có vai trò quan trọng trong công tác đào
tạo của nhà trường. Các nguồn thông tin này ngày càng phong phú, đa dạng và luôn chứa đựng
những thông tin mới nhất trong lĩnh vực mà nó xem xét, rất cần được quản lý và khai thác một
cách hiệu quả. Một thuận lợi là các nguồn thông tin này thường được lưu trữ dưới dạng tệp văn
bản, tức là đã được số hoá và về cơ bản nhà trường có quyền sử dụng, không gặp nhiều khó
khăn trong vấn đề bản quyền.
Năm 2017, Trung tâm Học liệu và truyền thông, Trường Đại học Bách khoa được thành lập
kế thừa từ Trung tâm Thông tin học liệu của Đại học Đà Nẵng. Việc kế thừa nguồn thông tin nội
sinh đã có và cập nhật nguồn thông tin mới là vấn đề cần thiết và cấp bách.
Ngày nay cùng với sự phát triển mạnh mẽ của Công nghệ Thông tin và mạng Internet đã làm
thay đổi nhiều lĩnh vực trong đời sống con người và trong đó có ngành Thông tin - Thư viện.
Cùng với sự phát triển của công nghệ, nhu cầu đọc và văn hóa đọc của con người cũng dần thay
đổi. Bên cạnh tài liệu truyền thống (dạng in ấn), dạng tài liệu số đã và đang được phổ biến và
được người đọc quan tâm bởi tính tiện lợi của chúng. Tài liệu số được sử dụng không giới hạn
về không gian và thời gian. Tài liệu số phát triển nhanh mạnh, đòi hỏi các thư viện phải có phần
mềm để quản lý. Có rất nhiều phần mềm dùng để quản lý các bộ sưu tập số, bao gồm cả phần
220 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC”
mềm thương mại và phần mềm mã nguồn mở miễn phí. Mỗi phần mềm đều có ưu và nhược
điểm riêng. Đối với các đơn vị có kinh phí hạn chế, giải pháp lựa chọn phần mềm mã nguồn mở
là lựa chọn tối ưu. Hiện nay, trên thế giới có 2 phần mềm mà nguồn mở được sử dụng rộng rãi
dùng để xây dựng, quản lý các bộ sưu tập số là GreenStone [3] và Dspace [2]. Tuy nhiên, qua
quá trình sử dụng, phần mềm mà nguồn mở DSpace được đánh giá tốt hơn bởi các tính năng nổi
trội của nó. Hiện nay, có hơn 1.000 trường đại học và các tổ chức văn hoá sử dụng phần mềm số
DSpace để quản lý và chia sẻ nguồn tài nguyên: sách, tạp chí, luận văn và các sưu tập hình ảnh,
âm thanh và phim...
2 Vài nét về phần mềm mã nguồn mở DSpace
Dspace do Công ty Hewlett-Packard (HP) và thư viện MIT (Massachusetts Institute of
Technology) phát triển vào năm 2002. DSpace là một hệ thống mã nguồn mở được miễn phí
cho các tổ chức, các thư viện, các cơ quan nghiên cứu phát triển và mở rộng. DSpace cung cấp
một phương thức mới trong việc tổ chức và xuất bản thông tin trên internet. Từ khi ra đời cho
đến nay DSpace luôn được cải tiến nhằm đáp ứng mạnh mẽ các nhu cầu thiết yếu của thư viện
và người dùng. Đến nay, năm 2017 phần mềm đã phát triển đến phiên bản 6.x. Đồng thời các
phiên bản ra đời sau DSpace cho phép nâng cấp dễ dàng từ các phiên bản trước đó. Tuy nhiên,
qua quá trình thử nghiệm phiên bản 5.x hiện đang hoạt động khá ổn định và được ứng dụng
rộng rãi tại các đơn vị trong nước và trên thế giới.
2.1 Vai trò chính của DSpace
DSpace được sử dụng như một phần mềm lưu trữ và phân phối tài liệu số với ba vai
trò chính:
Giúp cho việc thu nhận và quản lý tài liệu số dễ dàng, bao gồm siêu dữ liệu của tài liệu;
Giúp cho việc truy cập tài liệu được dễ dàng (bao gồm liệt kê và tìm kiếm);
Giúp cho việc bảo quản tài liệu được lâu dài.
2.2 Ưu điểm của phần mềm Dspace 5.x
Ngoài những tính năng cơ bản được kế thừa từ phiên bản 4.x [1] như: hệ quản trị cơ sở dữ
liệu, bảo mật, chức năng tìm kiếm, định dạng tài liệu và nhập xuất bản ghi.. DSpace 5.x còn có
những ưu điểm nổi bật như sau:
Cho phép nâng cấp DSpace dễ dàng từ bất kỳ phiên bản nào trước đây sang phiên
bản 5.x;
Cho phép nhập/xuất dữ liệu, siêu dữ liệu từ giao diện diện web, giúp người quản trị có
thể thực hiện trực tiếp không cần nhiều kiến thức về CNTT;
Phân quyền và bảo mật mạnh. Có thể phân quyền đến từng tài khoản người dùng, đến
từng bộ sưu tập hoặc thậm chí đến từng tài liệu. Các quyền được cấu hình khá chi tiết
như: Quyền xem biểu ghi thư mục, quyền xem toàn văn... Ngoài ra, DSpace 5.x còn cho
phép phân quyền truy cập theo cơ chế tài khoản truy cập hoặc qua địa chỉ IP;
Tích hợp các công cụ cho phép người dùng xem nội dung dữ liệu trực tuyến như văn
bản (.doc, .xlx, .ppt), âm thanh, hình ảnh, phim.
Võ Đức Hoàng 221
Xác nhận cho phép quyền tải tài liệu là người cập nhật tài liệu (người quản trị không thể
thực hiện) vì vậy sẽ đảm bảo cơ chế sở hữu trí tuệ quyền tác giả.
2.3 Hạn chế Dspace
Chưa có tính năng phát hiện trùng tài liệu khi nhập dữ liệu.
3 Tổng quan về hệ thống
3.1 Mô hình đề xuất hệ thống tài nguyên số DUT
Hình 1. Mô hình đề xuất tổ chức thông tin
Trước khi đưa tài liệu vào các bộ sưu tập, ta nên đề ra chính sách khai thác tài liệu đối với
các bộ sưu tập số để cấu hình cho các đơn vị và bộ sưu tập. Cần xác định người dùng và nhóm
người dùng để có thể phân quyền cụ thể về quyền truy cập, quyền xem trực tuyến, quyền tải về,
quyền yêu cầu như vậy sẽ dễ dàng quản lý và thay đổi quyền khi cần thiết.
Cần phân cấp quyền cho đơn vị và bộ sưu tập đến cấp quản lý từng khoa, phòng, dự án để
các đơn vị có thể tự động cập nhật dữ liệu và bảo đảm quyền sở hữu tác giả đối với các tài
nguyên số.
3.2 Kiến trúc hệ thống
Kiến trúc hệ thống của Dspace là một kiến trúc ba lớp:
Lớp lưu trữ;
Lớp nghiệp vụ;
Lớp ứng dụng.
Các lớp lưu trữ được thực hiện bằng cách sử dụng hệ thống tập tin, quản lý bởi các bảng
trong cơ sở dữ liệu PostgreSQL. Lớp nghiệp vụ là lớp các chức năng cụ thể của Dspace, bao
gồm cả các module luồng công việc, quản lý nội dung, quản trị, tìm kiếm và duyệt tài liệu. Mỗi
222 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC”
module có một API để cho phép Dspace tùy chỉnh, nâng cấp các chức năng phù hợp với từng
đối tượng. Cuối cùng, lớp ứng dụng bao gồm các giao diện cho hệ thống giao diện người dùng
web và bộ xử lý theo lô, đặc biệt còn hỗ trợ OAI (Open Archives Initiative) và xử lý máy chủ để
giải quyết định danh liên tục (Handle) đến các biểu ghi trong Dspace.
3.3 Metadata (siêu dữ liệu)
Dspace sử dụng siêu dữ liệu chuẩn Dublin core để mô tả các thông tin về tài nguyên điện tử
cần lưu trữ, phân phối. Trong đó có 3 yếu tố (thông tin) bắt buộc phải mô tả: Nhan đề, ngôn
ngữ, ngày đăng, các yếu tố còn lại là tùy chọn. Ngoài ra, có một số các yếu tố bổ sung cho tài
liệu: tóm tắt, từ khóa, siêu dữ liệu kỹ thuật và siêu dữ liệu quyền. Các siêu dữ liệu này được
hiển thị trong biểu ghi của tài liệu trong hệ thống Dspace và được lập chỉ mục để hỗ trợ tìm
kiếm, duyệt thông tin trong hệ thống (duyệt theo Bộ sưu tập, theo chủ đề, theo các đơn vị thành
viên của tổ chức). Hệ thống hỗ trợ kết xuất siêu dữ liệu và tài liệu điện tử trong kho lưu trữ
theo dạng chuẩn XML, và hiện đang phát triển để hỗ trợ chuẩn METS đối với các siêu dữ liệu
kỹ thuật và siêu dữ liệu quyền cho các định dạng kỹ thuật số tùy ý.
3.4 Giao diện người dùng
Dspace sử dụng giao diện người dùng dạng web-based. Có 3 giao diện người dùng trong hệ
thống Dspace: Giao diện người dùng cho những người tham gia trong quá trình đăng xuất bản
phẩm điện tử; Giao diện cho người dùng tin: tìm kiếm, duyệt thông tin trong kho lưu trữ; Giao
diện người dùng cho người quản trị. Giao diện cho người dùng tin hỗ trợ tìm kiếm và nhận
thông tin trả về bằng cách duyệt hoặc tìm kiếm siêu dữ liệu. Một biểu ghi thỏa mãn các điều
kiện tìm kiếm trong kho lưu trữ sẽ được trả về, người dùng tin có thể tải tài liệu điện tử gắn với
biểu ghi thông qua các siêu liên kết, người dùng tin có thể xem trực tiếp nội dung tài liệu trên
DSpace 5.x không cần phải cài đặt thêm các tích hợp.
3.5 Luồng công việc trong Dspace 5.x
Bằng cách áp dụng mô hình luồng công việc, Dspace là một kho lưu trữ tài liệu điện tử mã
nguồn mở giải quyết những vấn đề phức tạp của một thư viện khoa học. Cơ chế phân quyền
Đơn vị và Bộ sưu tập có thể tạo cho mỗi đơn vị khoa, phòng, trung tâm, cá nhân là một thư viện
số có thể toàn quyền xử lý hoặc cho phép các đơn vị được trao đổi dữ liệu lẫn nhau mà không
cần phải chuyển đổi vị trí lưu dữ liệu. Cơ chế quản lý của DSpace 5.x tự động xác định loại tài
liệu điện tử phải nộp là gì? Ai là người gửi tài liệu? Ai là người duyệt? Ai được xem và ai là
người bị hạn chế xem các tài liệu này Mỗi thành viên trong Dspace đều được gán các quyền
thích hợp với vai trò của mình: vai trò người đăng tài liệu điện tử, vai trò người biên tập siêu dữ
liệu, vai trò quản trị các bộ sưu tập, vai trò quản trị hệ thống Có 2 cách để tạo lập, quản trị bộ
sưu tập số. Cách thứ nhất, thư viện có thể quy định tất cả mọi bạn đọc đều có quyền đăng tài
liệu điện tử, và bất kỳ người dùng nào (trong nội bộ và bên ngoài) đều có quyền xem các tài liệu
đã được đăng tải. Cách thứ hai, thư viện có thể tổ chức mô hình lưu trữ và phân phối tài liệu
chặt chẽ hơn: các tác giả nộp các tài liệu điện tử do mình tạo lập, sau đó sẽ có một bộ phận chịu
trách nhiệm biên tập siêu dữ liệu và người có quyền cao nhất sẽ quyết định có xuất bản tài liệu
đó không. Như vậy mỗi bước trong quá trình đăng tài liệu điện tử sẽ được xem xét, phê duyệt
trước khi tài liệu đó được đưa vào bộ sưu tập, các tài liệu điện tử không được thông qua trong
quá trình này sẽ không được phép lưu trữ trong hệ thống Dspace.
Võ Đức Hoàng 223
4 Một số hình ảnh triển khai
Với giao diện thiết kế trang chủ có thể hiển thị danh mục các đơn vị quản lý trong thư viện
số giúp người dùng có thể dễ dàng truy cập đến tài nguyên đơn vị mà cần tìm. Đồng thời việc tổ
chức duyệt theo một số tính năng như: tác giả, chủ đề, năm xuất bản hỗ trợ thuận tiện và
nhanh chóng trong việc tìm kiếm tài liệu. Với cơ chế tìm kiếm tiêu đề, danh mục và trong cả nội
dung, được hỗ trợ tìm kiếm tiếng Việt không dấu DSpace 5.4 đã tối ưu hóa thời gian của
người dùng.
Hình 2. Giao diện trang chủ
Hình 3. Duyệt dữ liệu theo nhan đề
5 Kết luận
Việc triển khai ứng dụng phần mềm mã ngưồn mở DSpace tại Trường Đại học Bách khoa
thực sự đem lại hiệu quả cao cho công tác quản lý, lưu trữ nguồn tài liệu nội sinh đã có kết hợp
cùng việc cập nhật mới. Với việc triển khai ứng dụng phần mềm mã nguồn mở DSpace 5.4 tại
Trường Đại học Bách khoa đã thu được một số kết quả như sau:
224 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC”
Triển khai và sử dụng sản phẩm tại Trung tâm Học liệu và truyền thông với địa chỉ
“” hoàn chỉnh với các chức năng: đăng ký thành viên,
biên mục, kết nối dữ liệu
Xây dựng giao diện thống nhất và hiện đã được kết nối đến hệ thống tài nguyên số của
Đại học Đà Nẵng.
Xây dựng đơn vị, bộ sưu tập để phân quyền đến từng Phòng, Khoa, Bộ môn hoặc dự án
để có thể lưu trữ tài nguyên số.
Xây dựng cơ chế cập nhật tài liệu cũ đã có và chia sẻ thông tin tài liệu của các đơn vị.
Tuy nhiên hiện DSpace đã phát triển các phiên bản mới 6.x, nghiên cứu sẽ tiếp tục nâng cấp
và hoàn thiện hơn để phục vụ công tác quản lý tài liệu tại trường Đại học Bách khoa.
Hệ thống sẽ được tiếp tục nghiên cứu và phát triển để tích hợp công cụ phát hiện trùng lặp
nội dung nhằm cảnh báo công tác nhập nội dung trùng lặp và sao chép luận văn.
Tài liệu tham khảo
1. Phan Ngọc Đông, Thư viện hướng đến tương lai: Hợp tác, tiến bộ và phát triển, Trường Đại học
Khoa học Xã hội & Nhân văn - Đại học Quốc gia TP. Hồ Chí Minh, DOI: 10.13140/2.1.4027.6800
(2014).
2. https://dspace.org/.
3.
Các file đính kèm theo tài liệu này:
- ung_dung_phan_mem_ma_nguon_mo_dspace_5_4_trong_xay_dung_va_q.pdf