Thông tin, dữ liệu đã luôn có vai trò ảnh hưởng quan trọng đối với
nền kinh tế công nghiệp. Tuy nhiên khi đến thời đại CMCN 4.0 thì nó
chiếm giữ ở vị trí số 1 và trở thành động lực chính tạo ra giá trị gia tăng
cho xã hội. Trước đây dữ liệu chỉ được sinh ra bởi con người với các
phương tiện thô sơ thủ công, thì nay dữ liệu có thể được thu thập một
cách tự động từ các thiết bị cảm biến thông qua nền tảng công nghệ IoT.
Dự tính đến 2023 trên thế giới sẽ có khoảng 50 tỷ thiết bị IoT (nguồn
statista.com). Chúng cung cấp ra một khối lượng dữ liệu khổng lồ về
hình ảnh, âm thanh, các số liệu đo đạc được thu thập từ hiện trường.
Ngoài ra công nghệ cũng cho phép con người thực hiện ghi chép và tạo
ra dữ liệu ở mọi lúc, mọi nơi và được ghi lưu lại một cách dễ dàng và
nhanh chóng. Ngày nay trên các mạng xã hội lớn như Facebook, Twitter
cứ sau mỗi phút thì một khối lượng lớn thông tin được tạo thêm từ các
chia sẻ của người dùng.
14 trang |
Chia sẻ: Thục Anh | Ngày: 19/05/2022 | Lượt xem: 279 | Lượt tải: 0
Nội dung tài liệu Xây dựng hệ sinh thái dữ liệu mở cùng cách mạng công nghiệp 4.0, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ủa các nước. Ví dụ, bảng xếp hạng
của Open Knowledge Foundation (index.okfn.org) đang thực hiện đánh
giá dựa trên 6 tiêu chí gồm: cấp phép mở; định dạng mở và máy đọc
được; có thể tải về một lần; có cập nhật thường xuyên; công bố rộng rãi;
và miễn phí sử dụng. Các tiêu chí này yêu cầu tương đương với mức
độ 3 theo tiêu chuẩn 5 sao như kể trên. Theo kết quả đánh giá mới nhất,
Đài Loan, Úc, Anh, Pháp, Phần Lan hiện đang dẫn đầu trong tổng số 94
quốc gia trên bảng xếp hạng. Việt Nam vẫn còn nằm trong những nước
chưa được đưa vào bảng đánh giá xếp hạng về dữ liệu mở (do chưa có
đủ nguồn thông tin để thực hiện đánh giá).
Ngoại trừ các hệ thống cũ đã có từ trước, hạ tầng dữ liệu được xây
dựng cho các hệ thống mới cần ưu tiên đạt tối thiểu mức độ 4. Khi đó
phải thiết lập một hệ thống các chuẩn định danh duy nhất và các thuật
ngữ dùng chung để mô tả dữ liệu và siêu dữ liệu. Chúng nên được áp
dụng thống nhất trên phạm vi của cả quốc gia, ưu tiên sử dụng những
326 XÂY DỰNG VÀ KHAI THÁC TÀI NGUYÊN GIÁO DỤC MỞ
chuẩn đã được quốc tế hóa. Ví dụ trong lĩnh vực thông tin khoa học
công nghệ, hệ thống mã quốc tế DOI được khuyến khích áp dụng để
định danh các công bố khoa học; mã ORCID để định danh người nghiên
cứu; các thuật ngữ của Dublin Core được dùng cho các1miêu tả siêu dữ
liệu. Việc áp dụng các chuẩn định danh và thuật ngữ dùng chung là yêu
cầu cần thiết để tạo thuận lợi cho quá trình trao đổi và tích hợp dữ liệu
trong một hệ sinh thái mở.
5.XÂY DỰNG HỆ SINH THÁI DỮ LIỆU MỞ TẠI VIỆT NAM
Việt Nam đang ở giai đoạn sơ khai của quá trình chuyển đổi số. Hạ
tầng dữ liệu quốc gia vẫn chưa được sẵn sàng. Đặc biệt ở trong khu vực
công, dữ liệu hiện chưa có nhiều và thường được quản lý khá manh mún.
Một số hệ thống CSDL tập trung vẫn còn đang trong quá trình triển khai
thông qua kế hoạch ưu tiên xây dựng 6 CSDL quốc gia về dân cư, đất đai,
đăng kí doanh nghiệp, dân số và tài chính. Do đó việc xây dựng hệ sinh
thái dữ liệu mở tại Việt Nam sẽ là một thách thức lớn do chúng ta còn
thiếu nhiều kinh nghiệm trong quản lý và khai thác dữ liệu lớn.
Tuy nhiên nhận thức về sự cần thiết xây dựng hạ tầng dữ liệu mở
đã được thể hiện trên thực tế trong các đề án xây dựng đô thị thông
minh tại một số thành phố lớn. Ví dụ trong Đề án của Thành phố Hồ
Chí Minh, “Trung tâm kho dữ liệu dùng chung và phát triển hệ sinh thái
dữ liệu mở” là một trong bốn trụ cột công nghệ sẽ được xây dựng. Hiện
Thành phố đã đưa vào vận hành Cổng khai thác dữ liệu mở tại địa chỉ
https://data.hochiminhcity.gov.vn. Dữ liệu mở được cung cấp trên Cổng
tương đương với mức độ 3 của tiêu chuẩn 5 sao. Tuy nhiên còn có một
thiếu sót lớn là tất cả các bộ dữ liệu được đăng tải trên Cổng chưa được
gắn với bất kì với một giấy phép truy cập mở nào.
Một đề án xây dựng hạ tầng dữ liệu khác ở quy mô quốc gia là
xây dựng Hệ tri thức Việt số hóa. Mặc dù không được đề cập trực tiếp,
nhưng toàn bộ mục tiêu và nội dung của Đề án hoàn toàn phù hợp với
mô hình xây dựng một hệ sinh thái dữ liệu và tài nguyên truy cập mở tại
Việt Nam. Hiện nay các sản phẩm của Đề án được công bố và đưa vào
vận hành khai thác tại địa chỉ https://itrithuc.vn. Các dự án thành phần
của Đề án hiện nay gồm có: Kho dữ liệu mở, Kho ứng dụng, Kho chia
327PHẦN 3. Công nghệ và công cụ cho tài nguyên giáo dục mở
sẻ kiến thức, Kho tài nguyên giáo dục, Kho di sản số hóa, Nền tảng dữ
liệu bản đồ Việt Nam, và Nền tảng dữ liệu tiếng Việt. Tuy nhiên cách
tiếp cận xây dựng của các dự án chưa thực sự đáp ứng được các yêu cầu
phát triển bền vững dựa trên mô hình của hệ sinh thái mở. Các lí do cụ
thể được mô tả sau đây.
Thứ nhất, chỉ có Dự án “Kho dữ liệu mở” là đã được công bố mở
gắn với giấy phép CC BY-NC (không được thương mại hóa). Tất cả các
dự án khác đều chưa được công bố mở. Do vậy sẽ rất khó khăn cho việc
phát triển hệ sinh thái, cho phép đổi mới sáng tạo ra các nội dung, dịch
vụ và ứng dụng mới dựa trên các dữ liệu được chia sẻ. Các nhà phát
triển và người sử dụng sẽ gặp phải các vướng mắc bởi vấn đề pháp lí
khi bản quyền sử dụng không rõ ràng.
Thứ hai, chưa hình thành được mạng lưới tổ chức hỗ trợ cộng
đồng dữ liệu mở. Hiện nay toàn bộ Đề án đang được điều hành bởi Cục
Thông tin khoa học & công nghệ quốc gia trực thuộc Bộ Khoa học &
Công nghệ. Cơ quan này chỉ nên đóng vai trò thực hiện chức năng quản
lý của nhà nước trong việc thúc đẩy các chính sách về xây dựng hệ sinh
thái dữ liệu mở. Các hoạt động cụ thể của Đề án chỉ có thể xã hội hóa
được khi có một tổ chức phi lợi nhuận đảm nhiệm vai trò xây dựng
mạng lưới, thực hiện tư vấn, tập huấn cho các tổ chức, cá nhân tham gia
đóng góp vào việc tạo lập dữ liệu. Tổ chức phi lợi nhuận này cần hoạt
động như doanh nghiệp để có thể thu hút được nhiều nguồn tài trợ cả
trong và ngoài chính phủ phục vụ triển khai các dự án mở theo đúng các
chuẩn mực quốc tế.
Thứ ba, chưa có các chính sách cụ thể để khuyến khích hình thành
các mô hình kinh doanh dựa trên hệ sinh thái dữ liệu mở. Đây là yếu
tố then chốt quyết định tới sự phát triển bền vững của các dự án triển
khai trong Đề án. Tham gia vào hệ sinh thái sẽ không chỉ có các đơn vị
tạo lập và chia sẻ dữ liệu, mà cần có cả các đối tác phát triển ứng dụng,
cung cấp các dịch vụ giá trị gia tăng trên cơ sở khai thác dữ liệu mở. Họ
sẽ liên tục đổi mới, sáng tạo ra những mô hình kinh doanh mới tạo ra
giá trị kinh tế để đóng góp ngược trở lại cho hệ sinh thái.
328 XÂY DỰNG VÀ KHAI THÁC TÀI NGUYÊN GIÁO DỤC MỞ
Thứ tư, các nguyên tắc FAIR chưa được tuân thủ để hướng tới tạo
dựng được hạ tầng kĩ thuật đạt chuẩn mức độ 5 hỗ trợ dữ liệu liên kết
mở. Hiện tại các dữ liệu được công bố trong Kho dữ liệu mở của Đề án
mới đạt chuẩn mức độ 1 (còn sử dụng định dạng pdf không dùng được
cho máy đọc). Chuẩn dữ liệu sử dụng trong các kho dữ liệu khác của Đề
án thì chưa có các mô tả cụ thể được công bố. Để tránh lãng phí nguồn
lực, tất cả các dự án xây dựng mới dữ liệu được khuyến cáo phải xem
xét đạt chuẩn tối thiểu mức độ 4.
Dữ liệu là nguyên liệu tạo ra các tri thức cho tương lại. Xây dựng
hệ sinh thái dữ liệu mở là hướng đi theo đúng xu thế chung trên toàn thế
giới. Tuy nhiên nó là công việc rất phức tạp, đòi hỏi sự nhất quán và kiên
trì theo đuổi để đạt được mục tiêu trong dài hạn. Khó có thể tạo ra được
hệ sinh thái dữ liệu mở có thể mang lại ngay lợi ích kinh tế trong thời gian
ngắn hạn. Các cách tiếp cận làm dự án dữ liệu mở chạy theo phong trào
sẽ nhanh chóng lỗi thời, hết giá trị sử dụng do không được nuôi dưỡng
bởi một hệ sinh thái. Mặc dù có rất nhiều thách thức, nhưng Việt Nam là
nước đi sau nên có cơ hội học hỏi kinh nghiệm các nước đi trước để chọn
ra được các cách làm đúng, tránh được sự lãng phí trong các đầu tư.
TÀI LIỆU THAM KHẢO
1. The World Bank Group, “Starting an Open Data Initiative”, truy cập ngày
20/8/2019 tại https://opendatatoolkit.worldbank.org/en/starting.html
2. European Data Portal, “Creating Value through Open Data”, truy cập
ngày 20/8/2019 tại https://www.europeandataportal.eu/en/highlights/
creating-value-through-open-data
3. James Manyika, Michael Chui, Diana Farrell, Steve Van Kuiken, Peter
Groves, and Elizabeth Almasi Doshi, “Open data: Unlocking innovation
and performance with liquid information”, truy cập ngày 20/8/2019 tại
https://www.mckinsey.com/business-functions/digital-mckinsey/our-
insights/open-data-unlocking-innovation-and-performance-with-liquid-
information
4. Lê Trung Nghĩa, “Rất cần khoa học mở cho CMCN 4.0”. Tạp chí Tia
sáng, truy cập ngày 20/8/2019 tại
tao/Rat-can-khoa-hoc-mo-cho-CMCN-40--10878
329PHẦN 3. Công nghệ và công cụ cho tài nguyên giáo dục mở
5. Thanh Nhàn, “Mở dữ liệu chính phủ - Kinh nghiệm từ Vương quốc Anh”,
Tạp chí Thông tin và Truyền thông, truy cập ngày 20/8/2019 tại http://
ictvietnam.vn/tuong-tac/mo-du-lieu-chinh-phu-kinh-nghiem-tu-vuong-
quoc-anh.htm
6. Zeleti, F. A., Ojo, A., & Curry, E. (2014). “Emerging Business Models for
the Open Data Industry: Characterization and Analysis”. In Proceedings
of the 15th Annual International Conference on Digital Government
Research (pp. 215–226).
7. Wilkinson, M. D. et al. “The FAIR Guiding Principles for scientific data
management and stewardship”, Scientific Data. Vol 3, 2016.
Các file đính kèm theo tài liệu này:
- xay_dung_he_sinh_thai_du_lieu_mo_cung_cach_mang_cong_nghiep.pdf