Trong thập kỷ qua, lượng dữ liệu được tạo ra và thu thập trên toàn cầu đã tăng trưởng theo cấp số nhân. Điều này khiến việc quản trị và điều hành dữ liệu trở thành ưu tiên hàng đầu đối với các tổ chức và doanh nghiệp thuộc mọi loại hình và quy mô. Quy mô của “vấn đề” dữ liệu đã trở nên rõ ràng. Các tổ chức cần dữ liệu đáng tin cậy để đưa ra các quyết định sáng suốt, nhưng quản lý khối lượng dữ liệu khổng lồ và đảm bảo chất lượng của chúng là một thách thức lớn. Vậy chi phí của việc quản lý dữ liệu kém hoặc dữ liệu chất lượng thấp là gì?
Các doanh nghiệp tại Mỹ ước tính thiệt hại 3 nghìn tỷ USD mỗi năm do dữ liệu kém chất lượng và những quyết định kém do sử dụng chúng.
Cùng bắt đầu hành trình xây dựng chương trình quản trị dữ liệu (Data Governance) cho doanh nghiệp với Kyanon Digital qua bài viết sau.
1. Quản trị dữ liệu là gì?
Theo Semarchy, nền tảng quản trị dữ liệu hàng đầu thế giới, quản trị dữ liệu bao gồm một loạt các nhiệm vụ quan trọng nhằm đảm bảo tổ chức sở hữu dữ liệu chính xác và tuân thủ các quy tắc, quy định. Những nhiệm vụ này bao gồm quản lý dữ liệu sẵn có, tính toàn vẹn, bảo mật và khả năng sử dụng của dữ liệu. Quản trị dữ liệu tốt giúp đảm bảo doanh nghiệp có được dữ liệu nhất quán, đáng tin cậy và không xảy ra bất kỳ trường hợp lạm dụng dữ liệu nào, cả bên trong lẫn bên ngoài tổ chức.
Cùng với việc các tổ chức phụ thuộc ngày càng nhiều vào phân tích dữ liệu để thúc đẩy hoạt động kinh doanh và ra quyết định, khối lượng dữ liệu cũng tăng trưởng theo cấp số nhân. Nhiều tổ chức đang bị “ngộp” trong dữ liệu từ nhiều nguồn khác nhau, do đó, việc quản lý chúng một cách hiệu quả là ưu tiên hàng đầu. Các chương trình quản trị dữ liệu hỗ trợ doanh nghiệp quản lý khối lượng dữ liệu khổng lồ, chuyển chúng thành những insight quý giá có thể quản lý, truy cập và có tính chính xác.
Tốc độ tăng trưởng của dữ liệu theo zetabyte từ năm 2010 – 2025 (Statista)
2. Tại sao quản trị dữ liệu quan trọng đối với doanh nghiệp?
Quản trị dữ liệu đóng vai trò quan trọng trong doanh nghiệp vì nếu không được kiểm soát, các tổ chức có thể mãi mãi không biết mình đang sử dụng dữ liệu kém chất lượng để ra quyết định. Ngoài ra, các tổ chức cần tuân thủ các luật lệ về cách sử dụng dữ liệu, bảo mật và quyền riêng tư. Tùy thuộc vào quy mô, ngành nghề và loại hình tổ chức, bạn thậm chí cần đảm bảo chỉ những người được phép mới có thể truy cập vào dữ liệu.
Với sự gia tăng gần đây của các hoạt động lập pháp về vấn đề tuân thủ dữ liệu, nhiều tổ chức phải đáp ứng các tiêu chuẩn ngày càng nghiêm ngặt như Quy định Bảo vệ Dữ liệu Chung của EU (GDPR) hoặc Đạo luật Quyền riêng tư Người tiêu dùng California (CCPA). Một chương trình quản trị dữ liệu tốt không chỉ liên quan đến chất lượng dữ liệu và tuân thủ pháp luật, mà còn đảm bảo doanh nghiệp có các tiêu chuẩn thống nhất về cách sử dụng dữ liệu.
Ví dụ, nếu Giám đốc Tài chính và Giám đốc Bán hàng cùng xem một dữ liệu, liệu họ có hiểu dữ liệu đó theo cùng một cách? Hãy cân nhắc thêm về cách dữ liệu khách hàng có thể được nhập và diễn giải trên các hệ thống và phòng ban khác nhau. Chẳng hạn, sự không nhất quán về tên khách hàng có thể gây phức tạp cho việc tích hợp dữ liệu và tạo ra các vấn đề về tính toàn vẹn cho hoạt động phân tích kinh doanh.
Một nguyên tắc then chốt của việc quản trị dữ liệu hiệu quả là chương trình của bạn phải hướng đến giải quyết các vấn đề kinh doanh thực tế và mang lại những kết quả cụ thể. Quan điểm này được nhấn mạnh bởi Eric Hirschhorn, Giám đốc Dữ liệu của Tập đoàn Ngân hàng New York Mellon tại hội nghị trực tuyến Enterprise Data World Digital năm 2022.
Ông khẳng định: “Thành quả không chỉ đơn thuần là quản trị dữ liệu tốt. Thành quả phải là điều kiện tiên quyết để vận hành doanh nghiệp hiệu quả hơn.”
3. Lợi ích của doanh nghiệp khi triển khai chương trình quản trị dữ liệu
Một vấn đề thường gặp trong các tổ chức lớn sở hữu khối lượng dữ liệu khổng lồ là thông tin bị “ẩn giấu” trong các silo dữ liệu. Khi mỗi phòng ban hoặc đơn vị kinh doanh có hệ thống riêng biệt, thông tin quan trọng có thể đóng vai trò then chốt trong việc cung cấp bối cảnh hoặc hỗ trợ ra quyết định lại nằm ngoài tầm với của những người cần đến. Chương trình quản trị dữ liệu vững chắc có thể thống nhất các hệ thống rời rạc trong toàn tổ chức, chấm dứt vấn đề silo dữ liệu.
Lợi ích rõ ràng của việc này là người dùng dữ liệu có được bức tranh toàn cảnh, từ đó đưa ra các quyết định chính xác và hiệu quả hơn. Bên cạnh đó, chất lượng dữ liệu được cải thiện có thể giúp giảm chi phí quản lý dữ liệu và nâng cao hiệu quả ra quyết định kinh doanh cho mọi bên liên quan. Dữ liệu chất lượng tốt hơn đồng nghĩa với khả năng đưa ra quyết định đúng đắn vào đúng thời điểm. Thực tế, việc cải thiện quản trị dữ liệu có thể trở thành một lợi thế cạnh tranh cho doanh nghiệp.
Cuối cùng, chương trình quản trị dữ liệu đảm bảo dữ liệu được sử dụng đúng cách trong tổ chức. Bạn cần tuân thủ nghiêm ngặt các quy định và tránh bất kỳ vấn đề nào liên quan đến việc bảo vệ dữ liệu của khách hàng hoặc thông tin nhạy cảm khác.
4. Các thành phần chính của chương trình quản trị dữ liệu
4.1. Framework quản trị dữ liệu
Một framework quản trị dữ liệu hỗ trợ bạn xác định và ghi chép các tiêu chuẩn, trách nhiệm giải trình và quyền sở hữu cho chương trình quản trị dữ liệu của mình. Dưới đây là một số lĩnh vực then chốt trong một khung quản trị dữ liệu hiệu quả:
- Vai trò và Trách nhiệm
- Chỉ số chất lượng chính (Key Quality Indicators – KQIs)
- Chỉ số hiệu suất chính (Key Performance Indicators – KPIs)
- Quy tắc về chất lượng dữ liệu
- Chỉ số đo lường mức độ rủi ro về dữ liệu và độ bảo mật
- Các định nghĩa và ngôn ngữ chung để quản trị dữ liệu
- Cách khám phá dữ liệu và một cách nhìn thống nhất về dữ liệu cho toàn bộ doanh nghiệp
4.2. Chính sách và quy trình quản trị dữ liệu
Chính sách và quy trình là một trong những trụ cột chính của việc quản trị dữ liệu hiệu quả. Các quy trình của bạn cần được thiết lập để đảm bảo các hoạt động kinh doanh dựa trên dữ liệu đáng tin cậy. Chính sách về dữ liệu xác định các nguyên tắc sử dụng, bảo vệ và quản lý dữ liệu. Các chính sách này quy định cách thức cộng tác giữa các phòng ban để quản lý dữ liệu, đồng thời đảm bảo tính thống nhất và tuân thủ các quy định.
4.3. Quyền quản lý và sở hữu dữ liệu
Trong việc quản trị dữ liệu, vai trò và trách nhiệm của những người tham gia cần được xác định rõ ràng. Bạn nên xây dựng một đội ngũ am hiểu dữ liệu và đại diện cho các chức năng khác nhau trong tổ chức.
Người quản lý dữ liệu (Data stewards) giám sát các tập dữ liệu cụ thể (chẳng hạn như cho một đơn vị kinh doanh cụ thể). Họ chịu trách nhiệm triển khai các chính sách quản trị và giám sát việc tuân thủ. Nhóm quản trị dữ liệu cũng nên có một người quản lý giám sát và có thể bao gồm các kiến trúc sư dữ liệu và chuyên gia quản trị.
4.4. Quản lý chất lượng dữ liệu
Chất lượng dữ liệu là một trụ cột chính của quản trị dữ liệu. Chất lượng đề cập đến tính chính xác và tính toàn vẹn của dữ liệu. Chất lượng dữ liệu được thiết lập thông qua các phương pháp thực hiện được chuẩn hóa, nơi tính toàn vẹn của dữ liệu được theo dõi và mọi điểm không chính xác có thể được đánh dấu và loại bỏ.
Một yếu tố quan trọng khác cần xem xét đối với quản lý chất lượng dữ liệu là tính hữu ích của nó đối với người dùng cuối. Ngay cả dữ liệu hợp lệ, đầy đủ cũng có thể được coi là “kém chất lượng” nếu nó không đáp ứng được nhu cầu của người dùng. Điều này quay trở lại với nhu cầu giải quyết các vấn đề kinh doanh thực tế; doanh nghiệp cần có những kết quả rõ ràng, được cải thiện từ việc quản trị dữ liệu thay vì quản lý dữ liệu một cách thừa thãi.
4.5. Quản lý Metadata
Metadata (siêu dữ liệu) chính là “dữ liệu về dữ liệu” của bạn. Nó cung cấp thông tin giúp bạn hiểu rõ ngữ cảnh của dữ liệu, trả lời các câu hỏi về dữ liệu của bạn như ai, cái gì, khi nào, tại sao, ở đâu và như thế nào. Một số ví dụ phổ biến về Metadata bao gồm mô tả, thẻ tiêu đề (meta script) và danh mục.
Quản lý Metadata là quá trình tổ chức và phân loại Metadata của doanh nghiệp. Điều này giúp việc tìm kiếm và truy cập Metadata dễ dàng hơn. Quản lý Metadata là một trụ cột quan trọng của quản trị dữ liệu vì nó giải quyết các vấn đề phổ biến trong quản lý dữ liệu, chẳng hạn như khó khăn trong việc chuẩn hóa và phân loại dữ liệu.
5. Các bước xây dựng chương trình quản trị dữ liệu
5.1. Xác định rõ mục tiêu kinh doanh
Nhiều tổ chức thường quá tập trung vào việc tìm kiếm công nghệ phù hợp để quản lý dữ liệu, nhưng ưu tiên quan trọng hơn cả là phải xây dựng rõ ràng nền tảng kinh doanh cho việc quản trị dữ liệu. Vậy giá trị của quản trị dữ liệu trong việc thúc đẩy doanh nghiệp tiến về phía trước là gì? Chương trình quản trị dữ liệu sẽ giúp giải quyết những vấn đề kinh doanh nào?
Việc thiết lập nền tảng này rất quan trọng vì doanh nghiệp cần sự tham gia của nhiều bên liên quan và cần họ duy trì hành trình này. Derek Steer từ Forbes Technology Council nhấn mạnh: “…chỉ thiết lập các quy trình và quy ước quản trị rõ ràng là không đủ; mọi người trong tổ chức cũng cần đồng ý với những quy trình đó. Nếu mọi người trong doanh nghiệp hiểu cách thức và lý do tại sao các lãnh đạo đang cố gắng quản lý dữ liệu doanh nghiệp, và có một chiến lược rõ ràng về những điều họ cần làm để đạt được mục tiêu đó, thì họ sẽ dễ dàng đồng ý tuân thủ các quy định.”
5.2. Thành lập nhóm quản trị dữ liệu
Các phòng ban khác nhau trong tổ chức sẽ sử dụng dữ liệu theo những cách khác nhau và có những ưu tiên riêng về việc sử dụng dữ liệu. Điều này có nghĩa là việc thành lập một nhóm quản trị dữ liệu với đại diện từ các phòng ban hoặc đơn vị kinh doanh khác nhau là rất quan trọng.
Nhóm quản trị dữ liệu nên hợp tác để thiết lập các định nghĩa chung và các số liệu đánh giá quản trị. Nhóm này cũng cần phân công vai trò và trách nhiệm cho người quản lý dữ liệu (data stewards), người dùng dữ liệu (data users) hoặc chủ sở hữu dữ liệu (data owners). Thông thường, nhóm quản trị dữ liệu sẽ chịu trách nhiệm lựa chọn công nghệ phù hợp để hỗ trợ hiệu quả việc quản trị dữ liệu. Đây nên là một nền tảng thân thiện với người dùng và giúp người dùng dễ dàng định nghĩa, theo dõi và quản lý các dữ liệu của họ.
5.3. Xác định các bên liên quan
Trong việc quản trị dữ liệu, bất kỳ cá nhân hay tập thể nào bị ảnh hưởng bởi quy trình này đều được coi là bên liên quan (stakeholder).
Các bên liên quan dễ nhận thấy nhất là những người làm trong lĩnh vực quản lý dữ liệu hoặc các vị trí cần sử dụng dữ liệu để đưa ra quyết định. Dataversity xác định ba nhóm bên liên quan chính, mặc dù thông thường mọi người có thể thuộc nhiều hơn một nhóm:
- Người ủy thác dữ liệu (Data trustees): Những người chịu trách nhiệm về định nghĩa, chất lượng dữ liệu và việc tuân thủ các chính sách, thường là đối với một lĩnh vực dữ liệu cụ thể.
- Người quản lý dữ liệu (Data stewards): Chuyên gia theo lĩnh vực dữ liệu của họ, hỗ trợ nhân viên đơn vị kinh doanh trong các nhu cầu về dữ liệu.
- Người giám sát dữ liệu (Data custodians): Thường là nhân viên IT hoặc quản lý hệ thống.
5.4. Các chính sách và quy trình đánh giá chương trình quản trị dữ liệu
Việc biết được mình cần bắt đầu từ đâu là rất quan trọng. Một cách logic để bắt đầu xây dựng chương trình quản trị dữ liệu là đánh giá tình trạng hiện tại của việc quản trị dữ liệu trên các khía cạnh con người, quy trình, chính sách và công nghệ. Các mô hình dữ liệu trưởng thành như DCAM của Hội đồng EDM có thể giúp bạn đánh giá mức độ trưởng thành dữ liệu của mình theo một cách có cấu trúc, so sánh với các tiêu chuẩn của ngành. Các mô hình dữ liệu trưởng thành này mang lại một ngôn ngữ chung và tập hợp các thực tiễn tốt nhất cho dữ liệu. Sau khi đánh giá tình trạng hiện tại, bạn có thể so sánh nó với các mục tiêu kinh doanh của mình về quản trị dữ liệu và tìm ra bất kỳ lỗ hổng nào.
5.5. Tạo một tuyên ngôn quản trị dữ liệu
Tuyên ngôn Quản trị Dữ liệu (Data Governance Charter) là một tài liệu quan trọng giúp nhóm quản trị dữ liệu xác định mục đích, phạm vi hoạt động, các công việc thực hiện và các mục tiêu của mình. Nó cũng có thể được sử dụng như một tài liệu tham khảo cho những người khác trong tổ chức để họ có thể hiểu được các mục tiêu của việc quản trị dữ liệu hiệu quả và những lợi ích mà họ có thể nhận được.
5.6. Triển khai chương trình quản trị dữ liệu
Khi bạn đã thiết lập được những nền tảng cơ bản, thì đây là lúc triển khai chương trình quản trị dữ liệu của bạn. Điều này có nghĩa là triển khai các quy trình và kiểm soát để hỗ trợ cho khuôn khổ của bạn. Ví dụ, các biện pháp kiểm soát truy cập và quy trình chất lượng dữ liệu của bạn là những bước then chốt. Bạn cũng sẽ cần các công cụ phù hợp với tech stack của mình để quản lý việc quản trị dữ liệu. Các công cụ bạn chọn nên giúp bạn quản lý các quy trình chất lượng dữ liệu và đáp ứng các mục tiêu kinh doanh của mình. Ví dụ, phần mềm như Semarchy Unified Data Platform bao gồm quản trị dữ liệu để tất cả các quy trình quản lý dữ liệu đều nằm trong một chương trình tập trung.
5.7. Quản lý và đánh giá chương trình quản trị dữ liệu
Quản trị dữ liệu không phải là một hoạt động có thể đạt kết quả trong một lần triển khai đơn giản. Đây là một quá trình liên tục cần được theo dõi và đánh giá hiệu quả. Cụ thể, bạn cần biết liệu các chính sách của mình có được tuân theo không và liệu chúng có đạt được mục đích đề ra không. Bạn có đang đạt được các mục tiêu đã đặt ra không?
6. Các phương pháp tốt nhất cho quản trị dữ liệu
6.1. Giao tiếp và sự hợp tác hiệu quả
Một mối lo ngại chung của các nhóm quản trị dữ liệu và bộ phận CNTT là những người khác trong tổ chức sẽ coi họ như “cảnh sát dữ liệu”, đặc biệt là vì một số phần trong chương trình quản trị sẽ áp đặt các hạn chế về cách quản lý và sử dụng dữ liệu. Cách tốt nhất để thúc đẩy sự tham gia của các phòng ban khác trong doanh nghiệp và tránh mọi sự phản kháng không hợp tác hiệu quả là thiết lập một môi trường giao tiếp thúc đẩy sự cộng tác ngay từ đầu.
Chương trình của bạn nên cởi mở, rõ ràng là hướng tới mục tiêu kinh doanh và có sự tham gia của tất cả chủ sở hữu và người dùng dữ liệu. Điều quan trọng cần lưu ý là quản trị dữ liệu không chỉ là vấn đề về công nghệ, mà còn là vấn đề về con người và quy trình. Bạn cần giúp mọi người dễ dàng tuân theo các hướng dẫn và quy trình của mình để thúc đẩy các hành vi mong muốn.
6.2. Kỹ năng lãnh đạo và hỗ trợ trong tổ chức
Tổ chức của bạn cần sẵn sàng để hỗ trợ nhân viên trong việc quản trị dữ liệu. Điều này có nghĩa là mọi người đều nhận được sự ủng hộ từ lãnh đạo và toàn bộ tổ chức. Bạn nên cung cấp các khóa đào tạo và giáo dục về quản trị dữ liệu, và đây nên là một phần tiêu chuẩn trong quá trình onboarding cho nhân viên mới. Một mẹo nhỏ là doanh nghiệp nên cung cấp các chính sách quản trị dữ liệu liên quan cùng với bất kỳ khóa đào tạo kỹ thuật nào. Ví dụ, nếu bạn đang triển khai các công cụ Business Intelligence (BI) mới, thì chính sách nào liên quan đến việc sử dụng dữ liệu là phù hợp?
Các chương trình đào tạo bạn cung cấp cũng nên đề cập đến tầm quan trọng của chất lượng dữ liệu và tác động của nó đến doanh nghiệp. Mọi người trong tổ chức của bạn cần hiểu mối quan hệ giữa các chính sách dữ liệu của bạn và kết quả kinh doanh.
6.3. Quản trị chất lượng dữ liệu
Như đã đề cập trước đó, chất lượng dữ liệu là một lĩnh vực gắn liền với quản trị dữ liệu. Trong khi quản trị dữ liệu là “cách doanh nghiệp quản lý dữ liệu” của mình, thì chất lượng dữ liệu là “trạng thái của dữ liệu”. Điều quan trọng là bạn phải có khả năng chứng minh giá trị kinh doanh của dữ liệu bằng cách thiết lập các số liệu để đo lường chất lượng dữ liệu và cho thấy những cải thiện đang được thực hiện. Báo cáo thường xuyên cũng giúp bạn theo dõi hiệu quả của các chính sách quản trị và thực hiện bất kỳ thay đổi cần thiết nào để đảm bảo chất lượng.
6.4. Quản trị Metadata
Bạn cần có một bộ giá trị thống nhất cho Metadata. Điều này giúp duy trì việc quản trị dữ liệu sạch, việc kết hợp dữ liệu và đảm bảo bạn nhận được kết quả chính xác sẽ dễ dàng hơn. Các chính sách quản trị dữ liệu của bạn cần nêu ra các định nghĩa về Metadata mà bạn sẽ sử dụng và tất cả người dùng cần nhập dữ liệu theo các danh mục được xác định của bạn.
6.5. Bảo mật dữ liệu và quyền riêng tư
Để bảo vệ dữ liệu nhạy cảm của bạn cùng với quyền riêng tư của khách hàng hoặc người dùng, điều quan trọng là phải hợp tác chặt chẽ với bảo mật dữ liệu. Một phương pháp phổ biến là bảo mật dữ liệu của bạn gần với nguồn dữ liệu. Điều đó có nghĩa là ban hành các quy tắc bảo mật và quyền riêng tư trên các hệ thống nguồn, trước khi dữ liệu được trích xuất và nạp vào kho lưu trữ dữ liệu.
Về phía khách hàng liên quan đến quyền riêng tư và bảo mật, cách tốt nhất là minh bạch về chính sách quyền riêng tư của bạn và cho phép khách hàng kiểm soát thông tin của riêng họ. Bạn cũng nên luôn yêu cầu sự cho phép của khách hàng khi sử dụng dữ liệu của họ cho bất kỳ mục đích nghiên cứu nào. Cuối cùng, bạn cần biết các bộ luật về bảo mật và quyền riêng tư dữ liệu liên quan đến tổ chức của bạn. Nếu bạn kinh doanh ở Châu Âu, thì bạn cần đáp ứng các yêu cầu của GDPR (Quy định chung về Bảo vệ dữ liệu). Ở Mỹ, bạn sẽ phải tuân thủ các luật kết hợp giữa liên bang và tiểu bang. Một mẹo nhỏ là tìm kiếm một hệ thống giúp bạn tuân thủ các luật pháp liên quan đến doanh nghiệp của mình.
7. Kyanon Digital hiện là đối tác của Semarchy về quản trị dữ liệu
Kyanon Digital là nhà cung cấp dịch vụ tư vấn và giải pháp công nghệ hàng đầu Việt Nam, hiện đang là tác chiến lược với Semarchy – nền tảng quản trị dữ liệu hàng đầu thế giới. Nhờ sự hợp tác này, Kyanon Digital có thể giúp các doanh nghiệp Việt Nam cải thiện chất lượng dữ liệu, tăng cường hiệu quả hoạt động và đưa ra quyết định kinh doanh sáng suốt hơn.
Nếu bạn đang tìm kiếm giải pháp quản trị dữ liệu để giúp doanh nghiệp của mình phát triển, hãy liên hệ với Kyanon Digital để được tư vấn.
Nguồn: Semarchy
Dịch và biên tập: Kyanon Digital