當前位置:首頁 > 新聞資訊 > 市場活動 > 正文

精彩報告 | 蔣育燕:質量之本,華南農業大學數據治理工作實踐與分享

發布時間: 2018-11-15 15:41:06   作者:本站編輯   來源: 本站原創  

蔣育燕(華南農業大學校黨委常委、總會計師)


全球已進入信息高速發展的時代,信息化是當今世界發展的根本趨勢,是推動經濟社會變革的重要力量,我國在2006年發布了《2006-2020年國家信息化發展戰略》,對我國的信息化發展進行戰略指導。


而學校在信息化教學過程中累積了大量的數據,如教職工、學生、資産、教學、科研等等,這些數據都是學校最為重要的資産之一,是學校支持精細化管理、實現差異化服務、提升風險分析能力的基礎。


目前,教育行業普遍面臨着數據質量不高、數據支持決策能力不足等問題,導緻數據遠未發揮其應有的價值,并已經成為提升學校信息化建設,提升學校教學、科研、管理等競争力的巨大障礙,主要表現為:缺乏整體數據治理戰略和文化、數據治理管理流程和職責劃分不清、數據标準不統一、數據質量不高、缺乏配套的技術和系統支撐等。


接下來我将從以下幾個方面開始介紹華南農業大學近幾年的信息化建設過程以及目前數據治理的一些成效。


第一,學校辦學曆史與辦學文化

我校建立于1909年,至今已有一百多年的曆史,是全國重點大學,是廣東省和農業部共建的“211工程”大學;在師資及學校建設方面實力雄厚,在百餘年的辦學曆程中,校形成了優良傳統、鮮明特色等等。


學校信息化建設曆程

華南農業大學開始信息化建設是在2000年,基于國家發布的《教育信息化十年發展規劃(2010-2020年)》和我校信息化十年發展規劃,為貫徹落實《華南農業大學關于大力推進信息化建設的決定》,推進學校信息化建設發展,基本形成了校園信息化支撐服務體系,建立了全校信息化統一規劃、信息化工作體制和協調管理機制,成立了信息化建設工作辦公室、現代教育中心、數據中心和内設機構,形成了完善的組織機構建設,各部門協調,共同推動教育信息資源整合和公共數據互聯、共享和開放,整體提升我校信息化建設水平。


2015年至2017年,學校圍繞“加強基礎設施建設,構建大數據平台,建設智慧校園”的總體目标展開高水平大學校園信息化建設,在各二級單位的大力支持下已形成了良好的網絡基礎環境,軟件支撐環境,業務應用系統,積累了大量的數字資源。


新建的校園雲平台為42個二級單位提供了309台虛拟服務器,支撐這些單位應用服務,公共數據管理、統一身份認證管理和綜合信息服務門戶三大平台整合了OA等50多個業務系統,網上辦事服務大廳整合29個職能部門和單位近200條服務流程,有效推動了部門間業務聯動及流程優化。


我校經過十多年的發展,在數字校園建設方面取得了可喜的成果,肯定成績和進步的同時,也要正視存在的問題,其中數據方面的問題尤為突出。面對這一系列的數據問題,急需對數據管理與服務方式變革,全面進行數據治理,建設完善學校數據資産勢在必行。


第二,智慧校園建設背景下數據治理建設與實踐


本次數據治理項目建設第一要務是确定數據的源頭,規範數據标準,并真正把核心數據集中管理起來,其次是實現數據平台化管理,最後才是數據質量分析和數據應用建設。接下來我們結合華南農業大學的現狀介紹一下我校在數據治理方面的一些經驗,分别從當前數據治理的現狀、數據治理的目标、以及目前我們完成的一些情況進行具體講解。


數據治理-水之源、木之本!


長期以來,我校信息化建設由于缺少統籌規劃和統一管理,産生了諸多問題:數據孤島林立,數據之間不能有效交換和共享;數據來源衆多且分散,缺乏真正有效整合;數據從生産到使用中間流程不清晰,數據發布出口不統一,存在随意性,造成信息權威性缺失;數據質量堪憂,數據的完備性、準确性存疑;數據融合困難,存在壁壘和發展不平衡;導緻師生對重複填報數據不斷吐槽,數據打架屢屢發生。可以說,數據問題已經成為學校智慧校園建設、大數據分析的一大瓶頸,因此在去年制定的《華南農業大學關于大力推進信息化建設的決定》裡将開展數據治理、建立數據規範和數據中心、開展數據分析應用作為重點推進的工作,也列入了今年學校工作計劃要點。


當然這些問題也不是突然就形成的,相反這恰恰是信息化進行到相當的階段才産生的。十年前我們為了解決數據孤島而建設了數據中心。十年後随着信息化的發展,随着服務應用、決策等大數據分析的發展,原本為打通數據孤島而建設的共享數據中心已經成為了另一個孤島,為了更好的體現數據的價值,我們需要進行以面向數據管理以及數據服務為目标的數據治理。


說到底數據治理正是一切信息化服務的水之源,木之本!


數據治理架構


我們經常在聊大數據,其實大數據在我們學校的使用存在兩方面:一是數據的可視化,即大數據分析、BI等等;二是大數據的管理即我們今天要講到的數據治理。後者才是前者真正落地的基礎和支撐!數據治理基于全量信息标準、元數據體系,對共享數據中心進行全面的升級,制定組織架構、完善數據管理、實現數據質量可視化,為數據服務進一步的改進提供依據。


數據治理建設目标


具體來說,數據治理其實就是基于全過程生命周期閉環管理理論,重新梳理、分析、規劃各業務域數據,并利用一系列輔助工具全面治理全校數據,以達到提升數據質量、規範數據使用、支持數據應用與決策,并最終将松散的數據沉澱為科學有效的學校數據資産的目标!


根據數據治理的需要,我們是要制定數據治理體系規範、建設我校業務域方案,同時包括一系列的治理工具平台包括标準平台、主數據平台、開發者平台、數據公示平台等。最終完成全校範圍内的“數據建模和業務建模”。


通過對學校已建設的60多業務系統的摸底分析,第一階段針對其中核心業務系統進行治理,為學校 “業務驅動” 轉為“業務與數據聯動”、建立“用數據說話、用數據決策、用數據管理、用數據創新”的管理決策機制打好基礎,助力學校“雙一流”建設。


數據治理是一個體系工程,我們也是在一步一步的試行。其歸根結底就是兩件事:業務建模,即管理組織梳理;數據建模,即數據域建設。


數據治理建設内容-規範制度建設


數據治理是一項系統工程,面對衆多的數據資源,沒有健全的數據環境做支撐,最終将直接影響數據質量的提升,所以規範制度的建設是數據治理目标實現的基礎。


我校數據治理得到了學校領導的高度重視,成立信息辦予以專事專辦,數據治理是一個需要各個部門積極配合參與的事務,确保數據治理能夠成果的基礎。


構建完整的數據規章制度,包括政策、制度、細則、規範等四方面。通過對數據治理過程中涉及到的數據資産分類分級、數據使用的過程規範管理、相應的管理體制和機制、共享和開放的原則和機制、安全與隐私保護政策等方面建設。支撐涵蓋數據管理、存儲、質量、共享與開放等多方面數據應用。保證數據治理工作有章可循,有法可依。


數據治理建設内容-頂層設計,業務域規劃建設


在确定了體系規範後,作為基礎也是核心的,即學校的數據資産頂層設計,業務域方案建設,業務域方案是一件比較複雜的工程,數據治理的核心之一是打造全局數據中心,使得數據中心作為全校數據的統一出口,那麼我們就需要建設一個全局的信息标準。


信息标準的梳理是以國标為基礎,以學校各個部門崗位職責為邊界,結合學校各類業務系統、網辦大廳、各類上報數據報表、校内決策報表、分析等梳理出來的,同時我們将信息标準由共享時的表、字段進行大量擴展,包括業務域分類、管理屬性、質量規則、安全屬性等等。通過對共享數據中心經驗的吸收,在數據治理中,信息标準将有各個部門一起參與,各業務部門的數據标準相關的權限将有各個部門自己制定。


數據治理建設内容-全面建設據治理管理體系


教育數據治理的價值體現在:

1.更好的服務于學校決策

2.更為精準的為學校各類型數據服務提供支撐

3.提高學校數據的風險管理能力

4.提升學校數據管理水平


通過建設完善的數據治理管理體系,建設數據治理管理平台,即“1方案(數據規劃方案)+7平台(信息标準平台、數據交換平台、主數據管理平台、開發者平台、數據質量管理平台、元數據管理平台、數據公示平台)”建設,使數據資源的使用和管理标準化、精确化和效益化。最終讓數據成為學校高效的戰略資源。


數據治理建設内容-全量數據中心建設


以前數據在各自的立場上維護和生産,沒有統一的數據源頭,數據管理不規範,數據使用價值不高。本次通過全量數據中心的建設,讓數據中心成為全校數據的統一出口,基于校内所有業務系統及所有半結構、非結構化數據,構建基于大數據平台的統一存儲,利用高效、實用、易用的可視化ETL,參照上述标準體系,對高校的所有數據進行全面梳理、清洗、抽取、轉換和裝載,形成業務數據池,實現全校各主要業務系統的數據共享和交換,目前數據共享的方式包括ODI、API、VIEW三種方式。


數據治理成效與改變


基于目标與建設内容,接下來将從各方面展示與講解本次數據治理建設取得的一些成效與改變。


組織架構、規範制度建設

在數據治理前期,我們就确定了數據治理組織架構,由信息辦牽頭,負責制訂和修訂數據标準,評估數據質量,協調推進數據共享,保障數據安全,協助各部門完善内部數據管理。通過建立明确的組織結構,各部門管理人員責任到位,重大決策建立完善的溝通管控流程,為數據資産的深度利用與服務提供基礎保障。


通過制定的這一系列的數據管理制度,進而保證了數據資産從産生,使用到變更的規範流程管理,基于數據治理體系,建立完善的數據流程管理體系。保證數據在管理的過程中系統化、可視化。同時基于規章制度與工具結合,落地操作辦法,保證了數據的安全使用和管理。


全量信息标準覆蓋,融合數據資源


在業務域建設方面,通過數據治理體系建設,整理出覆蓋全校業務的全域信息标準規範,包含包含人力資源管理域、學生管理域、科研管理域、資産管理域、财務管理域各大類業務域。全域信息标準涵蓋共享标準、采集标準,并覆蓋全校業務,同時覆蓋各類報表、上報、決策分析等方面。


基于本期建設20多個業務系統,共計4300+數據表進行建設,目前我們已經對其中核心系統完成了數據分析及集成工作,包括人事系統、财務系統、科研系統等在内的9個業務系統,針對已完成集成的這9個系統,目前已梳理業務域表數918+,字段數5611+,代碼集651+,制定對象規則數280+。确定這9個系統的核心數據來源。


同時以國标為基礎,整合全校各業務領域數據标準模型,構建了全量信息标準,全面對接學校内部業務系統數據,并實現信息标準平台化管理。


構建主數據平台實現數據集中管理


基于數據交換管理,依托信息标準規範建設全量數據庫,構建統一主數據平台,目前全局數據中心已經集成人事所有數據、科研系統所有數據等,實現平台數據可視化;總數據量已達到40萬+條,覆蓋數據項5000+,實現基于全局數據中心動态發布接口,在後續工作中将通過全量數據中心,提供覆蓋教工基本信息、學生基本信息的數據接口,提供涵蓋班級信息表、學生信息表、單位基本信息等的相關視圖和中間表,下行數據覆蓋學校數據應用建設。


當然在完善曆史庫和數據倉庫的建設也是工作中的重中之重。


實現元數據統一管理

元數據建設是數據治理建設必不可少的環節,元數據管理平台是數據治理基礎平台,結合學校信息化建設的情況,以人、事、财、物為核心進行全校元數據采集及管理,定義全鍊的元數據以及流程信息,采用集中式管理模式對數據資源統一定義、統一管理。


我校目前已完成人事系統、教務系統、财務系統等10個核心業務系統的元數據采集(包括數據表、結構、數據流程等信息)工作,采集數據覆蓋系統表829+、涵蓋數據字段18386+、涵蓋數據字典2811+。使數據的定位清晰可見。通過血統、影響分析等快速定位問題數據。數據改了,哪裡受影響,分析追溯,一目了然。最終實現數據從産生、采集、分析、決策和應用的全生命周期管理,增加數據可信度。


呈現過程可視化質量可視化管理


數據治理最終還是為了提升數據質量,通過數據質量平台建設,實現對數據質量的分析,通過可視化的呈現方式展示數據集成規模,數據流程關系,表數據質量的分析與統計,并形成包括UC矩陣、數據血統溯源、數據指标度量和數據關系分析的綜合數據治理報告。全面展示學校數據質量情況和整體建設情況。


實現數據資源公示


在數據中心數據使用的過程,我們常常會有這樣的煩惱,對數據的情況,數據的質量、數據使用的流程無從可知,這大大的制約了數據應用及分析開展的進程,為方便數據的使用,節省大量的時間及人力成本,建設數據公示管理平台,通過對前期數據質量分析,出具現狀數據質量報告,通過報告查看當前學校數據質量問題。


通過數據治理,對治理後的數據提供全校數據資産的公示,便利的公示查詢服務和個性化的數據申請及審批流程,增強數據中心數據歸集,實現數據中心數據的公開、公正、透明,為數據應用及決策分析提供高效運行的支撐保障。貫徹數據資産管理進程。


數據支撐分析


經過大半年的數據治理項目建設,目前已實現核心業務數據的融合及數據間的聯動,可支持基礎數據信息服務建設,已獲取人事所有數據,可為人事數據遷移等提供支持等服務,從數據應用層面來講,目前已為學校決策分析提供對應的數據應用支撐,包括辦事大廳、高基表系統、迎新服務、基于移動端的數據服務等,通過數據治理,以打造全面的數據服務為目标,最終為學校分析決策提供數據支撐,促進學校“雙一流”建設,進一步推進學校信息化發展。

高基表及本科評估數據應用建設


基于數據治理建設,在本科評估及高基表建設方面取得了良好的效果,通過數據治理,數據支撐本科評估及高基表數據應用建設,同時通過數據應用建設帶動數據治理體系建設。


基于全校業務數據及部門數據和服務流程信息,采集獲取治理後的數據,分析、評估和完善學校内部質量保證體系。以常态質量與監控為依據,促使我校在學校、專業、課程、教師、學生不同層面建立起完整且相對獨立的自我質量保證機制,強化學校各層級管理系統間的質量依存關系,形成全要素網絡化的内部質量保證體系。


我校自2008年開展學院(部)本科教學工作狀态評估工作以來,對規範本科教學過程管理、促進教學改革、提高教學質量起到了積極的促進和引導作用。


在數據上報及數據分析方面,通過高基表系統建設,提高學校部門基本數據的收集、統計、報送工作效率,讓高基表統計數據有據可依,有源可查。确保數據來源可靠,有效,為學校管理工作提供參考和指導意見。


數據治理帶來的改變

最後,通過整個數據治理建設,目前學校已經治理的業務系統,我們可以獲取具體的數據定義,知道數據在哪裡(包括在哪個系統、哪個數據庫、那張表、那張字段),解決了數據盲點的問題。


在一方面來講,通過治理的标準規則以及質量平台,以及自定義質量報告的,實現對于已治理的系統的數據質量實時化掌握,為進一步改進數據提供充分依據;同時通過元數據平台,掌握學校局部數據地圖,并将進一步掌握全部,了解數據從哪來,到哪去,比如一條人事改了,哪裡會受到影響,都能夠很快的掌握。


從數據支撐層面來講對于數據分析的支撐,以前都是需要找各業務部門,甚至找産商,困難重重,現在一目了然,非常便捷;同時通過一系列管理制度集合治理工具的使用,完善了學校數據的線上使用流程管理。理清數據安全制度,數據标準學校統一制定,數據安全等級來源部門确定,數據使用業務部門參與,做到公開、公正、規範,大家一起參與,現在數據的使用比之前更加科學、合理、高效!


以上就是我今天的彙報,謝謝大家!


(以上内容為現場實錄,未經過嘉賓審核)