黨的二十大首次將“教育數字化”寫進報告,足見數字化在教育領域的關鍵引領。從2022年12月發(fā)布《關于構建數據基礎制度更好發(fā)揮數據要素作用的意見》,到2023年2月發(fā)布《數字中國建設整體布局規(guī)劃》,再到十四屆全國人大一次會議表決通過組建國家數據局,統(tǒng)籌數據資源整合共享和開發(fā)利用,統(tǒng)籌推進數字中國、數字經濟、數字社會規(guī)劃和建設等。各行各業(yè)數字化轉型蓬勃發(fā)展,推進教育數字化已經成為全國普遍共識和重要戰(zhàn)略目標任務,教育領域也在積極推進國家教育數字化戰(zhàn)略行動。
《上海交通大學“十四五”發(fā)展規(guī)劃》中指出要以數據為驅動力,進一步推動學校管理決策向數據驅動、協(xié)同治理、主動服務轉變,以信息化支撐內部治理體系和治理能力現代化。數據治理是數字化轉型的基礎,通過數據治理才能挖掘并體現數據資產的價值。隨著教育統(tǒng)計事業(yè)數字化轉型的深入開展,高校作為數據提供的基層單位,也需要不斷提高自身數據采集、審核、管理、發(fā)布的能力。上海交通大學在數據治理過程中,以典型數據應用為驅動,構建數據治理框架和平臺,通過反復迭代不斷提升數據質量。
01責任部門確定
數據治理工作是“一把手”工程,需要全校參與。黨政辦公室推動力、協(xié)調力強,但是在技術層面理解不深入;信息化推進辦公室對學校整體數據了解深入,但是技術能力存在局限性;網絡信息中心有很強技術能力,但是其協(xié)調推動能力不足,與數據決策的結合不夠緊密。
目前,信息化推進辦公室是數據治理的主要責任部門,統(tǒng)籌全校數據資源整合和共享;規(guī)劃發(fā)展處負責全校統(tǒng)計數據統(tǒng)一歸口管理,梳理各級各類數據應用需求;網絡信息中心支持各單位梳理數據資源目錄,開發(fā)數據共享應用,為數據治理提供技術保障。三部門互相配合,協(xié)同推進全校數據治理。這種組織架構將統(tǒng)籌推進、部門協(xié)調、技術能力有效結合在一起,以提供數據應用為出發(fā)點開展數據治理,推動全校數據資源整合共享。
02數據應用分類
學校數據應用主要分為四類:
一是校級數據報送。高校作為高等教育的基層單位,根據《中華人民共和國統(tǒng)計法》規(guī)定,每年依法填報《高等教育基層統(tǒng)計報表(以下簡稱高基表)》《中央預算編制基礎數據表》等各級各類報表。該類報表統(tǒng)計口徑固定,能反映學校的發(fā)展變化情況。
二是院校研究分析。學校在人才培養(yǎng)、教育教學、科學研究、國際合作等多個方面需要不斷發(fā)展,通過對標國內外高校,以精準的指標型數據為研究基礎,找出自身差距,尋求改革發(fā)展的新路徑。
三是部門院系管理。學校職能部處、直屬單位和學院的管理需要結合各自情況,針對業(yè)務數據進行采集和處理,同時參考校級數據和院校研究數據作為輔助。
四是科學決策支撐。通過對全面、及時、準確和多維度的數據進行深度挖掘分析,為學校的科學決策和高質量發(fā)展提供數據支撐服務。
03具體工作推進
根據教育部《教育系統(tǒng)核心數據和重要數據識別認定工作指南(試行)》的指導,結合上海交通大學實際情況,將數據分為基礎數據、擴展數據、業(yè)務域數據三類,如圖1所示。
圖1 上海交通大學數據分類
基礎數據主要包括本科生、研究生、留學生的基本學生數據和專任教師、科研人員、行政人員、教學及輔助人員、離退休人員等教職工基本數據。擴展數據主要包括各個部門業(yè)務數據,包括項目、獲獎、基地、論文等科研數據,經費收入支出等財務數據,土地、建筑物、實驗室等資產類數據,交流交換情況等國際交流合作數據,授課、評教等教學數據,畢業(yè)生發(fā)展情況等就業(yè)數據,該類數據主要沉淀在各個部門管理領域,是衡量學校各方面發(fā)展的重要指標。業(yè)務域數據是指部門內部管理數據,滿足本部門業(yè)務和管理需要,不涉及部門交叉。
在數據分級分類的基礎上開展數據資源梳理、匯總形成校級數據資源目錄。數據治理工作流程如圖2所示,明確數據權威源,堅持“一數一源”原則,優(yōu)先通過共享獲取數據。數據業(yè)務部門根據管理職能需要,通過信息系統(tǒng)或其他手段進行數據采集和檢查維護,確保源頭數據真實、準確、完整。
圖2 數據治理工作流程
在進行數據歸集前,進行數據標準檢查,完成數據規(guī)則轉化,通過數據清洗形成規(guī)范可用的數據,傳輸進入數據資源管理平臺。數據資源管理平臺是學校數據資源的匯聚中心,實現規(guī)范化統(tǒng)一管理,支撐學校數據標準維護實施、數據質量監(jiān)測、數據共享交換、數據授權應用和數據安全管理等。信息化推進辦公室定期考核評估歸集的數據質量,推動數據源頭部門整改問題數據,加強數據質量控制。
04典型數據應用
數據資源共享平臺,如圖3所示,涵蓋校內信息系統(tǒng)、第三方公開數據、政府共享數據、填報采集數據等方面數據,通過數據的清洗加工、歸集整合、入庫存儲、交互共享,形成質量良好、互相關聯的數據資源,打破基礎數據、擴展數據、業(yè)務域數據壁壘,聯通數據孤島,提升數據應用能力和使用效能,通過數據挖掘、知識圖譜、數據可視化分析等方法,在學校級、部門級、院系級、學科級四個維度上實現校級數據上報、院系研究分析、部門院系管理,為科學決策提供數據支撐服務。
圖3 數據資源共享平臺
數據綜合統(tǒng)計平臺,針對業(yè)務部門臨時性數據采集項目和固定性報表項目。主要實現三個功能:一是關聯數據推送,對于各級各類報表中關聯性數據進行梳理,對其他報表中有相關的數據指標實現數據推送。例如將高基表中涉及學?;A數據推送到其他相關報表。二是業(yè)務數據采集,根據業(yè)務部門采集需求增加個性化表單設計。三是相關數據分析,對于報表的年度數據進行存儲,實現數據可視化分析。
針對高等教育基層統(tǒng)計建立校內填報系統(tǒng)。高基表是教育部為全面系統(tǒng)地掌握我國各級各類教育事業(yè)的發(fā)展狀況進行統(tǒng)計的報表,主要統(tǒng)計學?;厩闆r、班級數、學生數、教職工數、校舍、資產和基本建設投資等指標。高基表校內填報系統(tǒng)采用全臺賬式填報方式,對學生、專任教師、建筑物等信息從系統(tǒng)中直接提取數據,根據部門統(tǒng)計人員在統(tǒng)計中的處理規(guī)則形成一級規(guī)則,統(tǒng)計人員在統(tǒng)計中的處理規(guī)則形成二級規(guī)則,通過后臺規(guī)則處理生成規(guī)范數據。對于非系統(tǒng)對接數據,建立臺賬模板,通過權限分配的方式開放給業(yè)務部門填報。
目前已完成通過48份臺賬自動生成高基表所有報表,極大提高了統(tǒng)計效率。數據審核方面,通過和上年數據比對,設定數據預警閾值等多方校驗,加強部門審核責任流程控制,提高了數據填報質量。
教育數字化轉型離不開高質量的數據支持,高質量的數據又來自持續(xù)的數據治理。數據治理需要全局性謀劃和統(tǒng)籌性推進,堅持以數據應用為驅動力,聚焦核心業(yè)務,全校各部門多方協(xié)同、持續(xù)維護來提升數據質量,才能將數據資產的價值最大化,助力高校高質量發(fā)展,促進學校治理能力現代化。
作者:楊松、張金冉(上海交通大學規(guī)劃發(fā)展處、信息化推進辦公室)