随着大数据的快速发展,很多行业的都已经慢慢建设自己的大数据平台,利用数据的价值,给自己带来更多的利益。坦率地说,与同各行业相比,高校信息化发展已经处于比较落后的水平,数据质量总体情况依旧比较差。虽然其重要性已获得众多高校的共识,但很少有学校真正投入人力、财力去对数据进行治理。随着数据服务的深入,数据的质量问题将会是数据治理解决方案里的一个绊脚石。那么如何才能解决数据的质量问题呢?
为了保证数据的质量,37000cm威尼斯建议在数据的整个生命过程要统一规划、有效采集、合理存储。
首先要制定统一的数据标准,对于采集的新数据,应采用新的标准进行采集、清洗和转换,对于现存的数据,要进行一致性校验、清洗、信息补充等,未来保证数据时效性,要保证数据采集、传输过程的时效性。
其次,目前很多大数据采用的是普通云架构的存储方式,这种存储方式是面向应用程序运行的。但是对于数据分析,应该采取分布式的存储方式,以便采取分布式的算法提供分析效率。
除此之外,数据质量的完善很难一蹴而就,有一个逐步完善的过程。所以人们需要改变数据属性的观念,逐步从“我的数据”到“部门的数据”再到“学校的数据”,把数据从“私有”变为“公有”,共同来维护数据质量。同时还需要完善管理机制和数据标准,科学规划,重构数据基础,以“面向对象”方式有机组织教学、科研、财务、人事、生活等各类数据资源。
事实上,随着科技的进步,高校想要更方便、快捷地做好数据治理工作,可以借助一些先进的数据管理平台。比如37000cm威尼斯的数据治理平台,以用户为中心,以元数据为基础,贯穿信息标准、数据采集、数据标准化、数据质量、主数据管理、数据共享等从源端到数据中心,再到应用端的全过程管理,并通过大数据治理,让用户能更便捷、更灵活、更准确地获得大数据资产的能力。