巧用数据解锁价值宝库
Seagate 最近发布的《数据新视界》报告指出:“数据是一座价值宝库。”全球范围内收集的所有电子数据构成了数据领域,其中包含着不断扩展的数据资产,对人类的进步有重要价值。正如报告中所指出的,这些资产包括“紧急的、关乎生命的信息,知识历史,操作说明,制造过程,情感编年史”等等。
当然,问题是如何释放这些价值。
数据的爆炸式增长使得释放数据价值成为 IT 专家和企业的一项复杂工作。简而言之:要从数据中获取价值,必须首先利用数据。这不仅需要采集和存储数据,还需要对数据进行分类、整理和分析,以确定最终如何发现其业务价值。
企业并非没有尝试利用他们拥有的信息,而是没有采集所有可用的有价值数据。收集到的信息通常未进行正确分类、编目和分析,因此无法加以利用。
“我们生活在知识经济的浪潮中,企业仍在努力找出释放未充分利用资产的方法,”纽约大学工程学院教授兼 GovLab 负责人 Stefaan G. Verhulst 在最近的 HBR 文章中表示,“人们普遍认为,公司生成的大量信息代表了巨大的潜在价值存储库。但是企业以及我们整个社会,知道如何释放这些价值吗?”
Seagate《数据新视界》报告证实,当今的数据未得到充分利用。企业仅在其运营中收集了 56% 的可用数据,其中只有 57% 得到了使用。
最终结果是,平均而言,企业可用数据中有 68% 从未投入使用。
此外,只有四分之一的企业制定了流程,用于量化所收集信息的价值。如果不知道数据的潜在价值,几乎不可能解锁其价值。大多数行业(从医疗保健到交通运输)的管理层并不认为所在的公司有能力领导信息使用。
但预测和直觉都表明,未使用数据的价值仍是一个天文数字。以医院为例,存在大量将会产生信息的来源和活动。患者病史、账单信息、核磁共振成像、X 射线,甚至远程医疗咨询都是可以提供巨大价值的数据类型示例。International Data Corportation (IDC) 在《数据新视界》报告中的分析预测,一家普通医院可能坐拥价值数亿美元的未挖掘和未充分分析的数据。
挑战在于如何将拼图拼凑在一起,让企业意识到他们已收集信息的内在价值。
释放价值的第一步就是获取更多数据。企业需要收集有用的信息、将其存储在需要的地方,并以易用的方式将其提供给决策者。但随着资源、设备和物联网 (IoT) 的指数级增长,企业 IT 基础架构在收集和存储数据时愈发捉襟见肘。
这是数据管理软件的用武之地。数据提取解决方案可以在数据生命周期开始时,对信息进行分类;在使用期间自动保留数据;并在必要时将其移动到数据存档中。这种类型的数据剪切软件可以帮助企业在不增加系统和存储负担的前提下,采集更多数据。
在完成采集后,信息就会流入大型数据湖,使软件应用可以轻松访问信息。然后,数据科学家和管理者就可以使用这些软件工具,挖掘、分析数据,制作可视化图表和趋势,以供决策者参考。创建所谓的“数据湖”能够消除数据孤岛,并促进从看似无关的元素建立连接的能力。
帮助企业建立新的联系和洞察将会转化为重要的竞争优势。
边缘数据采集和处理技术的改进,以及数据存储的持续创新,正是两个可以为企业提供更多机会来释放巨大价值的趋势。
报告指出:“边缘设备对数据采集提出了特殊的挑战。通常,只有边缘应用知道必须采集和处理哪些数据,以及哪些数据是暂时性、可忽略的。”
边缘采集需要在尽可能靠近数据生成的位置进行分析和决策。
在边缘使用人工智能 (AI) 的全新数据管理应用正不断涌现,这使在边缘进行快速分析成为现实。随着企业部署更出色的数据采集机制,避免让 IT 系统过载,他们可以开始收集能够推动增长的洞察。
多领域的存储创新也在影响企业可以获得的价值。首先,存储硬件的容量正在增加,使得人工智能应用可以访问更多信息。随着存储硬件越来越强大,就能容纳更多数据,并支持更加复杂的人工智能解决方案。存储容量的进步正在硬盘、SSD 以及组成大部分云和数据中心基础架构的存储系统中发生。
存储带宽也在不断提高,由此支持信息流量在存储、网络和计算功能之间更加稳健的移动。带宽是分析应用的支柱,因为它们的作用是提取信息。例如,为了提高带宽,企业为复杂的 AI 应用采用可组合、分解的架构。
在对这些大型数据湖进行分析时,增强安全性能够保证分析不易受到破坏和危害的影响。《数据新视界》报告指出,对于增强设备和系统级别安全性的技术投资有所增加。例如,企业必须相信大规模人工智能应用可以安全地分析信息。
但创新不能替代高效的内部管理和规划。收集信息相对容易;实现智能则难上加难。要想实现智能收集,企业需要克服重叠工具、数据复杂性和集成带来的挑战。未能将业务目标置于信息收集工作的核心位置,将会导致从所收集数据中获得的价值低于预期。
该报告中的调查显示,在短短两年内,从 2020 年初到 2022 年初,企业生成的数据量每年将增长 42.2%。然而至今,超过三分之二可用于分析的数据已经丢失、被遗忘或干脆消失了。
对于企业而言,第一步是识别实际丢失或未充分利用的信息量。释放价值的关键在于收集、存储和分析技术的进步。通过从核心业务目标的角度来使用这些工具和数据湖,企业就有能力开始释放数据价值的宝库。
阅读 Seagate《数据新视界》报告,详细了解企业如何利用更多业务数据。