データを使って価値の宝庫を発掘する
Seagateが最近発表した「データを再考する」レポートでは、「データは価値の宝庫である」とされています。世界中で収集されたデジタルデータ、いわゆるデータスフェアは、人間の行動にとって非常に貴重なデータの集大成であり、その規模は絶え間なく拡大を続けています。同レポートでも指摘されているように、データには「緊急性のあるライフクリティカルな情報、知識の歴史、業務の指示、製造工程、感情の記録」などが詰まっています。
当然のことながら、問題はその価値をどう引き出すかという点です。
データ量が急増するペースを考えると、その価値を引き出す作業はIT専門家や企業にとって悩ましい課題です。簡単に言えば、データから価値を引き出すためには、まずはそのデータを使用できる状態にしなければなりません。しかし、そのためには単にデータを記録して保管するだけでなく、最終的にビジネスに役立つ価値をいかにして見出すのかを判断するため、データを分類、整理、分析する能力が必要です。
企業は決して自分たちの持つ情報を意図的に持て余しているわけではなく、活用できるはずの重要なデータを取得しきれていないだけなのです。そして、収集された情報は適切に選別、分類、分析されていないことが多く、それゆえに活用できない状態になっています。
ニューヨーク大学工学部の教授であり、GovLabの所長も務めるステファン・G・フェルフルスト氏は、最近のHBRの記事の中でこう述べています。「我々の住む世界は知識経済であり、組織は活用しきれていないアセットを引き出す方法を依然として模索している。企業の生み出す膨大な量の情報が極めて大きな価値を秘めていることは、広く知られるところとなった。しかし組織は、そして私たちを取り巻く社会は、その価値を引き出す方法を果たして心得ているだろうか?」
Seagateの「データを再考する」レポートでは、今日のデータは十分に活用されていないと結論付けています。企業は、その事業活動から得られたデータのわずか56%しか収集しておらず、さらに、実際に活用されているデータはそのうちのわずか57%に過ぎません。
そのため、企業が利用できるデータの68%程度は、一度も活用されないまま放置されています。
さらに、自社で収集した情報の価値を定量化するためのプロセスを整備している組織は、全体のわずか1/4でした。データにどの程度の価値があるのかを見出せなければ、その価値を引き出すことはほぼ不可能です。また、医療から運輸に至るまでのほぼすべての業種で、役員は自社が情報活用能力の点で業界をリードしているとは思えないという考えを持っています。
一方、利用されていないデータが莫大な価値を秘めていることはそれとなく示されています。病院を例にとって考えてみましょう。病院には、情報を生み出すソースや活動が数多く存在します。患者の病歴、請求情報、MRIやレントゲンの結果、さらには遠隔医療による診療情報など、極めて大きな価値を秘めたデータの例は枚挙にいとまがありません。International Data Corporation (IDC) が「データを再考する」レポートの中で展開している分析によると、一般的な病院には、数億ドル相当のデータが日の目を見ることなく、十分に分析されないまま埋もれているといいます。
大切なのは、企業が収集した情報の中に潜む価値を見出すことができるよう、解決の糸口を提供することです。
価値を引き出すための最初のステップは、より多くの価値を手に入れることです。組織は適切な情報を収集し、それを必要とされる場所に保管して、分かりやすい方法で意思決定者に提供する必要があります。しかし、データソースやデバイス、モノのインターネット (IoT) が急増する中で、企業のITインフラストラクチャはデータ収集と保存において限界を迎えつつあります。
そこで活躍するのが、データ管理ソフトウェアです。データ取り込みソリューションは、データライフサイクルの最初の段階で情報を分類し、有用な期間にわたって自動で保管し、必要に応じてデータアーカイブへと移動させます。このようなデータ・プルーニング・ソフトウェアがあれば、企業は自社のシステムとストレージに過度の負荷をかけることなく、価値あるデータを多く取得することができます。
収集された情報は大規模なデータレイクに保存され、ソフトウェア・アプリケーションから簡単にアクセスできるようになります。そして、データサイエンティストやキュレーターは、こうしたソフトウェア・ツールを使ってデータを取り出し、分析して、意思決定者のためにグラフ化したり、動向を視覚化したりすることができます。いわゆる「データレイク」を構築することでサイロをなくし、一見すると無関係に思われる要素を線でつなぐことが可能になります。
こうして新たなつながりと洞察を持つことは、企業にとって大きな競争力となります。
エッジでのデータ取得および処理の向上と、データ保存技術の継続的なイノベーションは、企業にとって重要な二大トレンドであり、データから膨大な価値を引き出すためのチャンスを与えてくれます。
レポートでは、「エッジ・デバイスはデータ取得において特に大きな課題である。どのデータを取得して活用すべきか、そしてどのデータを一時データとして放置するのかをエッジ・アプリケーションのみが把握していることが多い」と指摘しています。
エッジでデータを取得するためには、データの生成場所からできる限り近い場所で分析と意思決定を行う必要があります。
エッジでの迅速な分析を実現するため、エッジで人工知能 (AI) を使用する新しいデータ管理アプリケーションも登場しています。企業は、ITシステムに過度の負荷をかけない優れたデータ取得メカニズムを採用することで、データから洞察を引き出し、事業成長につなげることができます。
さらに、ストレージ分野のイノベーションが各方面で進んだ結果、企業が得られる価値にも影響が及んでいます。第一に、ストレージ・ハードウェアの大容量化が進んだことで、AIアプリケーションがアクセスできる情報の量が増加しました。ストレージ・ハードウェアがより一層強力になり、さらに多くのデータを保存できるようになったことで、高度なAIソリューションにも対応できるようになっています。ハードディスク・ドライブ、SSD、さらにはクラウドやデータセンターのインフラストラクチャの大部分を定義するストレージ・システムにおいて、ストレージ容量は進化を続けています。
また、ストレージの帯域幅も改良が進み、ストレージ、ネットワーキング、およびコンピューティング機能における情報トラフィックが安定化しました。帯域幅は、分析アプリケーションによる情報の取り込みを支える重要な骨組みです。例えば、組織は帯域幅を改善するために、複雑なAIアプリケーションに対応できる分散型のコンポーザブル・アーキテクチャを導入しています。
さらに、セキュリティ機能が強化されたことで、大規模なデータレイクの分析を侵害や漏洩から保護することができるようになりました。「データを再考する」レポートによると、昨今、セキュリティ技術への投資額が増加しており、デバイスとシステムの両レベルでセキュリティ対策を強化する動きが進んでいるといいます。企業は、例えば大規模なAIアプリケーションに情報の分析を安心して任せられるような環境を整える必要があります。
一方で、どれほどイノベーションが進んでも、社内での効果的なデータ管理と計画が不要になるわけではありません。データを収集するのは容易ですが、インテリジェンスを得ることは大変な作業です。データをスマートに収集して整理するためには、ツールの重複や複雑なデータ、統合といった課題を克服する必要があります。ビジネス上の目標をデータ収集の主な目的としなければ、さして価値のないデータばかりを抱え込むことにつながります。
レポートに先立って実施された調査によると、2020年はじめから2022年はじめまでのわずか2年間で、企業が生成するデータの量は年間42.2%増加する見通しであるとされています。しかし現在、分析に利用できるデータのうち2/3以上は紛失しているか、忘れられているか、あるいは単に消去されてしまっています。
企業がとるべき最初のステップは、実際にどれほどの情報が十分に活用されないまま放置されているのかを把握することです。データから価値を引き出すためのカギは、収集、保管および分析技術の進歩にあります。ビジネス上の目的という観点からこうしたツールやデータレイクを捉えることで、企業はデータの価値の宝庫を発掘することができるはずです。
「データを再考する」レポート全文では、企業がより多くのビジネスデータを有効活用するための方法をご紹介しています。