Exploiter la mine d'or que représentent les données
Selon le dernier rapport Rethink Data de Seagate, « les données sont une véritable mine d'or ». Toutes les données numériques collectées dans le monde, qui forment la sphère des données, synthétisent des informations extrêmement précieuses pour les activités humaines. Comme le souligne le rapport, cette sphère contient « des informations vitales urgentes, l'historique des connaissances, des instructions opérationnelles, des procédés de fabrication, des chroniques des moments forts », et bien plus encore.
Mais comment exploiter cette mine d'or ?
La vitesse à laquelle augmente le volume de données déconcerte les experts informatiques et les entreprises, pour qui la tâche paraît de plus en plus compliquée. En bref, pour parvenir à exploiter les données, vous devez d'abord mettre ces données à profit. Cela implique bien plus que la collecte et le stockage des données : vous devez pouvoir les trier, les organiser et les analyser pour déterminer quelle est leur véritable valeur stratégique.
Le problème ne vient pas du manque de volonté des entreprises d'utiliser les données dont elles disposent, mais du manque de données collectées : les entreprises ne recueillent pas toutes les données disponibles. De plus, les informations collectées sont souvent mal triées, cataloguées et analysées, autrement dit, peu exploitables.
Selon Stefaan G. Verhulst, professeur et responsable de GovLab à l'école d'ingénieur de l'université de New York, dans un récent article de HBR : « Nous vivons dans une économie du savoir et les entreprises cherchent encore à comprendre comment tirer profit des ressources sous-exploitées. Il est largement admis que les quantités colossales d'informations générées par les entreprises peuvent avoir une valeur inestimable. Le problème est que les entreprises, et la société au sens large, ne savent pas vraiment comment révéler tout le potentiel de ces données. »
Le rapport Rethink Data de Seagate confirme la sous-exploitation massive des données. Les entreprises collectent seulement 56 % des données disponibles via leurs opérations, et seuls 57 % de ces données sont utilisés.
Au final, en moyenne, 68 % des données à disposition des entreprises ne sont jamais mis à profit.
De plus, un quart seulement des entreprises ont mis en place des processus pour quantifier la valeur des informations qu'elles collectent. Or, comment exploiter la valeur des données sans savoir quelle est leur valeur potentielle ? Sans compter que dans la plupart des secteurs, de la santé aux transports, les responsables ne considèrent pas leur entreprise comme des experts en exploitation des informations.
Cependant, nos estimations et notre intuition suggèrent que les données non inutilisées ont une valeur astronomique. Prenons l'exemple de l'hôpital et de ses multiples sources et activités qui génèrent des informations. Les antécédents des patients, les informations de facturation, les IRM, les radiographies et même les consultations à distance ne sont que quelques exemples de données qui peuvent avoir une forte valeur. Selon les analyses de l’IDC (International Data Corporation) dans le rapport Rethink Data, les données non exploitées et sous-analysées d’Rethink Data, les données non exploitées et sous-analysées d'un hôpital moyen peuvent valoir des centaines de millions de dollars.
Le défi consiste à rassembler toutes les pièces du puzzle de sorte que les entreprises prennent conscience de la valeur intrinsèque des données qu'elles ont déjà en leur possession.
La première étape pour tirer profit des données est tout simplement d'en collecter davantage. Les entreprises doivent collecter les bonnes informations, les stocker là où elles seront utiles et les mettre à disposition des décisionnaires de manière conviviale. Malheureusement, les infrastructures informatiques des entreprises ne sont pas armées face à la multiplication exponentielle des sources de données et des appareils, et au développement de l'IoT.
Pour parer à ces défaillances de collecte et de stockage, les entreprises peuvent se tourner vers des logiciels de gestion des données. Les solutions d'ingestion des données peuvent classer les informations au début du cycle de vie des données, les conserver automatiquement le temps nécessaire et les archiver quand elles ne sont plus utiles. Ces logiciels de tri des données permettent aux entreprises de collecter davantage de données sans surcharger leurs systèmes et leur stockage.
Une fois les informations recueillies, elles sont conservées dans de vastes lacs de données afin que les applications puissent facilement les trouver. Les data curators et data scientists peuvent ensuite utiliser ces outils pour générer, analyser et visualiser des graphiques et des tendances pour les décisionnaires. En regroupant les données collectées dans des lacs de données, les entreprises éliminent les silos et peuvent plus facilement établir des liens entre des éléments qui n'ont a priori aucun rapport entre eux.
Ces nouvelles connexions et conclusions se traduisent en précieux avantage concurrentiel.
Les avancées réalisées en matière de collecte et de traitement des données en périphérie, ainsi que les innovations continues en matière de stockage des données, sont deux tendances que les entreprises peuvent mettre à profit pour augmenter leurs chances de mieux exploiter leurs données.
Le rapport souligne : « La collecte des données est particulièrement problématique sur les appareils en périphérie. Bien souvent, l'application en périphérie est la seule à pouvoir distinguer les données exploitables, qui doivent être collectées, des données en transit, qui peuvent donc être ignorées. »
Pour collecter les données en périphérie, l'analyse des données et la prise de décision doivent intervenir le plus près possible de la source des données.
Les dernières applications de gestion des données qui utilisent l'intelligence artificielle (IA) en périphérie se distinguent en permettant d'effectuer des analyses de plus en plus rapides en périphérie. À mesure que les entreprises déploient des mécanismes plus efficaces pour collecter des données sans surcharger leurs systèmes informatiques, elles peuvent progressivement recueillir des informations exploitables et les utiliser à des fins stratégiques.
Plusieurs innovations en matière de stockage influencent également la valeur que les entreprises peuvent exploiter. Tout d'abord, la capacité du stockage matériel ne cesse d'augmenter, ce qui permet aux applications d'IA d'accéder à de plus gros volumes d'informations. En gagnant en capacité et en puissance, le matériel de stockage peut supporter des solutions d'IA de plus en plus sophistiquées. Tous les types de stockage bénéficient de cette augmentation de la capacité : les disques durs, les SSD et les systèmes de stockage composant la plupart des infrastructures du cloud et des centres de données.
En parallèle, la bande passante de stockage connaît aussi des améliorations, qui optimisent la circulation des données entre les fonctions de stockage, de réseau et de calcul. L'efficacité de l'ingestion des données par les applications d'analyse repose principalement sur la bande passante. Un des moyens d'améliorer la bande passante consiste à utiliser des architectures distinctes modulables dans les applications d'IA complexes.
Les avancées en matière de sécurité constituent un autre atout pour les analyses de ces vastes lacs de données, qui sont moins vulnérables aux violations et aux attaques. Le rapport Rethink Data signale une légère hausse des investissements dans les dispositifs de sécurité au niveau des appareils et des systèmes. Les entreprises veulent être sûres qu'elles peuvent confier l'analyse de leurs informations à des applications d'IA à grande échelle, par exemple, en toute tranquillité.
Toutefois, l'innovation ne peut remplacer une planification et une gestion internes efficaces. La collecte des informations est la partie la plus simple : leur analyse est bien plus complexe. Pour recueillir et organiser judicieusement les données, les entreprises doivent surmonter de nombreux obstacles, parmi lesquels des outils redondants, la complexité et l'intégration des données. À défaut de placer les objectifs stratégiques au cœur de la collecte des informations, les entreprises seront condamnées à cumuler des données moins prometteuses que prévu.
L'enquête du rapport montre qu'en seulement deux ans, de début 2020 à début 2022, le volume de données générées par les entreprises connaîtra une croissance annuelle de 42,2 %. Pourtant, aujourd’hui, plus des deux tiers des données qu'elles peuvent analyser sont omis, ignorés ou ont purement et simplement disparu.
Les entreprises doivent donc commencer par identifier les informations qu'elles ne prennent pas en compte ou qu'elles n'exploitent pas suffisamment. Pour tirer profit de leurs données, les entreprises doivent se tourner vers les avancées technologiques en matière de collecte, de stockage et d'analyse des données. En alignant ces lacs de données et ces outils sur leurs principaux objectifs stratégiques, les entreprises peuvent exploiter la mine d'or que représentent leurs données.
Pour en savoir plus sur la manière dont les entreprises peuvent exploiter davantage de données, lisez le rapport Rethink Data de Seagate.