Les différents types de données
Il convient d’abord de définir ce que sont les données de production. Ces dernières sont recueillies au fil du temps à partir des procédés industriels et des processus qui y sont associés. Elles peuvent provenir de capteurs, d’analyses de laboratoire, de systèmes de géolocalisation ou de toute autre méthode utilisée dans un processus décisionnel. Les données de production peuvent être de qualité et de nature variées.
L’Internet des objets (IoT) ouvre aujourd’hui la porte à un vaste univers de solutions d’acquisition de données. Plusieurs plateformes sont désormais offertes sur le marché. Elles viennent parfois avec leurs propres capteurs, envoient les données dans le nuage et permettent de développer des tableaux de bord et des graphiques facilement accessibles.
L’entreposage des données
Il existe aussi des solutions dites traditionnelles permettant d’entreposer les données de production. L’historien de données en est une toute indiquée pour l’archivage en temps réel. Il peut offrir des fonctionnalités de compression, d’archivage par exception et de temporisation (buffering) en cas de panne lors de l’acquisition. Toutes ces options garantissent une utilisation optimale de l’infrastructure de stockage tout en préservant l’intégrité dans le temps de l’information récoltée. L’historien permet une gestion plus efficace de l’espace de stockage, comparativement à une base de données relationnelle.
Pour les données de laboratoire et les données transactionnelles, un modèle de données relationnelles est généralement la solution de choix. Dans ce modèle, les données sont organisées sous forme de tables mises en relation entre elles. Les relations imposent une intégrité et une cohérence et facilitent la manipulation des données. En contre-partie les données temporelles représentent un état dans le temps, sans lien les unes avec les autres il n’est donc pas nécessaire d’utiliser ce mécanisme pour en assurer la cohérence.
L’entrepôt des données : un précieux allié
Selon le type d’informations recueillies et les techniques d’acquisition disponibles, les entreprises utilisent l’une ou l’autre de ces solutions pour gérer leurs données, voire les deux. Pour tirer profit des données, une bonne pratique consiste à les regrouper, à les documenter et à en assurer la validité. L’outil pour y arriver s’appelle l’entrepôt de données de production, qui comporte quatre grands modules :
- Le module ETC (extraction, transformation, chargement), qui permet d’extraire les informations des systèmes, de les transformer (nettoyer, valider, uniformiser) et de les charger dans la base de données. Par exemple, l’ETC peut être utilisé pour effectuer des changements d’échelle ou pour interpoler certaines données manquantes.
- La base de données, qui permet de stocker ces dernières dans un modèle dit dimensionnel afin d’optimiser les performances en matière de lecture et de consultation. Ce module permet de mettre en relation des faits (tonnage produit, qualité obtenue) avec des dimensions (quart de travail, secteur, type de produit).
- Les magasins de données, qui permettent de consulter les informations et de les recouper entre elles par sujet. Par exemple, on peut avoir un magasin de données qui regroupe toutes les informations qui traitent d’un secteur d’une usine ou des réactifs utilisés dans un procédé.
- La boîte à outils de visualisation, qui permet de tirer des conclusions et d’inférer de l’information et qui amène les utilisateurs à poser une action. Quelques exemples : rapport périodique, outil de visualisation graphique, alertes déclenchées par certaines conditions programmées.
Pour conclure, soulignons qu’il est important de choisir la solution qui convient le mieux aux besoins de l’entreprise, à son contexte d’affaires et aux actifs pour lesquels les données sont recueillies. Une fois la solution choisie, on doit planifier son intégration avec l’entrepôt de données de production, un outil incontournable dans la mise en place d’initiatives de valorisation des informations. L’entrepôt permettra à tous de prendre des décisions selon une version commune et acceptée de ce qui constitue la « vérité » des données de production et, à terme, d’effectuer des analyses avancées.