HDF5 voor de opslag van meetgegevens bij condition monitoring

Inleiding

Condition monitoring van een machine of enkele van haar onderdelen omvat een complex proces van gegevensverzameling en -verwerking van verschillende sensoren, gewoonlijk met hoge frequenties. Een efficiënte architectuur voor een gegevensverzamelingssysteem steunt, naast andere belangrijke factoren, op een geschikt bestandsformaat om de metingen van de sensoren op te slaan.  Deze metingen moeten niet alleen worden opgeslagen, maar ook gelabeld en gestructureerd, zodat zij tijdens de verwerkingsfase efficiënt kunnen worden teruggevonden.

Wat is het HDF5 bestandstype?

Het HDF5-formaat (Hierarchical Data Format 5) is een opslagformaat voor grote en complexe datasets. Het is ontwikkeld door het National Center for Supercomputing Applications (NCSA) en wordt gebruikt door wetenschappers en ingenieurs op allerlei gebieden.

HDF5 is ontworpen om grote hoeveelheden gestructureerde en ongestructureerde gegevens op te slaan, zoals afbeeldingen, audio, video, tekst, simulatieresultaten en andere soorten wetenschappelijke gegevens. Het formaat biedt een hiërarchische structuur waarin gegevens kunnen worden opgeslagen als datasets, groepen en attributen.

 

Voordelen van HDF5

Het gebruik van HDF5 voor de opslag van experimentele gegevens heeft een aantal voordelen. Wat de gegevensopslag betreft, kunnen heterogene gegevens in hetzelfde bestand worden opgenomen. Bovendien is HDF5 een gecomprimeerd formaat, waardoor een grote hoeveelheid gegevens van een complex experiment in hetzelfde bestand van redelijke omvang kan worden opgeslagen. 

Wat de toegang tot gegevens betreft, ondersteunt HDF5 het slicen van gegevens. Dit betekent dat men toegang heeft tot een subset van de in het bestand opgeslagen gegevens zonder de volledige inhoud ervan in het RAM-geheugen van de computer te laden, wat cruciaal is bij het werken met grote datasets. 

Een andere belangrijke eigenschap is zelfbeschrijving. Met HDF5 kunnen metadata worden toegekend aan verschillende subsets van de inhoud van het bestand, wat een grote flexibiliteit geeft bij het annoteren van de gegevens. Bovendien vergemakkelijkt dit het automatisch ophalen van informatie uit de metadata. 

Ten slotte is HDF5 een open standaard, en wordt het ondersteund door diverse programmeertalen en gereedschappen zoals C, Python, R, MATLAB, LabView, en meer. Hierdoor kunnen de experimentele gegevens in een HDF5-bestand worden gebruikt door wetenschappers en ingenieurs die verschillende computerplatforms en software gebruiken.

Nadelen

Geen enkel bestandsformaat is perfect, en HDF5 vormt daarop geen uitzondering. Vanwege de complexiteit van de specificatie is er slechts één volledig ontwikkelde implementatie, wat problemen kan opleveren als deze implementatie afwijkt van de HDF5-specificatie. Bovendien moet elke gebruiker en ontwikkelaar omgaan met de bugs die van tijd tot tijd opduiken.  

Een ander probleem is dat HDF5 een binair formaat is, en dus niet menselijk leesbaar. Het moet worden verkend met een viewerprogramma, zoals HDF5View, of via een door de gebruiker gemaakt programma, maar het gebruik van standaardtools in Unix en Windows om bestanden te verkennen is niet mogelijk.  

Niettemin wordt het HDF5-formaat al enkele decennia op grote schaal gebruikt in wetenschappelijke toepassingen, waaruit blijkt dat de robuustheid en efficiëntie ervan opwegen tegen de tekortkomingen.

Relevantie voor condition monitoring

Zoals we in de inleiding hebben besproken, omvat conditiebewaking het verzamelen, opslaan en analyseren van machinegegevens met behulp van een breed scala aan sensoren, zoals versnellingsmeters, microfoons, rekstrookjes, krachtopnemers en meer. Dit gebeurt vaak met hoge bemonsteringsfrequenties, met name wanneer trillingsanalyse noodzakelijk is, bijvoorbeeld bij de bewaking van elementen zoals rollagers en tandwielen.  

Het bewakingsproces resulteert in grote hoeveelheden numerieke gegevens van heterogene sensoren, mogelijk van verschillende fabrikanten, die vaak op afstand moeten worden geraadpleegd om fouten op te sporen, de toestand van het machineonderdeel te beoordelen en de resterende nuttige levensduur in te schatten. De mogelijkheden van HDF5, die wij in dit artikel hebben besproken, voldoen zeer goed aan deze behoeften, en dus is dit bestandsformaat een zeer sterke kandidaat voor een universele manier om meetgegevens op te slaan.

Meer informatie?

Wil je meer informatie over het HDF5-formaat en het gebruik ervan bij conditiebewaking? Neem contact met ons op.