Data Redundantie treedt op wanneer hetzelfde stuk data is opgeslagen op twee of meer verschillende plaatsen en is een veel voorkomend verschijnsel in veel bedrijven. Naarmate meer bedrijven overgaan van silogestructureerde gegevens op een centrale opslagplaats voor informatie, ontdekken ze dat hun database gevuld is met inconsistente duplicaten van dezelfde invoer. Hoewel het een uitdaging kan zijn om dubbele gegevensinvoer te verzoenen – of er zelfs voordeel uit te halen – kan een goed begrip van de manier waarop de redundantie van gegevens kan worden verminderd en efficiënt kan worden bijgehouden, helpen langdurige inconsistentieproblemen voor uw bedrijf te beperken.
Hoe ontstaat dataredundantie?
Soms ontstaat dataredundantie per ongeluk, soms is het opzettelijk. Onopzettelijke dataredundantie kan het gevolg zijn van een complex proces of inefficiënte codering, terwijl opzettelijke dataredundantie kan worden gebruikt om gegevens te beschermen en consistentie te waarborgen – eenvoudig door de meervoudige voorkomens van gegevens te benutten voor herstel na calamiteiten en kwaliteitscontroles.
Als dataredundantie opzettelijk is, is het belangrijk om een centraal veld of centrale ruimte voor de gegevens te hebben. Zo kunt u alle records met redundante gegevens gemakkelijk bijwerken wanneer dat nodig is. Wanneer redundantie van gegevens niet opzettelijk is, kan dit leiden tot een verscheidenheid aan problemen die we hieronder zullen bespreken.
Download nu De Definitieve Gids voor Datakwaliteit.
Lees nu
Gebruik van database- versus bestandsgebaseerde gegevensredundantie
Gegevensredundantie kan worden gevonden in een database, wat een georganiseerde verzameling van gestructureerde gegevens is die is opgeslagen door een computersysteem of de cloud. Een detailhandelaar kan een database hebben om de producten die hij in voorraad heeft te volgen. Als hetzelfde product per ongeluk twee keer wordt ingevoerd, is er sprake van gegevensontdubbeling.
Dezelfde detailhandelaar kan klantenbestanden bewaren in een bestandsopslagsysteem. Indien een klant meer dan eens bij het bedrijf koopt, kan zijn naam meerdere malen worden ingevoerd. Dubbele invoer van de naam van de klant wordt beschouwd als overbodige gegevens.
Of redundante gegevens nu in een database of in een bestandsopslagsysteem voorkomen, het kan problematisch zijn. Gelukkig kan gegevensreplicatie helpen redundantie van gegevens te voorkomen door dezelfde gegevens op meerdere locaties op te slaan. Met gegevensreplicatie kunnen bedrijven consistentie garanderen en op elk moment de informatie ontvangen die ze nodig hebben.
Top 4 voordelen van gegevensredundantie
Hoewel gegevensredundantie klinkt als een negatieve gebeurtenis, zijn er veel organisaties die kunnen profiteren van dit proces wanneer het opzettelijk wordt ingebouwd in de dagelijkse activiteiten.
Alternatieve methode voor gegevensback-up
Bij het back-uppen van gegevens worden gecomprimeerde en gecodeerde versies van gegevens gemaakt en opgeslagen in een computersysteem of de cloud. Gegevensredundantie biedt een extra beschermingslaag en versterkt de back-up door gegevens te repliceren naar een extra systeem. Het is vaak een voordeel wanneer bedrijven gegevensredundantie opnemen in hun noodherstelplannen.
Betere gegevensbeveiliging
Gegevensbeveiliging heeft betrekking op het beschermen van gegevens, in een database of een bestandsopslagsysteem, tegen ongewenste activiteiten, zoals cyberaanvallen of gegevensinbreuken. Het hebben van dezelfde gegevens opgeslagen op twee of meer afzonderlijke plaatsen kan een organisatie beschermen in het geval van een cyberaanval of -inbreuk – een gebeurtenis die kan resulteren in verloren tijd en geld, evenals een beschadigde reputatie.
Snellere toegang tot en updates van gegevens
Wanneer gegevens redundant zijn, genieten medewerkers van snelle toegang en snelle updates omdat de benodigde informatie op meerdere systemen beschikbaar is. Dit is met name van belang voor organisaties die op klantenservice zijn gebaseerd en waarvan de klanten snelheid en efficiëntie verwachten.
Verbeterde betrouwbaarheid van gegevens
Betrouwbare gegevens zijn volledig en nauwkeurig. Organisaties kunnen gegevensredundantie gebruiken om gegevens dubbel te controleren en te bevestigen dat ze correct en volledig zijn ingevuld – een noodzaak bij de interactie met klanten, verkopers, interne medewerkers en anderen.
Waarschuw de nadelen van dataredundantie
Hoewel er opmerkelijke voordelen zijn van opzettelijke dataredundantie, zijn er ook een aantal belangrijke nadelen wanneer organisaties zich niet bewust zijn van de aanwezigheid ervan.
Mogelijke data-inconsistentie
Data-redundantie treedt op wanneer hetzelfde stuk data op meerdere plaatsen bestaat, terwijl van data-inconsistentie sprake is wanneer dezelfde data in verschillende formaten in meerdere tabellen bestaat. Helaas kan gegevensredundantie gegevensinconsistentie veroorzaken, waardoor een bedrijf onbetrouwbare en/of betekenisloze informatie kan krijgen.
Toename van gegevenscorruptie
Van gegevenscorruptie is sprake wanneer gegevens beschadigd raken als gevolg van fouten bij het schrijven, lezen, opslaan of verwerken. Wanneer dezelfde gegevensvelden herhaaldelijk voorkomen in een database of bestandsopslagsysteem, ontstaat gegevenscorruptie. Als een bestand bijvoorbeeld beschadigd raakt en een werknemer probeert het te openen, kan hij een foutmelding krijgen en zijn taak niet kunnen voltooien.
Toename van databasegrootte
Data redundantie kan de omvang en complexiteit van een database vergroten – waardoor het een grotere uitdaging wordt om deze te onderhouden. Een grotere database kan ook leiden tot langere laadtijden en veel hoofdpijn en frustraties bij werknemers, omdat zij meer tijd zullen moeten besteden aan het voltooien van dagelijkse taken.
Stijging van de kosten
Wanneer er meer gegevens worden gecreëerd als gevolg van gegevensredundantie, nemen de opslagkosten plotseling toe. Dit kan een ernstig probleem zijn voor organisaties die de kosten laag proberen te houden om de winst te verhogen en hun doelstellingen te bereiken. Bovendien kan de implementatie van een databasesysteem duurder worden.
Hoe gegevensredundantie te verminderen
Gelukkig genoeg is het mogelijk om onbedoelde gevallen van gegevensredundantie, die vaak tot operationele en financiële problemen leiden, te verminderen.
Mastergegevens
Mastergegevens zijn een enkele bron van gemeenschappelijke bedrijfsgegevens die door verschillende applicaties of systemen worden gedeeld. Hoewel stamgegevens de redundantie van gegevens niet verminderen, stelt zij bedrijven in staat een zekere mate van gegevensredundantie te omzeilen en te accepteren. Het gebruik van masterdata zorgt er namelijk voor dat een organisatie bij een wijziging van een gegevenselement slechts één gegevenselement hoeft bij te werken. In dit geval worden redundante gegevens consistent bijgewerkt en bieden ze dezelfde informatie.
Bekijk nu hoe u gegevens op schaal kunt organiseren en beheren.
Watch Nu
Database normalisatie
Database normalisatie is het proces van het efficiënt organiseren van gegevens in een database, zodat overbodige gegevens worden geëlimineerd. Dit proces kan ervoor zorgen dat alle gegevens van een bedrijf er in alle records hetzelfde uitzien en op dezelfde manier worden gelezen. Door normalisering van gegevens te implementeren, standaardiseert een organisatie gegevensvelden zoals klantnamen, adressen en telefoonnummers.
Normalisatie van gegevens omvat het organiseren van de kolommen en tabellen van een database om ervoor te zorgen dat hun afhankelijkheden correct worden afgedwongen. De “normale vorm” verwijst naar de set van regels of het normaliseren van gegevens, en een database is bekend als “genormaliseerd” als het vrij is van verwijderen, bijwerken, en invoegen anomalieën.
Als het gaat om het normaliseren van gegevens, heeft elk bedrijf zijn eigen unieke set criteria. Wat voor de ene organisatie “normaal” is, is dat voor een andere organisatie misschien niet. Het ene bedrijf wil bijvoorbeeld het veld van de staat of provincie normaliseren met twee cijfers, terwijl een ander bedrijf de voorkeur geeft aan de volledige naam. Hoe dan ook, database normalisatie kan de sleutel zijn tot het verminderen van redundantie van gegevens in elk bedrijf.
Efficiënte use-cases voor gegevensredundantie
Efficiënte gegevensredundantie is mogelijk. Veel organisaties, zoals bedrijven voor woningverbetering, makelaars en bedrijven die zich richten op klantinteracties, hebben systemen voor relatiebeheer (CRM).
Wanneer een CRM-systeem wordt geïntegreerd met een andere bedrijfssoftware, zoals een boekhoudprogramma dat klant- en financiële gegevens combineert, worden overbodige handmatige gegevens geëlimineerd, wat leidt tot meer inzichtelijke rapporten en een betere klantenservice.
Database management systemen worden ook gebruikt in een verscheidenheid van organisaties. Zij krijgen aanwijzingen van een databasebeheerder (DBA) en stellen het systeem in staat bestaande gegevens uit de systemen te laden, op te halen of te wijzigen. Databasemanagementsystemen houden zich aan de regels van normalisatie, waardoor redundantie van gegevens wordt verminderd.
Ziekenhuizen, verpleeghuizen en andere entiteiten in de gezondheidszorg gebruiken databasebeheersystemen om rapporten te genereren die nuttige informatie bieden voor artsen en andere medewerkers. Wanneer de redundantie van gegevens efficiënt is en niet leidt tot inconsistentie van gegevens, kunnen deze systemen zorgverleners waarschuwen voor stijgingen in het percentage geweigerde claims, hoe succesvol een bepaalde medicatie is, en andere belangrijke stukjes informatie.
Download nu Hoe organisaties in de gezondheidszorg succes behalen met gegevensintegratie.
Lees nu
Reductie van gegevensredundantie met gegevensbeheer
Hoewel gegevensredundantie in een database- of bestandsopslagsysteem een organisatie ten goede kan komen wanneer het opzettelijk gebeurt, kan dit proces ook nadelig zijn wanneer het per ongeluk gebeurt. Bedrijven kunnen de hoofdpijn die vaak gepaard gaat met data redundantie verlichten met Talend Data Fabric.
Met Talend Data Fabric kunt u data verzamelen, beheren, transformeren en delen met interne belanghebbenden terwijl u geautomatiseerde datakwaliteit mogelijk maakt. Probeer Talend Data Fabric vandaag nog om data redundantie problemen te verminderen.