Hvad er dataredundans?

Dataredundans opstår, når det samme stykke data er gemt to eller flere forskellige steder, og det er en almindelig foreteelse i mange virksomheder. Efterhånden som flere virksomheder bevæger sig væk fra siloedata til at bruge et centralt repository til at gemme oplysninger, finder de ud af, at deres database er fyldt med inkonsekvente dubletter af den samme post. Selv om det kan være en udfordring at afstemme – eller endda drage fordel af – dobbelte dataposter, kan en forståelse af, hvordan man effektivt reducerer og sporer dataredundans, være med til at mindske langsigtede inkonsekvensproblemer for din virksomhed.

Hvordan opstår dataredundans?

I nogle tilfælde sker dataredundans ved et uheld, mens det andre gange er forsætligt. Utilsigtet dataredundans kan være resultatet af en kompleks proces eller ineffektiv kodning, mens tilsigtet dataredundans kan bruges til at beskytte data og sikre konsistens – ganske enkelt ved at udnytte de mange forekomster af data til katastrofeberedskab og kvalitetskontrol.

Hvis dataredundans er tilsigtet, er det vigtigt at have et centralt felt eller rum for dataene. Dette giver dig mulighed for nemt at opdatere alle poster med redundante data, når det er nødvendigt. Når dataredundans ikke er tilsigtet, kan det føre til en række problemer, som vi vil diskutere nedenfor.

Download The Definitive Guide to Data Quality nu.
Læs nu

Forståelse af database versus filbaseret dataredundans

Dataredundans kan findes i en database, som er en organiseret samling af strukturerede data, der er gemt af et computersystem eller i skyen. En detailhandler kan have en database til at spore de produkter, de har på lager. Hvis det samme produkt ved en fejl bliver indtastet to gange, opstår der dataredundans.

Den samme detailhandler kan opbevare kundefiler i et fillagringssystem. Hvis en kunde køber hos virksomheden mere end én gang, kan hans navn være indtastet flere gange. Dobbelte indtastninger af kundenavnet betragtes som redundante data.

Uanset om dataredundans forekommer i en database eller i et fillagringssystem, kan det være problematisk. Heldigvis kan datareplikering hjælpe med at forhindre dataredundans ved at lagre de samme data på flere steder. Med datareplikering kan virksomheder sikre konsistens og modtage de oplysninger, de har brug for, når som helst.

Top 4 fordele ved dataredundans

Og selv om dataredundans lyder som en negativ begivenhed, er der mange organisationer, der kan drage fordel af denne proces, når den bevidst er indbygget i den daglige drift.

Alternativ metode til sikkerhedskopiering af data

Sikkerhedskopiering af data indebærer, at der oprettes komprimerede og krypterede versioner af data og lagres i et computersystem eller i skyen. Dataredundans giver et ekstra beskyttelseslag og forstærker sikkerhedskopien ved at replikere data til et ekstra system. Det er ofte en fordel, når virksomheder indarbejder dataredundans i deres katastrofeberedskabsplaner.

Bedre datasikkerhed

Datasikkerhed vedrører beskyttelse af data, i en database eller et fillagringssystem, mod uønskede aktiviteter såsom cyberangreb eller databrud. Ved at have de samme data gemt to eller flere forskellige steder kan man beskytte en organisation i tilfælde af et cyberangreb eller et brud – en begivenhed, der kan resultere i tabt tid og penge samt et skadet omdømme.

Hurtigere dataadgang og opdateringer

Når data er redundante, nyder medarbejderne godt af hurtig adgang og hurtige opdateringer, fordi de nødvendige oplysninger er tilgængelige på flere systemer. Dette er især vigtigt for kundeservicebaserede organisationer, hvis kunder forventer hurtighed og effektivitet.

Forbedret pålidelighed af data

Data, der er pålidelige, er fuldstændige og nøjagtige. Organisationer kan bruge dataredundans til at dobbelttjekke data og bekræfte, at de er korrekte og fuldstændigt udfyldt – en nødvendighed, når de interagerer med kunder, leverandører, interne medarbejdere og andre.

Vær opmærksom på ulemperne ved dataredundans

Og selv om der er bemærkelsesværdige fordele ved bevidst dataredundans, er der også flere betydelige ulemper, når organisationer ikke er opmærksomme på dens tilstedeværelse.

Mulig datainkonsistens

Data redundans opstår, når det samme stykke data findes flere steder, mens datainkonsistens er, når de samme data findes i forskellige formater i flere tabeller. Desværre kan dataredundans medføre datainkonsistens, hvilket kan give en virksomhed upålidelige og/eller meningsløse oplysninger.

Stigning i datakorruption

Datakorruption er, når data bliver beskadiget som følge af fejl i forbindelse med skrivning, læsning, lagring eller behandling. Når de samme datafelter gentages i en database eller et fillagringssystem, opstår der datakorruption. Hvis en fil f.eks. bliver beskadiget, og en medarbejder forsøger at åbne den, kan han/hun få en fejlmeddelelse og ikke være i stand til at fuldføre sin opgave.

Stigning i databasestørrelse

Dataredundans kan øge størrelsen og kompleksiteten af en database – hvilket gør det til en større udfordring at vedligeholde den. En større database kan også føre til længere indlæsningstider og en hel del hovedpine og frustrationer for medarbejderne, da de skal bruge mere tid på at udføre daglige opgaver.

Stigning i omkostninger

Når der skabes flere data på grund af dataredundans, stiger lageromkostningerne pludselig. Dette kan være et alvorligt problem for organisationer, der forsøger at holde omkostningerne nede for at øge overskuddet og opfylde deres mål. Desuden kan det blive dyrere at implementere et databasesystem.

Hvordan man kan reducere dataredundans

Glædeligvis er det muligt at reducere utilsigtede tilfælde af dataredundans, som ofte fører til operationelle og økonomiske problemer.

Masterdata

Masterdata er en enkelt kilde til fælles forretningsdata, som deles på tværs af flere applikationer eller systemer. Selv om stamdata ikke reducerer forekomsten af dataredundans, giver det virksomhederne mulighed for at arbejde uden om og acceptere et vist niveau af dataredundans. Dette skyldes, at brugen af stamdata sikrer, at en organisation kun behøver at opdatere ét datastykke i tilfælde af ændringer i et datastykke. I dette tilfælde er redundante data konsekvent opdateret og giver de samme oplysninger.

Se hvordan man organiserer og styrer data på skala nu.
Se nu

Databasenormalisering

Databasenormalisering er processen til effektiv organisering af data i en database, så overflødige data elimineres. Denne proces kan sikre, at alle en virksomheds data ser ud og læses ens på tværs af alle poster. Ved at implementere datanormalisering standardiserer en organisation datafelter som f.eks. kundenavne, adresser og telefonnumre.

Normalisering af data indebærer organisering af kolonnerne og tabellerne i en database for at sikre, at deres afhængigheder håndhæves korrekt. Den “normale form” henviser til det sæt regler eller normalisering af data, og en database er kendt som “normaliseret”, hvis den er fri for slette-, opdaterings- og indsætningsanomalier.

Når det gælder normalisering af data, har hver virksomhed sit eget unikke sæt af kriterier. Derfor er det, som en organisation mener er “normalt”, måske ikke “normalt” for en anden organisation. F.eks. ønsker en virksomhed måske at normalisere feltet for stat eller provins med to cifre, mens en anden måske foretrækker det fulde navn. Uanset hvad kan normalisering af databaser være nøglen til at reducere redundans af data i alle virksomheder.

Brugssituationer for effektiv dataredundans

Effektiv dataredundans er mulig. Mange organisationer som f.eks. boligforbedringsfirmaer, ejendomsmæglere og virksomheder, der fokuserer på kundeinteraktioner, har CRM-systemer (Customer Relationship Management).

Når et CRM-system er integreret med et andet forretningsprogram som f.eks. et regnskabsprogram, der kombinerer kunde- og økonomidata, elimineres overflødige manuelle data, hvilket fører til mere indsigtsfulde rapporter og forbedret kundeservice.

Databaseadministrationssystemer anvendes også i en række forskellige organisationer. De modtager vejledning fra en databaseadministrator (DBA) og gør det muligt for systemet at indlæse, hente eller ændre eksisterende data fra systemerne. Database management systemer overholder reglerne for normalisering, hvilket reducerer redundans af data.

Hospitaler, plejehjem og andre enheder inden for sundhedssektoren bruger databasestyringssystemer til at generere rapporter, der giver nyttige oplysninger til læger og andre medarbejdere. Når dataredundans er effektiv og ikke fører til datainkonsistens, kan disse systemer advare sundhedsvæsenet om stigninger i antallet af afviste krav, hvor vellykket en bestemt medicinering er, og andre vigtige oplysninger.

Download Hvordan sundhedsorganisationer opnår succes med dataintegration nu.
Læs nu

Reduktion af dataredundans med datastyring

Og selv om dataredundans i en database eller et fillagringssystem kan være til gavn for en organisation, når det er tilsigtet, kan denne proces også være skadelig, når den sker ved et uheld. Virksomheder kan afhjælpe den hovedpine, der ofte følger med dataredundans, med Talend Data Fabric.

Talend Data Fabric giver dig mulighed for at indsamle, styre, transformere og dele data med interne interessenter, samtidig med at du muliggør automatiseret datakvalitet. Prøv Talend Data Fabric i dag for at afhjælpe problemer med dataredundans.

Skriv en kommentar