SubstituțieEdit
Substituția este una dintre cele mai eficiente metode de aplicare a mascării datelor și de păstrare a aspectului autentic al înregistrărilor de date.
Permite ca mascarea să fie efectuată astfel încât o altă valoare cu aspect autentic să poată fi înlocuită cu valoarea existentă. Există mai multe tipuri de câmpuri de date pentru care această abordare oferă un beneficiu optim în disimularea subansamblului general de date cu privire la faptul că este sau nu un set de date mascat. De exemplu, dacă este vorba de date sursă care conțin înregistrări de clienți, numele de familie sau prenumele reale pot fi înlocuite aleatoriu dintr-un fișier de căutare furnizat sau personalizat. Dacă prima trecere a substituției permite aplicarea unui prenume masculin la toate prenumele, atunci a doua trecere ar trebui să permită aplicarea unui prenume feminin la toate prenumele în care genul este egal cu „F”. Folosind această abordare am putea menține cu ușurință amestecul de genuri în cadrul structurii de date, am putea aplica anonimatul înregistrărilor de date, dar am putea, de asemenea, să menținem o bază de date cu aspect realist, care nu ar putea fi identificată cu ușurință ca fiind o bază de date formată din date mascate.
Această metodă de substituție trebuie aplicată pentru multe dintre câmpurile care se află în structurile BD din întreaga lume, cum ar fi numerele de telefon, codurile poștale și codurile poștale, precum și numerele cărților de credit și alte numere de tip card, cum ar fi numerele de securitate socială și numerele Medicare, în cazul în care aceste numere trebuie de fapt să se conformeze unui test al sumei de control al algoritmului Luhn.
În cele mai multe cazuri, fișierele de substituție vor trebui să fie destul de extinse, astfel încât existența unor seturi mari de date de substituție, precum și capacitatea de a aplica seturi personalizate de substituție a datelor ar trebui să fie un element cheie al criteriilor de evaluare pentru orice soluție de mascare a datelor.
ShufflingEdit
Metoda de amestecare este o formă foarte comună de ofuscare a datelor. Este similară cu metoda substituției, dar derivă setul de substituție din aceeași coloană de date care este mascată. În termeni foarte simpli, datele sunt amestecate aleatoriu în cadrul coloanei. Cu toate acestea, dacă este utilizat în mod izolat, oricine care cunoaște datele originale poate aplica un scenariu „Ce se întâmplă dacă” la setul de date și apoi poate reconstitui o identitate reală. Metoda de amestecare este, de asemenea, susceptibilă de a fi inversată dacă algoritmul de amestecare poate fi descifrat.
Shuffling, totuși, are câteva puncte forte reale în anumite domenii. Dacă, de exemplu, cifrele de sfârșit de an pentru informații financiare dintr-o bază de date de testare, se pot masca numele furnizorilor și apoi se poate amesteca valoarea conturilor în întreaga bază de date mascată. Este foarte puțin probabil ca cineva, chiar și cineva cu o cunoaștere intimă a datelor originale, să poată obține o înregistrare de date adevărată înapoi la valorile sale originale.
Varianța numerică și varianța de dateEdit
Metoda varianței numerice este foarte utilă pentru aplicarea la câmpurile de informații financiare și la cele bazate pe date. În mod eficient, o metodă care utilizează acest mod de mascare poate lăsa în continuare un interval semnificativ într-un set de date financiare, cum ar fi salariile. Dacă varianța aplicată este de aproximativ +/- 10%, atunci este încă un set de date foarte semnificativ în ceea ce privește intervalele de salarii care sunt plătite destinatarilor.
Același lucru este valabil și pentru informațiile privind data. Dacă setul general de date trebuie să păstreze integritatea datelor demografice și actuariale, atunci aplicarea unei variații numerice aleatorii de +/- 120 de zile la câmpurile de date ar păstra distribuția datelor, dar ar împiedica în continuare urmărirea până la o entitate cunoscută pe baza datei sau a datei de naștere reale cunoscute sau a unei valori de dată cunoscute pentru orice înregistrare care este mascată.
CriptareEdit
Criptarea este adesea cea mai complexă abordare pentru a rezolva problema mascării datelor. Algoritmul de criptare necesită adesea aplicarea unei „chei” pentru a vizualiza datele în funcție de drepturile utilizatorului. Aceasta pare adesea cea mai bună soluție, dar, în practică, cheia poate fi apoi furnizată personalului care nu are drepturile corespunzătoare pentru a vizualiza datele. Acest lucru contrazice atunci scopul exercițiului de mascare. Bazele de date vechi pot fi apoi copiate cu acreditările originale ale cheii furnizate și aceeași problemă necontrolată continuă să trăiască.
Recent, problema criptării datelor păstrând în același timp proprietățile entităților a fost recunoscută și a dobândit un interes nou în rândul furnizorilor și al mediului academic. Noua provocare a dat naștere unor algoritmi numiți FPE (format preserving encryption). Aceștia se bazează pe modalitatea algoritmică AES acceptată, ceea ce face ca ei să fie recunoscuți de NIST.
Nulling out or deletionEdit
Câteodată se adoptă o abordare foarte simplistă a mascării prin aplicarea unei valori nule la un anumit câmp. Abordarea cu valoare nulă este cu adevărat utilă doar pentru a împiedica vizibilitatea elementului de date.
În aproape toate cazurile, aceasta diminuează gradul de integritate a datelor care se menține în setul de date mascat. Nu este o valoare realistă și va eșua apoi la orice validare a logicii aplicației care ar fi putut fi aplicată în software-ul front-end care se află în sistemul testat. De asemenea, evidențiază pentru oricine dorește să facă inginerie inversă cu privire la oricare dintre datele de identitate că mascarea datelor a fost aplicată într-o anumită măsură asupra setului de date.
Mascarea de eliminareEdit
Brambureala caracterelor sau mascarea anumitor câmpuri este, de asemenea, o altă metodă simplistă, dar foarte eficientă, de a împiedica vizualizarea informațiilor sensibile. Este, de fapt, o extensie a metodei anterioare de anulare, dar se pune un accent mai mare pe menținerea datelor reale și nu pe mascarea totală a acestora.
Aceasta se aplică în mod obișnuit datelor cardurilor de credit în sistemele de producție. De exemplu, un operator de la un call center poate factura un articol pe cardul de credit al unui client. Aceștia citează apoi o referință de facturare a cardului cu ultimele 4 cifre XXXX XXXX XXXX xxxx 6789. În calitate de operator, acesta poate vedea doar ultimele 4 cifre ale numărului de card, dar odată ce sistemul de facturare transmite detaliile clientului pentru taxare, numărul complet este dezvăluit sistemelor de gateway de plată.
Acest sistem nu este foarte eficient pentru sistemele de testare, dar este foarte util pentru scenariul de facturare detaliat mai sus. Este, de asemenea, cunoscut în mod obișnuit ca o metodă de mascare dinamică a datelor.
Reguli complexe suplimentareEdit
Reguli suplimentare pot fi, de asemenea, integrate în orice soluție de mascare, indiferent de modul în care sunt construite metodele de mascare. Cărțile albe agnostice față de produse sunt o bună sursă de informații pentru explorarea unora dintre cele mai comune cerințe complexe pentru soluțiile de mascare a datelor în întreprinderi, care includ reguli de sincronizare internă a rândurilor, reguli de sincronizare internă a tabelelor și reguli de sincronizare între tabele.
.