Home VestiIT i nauka Gomilanje nepotrebnih podataka i dalje mnogo košta kompanije

Gomilanje nepotrebnih podataka i dalje mnogo košta kompanije

by bifadmin

U svom prvom “Indeksu genomike podataka” kompanija Veritas Technologies, lider u oblasti upravljanja informacijama, objavila je prvi pouzdani uvid u sastav podataka velikih korporacija. Ovaj uvid u tekuće stanje korporativnih podataka, koji se odvija u realnom vremenu, otkriva nam da je više od 40% datoteka u kompanijskim okruženjima za skladištenje podataka ostalo netaknuto tokom tri godine od njihovog nastanka, što je jedna od prilika za smanjenje troškova čuvanja podataka. “Indeks genomike podataka” je prvi korak u smeru merenja performansi okruženja za skladištenje podataka velikih korporacija, kao i pobuđivanja interesovanja i stupanja u akciju kad je reč o ovom rastućem izazovu.

 

genomika p

 

“Indeks genomike podataka” (eng. Data Genomics Index) je prvi izveštaj koji s visokim stepenom tačnosti pruža uvid u okruženja za pohranjivanje i pristupanje podacima velikih korporacija, a istovremeno služi i kao etalon za izvođenje poređenja. Saznanja koja on pruža organizacijama mogu da ubrzaju pokretanje inicijativa za inteligentno postupanje i posvećivanje korektivnim merama tamo gde će one imati najbolji rezultat. Suštinski zaključci iz izveštaja uključuju sledeće:

 

podaci i skladistenje

 

Programeri dominiraju, a prezentacije su “odsvirale” svoje

Indeks nam otkriva da slike, programerske datoteke i komprimovane datoteke zauzimaju skoro jednu trećinu kapaciteta prosečnog okruženja za podatke velikih korporacija. Ako posmatramo po brojnosti, na programerske datoteke otpada ogromnih 20% ukupnog broja datoteka. Posmatramo li trendove za proteklih 10 godina, naspram ostalih tipova podataka, prezentacije su se redukovale petostruko. Konačno možemo s pouzdanošću da kažemo da više nema bojazni da će nam PowerPoint prezentacije doći glave.

 

Najzauzetiji smo u jesen

Jesen je dominantno godišnje doba za kreiranje datoteka. Najdrastičniji porast u jesen beleže tekstualne datoteke (91% više), geografski podaci (89%) i tabele (48% više). Očigledno je i to da najviše video snimaka nastaje leti i tokom jeseni, pa da ih onda, kad se vratimo s odmora prebacujemo na kompanijske diskove, što rezultira porastom broja video datoteka za 68 procenata.

 

41% podataka se “ubajati” tokom tri godine

Ako izuzmemo ono što je po zakonu potrebno čuvati duži niz godina, za podatke važi pravilo da su potencijalno relevantni tri godine, tj. da po isteku tog perioda oni postaju irelevantni, ustajali podaci. Ono što iznenađuje je visok prosečni udeo ustajalih podataka u sistemima za podatke od čak 41% onih koji se tri godine nisu ažurirali.

 

Prekomerno opterećenje napuštenih datoteka

Podaci čiji vlasnik više nije u prilici da im pristupi, bilo zbog toga što mu je uloga promenjena ili zbog toga što više nije u organizaciji u kojoj je radio, jednim imenom se zovu “siročad”. Podaci bivših zaposlenih su često skrajnuti i izvan vidokruga organizacija, a njihovo čuvanje i održavanje ih košta. Na osnovu nalaza iz “Indeksa genomike podataka” među napuštenim podacima su mahom video sadržaji, fotografije i prezentacije – tj. tipovi podataka tzv. bogate sadržine, a njih je rizično ostaviti bez ikakvog nadzora. Napušteni podaci zauzimaju 200% više prostora na disku nego što bi to bilo poželjno, gledano po raspodeli broja datoteka.

 

Male promene mogu imati velikog uticaja na troškove skladištenja podataka

Sličnim uvidima u svoje podatke organizacije bi mogle da odrede prioritetne oblasti u kojima mogu postići značajne rezultate. Tradicionalni “kancelarijski” formati datoteka poput prezentacija, tabela i dokumenata, kao ustajali sadržaji, zauzimaju više skladišnog prostora nego što bi trebalo, nepotrebno koštajući organizacije. Vizuelno bogati formati poput videa i slika takođe predstavljaju nepotreban balast. To su sve oblasti u kojima bi trud u arhiviranje, brisanje i migriranje bio pametno uložen. U prosečnom okruženju kapaciteta 10 petabajta, projekat arhiviranja usresređen na ustajale prezentacije, dokumente, tabele i tekstualne datoteke, mogao bi da donese uštedu u troškovima skladištenja od 2 miliona američkih dolara godišnje.

 

rast podataka

 

“Naši klijenti nam uvek pričaju da se bore s dve suprostavljene sile prirode – exponencijalnim rastom količine podataka i restrikcijama resursa i budžeta kojima bi se protiv tog rasta borili novim serverima i aplikacijama,” rekao je Steve Vranyes, CTO u kompaniji Veritas. “Sabirajući jedinstveno Veritasovo razumevanje ključnih karakteristika meta-podataka, u stanju smo da isteramo na površinu pouzdanu predstavu o prosečnom okruženju za skladištenje podataka. Ova uviđanja će promeniti obogaljujuće izazove s kojima se danas suočavaju dinamične kompanije koje se razvijaju i rastu.”

“Indeks genomike podataka” je prvo istraživanje koje meri tačne detalje realnih okruženja za podatke – počev od sastava po tipu podataka, preko distribucije prosečne starosti, sve do proporcija veličina pojedinačnih datoteka. Da bi obezbedila zajednicu i forum za ovo istraživanje i diskusiju, kompanija Veritas najavljuje “Projekat genomike podataka“, svojevrsnu inicijativu za istraživanje s ciljem da se organizacijama pomogne u razumevanju istinske prirode nestrukturiranih podataka koje stvaraju, skladište i s kojima upravljaju na dnevnom osnovu. Prvi u nizu “Indeks genomike podataka” predstavlja inicijalni doprinos ovoj stvari. Projekat će biti zajednica naučnika koji se bave podacima, stručnjaka ove oblasti industrije i vodećim misliocima koji grade genom podataka za upravljanje informacijama i dele svoja istraživanja i diskutuju s organizacijama širom sveta koje se pokušavaju da se izbore s velikim izazovima uslovljenim rastom količine podataka. Uprkos tome što je kompanija Veritas jedna od osnivača i aktivnih učesnika Projekta, on će ostati komercijalno razdvojen od biznisa.

Pročitajte i ovo...