Seit Jahren sorgen klassische ERP- und SCM-Systeme ebenso wie Web-2.0-Applikationen (Wikis, Blogs) und immer striktere Compliance-Anforderungen für eine exponentiell wachsende Datenmenge. Anwender reagieren darauf meist mit der Anschaffung zusätzlicher Speichersysteme, die hohe Kosten verursachen, aber kaum je ausgelastet werden. Einen Ausweg aus diesem Dilemma weist die Datendeduplikation.
Datenmonstren: Ursachen erkennen
Dass Organisationen ebenso wie Computerprogramme dazu tendieren, schon aus Vorsicht eine Menge Datensätze aufzubewahren, die nach kurzer Zeit niemand mehr braucht, ist hinlänglich bekannt. Bereits dadurch reifte das wöchentliche Voll-Backup für viele Administratoren zum Alptraum.

Strengere gesetzliche Auflagen und Branchenstandards wie etwa die GDPdU oder Basel II haben die Situation noch verschärft: Inzwischen kommen selbst mittelständische Betriebe kaum noch ohne Storage-Kapazitäten im Terabyte-Bereich aus, was große Lücken in die belasteten IT-Budgets reißt.
Stress und hohe Investitionen ließen sich indes in den meisten Fällen bequem vermeiden, da Expertenberichten zufolge zwischen 60 und 90 Prozent der aufbewahrten Daten aus völlig identischen Elementen bestehen. Diese Dubletten belegen wertvollen Festplattenspeicher, sind aber ihrer Natur nach völlig verzichtbar.
Mehr zu Deduplikation | Storage