Business-IT
11.09.2020
Langfristig speichern
1. Teil: „Digitale Dokumente beweissicher archivieren“

Digitale Dokumente beweissicher archivieren

Speicher-SymbolSpeicher-SymbolSpeicher-Symbol
Alexander Supertramp / shutterstock.com
Dokumente langfristig und beweissicher zu archivieren, stellt viele Firmen vor Probleme. Wichtig sind sowohl die Wahl des Speichermediums als auch des Managementsystems.
Wie einfach war doch die sichere Archivierung von Dokumenten im Prä-Computer-Zeitalter: Lange war Papier das perfekte Medium für die dauerhafte Aufbewahrung wichtiger Informationen. Ohne großen administrativen Aufwand konnten Papierdokumente lange und relativ platz­sparend aufbewahrt werden - und überlebten bei lediglich minimalen Vorkehrungen schadlos Jahrzehnte und gar Jahrhunderte.
Doch die Zeiten der papierbasierten Datenarchivierung sind vorbei. Heute müssen Unternehmen immer mehr elek­tronisch erzeugte Dokumente und Daten aufbewahren: Steuerdokumente, Verträge, Entwicklungsunterlagen oder Umsatzstatistiken - alles liegt digitalisiert vor. Viele dieser Unterlagen müssen Jahre, teilweise Jahrzehnte archiviert werden. Das schreibt der Gesetzgeber vor.
Im öffentlichen Sektor etwa sind Daten über 70 oder mehr als 100 Jahre vorzuhalten. Bei Geschäftsunterlagen beträgt der vorgeschriebene Archivierungszeitraum bis zu zehn Jahre, bei Patientendaten bis zu 30 Jahre. Gebäudepläne, Katas­tereinträge und Unterlagen für medizinische Geräte müssen sogar über die gesamte Nutzungszeit hinweg aufbewahrt werden.
Eine aktuelle Befragung von Statista im Auftrag von Kyocera Document Solutions zeigt, wie nachlässig viele Unternehmen hier sind. Kyocera-Business-Consultant Christoph Kuboth spricht von „alarmierenden Zahlen“ und beschreibt die gegenwärtige Situation so: „Dokumente werden unvollständig abgelegt, Aufbewahrungsfristen werden nicht eingehalten, nur rund ein Drittel der Befragten geht davon aus, dass aufbewahrte Dokumente nicht verfälscht werden können.“ Sein Rat: „Ich empfehle Betrieben und Organisationen aller Größenordnungen, schnell ihre Hausaufgaben zu machen.“

Backup, Archivierung & Co.

Dass die Dokumentenarchivierung in vielen Unternehmen nicht den Stellenwert hat, den sie haben sollte, liegt nicht nur am geringen Glamour des Themas. Oft ist es auch schlicht Unwissenheit. So verwechseln IT-Verantwortliche immer noch Backup und Archivierung - ein schwerwiegender und folgenreicher Fehler. Beide Konzepte unterscheiden sich nämlich in wesentlichen Punkten.
Ein Backup ist eine Kopie der Daten für den Fall, dass diese infolge Benutzerfehlern oder technischer Defekte verloren gehen. Diese Sicherungskopien werden in der Regel wenige Tage bis Wochen aufbewahrt und danach mit einer neuen Version überschrieben. Das Ziel eines Backups ist also die schnelle und unproblematische Wiederherstellung der Daten bei Verlust der Produktionsdaten.
Eine Archivierung dagegen ist das systematische und langfristige Lagern von Daten auf speziellen Datenträgern. Die Informationen sollten stabil, geschützt und jederzeit reproduzierbar sein. Von Langzeitarchivierung spricht man, wenn die Dokumente mindestens zehn Jahre aufbewahrt werden sollen. Und mit digitaler Archivierung ist allgemein die datenbankgestützte, langfristige, sichere Speicherung von Daten gemeint.
Die Archivierung ist oft an weitere Regeln gebunden wie Unveränderbarkeit, langfristige Wiederauffindbarkeit und Wiedergabefähigkeit. Häufig geht es auch darum, dass die betreffenden Daten nachträglich nicht mehr verändert werden dürfen. Man spricht in diesem Fall von revisionssicherer Archivierung. Diese revisionssichere Archivierung geht also noch einen Schritt weiter als die normale Archivierung und fordert, dass die Daten unveränderbar zu speichern sind.
10 Merksätze
Der Bitkom-Leitfaden „Elektronische Archivierung und GoBD - 10 Merksätze für die Unternehmenspraxis“ erläutert prägnant die wichtigsten Regelungen der GoBD:
  • Elektronische Archivierung ist technologieneutral.
  • Die Archivierung von Belegen hat zeitnah zu erfolgen.
  • Die elektronische Archivierung muss eine Unveränder­barkeit sicherstellen.
  • Archivierte Objekte müssen mit einem Index versehen werden.
  • Elektronisch archivierte Objekte müssen lesbar und auswertbar bleiben.
  • Steuerrelevante Daten dürfen im elektronischen Archivsystem aufbewahrt werden.
  • Elektronisch archivierte Objekte unterliegen der Betriebsprüfung.
  • Das elektronische Archivsystem darf vom Betriebsprüfer genutzt werden.
  • Die elektronische Archivierung darf unter bestimmten Voraussetzungen im Ausland erfolgen.
  • Das elektronische Archivierungsverfahren ist zu dokumentieren.
2. Teil: „Warum Archivieren so wichtig ist“

Warum Archivieren so wichtig ist

  • Typische Archiv-Infrastruktur: Speichersystem, Krypto-Komponenten für beweisrechtliche Archivierung und Archivschnittstellen.
    Quelle:
    BSI
Unternehmen müssen Geschäftsdokumente aus vielen Gründen archivieren. Der wichtigste sind gesetzliche Vorgaben. Bestimmte Dokumente wie Rechnungen, Geschäftsbriefe und Verträge müssen mindestens zehn Jahre aufbewahrt werden. Auch E-Mails sind davon betroffen - schließlich können sich auch hierin Details zu einem Angebot verstecken oder steuerrelevante Regelungen getroffen worden sein.
Die gesetzlichen Vorschriften für die langfristige Archi­vierung von Dokumenten sind das Handelsgesetzbuch, die Abgabenordnung (AO) und die „Grundsätze zur ordnungsmäßigen Führung und Aufbewahrung von Büchern, Aufzeichnungen und Unterlagen in elektronischer Form sowie zum Datenzugriff (GoBD)“. Die in diesen Kontexten relevanten Daten müssen Firmen bei Bedarf und in einem maschinenlesbaren Format umgehend Behörden wie dem Finanzamt zur Verfügung stellen können. 
Neben den gesetzlichen Vorgaben hat jedes Unternehmen zusätzlich interne Compliance-Regeln und regulatorische Anforderungen zu beachten, die oft branchenspezifisch sind. Beispielsweise müssen viele Finanzinstitute die strikten Vorgaben der US-Börsenaufsicht für Datenarchivierung, SEC 17a-4, erfüllen. In der Pharmabranche gilt GxPData als wichtige Vorgabe, im Healthcare-Bereich das HIPAA-Gesetz und die Röntgenverordnung.
Wichtig sind auch weitere Gesetze und Vorgaben wie HGB, SOX, Basel III, IDW PS 330, IDW PS 880, BDSG, das Schweizer Obligationenrecht OR und die Geschäftsbücherverordnung (GeBüV).
Branchenspezifische Vorgaben können besonders lange Archivierungszeiten fordern. In der Medizin müssen Patientendaten wie erwähnt über 30 Jahre aufbewahrt werden Im Bauwesen und bei Immobilien ist man bei Zeiträumen, die der Nutzungsdauer eines Objekts entsprechen. Und Konstruktionsdaten zum Beispiel müssen über den gesamten Lebenszyklus eines Produkts aufbewahrt werden, um eine Beweissicherung zu ermöglichen.

Dokumente als Beweise

Die Beweissicherung ist ein weiterer Punkt, warum Dokumente archiviert werden müssen. Diese „Beweiswerterhaltung“ oder „Revisionssicherheit“ ist wichtig, um etwa die
Gerichtsverwertbarkeit von elektronischen Dokumenten zu garantieren. Im Rahmen eines Schadenersatzprozesses wegen eines angeblichen Konstruktionsfehlers eines Produkts muss ein Unternehmen auch noch nach Jahrzehnten die Originalunterlagen vorlegen können.
Die Beweiswerterhaltung wird dadurch sichergestellt, dass die Inhalte unveränderlich sind. Zu diesem Zweck fordert sie den Nachweis, dass digitale Dokumente und Daten sowie zugehörige Meta-Informationen zu einem nachweisbaren Zeitpunkt vorgelegen haben und seitdem nicht verändert wurden. Dazu werden kryptografische Komponenten verwendet und ein sogenannter Beweiswert oder „Evidence Record“ an jedes Dokument angehängt - analog dem Personalausweis, der die Identität einer Person belegt. In der „Technischen Richtlinie für die revisionssichere Langzeitspeicherung“ hat das Bundesamt für Sicherheit in der Informationstechnik (BSI) mehrere rechtliche Grundlagen, darunter auch die Beweiswerterhaltung, zusammengefasst.
Neben diesen rechtlichen Vorgaben gibt es auch ganz pragmatische Gründe, Dokumente digital zu archivieren. So ermöglicht ein digitales Archiv, wertvolles Unternehmenswissen zentral und sicher abzulegen, sodass wichtige Informationen berechtigten Mitarbeitern jederzeit zur Verfügung stehen. Ein digitales Archiv ist zudem im Vergleich zu einem papierbasierten Archiv deutlich kostengünstiger. So sind Papierablagen nicht nur hinsichtlich der Lagerkosten teuer, sondern zusätzlich in puncto Arbeitskosten, wenn die Mitarbeiter lange mit dem Suchen von Dokumenten beschäftigt sind.
3. Teil: „Haltbarkeit von Speichermedien“

Haltbarkeit von Speichermedien

Die große Herausforderung der Langzeitarchivierung ist, die Lesbarkeit der Daten über eine lange Speicherungsdauer zu gewährleisten. Medien, auf denen Dokumente zehn Jahre oder länger abgelegt werden, sollten idealerweise nicht altern und möglichst resistent gegenüber äußeren Einflüssen sein. Doch die Realität ist eine andere: Bei optischen Medien wie DVDs oder Blu-Rays gilt eine Lebensdauer von zehn bis 30 Jahren als realistisch, bei Festplatten sind es nur etwa fünf Jahre. Bänder verlieren ihre Magnetisierung nach 20 bis 30 Jahren und überstehen selten 40 Jahre.
Selbst optimale Lagerbedingungen bieten keine Garantie, wie das Deutsche Musikarchiv leidvoll erfahren musste. Dort wurden 200 Musik-CDs, die zwischen 1983 und 1986 zur
Archivierung eingegangen waren, unbrauchbar. In rund 25 Jahren Lagerung haben sie aggressive Lacke des Label­aufdrucks zerstört.
Doch nicht nur die Haltbarkeit des Mediums ist ein Pro­blem. Im Gegensatz zu Printprodukten, die lediglich dem zeitlich bedingten Materialverfall unterliegen, muss bei digitalen Dokumenten immer auch der technologische Fortschritt mit einkalkuliert werden. Es sollte deshalb auch berücksichtigt werden, wie lange die Hard- und Software zur Verfügung steht, mit der sich archivierte Daten auslesen lassen. Niemand garantiert, dass Lesegeräte über viele Jahre hinweg verfügbar sind. 
Marktübliche Computer haben beispielsweise schon lange kein Diskettenlaufwerk mehr integriert. Schon heute ist es schwierig, einen in den 1980er-Jahren auf 3,5-Zoll- oder gar 5,25-Zoll-Disketten gespeicherten Vertrag lesen zu können. In wenigen Jahren gibt es mit großer Wahrscheinlichkeit keine CD- und DVD-Laufwerke mehr. Beispiele für Probleme mit veralteten Speichertechnologien gibt es in Hülle und Fülle. So konnte die NASA auf Daten der Saturnmission der Raumsonde Pioneer in Ermangelung entsprechender Lesegeräte nicht mehr zugreifen - trotz redundanter Speicherung auf verschiedenen Datenträgertypen.

Das WORM-Verfahren

Müssen Daten revisionssicher archiviert werden, galten lange Zeit Speichermedien nach dem WORM-Verfahren (Write Once Read Multiple) als einzige rechtskonforme Möglichkeit. WORM-Medien wie CD-R oder DVD-ROM sind nur einmal beschreibbar und werden damit den rechtlichen Anforderungen der Unveränderbarkeit von Daten gerecht. Diese Speichermedien sind - anders als Festplatten oder Tapes - aufgrund ihrer physikalischen Eigenschaften gegen Veränderungen geschützt.
Speziell für die elektronische Archivierung in Unternehmen wurde die 5,25-Zoll-WORM entwickelt. Anders als CD und DVD, die für den Endverbrauchermarkt bestimmt sind, fassen 5,25-Zoll-WORMs mehr Daten. Für die Verwaltung und Nutzung der WORM-Medien im Unternehmenseinsatz waren lange Plattenwechselautomaten, sogenannte Jukeboxen, gebräuchlich. Die Speichermedien befanden sich in stabilen Cartridges, die die Jukebox bei Bedarf automatisch wechselte, und galten als langlebig und fälschungssicher.
Diese Technologie litt jedoch unter mehreren Einschränkungen. So waren verschiedene Medientypen nicht kompatibel, sodass beim Austausch ein langwieriges Umkopieren der Daten nötig war. Die Verwaltung der teils ausgelagerten Medien war ebenso umständlich wie fehleranfällig. Vor allem hielt die eingeschränkte Skalierbarkeit der Jukeboxen den wachsenden Datenmengen nicht stand, und die Geschwindigkeit beim Zugriff genügte den Nutzeranforderungen nicht. Auch die nachfolgenden proprietären Archiv-Appliances sind wegen vieler Nachteile heute kaum mehr üblich.
Tabelle:

4. Teil: „Archivierungsmedien“

Archivierungsmedien

Maßgeblich für das Verschwinden dieser Medien war auch der Abschied von der rein hardwarebasierten Revisionssicherheit. Die Ausschließlichkeit der revisionssicheren Speicherung auf WORM-Datenträgern gilt nicht mehr. Die Finanzbehörden haben ausdrücklich darauf hingewiesen, dass für die Archivierung keine speziellen Datenträger gefordert sind. Vielmehr kann auf Medien jeder Art archiviert werden, wenn die Revisionssicherheit per Software sichergestellt wird.
Seitdem verwenden viele Anbieter von Archivierungslösungen günstigere Datenträger wie Festplatten zur Archivierung. Die Revisionssicherheit implementieren sie innerhalb ihrer Dokumentensysteme per Software-Schreibschutz - zur Unterscheidung vom Hard-WORM der echten WORM-Laufwerke und -Medien oft als Soft-WORM bezeichnet.
In der Tat gelten Festplatten inzwischen auch für die Langzeitarchivierung als ebenso geeignete Datenträger wie Magnetbänder - das historisch beliebteste Archivierungsmedium. Nach einer Studie der amerikanischen Marktforschungsgesellschaft Enterprise Strategy Group (ESG) dominieren heute im Bereich Langzeitarchivierung im Wesentlichen vier Medientypen: interne Festplatten, externe Storage-Systeme mit Hard-Disks, etwa NAS-Geräte (Network-Attached Storage), Speichersysteme, die in ein Storage Area Network (SAN) eingebunden sind, und Bandlaufwerke. Optische Medien wie DVDs spielen heute kaum mehr eine Rolle.
IT-Verantwortliche haben also, was das Archivierungsmedium betrifft, im Prinzip freie Hand. Beachtet werden muss aber in jedem Fall die erwartete Lebensdauer der Datenträger. Egal welches Medium für die Archivierung eingesetzt wird: Wichtig ist immer, die archivierten Daten rechtzeitig auf aktuelle Medien umzukopieren. Als Faustregel gilt, dass dies spätestens alle fünf Jahre erfolgen sollte.

Die Formatfrage

Ähnlich problematisch wie die Wahl des Speichermediums gestaltet sich die Formatfrage. Wer kann heute sicherstellen, dass es Dateiformate wie DOC oder XLS in zehn oder zwanzig Jahren noch gibt? Was passiert, wenn sich archivierte PDFs nicht mehr öffnen lassen? Irgendwann verschwindet jedes Format oder wird gravierend geändert. Dann sind ältere Dokumente wegen fehlender Kompatibilität nicht mehr lesbar.
Institutionen wie das BSI empfehlen für die Archivierung ausschließlich Standardformate. Dazu gehören nur wenige Dateitypen und Dokumentenbeschreibungssprachen. Im Kern sind dies die Textformate PDF/A, SGML, XML und ASCII sowie die Bildformate JPEG und TIFF.
Eine besondere Bedeutung kommt PDF zu. Seit die ISO 2005 das PDF/A-Format (A = Archive) als Standard für die Langzeitarchivierung von Dokumenten zertifiziert hat, wird das Format im Markt hoch gehandelt. Der ISO-Standard 19005-1 PDF/A basiert auf PDF 1.4, schließt aber einige Funktionen aus, die eine langfristige Darstellbarkeit beeinträchtigen könnten. So ist beispielsweise die Verwendung externer oder spezifischer Ressourcen wie eingebetteter Fonts nicht erlaubt. Durch diese und andere detaillierte Vorschriften soll eine langfristige Lesbarkeit der Dokumente garantiert sein.
Der Vorteil von PDF/A: Ein PDF/A-konformes Dokument kann den Inhalt auf verschiedenen Computern mit unterschiedlichen Betriebssystemen und unter verschiedenen Druckumgebungen visuell gleich reproduzieren. Es bettet zum Beispiel alle Schriften und Farbprofilinformationen in das Dokument ein. Dynamischer Inhalt eines PDFs ist nicht gestattet. Der PDF/A-Standard ist also eine Beschränkung auf die wesentlichen Informationen.
Tabelle:

5. Teil: „Dokumentenmanagement“

Dokumentenmanagement

Voraussetzung für eine effiziente Langzeitarchivierung ist in der Praxis ein funktionierendes Datenmanagement. Für die Archivierung müssen die Daten, die oft in verschiedenen Abteilungen liegen, zusammengeführt, konsolidiert, in Standardformate überführt und abgelegt werden.
Bei der Archivierung müssen bestimmte Regeln befolgt werden. Die GoBD fordert etwa, dass relevante digitale Dokumente im Ursprungsformat aufbewahrt werden müssen. Eine Rechnung in Form einer PDF-Datei ist auch als PDF-Datei zu speichern. Werden aufbewahrungspflichtige Unterlagen in ein unternehmenseigenes Format konvertiert, müssen grundsätzlich beide Versionen aufbewahrt werden. Papierdokumente können erst vernichtet werden, wenn eine ordnungsgemäße elektronische Archivierung sichergestellt ist.
Nur die Originaldaten im Archivsysteme abzulegen reicht dabei nicht aus, weil sie auch wiedergefunden werden müssen. Daher müssen Zusatzdaten zu Struktur und Inhalt der Originaldaten mit aufgenommen werden. Diese Metadaten bilden zudem die Grundlage für die Indizierung des Datenbestands.
Alle Dokumente und die Metadaten sollten digital erzeugt oder übernommen werden. Das stellt sicher, dass Dokumente dieselben Datenformate aufweisen und nach einheitlichen Kriterien indiziert werden. Die Praxis zeigt, dass es sinnvoll ist, eine flexible Archivierungslösung zu implementieren, die unabhängig von Applikation und Speichermedium ist. So kann mit einem softwarebasierten Archivierungsansatz eine zukunftssichere Langzeitdatenspeicherung und eine rechtskonforme Archivierung erreicht werden.

Software-Anforderungen

Ein digitales Archivierungssystem sollte sowohl mit textbasierten Dokumenten als auch mit Multimedia-Inhalten umgehen können, verschiedene Datenträger wie Bänder und Festplatten unterstützen, den rechtlichen Vorgaben entsprechen, hochverfügbar sein und mit Standardformaten wie PDF und TIFF arbeiten und diese durchsuchen können. Auch Papier­dokumente sollten sich nach einer Digitalisierung verwalten lassen. Heute erledigt die gesetzes- und GoBD-konforme Archivierung üblicherweise Enterprise-Content-Manage­ment(ECM)- und Dokumenten-Management(DM)-Software. Während sich DM-Systeme ausschließlich auf die Aufbewahrung, Verwaltung und Nachverfolgung elektronischer Dokumente beschränken, übernehmen ECM-Systeme umfassendere Aufgaben. DM-Lösungen sind eher im Mittelstand verbreitet, ECM-Systeme werden hauptsächlich von größeren Unternehmen eingesetzt.
Jedes Dokument, das in das DM- oder ECM-System eingepflegt wird, wird nach Vorgaben automatisch indexiert, verschlagwortet und kann rechts- und revisionssicher archiviert werden. Verfügt die Software über eine OCR-Texterkennung, liest sie den Inhalt gescannter Dokumente aus und indexiert ihn. Bei Eingabe eines Suchbegriffs erscheinen in Sekundenbruchteilen alle Dateien, die den gesuchten Text enthalten. Die Archivierungs-Software vereinfacht schließlich auch Betriebsprüfungen durch das Finanzamt. Und eine Verfahrensdokumentation für die Rechnungsbearbeitung und -archivierung kann die Einhaltung der GoBD-Vorschriften zuverlässig nachweisen und somit den Prüfprozess wesentlich erleichtern und verkürzen.

Ausblick: Archiv als Service

Laut der Studie „Digital Office im Mittelstand 2019“ des Digitalverbands Bitkom nutzen mittlerweile 96 Prozent der größeren Unternehmen Software für das Management und die Archivierung von Dokumenten. „Unsere Untersuchungen zeigen, dass sich die Investitionen in DMS-Lösungen lohnen und die Erwartungen überwiegend erfüllen“, resümiert Axel Pols, Geschäftsführer von Bitkom Research. „Knapp zwei Drittel der DMS-Nutzer geben an, dass die Kundenzufriedenheit durch den Einsatz von DMS-Lösungen zugenommen hat.“ Die Archivierungsfunktionen bilden dabei den wichtigsten Kern. Laut der eingangs erwähnten Kyocera-Studie schätzen unter den DMS-Nutzern die meisten Mitarbeiter  (69 Prozent) vor allem die Archivierungsfunktion.
In neuerer Zeit gehen Anbieter von Archivierungslösungen dazu über, ihre Produkte als Software as a Service (SaaS) in der Cloud bereitzustellen. Dies ist auch bei der beweiserhaltenden Langzeitarchivierung möglich. Der Cloud-Provider hält in diesem Fall in seinem Rechenzentrum die Infrastruktur vor, also die Speichersysteme sowie die Software und Middleware wie etwa SecDocs von Fujitsu.
Bei der Nutzung von Cloud-Services sollte allerdings geprüft werden, ob der Anbieter über Sicherheitszertifikate wie ISO 27001 verfügt und wo die Daten physisch gelagert werden. Vorzuziehen sind Cloud-Provider, die Rechenzen­tren in Deutschland oder der Europäischen Union betreiben und den Vorgaben des EU-Datenschutzrechts unterliegen - oder noch besser den strengeren deutschen Datenschutzregeln.
Tabelle:


mehr zum Thema