Oryginalna propozycja for the World Wide Web, napisany przez Tima Bernersa-Lee w 1989 roku, jest ważnym elementem historii Internetu. Nie można go również otworzyć na nowoczesnych komputerach.
John Graham-Cumming, brytyjski inżynier i pisarz oprogramowania, próbował otworzyć dokument Word zawierający propozycję. Zarówno współczesne wersje programów Microsoft Word, jak i Apple Pages całkowicie nie otwierały pliku, jak opisał w wpis na blogu. Procesor tekstu typu open source LibreOffice zadziałało, chociaż z niechlujnym formatowaniem. Graham-Cumming ostatecznie znalazł plik PDF wyeksportowany przez CERN w 1998 r. i tylko dzięki temu mógł zobaczyć dokument w stanie, w jakim istniał w 1989 r.
Niepokojące jest to, że tak ważny fragment historii, w tak powszechnym formacie pliku, może zostać prawie całkowicie utracony na skutek upływu czasu i aktualizacji oprogramowania. Każdy, kto posiada kolekcję starych cyfrowych dokumentów, zdjęć i filmów, może zastanawiać się, czy to samo stanie się z ich plikami. Okazuje się, że z tym pytaniem nieustannie borykają się archiwiści cyfrowi. Skontaktowałem się więc z jednym.
„Dwadzieścia lat w dziedzinie cyfrowej to szmat czasu” – mówi Lance Stuchell, dyrektor ds. usług konserwacji cyfrowej na Uniwersytecie Michigan. Jego zespół często otrzymuje zadanie odzyskiwania plików cyfrowych ze starych komputerów i nośników danych. „Mamy laboratorium, które zajmuje się starymi nośnikami – stacjami dyskietek, płytami CD, starszymi komputerami. Możemy to pobrać z tego typu nośników i przenieść do naszego systemu przechowywania, jednocześnie upewniając się, że tego nie zepsujemy”.
Jednak usunięcie plików z dysku to dopiero pierwszy krok: następnie należy je otworzyć i pozostawić w stanie, w którym będzie można je otwierać przez dziesięciolecia. Ta praca dała Stuchellowi powód do zastanowienia się nad strategiami przechowywania dokumentów tak długo, jak to możliwe. Zapytałem go, co powinni zrobić ci z nas, którzy nie są zawodowymi archiwistami, aby nasze akta przetrwały dziesięciolecia.
Używaj otwartych formatów
Dokument programu Word, o którym wspomniałem wcześniej, nie mógł być już otwarty w programie Microsoft Word, ponieważ oprogramowanie zmieniało się z biegiem czasu. Jest to część wyzwania związanego z archiwizacją plików cyfrowych.
„W przypadku rzeczy fizycznych im mniej na nie patrzysz, tym dłużej to trwa” – mówi Stuchell. „Rzeczy cyfrowe – stale walczymy z przestarzałością. W miarę upływu czasu plik traci informacje”.
Aktualizacje oprogramowania takiego jak Microsoft Word oznaczają, że pliki, które dobrze się otwierały w latach 80., nie otwierają się w latach 20. XXI wieku. Część problemu: Microsoft i tylko Microsoft kontroluje format pliku, a nawet wie, jak on działa. Z tego powodu Stuchell zachęca ludzi do eksportowania plików w otwartym formacie — zwłaszcza tych, które chcą zachować dostępność przez dłuższy czas.
Do dokumentów, które poleca PDF/A, otwarty standard oparty na formacie PDF firmy Adobe, który zawiera wszystko, czego potrzebuje plik do otwarcia, w tym czcionki użyte w dokumencie. Microsoft Office, LibreOffice i Adobe Acrobat obsługują eksport do formatu PDF/A, co oznacza, że utworzenie takiego pliku jest stosunkowo łatwe. Stuchell zaleca archiwizację wszelkich dokumentów, które chcesz zachować w tym formacie.