Digitaalisessa arkistoinnissa riittää haasteita

Copyright: Nina Kurki

Suomessa tiettyjen asiakirjojen säilyttämistä säädellään laein. Lait koskevat sekä paperimuotoisia että digitaalisia asiakirjoja. Nykyisin erilaisten virastojen, laitosten ja yritysten arkistot ovat yhä useammin digitaalisessa muodossa. Tämä aiheuttaa haasteita arkistoalan ammattilaisille, sillä digitaalisen tiedon pitkäaikaiselle säilyttämiselle ei ole ehtinyt kehittyä kovinkaan vakiintuneita käytäntöjä. Elkad-projektilla etsitään vastauksia siihen, kuinka digitaalisen tiedon saatavuus ja käyttökelpoisuus voitaisiin varmistaa myös tulevaisuudessa, sillä nykyisellä kehitysvauhdilla ohjelmistot, laitteet ja toimintatavat vanhenevat muutamassa vuodessa.

Elkad on Suomen Elinkeinoelämän Keskusarkiston Elkan ja Mikkelin ammattikorkeakoulun (MAMK) yhteisin voimin toteutettu hanke. Projektipäällikkö Jarmo Luoma-aho kertoo, että Elkad-projektin ensisijainen tehtävä on magneettisessa muodossa olevien, uhanalaisten ääni- ja videotallenteiden digitoiminen. Tämän lisäksi luodaan uusia menetelmiä jo alkujaan digitaalisen aineiston, kuten digikuvien ja asiakirjojen, pitkäaikaiseen säilyttämiseen. Kaikkien Mikkelissä toimivien digitoimishankkeiden yhteinen päämäärä on arkistopalvelukeskuksen perustaminen Mikkeliin.

Suomessa tiettyjen asiakirjojen säilyttämistä säädellään laein. Esimerkiksi kirjanpitolaista löytyvät säännöt erilaisten yhtiöiden, osuuskuntien, säätiöiden ja rahastojen kirjanpitoaineiston säilyttämiseen. Säilyttämisajat vaihtelevat asiakirjatyypistä riippuen yleensä kuudesta kymmeneen vuoteen. Lakisääteisen ajan jälkeen asiakirjoilla voi periaatteessa vaikka heittää vesilintua, mutta Luoma-ahon mukaan varsinkin pitkään toimineet yritykset ymmärtävät vanhojen asiakirjojen historiallisen arvon. Elkassa on otettu reilun kahdenkymmenen vuoden aikana vastaan yhteensä 17 ja puoli hyllykilometriä paperiasiakirjoja. Nykyään valtaosa yritysten toiminta- ja taloustiedosta on kuitenkin digitaalisessa muodossa, mikä haastaa arkistoalan ammattilaisia kehittämään uutta ja monipuolista tallennus- ja tietojärjestelmää yritysten digitaaliselle aineistolle. Tähän haasteeseen Elkad-hankkeellakin osaltaan pyritään vastaamaan.


Elkan paperisten asiakirjojen digitointi veisi 450 henkilötyövuotta


Digitaalisen tai digitoidun aineiston arkistoinnissa on monta mutkaa ja ratkaistavaa ongelmaa. Ensiksi täytyy tietysti päättää, mikä tieto on riittävän tärkeää säilytettäväksi pysyvästi. Kun säilytettävä aineisto on tiedossa, täytyy päättää, halutaanko siitä säilyttää sisältö vai ulkoasu vai kenties molemmat. Arkistoitaessa aineisto pyritään säilyttämään mahdollisimman lähellä alkuperäistä muotoaan. Tekstidokumenteissa ongelman ratkaisisi standardisoitu formaatti - kuten esimerkiksi pdf - jolla voisi tallentaa sisällön lisäksi myös dokumentin muotoilut. Video- ja kasettimateriaalin kohdalla ulkoasukysymykset eivät ole niin olennaisia, mutta esimerkiksi videomateriaalia joudutaan usein käytännön syistä pakkaamaan, jolloin alkuperäisyys hieman kärsii.


Säilyttääkö sisältö vai ulkoasu, kas siinä pulma.
Autenttisuuden ja eheyden ongelma?


Copyright: Nina Kurki

Nykyisellä kehitysvauhdilla ohjelmistot, laitteet ja toimintatavat vanhentuvat nopeasti. Nyt johonkin muotoon tallennettua dokumenttia ei kenties saakaan auki kymmenen tai kahdenkymmenen vuoden kuluttua. Luoma-aho kertoo, että ongelmaan on olemassa kolme ratkaisua: alkuperäisten ohjelmien ja laitteiden säilyttäminen, emulointi sekä mikraatio. Emuloinnilla tarkoitetaan vanhojen laitteiden ja ohjelmistojen matkimista. Suomessa on yleisesti käytössä mikraatio, missä vanhaan formaattiin tallennettu tiedosto siirretään aina tarpeen tullen uuteen.

Ammattilaisten käytössä olevissa tiedon tallennusjärjestelmissä on pyritty minimoimaan digitaalisuuteen liittyvät riskit varmuuskopioinnilla. Lisäksi aineisto voidaan siirtää tarvittaessa uuteen formaattiin. Kotikäyttäjille tutut cd-romit eivät kuulu ammattilaiskäyttöön, eikä Luoma-aho suosittele, että kotikäyttäjätkään luottaisivat niihin sokeasti. Levynvalmistajat ovat luvanneet tuotteilleen ikää viidestä viiteenkymmeneen vuoteen. Luoma-aho kuitenkin muistuttaa, että harvan kotona on magneettikentättömiä alueita tai optimaalisia ilmasto-olosuhteita, joten levyt voivat olla yllättävänkin lyhytikäisiä.


Kuinka tavallisen käyttäjän kannattaa varmistaa digikuva-arkistonsa säilyvyys?


Elkad-projekti käynnistyi vuoden 2004 alussa, mutta varsinainen konkreettinen työ aloitettiin toukokuun alussa. Jarmo Luoma-aho arvioi, että juhannukseen mennessä ääninauhoja oli digitoitu yhteensä noin 40-50 tuntia. Alussa aikaa on kuitenkin vienyt eniten metatietojen eli aineiston kuvailu- ja tunnistetietojen määrittely. Metatiedot ovat erittäin tärkeitä esimerkiksi siksi, että ne kertovat käyttäjälle digitointiprosessista: kuinka ja millaisella laitteistolla aineisto on digitoitu ja millaisilla laitteilla tai ohjelmistoilla sen saa auki. Vielä tätäkin tärkeämpää on se, että metatiedot toimivat digitaalisen aineiston tunnistetietoina. Ilman niitä jotain tiettyä aineistoa olisi vaikeaa ellei jopa mahdotonta löytää tuhansien mystisin numerosarjoin nimettyjen tiedostojen joukosta. Metatietojen määritteleminen ja tallentaminen on kuitenkin erittäin hidasta ja ihmistyövoimaa vaativaa hommaa. Automaattisia systeemejäkin kehitellään, mutta etenkin suomen kieli on haastava taipuisuutensa vuoksi.


Automaattisia sisällönkuvailumenetelmiä kehitellään


Jarmo Luoma-aho. Copyright: Nina Kurki

Monipuoliset metatiedotkaan eivät takaa sitä, että käyttäjä ja aineisto kohtaisivat toisensa. Jarmo Luoma-aho myöntääkin, että tässä tullaan ikuisuuskysymyksen äärellä. Vaikka tietoa tallennetaan mahdollisimman yksiselitteisesti ja varsin tiukkojen ohjeiden mukaan, käyttäjä saattaa käyttää jostain tietystä asiasta aivan toisenlaisia termejä kuin arkistoalan ammattilainen. Tiedon löytämisen ongelma onkin haaste, mihin ei kenties koskaan löydetä lopullista ja kaikki ongelmat poistavaa ratkaisua.


Tiedon löydettävyys ikuinen haaste?
Tulevaisuuden haasteita digitaalisessa arkistoinnissa?


Elkad on pääosin Euroopan sosiaalirahaston (ESR) ja Itä-Suomen lääninhallituksen rahoittama hanke. Näiden lisäksi myös Elka, Mikkelin kaupunki ja Mikkelin ammattikorkeakoulu ovat mukana rahoittamassa hanketta. Tällä hetkellä Elkad-projektissa työskentelee päätoimisesti neljä henkilöä, ja sen lisäksi jonkin verran MAMK:n IMT-kehittämispalveluiden henkilöstöä. Elkad-hanke jatkuu syksyyn 2005.

Nettiradio Mikaelin arkistosta:

Linkit: