TIVIAn arkistoprojekti: Tieto paperilta digitaaliseksi
TIVIA 70 -historiikkiprojekti sisälsi myös arkistoprojektin, jonka tarkoituksena oli siirtää TIVIAn arkisto Suomen Elinkeinoelämän keskusarkistoon (ELKA) Mikkeliin sitten, kun se on hyödynnetty historiikin kirjoittamisessa. Tämä rasti olisi voitu toteuttaa monella tapaa, mutta kiire saada aineistoa Mikkeliin tätä varten palkatuille kesätyöntekijöille ajoi sitten ratkaisuun, jossa kaikki aineisto ajettiin skannerista läpi.
Valittua skannauspohjaista ratkaisua ajoi myös mielenrauha. Paperisen aineiston uudelleentutkiminen olisi edellyttänyt Mikkeliin matkustamista sen jälkeen, kun aineisto olisi ilman skannausta siirretty sinne. Nämä kaksi näkökulmaa – ELKAn prosessit ja oma mielenrauha – olivat pääsyyt valittuun ratkaisuun, joka kuitenkin mahdollisti kolmannenkin näkökulman, joka ei alussa tullut mieleen. Skannattua aineistoa on helppo jakaa omia historiikkejaan tekeville jäsenyhdistyksille, kuten on nyt jo toimittu kolmen yhdistyksen osalta.
Skannaus ei ollut mikään pikkujuttu. Päätin käyttää loppuun 13 vuotta vanhan Epson Workforce -monitoimilaitteeni, jonka vahvuus oli A3-koko ja arkinsyöttölaite. Sen rinnalle toin A4-kokoisen Czur Shine Pro 800 -skannerin, jolla ajattelin kuvata sellaista aineistoa, jota ei syystä tai toisesta voi skannata arkinsyöttölaitteen kautta.
Arkinsyöttölaitteen kautta syötettävästä materiaalista oli tietysti poistettava niitit. Käytin niittien poistamiseen pieniä sivuleikkureita ja poistettujen niittien määräksi tuli hulppeat 11 800. Ei, en laskenut niitä, mutta keräsin yhteen purkkiin, jolloin punnitsemalla ja keskimääräisellä niitin painolla voitiin laskea määrä.
Opin, että niittejä voi olla vaikea löytää. Jos nipussa on pystytulosteen sijasta vaakatulosteita, niitti ei olekaan vasemmassa ylänurkassa, vaan vasemmassa alanurkassa. Muitakin paikkoja oli: joskus niitti oli lyöty rei’itetyn paperin reikien väliin. Lisäksi pienikokoista niittiä saattoi olla vaikea löytää, jos se pystytulosteessa osui vasemman ylänurkassa esimerkiksi logon päälle.
Samassa nipussa saattoi olla useita niittejä, mikä hidasti skannausta huomattavasti. Tilanne lienee syntynyt niin, että niitattuun nippuun oli lisätty yksi arkki ja lyöty sen takia lisäniitti. Tai sitten niitattuja nippuja oli yhdistetty isommalla niitillä kokonaisuudeksi. Pahimmasta nipusta irrotin seitsemän niittiä.
Joskus niittaamalla koottuja nippuja oli koottu yhteen klemmareilla. Irrotettuja klemmareitakin kertyi litran purkillinen. Mutta klemmari harvemmin joutui skanneriin tai muuten haittasi työtä. Sen sijaan skanneriin joutunut niitti yleensä esti skannauksen. Joskus harvoin kävi niin, että koko nidottu nippu meni skannerista kerralla, jolloin vain etusivu tuli skannatuksi. Silloin oli irrotettava niitti ja skannattava nippu uudelleen. Vaakatulosteen kohdalla saattoi käydä siten, että arkinsyöttölaite tarttui päällimmäiseen arkkiin, veti sitä ja irrotti sen niiteistä. Sama seuraavien kanssa kunnes jäljellä oli enää yksi arkki niitteineen ja sekin suostui menemään skannerista läpi.
Oman ongelmansa toivat muovitaskut. Osa arkistossa käytetyistä muovitaskuista ei ollut arkistokelpoisia ja jokin kemiallinen reaktio muovin ja tulostusmusteen sekä mahdollisesti myös paperin välillä sai arkit laminoitumaan lähes vanerin tapaiseksi komposiittimateriaaliksi. Arkkeja muovitaskusta irrotettaessa päällimmäisen arkin teksti kopioitui muovitaskun sisäpinnalle ja nippua hajotettaessa arkit oli nyljettävä irti toisistaan, jolloin yksipuolisesti tulostettu arkki näytti kaksipuoliselta. Tuollainen nylkeminen vei aikaa ja dokumentissa oli koko ajan repeytymisvaara.
Yksipuoliset dokumentit skannattiin tietysti yksipuolisina ja kaksipuoliset kaksipuolisina. Koska tuossa Epson Workforcessa kaksipuolinen skannaus tapahtuu siten, että arkinsyöttölaite kääntää paperin toisinpäin, kaksipuolinen skannaus oli sekä selvästi hitaampaa että vikaantumisherkempää. Joskus kun luuli skannavansa yksipuolisesti tulostettua dokumenttia, joutuikin huomaamaan, että osa nipun arkeista olikin kaksipuoleisia. Silloin tuli tavaksi kääntää kaksipuoleiset ympäri ja syöttää ne jo skannattujen jatkoksi. Kaikki tuli silloin skannatuksi, mutta sivut eivät ole oikeassa järjestyksessä.
Arkistossa oli ollut joskus 2000-luvun alussa vesivahinko, minkä seurauksena jotkin mapit sisälsivät pelkästään toisiinsa liimautuneita arkkeja. Lisäksi hyvin pieni osa mapeista sisälsi homehtunutta tavaraa. Yleensä homeessa olivat vain sormenjäljet! Lisäksi arkistosta löytyi kuolleita sokeritoukkia sekä yksi elävä, joka oli niin iso, että taisi olla paperitoukka.
Czur Shine Pro 800 -skannerilla skannasi – tai pikemminkin kuvasin – enimmäkseen mainoksia, lehtileikkeitä ja yhdistysten tiedotteita ja jäsenlehtiä, sillä pedaalilla varustettuna se soveltui hyvin auki pidettävän materiaalin skannaamiseen, sillä molemmat kädet vapautuivat pitämään materiaalia suorassa. Laite ei kuitenkaan sovellu kiiltävän materiaalin skannaukseen, sillä laitteen led-valot sijaitsevat kameran linssin vieressä. Näin kuvaan pyrkii tulemaan ”häikäisyläikkä” keskelle. Projektin aikana korvasin A4-kokoisen laitteen A3-kokoisella laitteella, joiden ainoa ero oli se, että A3-kokoisen varsi on teleskooppinen.
Kuten aiemmin kirjoitin, ajatus oli, että käytän 13 vuotta vanhan Epson Workforcen projektissa loppuun. Näin kävikin, mutta laitteen arkinsyöttölaite hajosi kesken projektin heinäkuussa 2022. Tilasin saman mallisarjan uudemman version verkkokaupasta, noudin kotimatkalla ja seuraavana aamuna homma jatkui entistä nopeammin, sillä teknisesti suorituskykyisempänä ja vähemmän kuluneena kaikki meni nopeammin. Lisäksi projektin kuluessa ostin huutokaupasta kaksi sähköpöytää, jotka osaltaan nopeuttivat projektia ja mahdollistivat työnteon välillä istuen, välillä seisten.
Minulla oli vanha varakoneeni skannauskoneena arkistossa. Skannaustiedostot menivät sen koneen kautta pilveen ja aina kotiin saavuttuani ne olivat ehtineet replikoitua pilvestä myös varsinaisen työtietokoneelle. Kaksi kertaa paloi talosta pääsulake arkiston viallisen pistorasian takia. Molemmilla kerroilla jouduin jatkamaan työtä otsalamppu päästä ja käytävästä jatkojohdolla otetulla sähköllä, kunnes vika saatiin korjattua. Kaikenlaista sattuu, kun paljon tekee…
Lopputuloksena syntyi 13 000 skannaustiedostoa, pääosin pdf-tiedostoja ja osin jpeg-tiedostoja, yhteiskooltaan 70 gigatavua. Aluksi aion järjestää ne samaan järjestykseen kuin olivat olleet eli mapeittain. Sitten huomasin ajatukseni epätarkoituksenmukaisuuden ja järjestin dokumentit vuosikohtaisiin alikansioihin. Näin saatoin kirjoittaa historiikkia vuosi kerrallaan tutustuen sen vuoden dokumentaatioon ja korvamerkiten dokumentteja tulevaa käyttöä varten. Toimintakertomukset löytyvät seuraavan vuoden kevätliittokokouksen materiaalista, jolloin kertaalleen järjestettyä materiaalia oli järjestettävä uudelleen. Tekstintunnistus on tehty vain parille dokumentille, mutta niiden osalta onnistui hyvin. Ottaen huomioon käynnissä olevan ChatGPT-huuman, olisikin mielenkiintoista ajaa pdf:t tekstiksi ja laittaa tekoäly tekemään esseitä aineiston perusteella. Ehkä tulevaisuudessa.
Kaikkiaan ELKAan siirrettävää materiaalia on ja oli noin 700 mappia eli reilut 50 hyllymetriä. Skannattavan materiaalin määrä lisääntyi matkan varrella siten, että arkistosta varastoidun tavaran joukosta löytyi lisää arkistomateriaalia ja myös toimistolta lähti skannauksen kautta ELKAan materiaalia, jota löytyi toimiston muuton yhteydessä alkuvuodesta 2023. Itse asiassa kotitoimistollani on viisi muuttolaatikollista ELKAan menevää materiaalia, joten kymmenes Mikkelin-reissu on vielä edessä.
Skannatun materiaalin joukossa oli jonkin verran henkilötietoja sisältävää materiaalia, joita säilytämme ja jaamme esimerkiksi jäsenyhdistysten käyttöön GDPR-säännöksiä noudattaen.
Arkistoprojekti on siis ihan loppusuoralla ja niin on historiikinkin kirjoitustyö. A4-kokoinen Czur Shine Pro 800 -skanneri samoin kuin vain puolen vuoden ikäinen Espon Workforce 7835DTWF -A3-monitoimilaite ovat myynnissä. Niistä tai arkisto/historiikkiprojekteista kiinnostuneet tavoittavat minut sähköpostiosoitteesta reino.myllymaki@tivia.fi.
Reino Myllymäki
kehityspäällikkö, TIVIA
Mitä meillä oli ennen kännyköitä, maailmanluokan tietoturvaosaamista ja vihaisia lintuja? Joukko mahdottoman haastajia ja TIVIA, joka on jo 70 vuotta yhdistänyt alan visionäärit ja auttanut tekemään utopiasta arkea. TIVIA viettää juhlavuottaan tiukasti työn merkeissä – yhdistäen, kouluttaen, tutkien, tiedottaen, suuntaa näyttäen ja Suomen digitaalista kilpailukykyä kehittäen. Siis pidä kiinni. Vauhti kun ei ole hiljenemään päin.
2023 on TIVIAn 70-vuotisjuhlavuosi
#TIVIA70
Lisätietoja
Tagit
Omat tagit
TIVIA ry - Asiantuntijat ja yhteyshenkilöt
TIVIA ry - Muita referenssejä
TIVIA ry - Muita bloggauksia
It- ja ohjelmistoalan työpaikat
- Laura - Mobiilikehittäjä, Android
- Laura - Ohjelmistoarkkitehti, Tampere/Oulu
- Laura - Development Team Manager, Sports Games
- Taito United Oy - Senior Full Stack -kehittäjä
- Webscale Oy - Head of Sales, Cloud Services
- Laura - Hankinta-asiantuntija, tietohallinto
- Laura - Development Manager, Operations
Premium-asiakkaiden viimeisimmät referenssit
- SD Worx - Kehitystyö SD Worxin kanssa takaa Clas Ohlsonille parhaat palkanmaksun prosessit kasvun tiellä
- Digiteam Oy - Case Esperi Care Oy: Ketterä kumppanuus vei Esperin verkkosivu-uudistuksen maaliin sujuvasti ja aikataulussa
- Kisko Labs Oy - Howspace Hub - Mukautuva oppimisen hallintajärjestelmä kasvaviin oppimisalustavaatimuksiin
- Kisko Labs Oy - Sanoma Pro: Multimediasisältöjen hallinnan uudistaminen
- Kisko Labs Oy - Svean helppokäyttöinen palvelu asiakkaan verkko-ostosten hallintaan
- Kisko Labs Oy - Yhtenäinen käyttöliittymä luovien alojen ammattilaisille
- Codemate - Digitaalisen murroksen nopeuttaminen Flutterin avulla
Tapahtumat & webinaarit
- 27.11.2024 - Green ICT -ekosysteemitapaaminen III: Ohjelmistojärjestelmien virrankulutuksen mittaaminen ja kasvihuonepäästöjen arviointi
- 27.11.2024 - Digitaalisen asiakaskokemuksen uusi aikakausi
- 28.11.2024 - Webinaari: Keskity myyntityön laatuun!
- 28.11.2024 - Copilot-webinaari – Mielekkäämpää tietotyötä turvallisesti
- 04.12.2024 - Kuinka oikea matka- ja kululaskujärjestelmä tehostaa prosesseja?
- 05.12.2024 - Green ICT VICTIS -hankkeen kick off -tilaisuus
- 15.01.2025 - Datavastuullisuuden valmennus: hanki valmiudet vastuulliseen datan ja tekoälyn hyödyntämiseen
Premium-asiakkaiden viimeisimmät bloggaukset
- Kisko Labs Oy - Heroku: Millaisiin projekteihin se sopii ja mitkä ovat sen todelliset hyödyt ja haitat?
- Zimple Oy - Pipedrive vai Hubspot? Kumpi kannattaa valita?
- SC Software Oy - Jatkuvat palvelut – asiakaslähtöistä kumppanuutta projekteista ylläpitoon
- Timeless Technology - Ohjelmoitavat logiikat (PLC): Ratkaisevat työkalut automaatioon ControlByWebiltä.
- Kisko Labs Oy - Heroku: Ohjelmistokehittäjän ykköstyökalu skaalautuvien sovellusten rakentamiseen
- SD Worx - Näin luot vakuuttavan Business Casen palkkahallinnon ulkoistukselle
- Timeless Technology - Kyberriskien tunnistaminen Profitap IOTA verkkoanalysaattorin avulla.
Digitalisaatio & innovaatiot blogimediaBlogimediamme käsittelee tulevaisuuden liiketoimintaa, digitaalisia innovaatioita ja internet-ajan ilmiöitä |