Pdf

PDF, Portable Document Format, on verkossa laajasti käytetty tiedostomuoto. Pdf-tiedostoista on mahdollista tehdä saavutettavia eli sellaisia, joiden sisältöön pääsee käsiksi avustavilla teknologioilla. Lähdetiedostosta riippuen pdf:n saavutettavuuden varmistaminen saattaa kuitenkin joskus vaatia paljon jälkikäsittelyä.

Saavutettavan pdf-dokumentin ominaisuuksia

Saavutettava pdf-dokumentti ei ole skannattu kuva tekstistä tai pdf-muodossa oleva tulostustiedosto. Saavutettavasta pdf-dokumentista voi valita ja kopioida tekstiä ja siirtää valittu teksti johonkin tekstinkäsittelyohjelmaan.

Saavutettavassa pdf-dokumentissa ovat seuraavat ominaisuudet:

  • Se on koodimerkitty pdf eli rakenteet (otsikot, kappaleet, listat, taulukot ym.) on merkattu tunnisteilla. Voidaan puhua myös tägätystä pdf:sta (englanniksi tagged pdf).
  • Dokumentissa on kirjanmerkit.
  • Sisällön lukemisjärjestys on määritelty.
  • Kuvilla on tekstivastineet eli kuvien olennainen sisältö on selostettu vaihtoehtoisena tekstinä, ns. alt-tekstinä.
  • Dokumentin pääkieli on määritetty.
  • Dokumentin ominaisuuksissa on määritelty dokumentin otsikko.
  • Dokumentissa on käytetty helposti luettavaa fonttia.
  • Tekstin ja taustan välillä on riittävä sävykontrasti.
  • Dokumentin lomakekentät on merkattu tunnisteiden avulla, kentissä on vihjeteksti ja kentistä toiseen pystyy siirtymään ilman hiirtä.

Saavutettava pdf-dokumentti voi noudattaa ISO 14289 -standardia PDF/UA. Uusin versio standardista on ISO 14289-2, PDF/UA-2, joka julkaistiin vuoden 2024 alussa. Ilmaiseksi on saatavilla PDF Associationin dokumentti Well-Tagged PDF (WTPDF).

Laki digitaalisten palvelujen tarjoamisesta ei kuitenkaan edellytä PDF/UA-standardin noudattamista, vaan pdf-dokumentin on täytettävä WCAG 2.1 -kriteerit tasoilla A ja AA. Englanninkielisellä W3C:n Techniques for WCAG 2.1 -sivustolla on tarkempia ohjeita pdf-tiedostoista ja WCAG-kriteereistä.

Hyödynnä saavutettavaa lähdetiedostoa

Kun lähdetiedosto on tehty tavallisilla toimisto-ohjelmilla ja on saavutettava, pdf-tiedoston saavutettavuus on melko helppoa varmistaa. Esimerkiksi jos teet pdf:n Word-asiakirjasta huolehti ensin siitä, että Word-tiedosto on saavutettava.

Tarkemmat ohjeet pdf-versioiden tallentamiseen toimisto-ohjelmilla löydät tältä sivustolta:

Google Docs tai Slides -ohjelmista tai Applen vastaavista ohjelmista ei tällä hetkellä saa pdf-tiedostoja, joissa olisi riittävät koodimerkinnät. Jos lähdetiedostot näissä muodoissa, tarvitset pdf-editorin korjaamiseen tai tiedosto pitää avata muissa ohjelmissa ja muuntaa niissä pdf-versio, johon tulevat riittävät koodimerkinnät.

Saavutettavan PDF-dokumentin tarkistaminen

Tämän osion ohjeiden perustana on Adobe Acrobat Pro/DC -editointiohjelma. Lisäksi annetaan vinkkejä PAC2024-tarkistustyökalun käyttöön sekä tiedoston tutkimiseen ruudunlukuohjelmalla (NVDA).

Osiossa annetaan yleisen tason neuvoja tavanomaisten pdf-tiedostojen käsittelyyn. Esimerkiksi laajojen ja monimutkaisten taulukoiden tai poikkeuksellisten asettelujen saavutettavaksi tekeminen vaativat työvaiheita, joita tässä osiossa ei käsitellä. Lopussa on kuitenkin linkkejä lisäohjeisiin (englanniksi).

Mitä tarkistetaan ja missä järjestyksessä? Pdf-tiedostojen saavutettavuuden tarkistaminen ja korjausten tekeminen kannattaa jakaa vaiheisiin. Tässä on esitetty yksi mahdollinen järjestys.

Käy läpi koodirakenne

Tiedostojen tarkistaminen kannattaa aloittaa koodirakenteen läpikäynnistä. Avaa koodinäkymä (tags tree) vasempaan reunaan. Helpointa on selata koodit nuolinäppäimillä ylhäältä alas. Ohjelma korostaa kunkin koodatun elementin tiedostosta, kun kursori on koodissa.

Ruutukaappaus Adobe Acrobat -ohjelmasta, jossa näkyy sisällössä korostettu otsikko, kun kyseinen kohta on valittuna koodissa.
Koodinäkymässä kursori on otsikon (H1) kohdalla. Sisältönäkymässä sama otsikko on korostettuna.

Koodinäkymä löytyy ohjelman vasemman reunan näkymävalikosta ja sen tunniste on nimilappusymboli. Jos näkymää ei löydy, sen saa lisättyä näin: yläreunan valikosta Näytä: Näytä/Piilota: Suunnistusruudut: Helppokäyttöisyysmerkinnät (View: Show/Hide: Navigation Panes: Accessibility Tags).

Ruutukaappaus Adobe Acrobatin koodirakennenäkymästä.
Tavallinen pitkän asiakirjatiedoston koodinäkymä: otsikoita (H1, H2), tekstikappaleita (P) ja sisällysluettelo (TOC).

Koodirakenteesta pitäisi ilmetä seuraavat asiat:

  • Kaikki oleellinen sisältö on koodattu, eli jokainen tekstikappale, otsikko, kuva jne. löytyy koodinäkymästä.
  • Koodien järjestys vastaa visuaalista lukemisjärjestystä: esimerkiksi kuvien tai tekstilaatikoiden koodi on oikeassa kohdassa koodinäkymää.
  • Elementeillä on oikeaa merkitystä vastaava koodaus: esim. otsikoilla on otsikkokoodaus (H1-H6), kuvilla figure-koodaus ja taulukoilla Table-koodaus.

Aja ohjelman käytettävyystarkistus

Adobe Acrobat Pro/DC:ssä on automaattinen työkalu, joka löytää osan saavutettavuusongelmista. Käytettävyys (engl. Accessibility) löytyy työkaluista (Tools) kohdasta Suojaa ja standardoi (Protect & Standardize). Käytettävyystyökalut kannattaa kiinnittää oikean laidan työkalupalkkiin, jotta sen saa nopeasti käyttöön. Käytettävyystyökaluissa on Käytettävyystarkistus (Accessibility Check).

Tarkistus avaa valintaruudun Tarkistimen asetukset (Accessibility Checker Options). Aluksi kannattaa varmistaa kaksi asetusta: rastin voi ottaa pois ruudusta Luo käytettävyysraportti (Create Accessibility Report). Lisäksi voi varmistaa, että tarkistusvalinta ei ole päällä taulukoiden yhteenvedolle, sillä ei sitä vaadita. Pudotusvalikko Luokka: Lomakkeet, taulukot ja luettelot, poista valinta Taulukoissa on oltava yhteenveto (Category: Forms, Tables and Lists: Tables must have a summary). Sen jälkeen tarkistuksen voi ajaa painamalla Aloita tarkistus (Start checking).

Työkalu tekee raportin vasemman reunan näkymään. Siinä on aina kaksi varoitusta: Looginen lukemisjärjestys (Logical reading order) ja Värikontrasti (Color contrast), sillä nämä on aina tarkistettava manuaalisesti. Lisäksi ohjelma löytää muita virheitä, jos sellaisia tiedostossa on.

Ruutukaappaus Adobe Acrobatin käytettävyysraportista.
Tarkistustyökalun raportti luokittelee löydökset välilehtiin.

Alla on esitelty joitakin yleisiä ongelmia. Jos saat herjan, jota tässä ei esitellä, lisätietoa ongelmasta saa, kun painaa hiiren kakkospainikkeella herjaa ja valitsee valintaikkunasta Selitä (Explain).

  • Tiedosto: Otsikko (Document: Title). Saavutettavassa tiedostossa pitää olla ominaisuustiedoissa annettuna asiakirjalle otsikko, ja se pitää olla asetettuna aloitusnäkymään. Tämä unohtuu varsin usein, mutta virhe on helppo korjata. Korjauksen voi tehdä joko tarkistustyökalun kautta, kun kursorin vie virheilmoituksen päälle ja hiiren kakkospainikkeella valitsee Korjaa. Toinen tapa on avata ylävalikosta Tiedosto: Ominaisuudet: Kuvaus: Otsikko (File: Properties: Description: Title). Lisäksi Ominaisuus-ikkunan kautta pitää asettaa otsikko oletukseksi Dokumentin ominaisuus: Aloitusnäkymä: Ikkunan asetukset: Näytä: Dokumentin otsikko (Properties: Initial View: Window Options: Show: Document Title).
  • Sivun sisältö: Koodimerkitty sisältö (Page Content: Tagged content). Tarkistustyökalu löytää sisältöä, jota ei ole koodimerkitty. Koodauksia ei voi suoraan korjata tarkistimen kautta. Koodaamatonta sisältöä voi koodata esimerkiksi Käytettävyys-työkaluista löytyvän Lukujärjestys-työkalun (Reading Order tool) avulla. Vaihtoehtoisesti sisältöä voi merkitä koristeelliseksi Sisältö-paneelissa (Content Pane).
  • Sivun sisältö: Sarkainjärjestys (Page Content: Tab Order). Sarkainjärjestys määrittää, että sarkainnäppäimellä liikkuessa liikkumisjärjestys on looginen. Sarkainjärjestys on erittäin helppo korjata ajamalla korjaus Käytettävyystyökalussa: siirrä kursori herjan päälle, paina hiiren kakkospainiketta ja valitse Korjaa (Fix).
  • Vaihtoehtoinen teksti: Kuvien vaihtoehtoinen teksti (Alternate Text: Figures alternate text). Huomauttaa, jos sisällössä on kuvaksi (figure) koodattua sisältöä, jolle ei ole annettu vaihtoehtoista tekstiä. Tekstin voi syöttää tarkistaminen Korjaa-toiminnon kautta (Fix) tai etsimällä oikean koodin koodinäkymästä ja avaamalla koodin Ominaisuudet (Properties). Koodi-välilehdeltä (Tag) löytyy tekstikenttä Kuvan vaihtoehtoinen teksti (Alternate Text for Images), johon kuvauksen voi kirjoittaa. Huom. jos kyseessä on koristekuva, se täytyy muuttaa artifaktiksi Sisältö-paneelin (Content Pane) kautta.
  • Taulukot: Otsikot (Tables: Headers). Tarkistus löytää taulukoita, joille ei ole merkitty otsikkoriviä (TH-koodaus). Jos otsikkorivi on jäänyt merkitsemättä, koodinäkymässä voi otsikkorivin solujen tunnisteet korjata oikeiksi.
  • Taulukot: Säännöllisyys (Tables: Regularity). Taulukossa ei ole vastaavaa määrää rivejä ja sarakkeita. Jos taulukossa on esimerkiksi yhdistettyjä soluja, herjan korjaamiseksi täytyy näille soluille merkitä alue (scope), jotta on yksiselitteistä, mitkä solut liittyvät toisiinsa. Korjaus tehdään Käytettävyys-osion Lukujärjestys-työkalun Taulukkoeditorilla (Accessibility: Reading Order: Table Editor).
  • Otsikot: Kelvollinen sisäkkäisyys (Headings: Appropriate nesting). Tarkistus havaitsee, jos otsikkohierarkia on pielessä, esimerkiksi ylimmän eli H1-otsikkoa seuraa otsikko tasolla H3. Huomaa, että tarkistus ei huomauta, jos otsikkokoodaukset puuttuvat kokonaan. Se täytyy varmistaa itse koodinäkymän tarkistuksessa (kohta 1).

Manuaalinen tarkistaminen

Ohjelman automaattitarkistus ei löydä kaikkia virheitä. Koodinäkymän läpikäynnillä ja käytettävyystarkistuksen ajamisella havaitaan yleensä isoimmat virheet. Etenkin värien käyttöön, oikeaan lukemisjärjestykseen ja sisällön mielekkyyteen tarvitaan kuitenkin manuaalista testausta.

  • Riittävät värikontrastit. Automatiikka ei osaa tarkistaa, onko tiedostossa käytetty värejä ja täyttävätkö värit riittävän kontrastin vaatimukset. Asia on yleensä paras varmistaa jo lähdetiedostossa, koska siinä värien mukauttaminen on helpompaa. Tällä sivulla on lisää tietoa kontrastivaatimuksista.
  • Looginen lukemisjärjestys. Tämä kehotetaan tarkistamaan jo koodinäkymän läpikäynnissä. Etenkin, jos sisältöä on aseteltu palstoihin, tekstilaatikoihin tai muuten poikkeuksellisesti, on varmistettava, että koodien järjestys vastaa visuaalista järjestystä. Acrobatissa voi tarkistaa myös Lukemisjärjestys-näkymän (Reading Order Pane) järjestyksen. Ruudunlukuohjelmat seuraavat kuitenkin koodijärjestystä, ja Lukemisjärjestyksen muokkaaminen yleensä sekoittaa koodeja, joten sitä kannattaa käyttää vain harkiten ja kun tietää, mitä tekee.
  • Värien käyttö. Jos sisällössä on tietoa visualisoivia kuvia tai asioita on eroteltu väreillä, onhan pidetty huoli siitä, että väri ei ole ainoa keino välittää tietoa?
  • Kuvien tekstivastineet ja koristekuvat. Automaattiset työkalut eivät osaa arvioida, onko kuville annettu vaihtoehtoinen teksti järjellinen tai onko koristavat kuviot merkitty oikein artifakteiksi.

Manuaaliseen testaamiseen voi kuulua myös esimerkiksi ruudunlukuohjelmilla testaaminen tai tiedostosisältöjen uudelleenjuoksutus reflow-näkymässä. Ruudunlukuohjelmilla voi testata esimerkiksi, että sisällöt esitetään oikeassa järjestyksessä, linkit toimivat ja tiedostossa pääsee liikkumaan odotuksenmukaisesti.

Jos haluat testata ruudunlukijaa, maksuton avoimen lähdekoodin NVDA on hyvä vaihtoehto. Ruudunlukuohjelmat toimivat näppäinkomennoilla, joten ainakin aluksi kannattaa hetken verran perehtyä yleisimpiin komentoihin, jotta tiedostossa liikkuminen onnistuu. Tekstisynteesi, etenkin Microsoftin oletusääni, lukee sisältöjä joskus kummallisesti, esimerkiksi numerosarjoja päivämäärinä. Sisältöjä ei kuitenkaan pidä alkaa optimoida ruudunlukuohjelmille vaan on syytä noudattaa kotimaisia oikeinkirjoitusohjeita.

Ruudunlukuohjelmilla testaaminen kannattaa tehdä Acrobat Readerissa tai Acrobat Prossa, ei selaimissa. Verkkoselainten pdf-toiminnoissa on heikompi tuki saavutettavuusominaisuuksille, joten saavutettavakin tiedosto voi selaimessa toimia oudosti ruudunlukijan kanssa.

Adobessa on myös oma ”read aloud” -toiminto. Se lukee ääneen ruudulla näkyvää tekstiä, mutta ei ole varsinainen ruudunlukuohjelma: sen avulla ei voi navigoida sisällöissä, eikä se esimerkiksi kerro tiedoston rakenteista. Myös ääneenlukutoimintoa voi testata, mutta sen toimintaa ei voi yleistää ruudunlukuohjelmiin.

PAC2024-tarkistustyökalu

Harjaantuneille pdf-tiedoston käsittelijöille suosittelemme PAC 2024 -työkalun käyttöä. PDF Associationin ylläpitämä PAC eli Pdf Accessibility Checker löytää monia sellaisia ongelmia, joita Adobe Acrobatin automaattitarkistus ei havaitse.

Jotta PAC-ohjelman tuloksista saa parhaimman hyödyn, tarvitaan jonkun verran kokemusta pdf-tiedostojen saavutettavuuden korjaamisesta ja testaamisesta: PAC löytää myös ongelmia, joilla ei välttämättä ole vaikutusta saavutettavuuteen ja esimerkiksi taulukoilta PAC vaatii tarkempaa merkkausta kuin Adoben oma tarkistustyökalu.

PAC tarkistaa pdf-tiedostot sekä PDF/UA-standardia että WCAG-kriteereitä vasten: tuloksissa on jonkin verran eroja painotuksissa. PAC:in tulossivu näyttää myös kootusti tiedoston ominaisuustiedot kuten otsikon (title) ja kielen.

PAC 2024 -ohjelman näkymä Results in Detail, jossa näkyvät PDF/UA- ja WCAG-tarkastuksen tulokset. Tulosluettelo kertoo, mitkä WCAG-kriteerit on kunnossa (Passed) ja antaa varoituksia (Warning) ja virheitä (Error).

Virhelistauksen lisäksi PAC:ssa on hyvä screen reader preview -työkalu, joka esittää visuaalisesti, missä järjestyksessä ruudunlukuohjelma löytää tiedoston sisällöt ja millaiset koodimerkinnät esimerkiksi kuvilla, otsikoilla ja taulukoilla on. Etenkin, jos käytössä ei ole testaamiseen sopivaa ruudunlukuohjelmaa tai sellaisen käyttöosaamista, PAC:n työkalu on hyödyllinen apuväline.

PAC 2024 -ohjelman Screnn reader -näkymä, jossa on pdf-tiedoston rakenteiden koodimerkinnät näkyvät.
Screen reader preview avataan PAC 2024 -ohjelman oikeassa alalaidassa olevasta painikkeesta, jossa on silmän kuva.

Vinkkejä korjaamiseen

Edellä esitellyillä ohjeilla voi löytää lähes kaikki pdf-tiedostojen saavutettavuusongelmat. Ongelmien löytäminen on tietysti vasta puolet työstä. Pdf-tiedostot pitäisi myös korjata saavutettaviksi. Toisinaan ongelmat ovat niin isoja, että on helpointa korjata lähdetiedostoa, jos se vain on mahdollista. Myös Adobe Acrobat Pro/DC on ohjelmassa voi tehdä paljon korjauksia, mutta osa niistä vaatii melko paljon ohjelman käyttöosaamista.

Sopiva korjaustapa riippuu usein tilanteesta, tiedoston rakenteesta ja lähdetiedostossa tehdyistä ratkaisuista. Korjausten tekemistä kannattaa harjoitella esimerkiksi verkkokurssien ja videoiden avulla. Tiedostosta kannattaa myös ottaa varmuuskopio aina ennen suurempien korjausten tekemistä tai jos teet joitain ensimmäistä kertaa: joitain Acrobatissa tehtäviä muutoksia ei nimittäin pysty perumaan!

Tässä muutamia vinkkejä asioista, jotka kannattaa Adobe Acrobatissa opetella.

  • Koodien eli tagien luominen ja muokkaaminen: esimerkiksi yksittäinen virheellinen otsikkokoodaus on helppoa korjata muokkaamalla koodin ominaisuuksia (Properties). Myös esimerkiksi kuvien vaihtoehtoisia tekstejä on helppo muokata koodinäkymän ominaisuuksien kautta.
  • Käytettävyys-osion (Accessibility) Lukujärjestys (Reading Order tool) ja siitä löytyvä Taulukkoeditori (Table Editor) ovat käytännöllisiä moniin korjauksiin. Lukujärjestys-työkalulla voi esimerkiksi koodata sisältöä, jolta on jäänyt koodaus puuttumaan. Taulukkoeditorilla voi puolestaan määritellä rivi- ja sarakeotsikoille scopeja ja parantaa monimutkaisten taulukoiden saavutettavuutta.
  • Artifaktien luominen Sisältö-näkymässä (Content Pane). Artifaktin luominen on tavallaan käänteinen toimi koodin (tag) luomiselle: siinä koodattu sisältö viedään taustaan, jolloin se ei enää löydy koodinäkymästä. Joskus etenkin muunnosvaiheessa pdf-tiedostoihin syntyy koodauksia sisällöille, joille niitä ei tarvita, esimerkiksi tekstien kehyksille tai koristekuvioille. Koodipuusta ei pidä poistaa koodeja, joilla on sisältöä. Sen sijaan sisällön voi etsiä Sisältö-näkymässä (Content Pane) ja hiiren kakkospainikkeella etsiä valikosta Luo artifakti (Create an artefact). Tällöin sisältö viedään ns. taustaan. Jos sisältö on ollut koodirakenteessa ylemmän tason koodin sisällä, lopuksi kannattaa tarkistaa, onko koodipuuhun jäänyt tyhjä koodi. Tyhjän koodin voi poistaa.
  • Preflight-työkalut. Adobe Acrobatin Preflight-työkalulla voi korjata monia saavutettavuusongelmia, joita etenkin PAC-tarkistus löytää. Esimerkiksi koodaamattomat merkinnät (untagged annotations) voi korjata ajamalla Preflightin toiminto ”Analyze and fiz problems in PDF tagging structure”.

Syventäviä ohjeita ja hyödyllisiä linkkejä

Tätä sivua on päivitetty 23.8..2024