Hvad er PDF/UA?
PDF/UA er en ISO-standard (ISO 14289-1) der specificerer, hvilke krav et PDF-dokument skal opfylde for at være universelt tilgængeligt — deraf forkortelsen UA (Universal Accessibility). Standarden udkom første gang i 2012 og bygger oven på den generelle PDF-standard (ISO 32000).
PDF/UA stiller krav til dokumentets interne struktur: Tekst skal være maskinlæsbar, overskrifter skal tagges med korrekte strukturtags (H1, H2 osv.), billeder skal have alt-tekster, og tabeller skal have korrekte header-celler. Et PDF/UA-kompatibelt dokument skal kunne læses og navigeres meningsfuldt af en skærmlæser.
PDF/UA vs. WCAG 2.1
PDF/UA og WCAG 2.1 er to distinkte standarder med delvist overlappende formål. WCAG 2.1 er designet til webindhold og stiller krav til HTML, CSS og JavaScript-baserede løsninger. PDF/UA er designet specifikt til PDF-dokumenter og stiller krav til dokumentets interne tag-struktur, metadata og indlejrede ressourcer.
I praksis er PDF/UA det nærmeste man kommer en WCAG-ækvivalent for PDF-formatet. Digitaliseringsstyrelsen vejleder om, at PDF-filer på offentlige websteder bør opfylde PDF/UA — eller alternativt ledsages af en tilgængeligt HTML-version. Begge tilgange er acceptable.
Centrale krav i PDF/UA-1
PDF/UA stiller en lang række tekniske krav til dokumentets opbygning. De vigtigste inkluderer:
- Alle sider skal indeholde et tag-træ med korrekte strukturtags (P, H1-H6, Table, TR, TD, TH, Figure, Caption osv.).
- Al tekst skal være inkluderet i tag-træet — ingen tekst må stå uden for strukturen.
- Figurer og billeder skal have alt-tekst eller markeres som artefakter, hvis de er dekorative.
- Tabeller skal have korrekte header-celler med scope-attributter.
- Dokumentet skal have en titel i metadata (XMP og DocInfo).
- Det naturlige sprog skal være angivet i dokumentets metadata.
- Alle links skal have en beskrivende alternativ tekst.
Skærmlæsere og PDF/UA-support
Ikke alle PDF-læsere understøtter PDF/UA’s strukturlæsning. Adobe Acrobat Reader er den PDF-læser, der har den bedste support for PDF/UA og tilgængeligheds-tags — men selv her er brugeroplevelsen for skærmlæserbrugere ofte langt dårligere end ved browsing af velstruktureret HTML.
Skærmlæsere som NVDA, JAWS og VoiceOver kan læse PDF/UA-kompatible dokumenter, men navigation i PDF’er er generelt mere kompleks og mindre forudsigelig end navigation i HTML-sider. Det er en af grundene til, at mange tilgængeligheds-eksperter foretrækker HTML-alternativer frem for at gøre PDF’er tilgængelige.
Sådan opretter du PDF/UA-kompatible dokumenter
Den nemmeste måde at oprette PDF/UA-kompatible dokumenter er at starte i et program, der understøtter eksport til tagget PDF — f.eks. Adobe InDesign, Microsoft Word (med korrekt brug af overskriftsstile) eller LibreOffice Writer. Det er afgørende, at dokumentet er oprettet med korrekte stilhierarkier fra starten.
Et dokument, der er oprettet korrekt i Word med overskriftsstile (Overskrift 1, Overskrift 2 osv.), kan eksporteres til en tagget PDF ved at vælge “Opret PDF/XPS” og markere “Dokumentstruktur-tags for tilgængelighed”. Resultatet opfylder ikke nødvendigvis alle PDF/UA-krav, men giver et langt bedre udgangspunkt end en utagget PDF.
Fra PDF til HTML: Hvornår er konvertering det bedste valg?
I mange tilfælde er det mere effektivt og brugervenligt at konvertere en eksisterende PDF til HTML end at forsøge at rette dens tilgængeligheds-problemer. HTML-formatet giver langt bedre responsivitet, brugerstyret skalering og skærmlæser-kompatibilitet end selv det bedste PDF/UA-dokument.
PDFAccess er bygget til netop dette scenarie. Uanset om din PDF er born-digital eller scannet, konverterer PDFAccess den til semantisk, WCAG 2.1 AA-kompatibelt HTML — direkte i din browser, gratis og uden at sende data til en server. For offentlige organer og biblioteker med store PDF-arkiver er dette et praktisk og hurtigt første skridt mod digital tilgængelighed.