Kuva kertoo tuhat sanaa, mutta ei oikeasti

Ruudunlukuohjelman käyttäjä käyttää VoiceOveria lukiessaan The New York Timesin artikkelia otsikolla

Zoey rakastaa internetin selaamista. Hän nauttii eksymisestä verkottuneeseen tietoverkkoon, joka on täynnä tietoa, ja purkaa kirjanmerkin arvoisia tiedonpalasia. Mutta he eivät nauti laajojen tekstikokonaisuuksien läpikäymisestä. He pitävät mieluummin kuvista. Niitä on paljon. He käyvät läpi ihastuksensa kuvat Facebookissa ennen kuin he edes harkitsevat hänen elämäkertansa lukemista. He kaipaavat meemejä ja visualisointeja enemmän kuin kukaan muu tällä planeetalla, ja heidän Instagram-tarinansa heijastavat sitä. He ovat vain, tiedäthän, vahvasti yhteydessä visuaalisesti oppivaan luontoonsa. Eikä siinä ole mitään väärää.

Mutta maailmassa ei ole vain Zoey. On Trung-Anh, on Sewon, on Nayon, on Venkatesh, on Zeqiu, on Dinko, on Sade, on Ivan ja on Mohammed. WHO:n mukaan ainakin noin 29 prosentilla (2,2 miljardilla) maailman väestöstä (7,7 miljardia) on jonkinlainen näkövamma, mikä tarkoittaa vähintään kolmea henkilöä edellä mainitussa luettelossa. Hmm, nyt kun tiedämme, että 29 prosenttia väestöstä ei välttämättä näe visuaalista sisältöä, mitä teemme? Tulkitsemmeko edelleen kirjaimellisesti Fred Barnardin sitaattia ”Kuva kertoo enemmän kuin tuhat sanaa”? Uskallan väittää, etten usko. Ei aina.

Usein utelias kysymys on – miten näkövammaiset ihmiset käyttävät tietokonetta? Ensinnäkin on mielestäni tärkeää ymmärtää, että näkövammaisuus ei ole sokeuden synonyymi. Jos siis näet jonkun käyttävän valkoista keppiä, olisi väärin olettaa, että hän on täysin sokea. Kun kyse on tietokoneen käytöstä, he saattavat näön tasosta riippuen käyttää ruudunlukulaitteita näytön sisällön lukemiseen. Joitakin suosittuja ruudunlukuohjelmia ovat JAWS, NVDA (ilmainen ja avoin lähdekoodi) ja VoiceOver (sisäänrakennettu Applen laitteisiin).

Maailman tila

Hienoa! Meillä on siis tapa, jolla ruudunlukijan käyttäjät voivat olla vuorovaikutuksessa tietokoneidensa tai mobiililaitteidensa kanssa. Mutta miten ruudunlukija voi lukea ihastuksensa kuvia? Tai meemejä? Tai graafeja/visualisointeja? Yksi mahdollinen vastaus tähän on, että meidän pitäisi tehdä lääketieteellistä edistystä, jotta heidän näkönsä paranisi tai jotain sen suuntaista, että heillä olisi henkilökohtainen hoitaja/ystävä/perhe, joka voisi selittää heille, mitä näytöllä on. Toinen mahdollinen vastaus on rakentaa maailma, jossa he voivat tehdä sen itse. Jos vastauksesi oli lähempänä edellistä, sinun on selvästi koulutettava ja tutustuttava vammaisuuden sosiaalisen mallin käsitteisiin.

Kuvat

Kohdistetaan katseemme kuviin. Jotta ruudunlukija pystyy lukemaan kuvan, sen on tiedettävä, mistä kuvassa on kyse, ja esitettävä se sitten käyttäjälle mielekkäällä tavalla. Tarkastellaan esimerkiksi kuvaa, jossa perhe leikkii Husky-kaksostensa kanssa (Go Huskies!). Käyttäjänä, joka ei käytä ruudunlukuohjelmaa, on helppo selvittää, mitä kuvassa tapahtuu – ei vain etualalla vaan myös taustalla. Esimerkiksi Jialinilla, yhdellä perheenjäsenistä, on yllään t-paita, jossa lukee ”100% human”. Voiko ruudunlukija poimia kohtauksen kokonaan? Tätä varten ruudunlukijat luottavat siihen, että kehittäjät tai sisällöntuottajat antavat kuville vaihtoehtoisen tekstin käyttämällä alt-attribuuttia, joka otettiin käyttöön vuonna 1995 osana HTML 2.0:aa (jos et tiedä, mikä alt-attribuutti on tai mitä merkitystä sillä on, tässä artikkelissa on hyvä yleiskatsaus alt-attribuuttiin). HTML-elementti img näyttää tällöin seuraavalta:

<img src="image1.jpg" alt="This is an image of two Huskies" />

Siten ruudunlukija lukee nyt ”Kuva, Tämä on kuva kahdesta Huskysta.”

Attribuutin alt jättäminen tyhjäksi tai merkityksettömän tekstin, kuten ”Kuva 1”, antaminen ei ole kovin hyödyllistä, kuten voit kuvitella. Vaikka vaihtoehtoinen teksti olisi ”This is an image of two Huskies”, välitettävä tieto ei ole lähelläkään sitä, mitä joku, joka ei käytä ruudunlukuohjelmaa, pystyisi tulkitsemaan, kuten Jialinin T-paidan tekstiä. Lisäksi ruudunlukija ilmoittaa sisällön jo ”kuvana” tai ”grafiikkana”, jolloin ”Tämä on kuva” on turhaa tekstiä. Kaikki tämä olettaen, että kuvan on julkaissut käyttäjä, jolla on pääsy koodiin vaihtoehtoisen tekstin syöttämiseksi.

Mutta entäpä paikat, kuten sosiaalisen median alustat, joissa kuvia lataavat käyttäjät, joilla ei ole lainkaan pääsyä koodiin. Facebook alkoi vuonna 2016, yli kymmenen vuotta perustamisensa jälkeen, käyttää tekoälyä lisäämään automaattisesti luotua vaihtoehtoista tekstiä kuviin ja antoi käyttäjien muokata tätä tekstiä tarvittaessa. Instagram seurasi ja otti tämän ominaisuuden käyttöön viime vuonna, kahdeksan vuotta lanseerauksensa jälkeen. Kysymykset pysyvät kuitenkin samoina: Kuinka paljon tietoa vaihtoehtoisen tekstin pitäisi tarjota? Riittääkö perustason, korkeamman tason kuvaus? Kun päätämme, mitä näytönlukijan käyttäjille esitetään, oletammeko ja yleistämmekö, mitä näytönlukijan käyttäjät etsivät kuvasta? Jos kuva kertoo enemmän kuin tuhat sanaa, eikö vaihtoehtoisen tekstin pitäisi kuvainnollisesti olla tuhat sanaa?

GIF:t ja animoidut kuvat

Leolla on vahva meemipeli ja hän on asiantuntija löytämään kissa-GIF:n joka tilanteeseen. Ottaen huomioon, että GIF luodaan yhdistämällä useita eri kuvia siten, että lopputulos antaa vaikutelman hyvin lyhyestä videosta, kohtaammeko samat ongelmat kuin kuvien kanssa? Pahempaa. Kehittäjänä voit toki (ja sinun pitäisikin) lisätä vaihtoehtoisen tekstin samalla tavalla kuin teemme kuvien kohdalla (GIF on loppujen lopuksi kuvatiedosto). Mutta sosiaalisen median alustoilla, riippuen siitä, miten alusta käsittelee GIF:ää, se joko renderöidään käyttämällä img-elementtiä ilman alt-attribuuttia tai käyttämällä video-elementtiä. video-elementti ei tue alt-attribuuttia lainkaan.

Siten kaikki ne GIF-widgetit, joita olemme käyttäneet animoitujen meemien julkaisemiseen Facebookissa ja Instagramissa, jotka tekevät meistä siistejä ja kaikkea muuta, ovat ruudunlukijakäyttäjille saavuttamattomissa. Tässä tavoitteemme ei ole estää Leoa julkaisemasta GIF:iä (koska, miau), vaan varmistaa, että tällaisesta sisällöstä nauttivat kaikki eivätkä vain osajoukko väestöstä.

Graafit ja visualisoinnit

Kaikki tämä, emmekä ole vielä edes päässeet ”vaikeisiin asioihin”. Esittelemme graafit ja interaktiiviset visualisoinnit. Yisu ja Xuhai ovat totaalisia visualisointinörttejä, ja aivan kuten kuka tahansa tutkija, he uskovat, että kuvaajat ja visualisoinnit ovat äärimmäisen arvokkaita; harvoin on akateemista artikkelia, jossa ei ole vähintään yhtä kuvaajaa tai visualisointia. Graafi välittää erittäin visuaalista tietoa, ja se on yleensä upotettu verkkosivulle käyttäen yhtä kolmesta tärkeimmästä tekniikasta:

  1. kuvana staattista sisältöä varten.
  2. HTML-elementtinä canvas tai SVG-kaavioina (kuvan päivitys eri näkökulmista) staattista sisältöä varten.
  3. ja/tai vuorovaikutteisena visualisointina käyttäen JavaScript-kirjastoja (jotka yleensä käyttävät HTML canvas– tai SVG-elementtiä taustalla olevana mekanismina) dynaamisen sisällön tarjoamiseksi ja käyttäjien vuorovaikutuksen mahdollistamiseksi kuvaajan kanssa.

Kuvana käytettäessä sovelletaan samoja näkökohtia, joita olemme käsitelleet edellä, ja tieteellisen informaation esittämisen monimutkaisuutta lisätään. Mitä vaihtoehtoisessa tekstissä pitäisi sanoa? Pitäisikö sen antaa yleiskuva kuvaajasta? Pitäisikö sen sisältää tilastoja, kuten keskiarvo, keskiarvo, mediaani, moodi jne. Ja jos on, mitkä niistä? Kuinka paljon tietoa on liian vähän ja kuinka paljon on liikaa? Nämä ovat vaikeita kysymyksiä.

HTML:n canvas itsessään paljastuu bittikarttana, ja ilman asianmukaisen fallback-sisällön toteuttamista se aiheuttaa useita saavutettavuushaasteita. On kuitenkin olemassa useita tekniikoita, joilla niistä voidaan tehdä saavutettavia, ja ne ovat vain Google-haun päässä. Mutta tietysti kehittäjät ovat vastuussa siitä, että he tuntevat nämä tekniikat ja toteuttavat ne työssään – jotain, jonka olen nähnyt paranevan ajan mittaan, mutta en pidättelisi hengitystäni sen suhteen. Päinvastoin, SVG:tä suositellaan esteettömiä kaavioita varten, sillä W3C:n eritelmien mukaan lapsielementit ovat Accessibility API:n käytettävissä. Selaintukea työstetään kuitenkin edelleen, ja täysin saavutettava SVG-grafiikka vaatii vaivannäköä ja ainakin jonkinlaista perustietämystä SVG:stä, mikä on jälleen kerran vastuu, joka lankeaa kehittäjien harteille.

Käsitelläkseni joitakin näistä huolenaiheista loin evoGraphs – jQuery-lisäosan saavutettavien grafiikoiden luomiseksi, joka voitti Delegaattipalkinnon esteettömyyshaasteesta W4A:n konferenssissa vuonna 2015. Myönnettäköön, että se ei vastaa kaikkiin esiin tuotuihin kysymyksiin, jotka liittyvät tieteellisen tiedon esittämisen monimutkaisuuteen. Näin ollen saavutettavat kuvaajat ovat aktiivinen tutkimusalue minulle ja muille tutkijoille.

Vuorovaikutteisen visualisoinnin (kuten ChartJS, Google Charts ja D3) osalta dynaamisesti päivittyvän tiedon esittäminen on hankalaa. Useimmat ruudunlukijakäyttäjät eivät käytä osoitinlaitetta (kuten hiirtä, Trackpadia jne.), ja useimmat vuorovaikutukset rajoittuvat joko pelkästään tai ovat käytännöllisesti katsoen käyttökelpoisempia, kun tiettyjen elementtien yläpuolella leijuminen käynnistyy. Ilman tällaisia vuorovaikutussuhteita interaktiivisten visualisointien tarkoitus ruudunlukijakäyttäjälle muuttuu epäselväksi, ja luultavasti ilman asianmukaista harkintaa sisällön ymmärtämisestä voi tulla entistä hämmentävämpää.

Lisäksi monet nykyaikaiset graafiset kirjastot mahdollistavat dynaamisen sisällön muokkaamisen. Tietojen välittäminen ruudunlukijoille, kun sisältöä muutetaan, voidaan hoitaa käyttämällä oikein ARIA-attribuutteja, joista tuli W3C:n suositus vuonna 2014 ja jotka ovat rehellisesti sanottuna taivaan lahja. Mutta kuten SVG:n kohdalla, selainten vakaa tuki kaikille ARIA-ominaisuuksille on vielä kesken, varsinkin kun niitä käytetään SVG:n sisällä. Kehittäjien asianmukainen koulutus on edelleen tarpeen, jotta ARIA:n tarjoamia mahdollisuuksia voidaan hyödyntää täysimääräisesti.

Tie eteenpäin

Teknologia on kehittynyt huomattavasti siitä, kun Tim Berners-Lee loi World Wide Webin, tähän päivään. Valitettavasti samaa ei voi sanoa tällaisen teknologian saavutettavuudesta. Kun tietty teknologia saadaan vammaisten ulottuville, maailma on jo siirtynyt kehittyneempiin teknologioihin. Kurominen umpeen ei siis koskaan lopu. Eikä tulekaan – ellei esteettömyydestä tule perustavanlaatuista näkökohtaa uusien teknologioiden kehittämisessä.

Mutta kaikki toivo ei ole menetetty. Olemme edistyneet ja edistyneet edelleen huomattavasti verkon saavutettavuuden alalla sekä akateemisessa tutkimuksessa että teollisissa tuotteissa. Opiskelijoille ja uusille kehittäjille opetetaan esteettömyyden käsitteitä ja tekniikoita, joiden avulla webistä voidaan tehdä esteettömämpi. Tulevaisuudessa haluan ottaa askeleen taaksepäin ja miettiä ohjelmistojen mukauttamista käyttäjien tarpeiden mukaan sen sijaan, että odottaisimme käyttäjien mukautuvan ohjelmistoihin. Oletammeko esimerkiksi, millaista tietoa ruudunlukijan käyttäjä haluaa poimia kuvasta, vai rakennammeko työkaluja, jotka oppivat enemmän käyttäjästä ja esittävät tietoa, jonka käyttäjä mieluummin ymmärtää? Minusta tulevaisuus vie meidät pois yleistämisestä ja lähemmäs personointia – World Wide Web, joka on aidosti käyttäjäkeskeinen.”

  1. ”Näkövammaisuus ja sokeus.” Maailman terveysjärjestö, World Health Organization, https://www.who.int/news-room/fact-sheets/detail/blindness-and-visual-impairment. Accessed 20 Oct. 2019.
  2. ”A Picture’s Worth: D. H. Hepting, Ph.D.” A Picture’s Worth | D. H. Hepting, Ph.D., http://www2.cs.uregina.ca/~hepting/projects/pictures-worth.
  3. HTML 2.0 Materials, https://www.w3.org/MarkUp/html-spec.
  4. Sharif, Ather, and Babak Forouraghi. ”evoGraphs-A jQuery plugin to create web-accessible graphs”. 2018 15th IEEE Annual Consumer Communications & Networking Conference (CCNC). IEEE, 2018.
  5. ”WAI-ARIA Overview”. Web Accessibility Initiative (WAI), https://www.w3.org/WAI/standards-guidelines/aria.

Jätä kommentti