Obrázek řekne tisíc slov, ale ne doopravdy

Uživatel čtečky obrazovky používá VoiceOver k přečtení článku The New York Times s názvem

Zoey rád prohlíží internet. Rád se ztrácí v propojené síti plné informací a rozplétá střípky vědomostí, které stojí za záložku. Neradi se však probírají rozsáhlými texty. Dávají přednost obrázkům. Je jich hodně. Procházejí fotky své lásky na Facebooku dřív, než je vůbec napadne přečíst si její životopis. Jejich touha po memech a vizualizacích nemá obdoby u nikoho na této planetě a jejich příběhy na Instagramu to odrážejí. Jsou prostě, znáte to, silně propojeni se svou vizuálně-naučnou povahou. A na tom není nic špatného.

Svět ale nemá jen Zoey. Je tu Trung-Anh, je tu Sewon, je tu Nayon, je tu Venkatesh, je tu Zeqiu, je tu Dinko, je tu Sade, je tu Ivan a je tu Mohammed. Podle WHO má nějakou formu zrakového postižení nejméně 29 % (2,2 miliardy) světové populace (7,7 miliardy), což jsou nejméně 3 lidé z výše uvedeného seznamu. Hmm, takže, ehm … když teď víme, že 29 % populace nemusí být schopno vidět vizuální obsah, co budeme dělat? Budeme se stále držet doslovného výkladu citátu Freda Barnarda „Obrázek vydá za tisíc slov“? Troufám si říct, že ne. Ne vždy.

Často se nabízí zvídavá otázka – jak používají počítač lidé se zrakovým postižením? Předně si myslím, že je důležité si uvědomit, že mít zrakové postižení není synonymem pro nevidomost. Pokud tedy vidíte někoho, kdo používá bílou hůl, bylo by nesprávné předpokládat, že je zcela slepý. Pokud jde o používání počítače, v závislosti na úrovni jejich zraku mohou ke čtení obsahu na obrazovce používat čtečky obrazovky. Mezi oblíbené odečítače obrazovky patří JAWS, NVDA (zdarma a s otevřeným zdrojovým kódem) a VoiceOver (zabudovaný v zařízeních Apple).

Stav světa

Skvělé! Máme tedy způsob, jak mohou uživatelé čteček obrazovky komunikovat se svými počítači nebo mobilními zařízeními. Ale jak může čtečka obrazovky přečíst fotografie svých miláčků? Nebo memy? Nebo grafy/vizualizace? Jednou z možných odpovědí zde je, že bychom měli udělat lékařský pokrok, který by jim vyléčil zrak, nebo něco v tom smyslu, že by měli osobního ošetřovatele/přítele/rodinu, který by jim mohl vysvětlit, co je na obrazovce. Další možná odpověď zahrnuje vybudování světa, kde je možné, aby to zvládli sami. Pokud se vaše odpověď blížila první variantě, pak se zjevně potřebujete vzdělávat a seznámit se s koncepty sociálního modelu postižení.

Obrázky

Soustřeďme se na obrázky. Aby byl odečítač obrazovky schopen přečíst obrázek, musí vědět, o čem obrázek je, a poté jej uživateli smysluplně prezentovat. Uvažujme například obrázek rodiny, která si hraje se svými dvojčaty Huskies (Do toho, Huskies!). Jako uživatel, který neumí číst z obrazovky, snadno zjistí, co se na obrázku děje – nejen co se děje v popředí, ale také na pozadí. Například Jialin, jeden z členů rodiny, má na sobě tričko s nápisem „100% člověk“. Dokáže čtečka obrazovky tuto scénu zcela extrahovat? Za tímto účelem se čtečky obrazovky spoléhají na to, že vývojáři nebo autoři obsahu dodají k obrázkům alternativní text pomocí atributu „alt“, který byl veřejnosti představen v roce 1995 jako součást jazyka HTML 2.0 (pokud nevíte, co je atribut alt nebo jaký má význam, tento článek poskytuje skvělý přehled atributu alt). Element HTML img pak vypadá následovně:

<img src="image1.jpg" alt="This is an image of two Huskies" />

Proto nyní bude čtečka obrazovky číst „Obrázek, Toto je obrázek dvou Huskyů“.

Ponechání atributu alt prázdného nebo dodání nesmyslného textu, jako například „Obrázek 1“, jak si jistě dokážete představit, příliš nepomůže. Ani s alternativním textem „Toto je obrázek dvou Huskyů“ se předávaná informace ani zdaleka neblíží tomu, co by byl schopen extrahovat někdo, kdo nepoužívá čtečku obrazovky, například text na Jialinově tričku. Navíc čtečka obrazovky již oznamuje obsah jako „obrázek“ nebo „grafiku“, takže „Toto je obrázek“ je nadbytečný text. To vše za předpokladu, že obrázek zveřejnil uživatel, který má přístup ke kódu pro zadání alternativního textu.

A co místa, jako jsou platformy sociálních médií, kde obrázky nahrávají uživatelé, kteří ke kódu vůbec nemají přístup. Facebook v roce 2016, tedy více než deset let po svém spuštění, začal využívat umělou inteligenci k přidávání automaticky generovaného alternativního textu k obrázkům a umožnil uživatelům tento text v případě potřeby upravit. Instagram ho následoval a tuto funkci zavedl loni, osm let po svém spuštění. Otázky však zůstávají stejné – Kolik informací by měl alternativní text poskytovat? Stačí základní popis na vyšší úrovni? Předpokládáme při rozhodování, co předložit uživatelům čtečky obrazovky, a zobecňujeme, co uživatelé čtečky obrazovky na obrázku hledají? Pokud obrázek vydá za tisíc slov, neměl by, obrazně řečeno, alternativní text vydat za tisíc slov?“

GIFy a animované obrázky

Leo má silnou hru na memy a je odborníkem na hledání kočičích GIFů pro každou příležitost. Vzhledem k tomu, že GIF vzniká spojením několika různých obrázků tak, aby konečný výsledek působil dojmem velmi krátkého videa, potýkáme se se stejnými problémy jako u obrázků? Ještě horší. Jako vývojář jistě můžete (a měli byste) přidat alternativní text podobně, jako to děláme u obrázků (GIF je koneckonců obrázkový soubor). Ale na platformách sociálních médií se v závislosti na tom, jak je GIF zpracován danou platformou, vykresluje buď pomocí elementu img bez atributu alt, nebo pomocí elementu video. Element video atribut alt vůbec nepodporuje.

Takže všechny ty widgety GIF, které jsme používali ke zveřejňování animovaných memů na Facebooku a Instagramu, ty, díky kterým jsme cool a vůbec, jsou pro uživatele čteček obrazovky nepřístupné. Zde není naším cílem zabránit Leovi ve zveřejňování GIFů (protože, mňau), ale zajistit, aby si takový obsah mohli užívat všichni a ne jen část populace.

Grafy a vizualizace

Všechno tohle a to jsme se ještě nedostali k „těžkým věcem“. Představujeme grafy a interaktivní vizualizace. Yisu a Xuhai jsou totální šprti na vizualizace a podobně jako každý výzkumník věří, že grafy a vizualizace jsou nesmírně cenné; málokdy se najde akademická práce bez alespoň jednoho grafu nebo vizualizace. Graf zprostředkovává vysoce vizuální znalosti a obvykle se vkládá do webové stránky pomocí jedné ze tří hlavních technik:

  1. jako obrázek pro statický obsah.
  2. jako prvek HTML canvas nebo grafy SVG (upgrade z obrázku z různých hledisek) pro statický obsah.
  3. a/nebo jako interaktivní vizualizace pomocí knihoven JavaScriptu (které obvykle využívají HTML canvas nebo SVG jako základní mechanismus) pro podávání dynamického obsahu a umožnění interakce uživatelů s grafem.

Při použití jako obrázek platí stejné úvahy, které jsme uvedli výše, s tím, že se přidává složitost prezentace vědeckých informací. Co by měl říkat alternativní text? Měl by poskytovat přehled o grafu? Měl by obsahovat statistické údaje, jako je průměr, průměr, medián, modus atd. A pokud ano, které? Kolik informací je příliš málo a kolik příliš mnoho? To jsou těžké otázky.

Samotný canvas v HTML je vystaven jako bitmapa a bez implementace vhodného záložního obsahu představuje několik problémů s přístupností. Existuje však několik technik, jak je zpřístupnit, a stačí je vyhledat na Googlu. Za znalost těchto technik a jejich implementaci do své práce jsou ale samozřejmě zodpovědní vývojáři – něco, co jsem viděl, že se postupem času zlepšuje, ale nedržel bych se toho. Naopak pro přístupné grafy se doporučuje SVG, protože podle specifikací W3C jsou podřízené prvky dostupné rozhraní API pro přístupnost. Na podpoře v prohlížečích se však stále pracuje a plně přístupný graf SVG vyžaduje úsilí a alespoň základní znalosti SVG, což je opět zodpovědnost, která padá na bedra vývojářů.

Pro řešení některých z těchto problémů jsem vytvořil evoGraphs – zásuvný modul jQuery pro vytváření přístupných grafů, který v roce 2015 získal cenu delegáta v soutěži Accessibility Challenge na konferenci W4A. Je třeba přiznat, že neřeší všechny zdůrazněné otázky týkající se složitosti prezentace vědeckých informací. Proto jsou přístupné grafy pro mě a další výzkumníky aktivní oblastí zkoumání.

Jako interaktivní vizualizace (například ChartJS, Google Charts a D3) je reprezentace dynamicky aktualizovaných informací ošemetná. Většina uživatelů čteček obrazovky nepoužívá ukazovací zařízení (jako je myš, trackpad atd.) a většina interakcí se buď výhradně omezuje, nebo je prakticky použitelná spíše po spuštění najetí na určité prvky. Bez takových interakcí se účel interaktivních vizualizací pro uživatele čtečky obrazovky stává mlhavým a pravděpodobně bez patřičného zvážení může být pochopení obsahu ještě zmatenější.

Mnoho moderních grafických knihoven navíc umožňuje dynamickou úpravu obsahu. Předávání informací čtečkám obrazovky při změně obsahu lze řešit vhodným použitím atributů ARIA, které se v roce 2014 staly doporučením W3C a jsou upřímně řečeno darem z nebes. Stejně jako v případě SVG je však stabilní podpora všech funkcí ARIA ze strany prohlížečů stále ve vývoji, zejména při použití v rámci SVG. K plnému využití toho, co ARIA nabízí, je stále zapotřebí řádné školení vývojářů.

Cesta vpřed

Od doby, kdy Tim Berners-Lee vytvořil World Wide Web, až po dnešek se technologie drasticky rozšířila. To samé se bohužel nedá říci o dostupnosti těchto technologií. V době, kdy je určitá technologie zpřístupněna osobám se zdravotním postižením, se svět již posunul k pokročilejším technologiím. Dohánění tak nikdy nekončí. A ani nebude – pokud se přístupnost nestane základním hlediskem při vývoji novějších technologií.

Ale ne všechna naděje je ztracena. V oblasti přístupnosti webu jsme udělali a stále děláme velké pokroky, a to jak v akademickém výzkumu, tak v průmyslových produktech. Studenti a noví vývojáři se učí konceptům přístupnosti a technikám, jak web zpřístupnit. Do budoucna si představuji, že uděláme krok zpět a budeme přemýšlet o přizpůsobení softwaru potřebám uživatelů, na rozdíl od očekávání, že se uživatelé přizpůsobí softwaru. Budeme například stále předpokládat, jaké informace bude chtít uživatel čtečky obrazovky z obrázku získat, nebo vytvoříme nástroje, které se o uživateli dozvědí více a budou prezentovat informace, které uživatel raději vnímá? Podle mě nás budoucnost posouvá od generalizace blíže k personalizaci – k World Wide Webu, který je skutečně zaměřen na uživatele.“

  1. „Poruchy zraku a slepota“. Světová zdravotnická organizace, Světová zdravotnická organizace, https://www.who.int/news-room/fact-sheets/detail/blindness-and-visual-impairment. Přístup 20. 10. 2019.
  2. „A Picture’s Worth: D. H. Hepting, Ph.D.“. A Picture’s Worth | D. H. Hepting, Ph.D., http://www2.cs.uregina.ca/~hepting/projects/pictures-worth.
  3. Materiály HTML 2.0, https://www.w3.org/MarkUp/html-spec.
  4. Sharif, Ather a Babak Forouraghi. „evoGraphs-A jQuery plugin to create web-accessible graphs“. 2018 15th IEEE Annual Consumer Communications & Networking Conference (CCNC). IEEE, 2018.
  5. „Přehled WAI-ARIA“. Iniciativa pro přístupnost webu (WAI), https://www.w3.org/WAI/standards-guidelines/aria.

.

Napsat komentář