Czytamy obrazki

 

W Internecie od lat występuje jedna rzecz, której szczerze mówiąc nigdy nie rozumiałem i chyba już nie zrozumiem. Tekst, tę najprostszą i najbardziej czytelną formę przekazu wiele osób udostępnia w graficznej formie. Oczywiście wiadomo, tzw. Memy czyli zabawne obrazki oprócz warstwy tekstowej posiadają także często jakąś zabawną, ilustrowaną historyjkę. Problemem jednak jest nie tylko ta śmieszna część Internetu. Prawdziwy kłopot zaczyna się w momencie, w którym jedyną dostępną formą informacji jest jej skan lub coraz częściej zdjęcie wykonane aparatem smartphone’a. Niejednokrotnie spotkałem się z sytuacją, kiedy właśnie w taki sposób restauracje udostępniały swoje menu, różnego rodzaju firmy czy instytucje ważne ogłoszenia, prawdziwym kuriozum było kiedyś zaproszenie dla niewidomych opublikowane przez pewną fundację w formie grafiki. Oczywiście warto edukować, napominać, opowiadać o dostępności, bo to w dłuższej perspektywie z pewnością przyniesie wymierne korzyści. Co jednak w sytuacji, kiedy dostęp do graficznej informacji potrzebny nam jest teraz?

Wiadomość do „przyjaciela”

Jeśli mamy chwilkę, możemy skorzystać z Facebookowej grupy Opisujemy Niewidomym. Z pewnością po krótszej lub dłuższej chwili znajdzie się ktoś, kto zechce poświęcić swój czas , by opisać udostępnione przez nas zdjęcie. Wszystkich zainteresowanych historią grupy zapraszamy do wysłuchania audycji, która jakiś już czas temu ukazała się w serwisie Tyflopodcast.

Sztuczna inteligencja od Microsoftu

Alternatywą, z której osobiście bardzo chętnie korzystam jest program Seeing AI. Ta rozwijana przez firmę Microsoft aplikacja to moim skromnym zdaniem jedno z bardziej rewolucyjnych narzędzi ostatnich czasów. Niby nic nowego, bo technologię rozpoznawania tekstu mamy już od dawna, jednak żadna aplikacja wcześniej, przynajmniej moim zdaniem nie robiła tego tak skutecznie. Oczywiście możemy zapomnieć o czytaniu tą metodą drukowanych książek choćby ze względu na, przynajmniej na razie, brak polskich liter. Nie należy również spodziewać się 100-procentowej dokładności i bezbłędnego odczytu tekstu. To, co uzyskamy, pozwoli jednak w większości przypadków na zorientowanie się, z jakim produktem mamy do czynienia i co znajduje się na jego opakowaniu.

Prawdziwa ciekawostka czeka nas jednak, gdy wejdziemy do menu aplikacji Seeing AI i wybierzemy pozycję „BROWSE PHOTOS”. Uzyskamy w ów czas dostęp do zdjęć, a każde z nich możemy poddać wnikliwej analizie sztucznej inteligencji. Po kilku, lub kilkunastu sekundach możemy otrzymać dwie informacje o zdjęciu. Po pierwsze, dowiemy się jakie obiekty na nim się znajdują. Jeśli na zdjęciu pojawi się np. siedzący na łóżku kot, usłyszymy: „A cat sitting on top of a bed”.

Jeśli do grafiki dołączona będzie informacja tekstowa, usłyszymy „Contains text” i tekst w większości przypadków zostanie nam odczytany. Czasem, jeśli tekstu jest więcej, należy dwukrotnie stuknąć w zdjęcie i użyć przycisku „Expand”, który się pojawi.

Czytamy zdjęcia na Facebooku

Sztuczna inteligencja opisująca zdjęcia na FB działa również coraz lepiej, podobno za granicą potrafi już wyłuskiwać tekst z niektórych grafik. Niestety, w Polsce tak dobrze nie jest i na razie poznać możemy jedynie ogólny opis przypisany do danego obrazka. Skoro jednak mamy do dyspozycji Seeing AI, spróbujmy zrobić z niego użytek. Po pierwsze, odnajdźmy jakieś zdjęcie w mobilnej aplikacji Facebooka i stuknijmy w nie dwukrotnie jednym palcem.

Jeśli zdjęcie opisane będzie jako tekst, wówczas szansa na to, że coś więcej z niego wydobędziemy diametralnie wzrasta, jednak z własnego doświadczenia mogę polecić podejmowanie prób także z innymi obrazkami. Kiedy wejdziemy już w interesującą nas fotkę, stukamy kolejno w przyciski więcej i zapisz. Teraz, wystarczy już tylko przełączyć się do aplikacji Seeing AI i wybrać Menu, a następnie ‘BROWSE PHOTOS”. Interesujące nas zdjęcie znajdować się będzie na samej górze listy. Możemy się z nim zapoznać, a następnie, by nie zajmowało pamięci naszego telefonu, usunąć je przy użyciu przycisku „Delete”.

Do trzech razy sztuka

Jeśli za pierwszym razem rozpoznane wyniki nie będą satysfakcjonujące, proponuję się nie zrażać i dać aplikacji jeszcze jedną, dwie szanse, korzystając z przycisku „REANALYZE”. Z bliżej niewyjaśnionych powodów pierwsze rozpoznanie daje czasem niedokładne wyniki. Przede wszystkim cierpi na tym warstwa tekstowa, grafiki zwykle rozpoznawane są za pierwszym razem.

Na koniec dodam, że Seeing AI ma znacznie więcej możliwości, a wszystkim zainteresowanym ich zgłębieniem polecam prezentację tej aplikacji w serwisie Tyflopodcast.

Michał Dziwisz

 

Projekt współfinansowany ze środków Państwowego Funduszu Rehabilitacji Osób Niepełnosprawnych oraz Gminy Miejskiej Kraków