Głosowe asystentki w Twoim smartfonie

głosowi asystenci

W styczniu 1984 roku, na konferencji Apple w Cupertino, Steve Jobs zaprezentował światu pierwszego Macintosha 128K. Komputer, który samodzielnie przemówił ludzkim głosem do zgromadzonej we Flint Center widowni. Oczywiście była to zasługa syntezatora mowy, nie sztucznej inteligencji komputera. Marzenia o mówiącym, ale i rozumiejącym urządzeniu osobistym, spełniły się częściowo dopiero w roku 2010, kiedy to Apple wykupiło popularną w Appstore aplikację Siri (wraz z jej twórcami) i przekształciło ją w pełni zintegrowaną z systemem, inteligentną asystentkę głosową.

Od tamtej pory Siri trafia do kolejnych wersji oprogramowania iOS. Pierwsza konkurencja pojawiła się ze strony Google. Pozwalająca na wydawanie smartfonowi komend głosowych – usługa Google Now – dotarła na smartfony wraz z Androidem 4.1. Trzeci gracz – Microsoft – czekał ze swoją głosową asystentką najdłużej, do 2014 roku. Cortana pojawiła się wraz z mobilną wersją Windowsa 8.1. Jak przebiega więc walka między trzema kobiecymi głosami wbudowanymi w systemy operacyjne naszych sprzętów [update: czterema, nie można zapomnieć o wydanym przez Samsunga w 2012 roku S Voice]?

Siri, w początkowej fazie, była jedynie ciekawostką, którą wszyscy zachwycali się przez parę miesięcy, by następnie odstawić na półkę jak przedszkolną zabawkę. Tymczasem kobiecy głos Apple dojrzał i nauczył się paru nowych funkcji. Czy nadchodzi czas, w którym bez lekkiej ironii w głosie nazwiemy go niezawodną, wirtualną asystentką? Do tej pory aplikacja odpowiadała tylko na nasze pytania i nie wykazywała własnej inicjatywy; ta pasywność wciąż pozostaje jej największym problemem – i tak programy pokroju Siri czy Google Now znacznie poprawiły swoje podstawowe funkcjonalności w ciągu ostatnich lat. Asystentki są w stanie bezproblemowo odsłuchać komendę głosową i wyszukiwać informacje w sieci, odnaleźć na mapie interesujące nas miejsce, przełożyć spotkanie w kalendarzu czy poinformować o rozkładzie odlotów i przylotów samolotów w trakcie podróży. Jest więc coraz lepiej (aż dziw bierze, że propagatorzy równości jeszcze nie zabrali się za “seksistowski” wybór płci asystentek 😉 ).

Od pasywności do aktywności

Głównym celem ewolucji tego typu programów, staje się przejście od pasywności do aktywności. W końcu inteligentna asystentka powinna nie tylko odpowiadać na komendy, ale sama zadbać o istotne dla użytkownika kwestie, przykładowo wcześniej badając i zapamiętując jego styl życia i nawyki, by potem wykorzystać te dane w układaniu proponowanego planu dnia itp. Oczywiście problem leży także w tym, by asystentka nie stała się nagle zbyt inwazyjna, władcza i chciwa informacji o użytkowniku (nadgorliwość jest w końcu gorsza od faszyzmu). Jak mniej więcej powinna więc wyglądać taka funkcjonalność? Na mniejszą skalę robi to chociażby HTC One M9, automatycznie dopasowując aplikacje dostępne z głównego ekranu smartfona w zależności od lokalizacji. Jeśli przebywasz “w terenie”, z dala od miejsca zamieszkania, znajdziesz na nim mapę czy odtwarzacz muzyki. W kwestii podobnego rodzaju „wykazywania inicjatywy” króluje jednak Google Now – potrafi w końcu przeskanować informacje i wiadomości w celu odnalezienia i wpisania do kalendarza być może interesujących właściciela spotkań i wydarzeń. Apple wprowadzi taką funkcjonalność wraz z aplikacją Proactive na iOS 9. Będzie ona w stanie przykładowo wyszukać potencjalną nazwę nieznanego połączenia przychodzącego, skanując otrzymane w ostatnim czasie maile. Widzimy tu przejście z nieskomplikowanego wykonywania rozkazów i prostych sugestii pokroju: “ten artykuł może ci się spodobać” do roli prawdziwej „pomocnej dłoni” przypominającej o spotkaniu służbowym czy opłaceniu rachunków. Oczywiście to wszystko odbywa się kosztem prywatności, jednak z pewnością ułatwia codzienne życie w świecie pełnym różnych wydarzeń i biurokracji. Apple planuje nawet zastąpić standardową pocztę głosową swoją Siri (jak wiemy gigant z Cupertino, podobnie jak Google, planuje także wejście na rynek operatorów sieci komórkowych). Usługa miałaby pozwolić na m.in. transkrypcję nagranej na poczcie głosowej wiadomości i przesłanie jej w formie tekstu na adres mailowy odbiorcy.

Nowy gracz

Do grona twórców wirtualnych asystentek ma dołączyć także producent procesorów do urządzeń mobilnych – Qualcomm. Na tegorocznych targach CES firma ta zaprezentowała swój kolejny, flagowy układ SoC (System on Chip) – Snapdragon 820. Wejdzie on w skład nowej platformy Zeroth, która również będzie posiadać znamiona wirtualnego asystenta, wykorzystującego do działania czujniki smartfona,  nawyki użytkownika oraz jego otoczenie. Kiedy poprosimy Zerotha, by wyszukał w galerii zdjęcie nas na słonecznej plaży – zrobi to. Kiedy zechcemy zrobić fotkę – urządzenie samo dopasuje ustawienia aparatu do scenerii. Ma to być zasługą właśnie tych wzmocnionych możliwości poznawczych oprogramowania, które według zapewnień, rozpoznawać będzie: obiekty, twarze, miejsca i dzięki temu zachowywać się odpowiednio do sytuacji.

Czy głosowi asystenci mówią po polsku?

Jak cała scena wirtualnych asystentów wygląda z polskiego punktu widzenia? Niestety, jak na razie Polacy nie doczekali się jeszcze rodzimej wersji Siri, jednak nic nie stoi na przeszkodzie, by korzystać z niej w innym języku. W przypadku wprowadzonej wraz z Windowsem 8.1 głosowej asystentki Microsoftu – Cortany, jest bardzo podobnie (Cortana została udostępniona również na desktopowym Windows 10, ale niestety – nie w Polsce). Jak na razie jedyną spolszczoną usługą pozostaje Google Now. Niestety mocno ustępuje ono swojej anglojęzycznej wersji. Na rynku asystentek pojawiają się już pewne tarcia – przykładowo Microsoft, który udostępnił Cortanę także na Androida, umożliwia użytkownikom zastąpienie oryginalnego Google Now, wywoływanego przyciskiem funkcyjnym, swoją własną asystentką (na razie Cortana dostępna jest w ramach beta testów). Zobaczymy, co powie na to Google. Microsoft planuje wysłać Cortanę również na urządzenia z iOS – możemy przyjąć, że w kwestii głosowych asystentów czeka nas prawdziwa walka o klientów (oby zahaczyła także o tych polskich).

Źródło:
http://www.forbes.com/sites/jaymcgregor/2015/07/06/siri-cortana-google-now-are-the-future-of-mobile/
http://searchenginewatch.com/sew/news/2420674/can-siris-voicemail-transcription-help-apple-pull-ahead

Zdjęcie:
DigiClack © Więcej zdjęć na Fotolia.pl