rozpoznawanie mowy

Rozpoznawanie mowy: czym jest i jak działa?

Czym jest ASR (ang. automatic speech recognition), czyli rozpoznawanie mowy? Jak to się dzieje, że voiceboty i głosowy asystenci tak dobrze odczytują pytania i polecenia ze strony użytkowników systemów służących automatyzacji komunikacji? Wyjaśnienie działania tej technologii znajdziecie w artykule. 

Automatyczne rozpoznawanie mowy to technologia stworzona po to, by umożliwić maszynie (np. komputerowi) interpretować ludzką mowę. W praktyce w systemach sztucznej inteligencji konwersacyjnej oznacza to konwersję głosu na tekst. Proces ten zachodzi w czasie rzeczywistym i przebiega tak płynnie, że jest dla użytkownika takiego systemu w zasadzie niewidoczny.  

Zastosowanie rozpoznawania mowy w voicebotach

To właśnie poprzez ASR voicebot potrafi zrozumieć ludzki sposób komunikowania się. Dzięki rozpoznawaniu mowy wie, z jakim problemem zgłasza się do niego użytkownik. Coraz więcej voicebotów pracuje na infoliniach, dlatego też sama technologia znajduje coraz powszechniejsze zastosowanie. Voiceboty dobierają połączenia w biurach obsługi klienta, ale też samodzielnie wykonują połączenia, by podjąć interakcję z klientami (ankietowanie, windykacja, weryfikacja leadów).

Jaka jest skuteczność systemów ASR?

skuteczność rozpoznawania mowy

Niestety, jak każda inna technologia, także ASR nie jest skuteczny w 100%. Pewne błędy i potknięcia w interpretacji ludzkich wypowiedzi są do uniknięcia. Co ciekawe – ten sam system rozpoznawania mowy, może charakteryzować się odmienną skutecznością podczas rozmowy z różnymi użytkownikami. Odsetek prawidłowo zinterpretowanych wypowiedzi zależy zarówno od doboru słów, składni, frazeologii, skrótów myślowych, ale też takich elementów komunikacji jak wymowa, akcept, posługiwanie się gwarą. Jako pożądany wynik dla systemów ASR często określą się 95% prawidłowej interpretacji kierowanych komunikatów. Jednak uzyskanie takiego wyniku wymaga pracy: analizy logów, dodatkowej konfiguracji. Nie bez znaczenia jest także stałe aktualizowanie bazy wiedzy bota.

Czy rozpoznawanie mowy to wszystko, czego potrzeba voicebotom?

Rozpoznawanie mowy to tylko jedna, ale nie jedyna technologia, która umożliwia voicebotom działanie. Drugą stroną medalu jest „generowanie mowy”, które odpowiada na przekształcenie tekstu na głos.

Polecane:

  1. Wikipedia o rozpoznawaniu mowy.
  2. Rozpoznawanie mowy w voicebocie.