음성인식 4

음성인식 - 상용 소프트웨어 순위에 대해 알아보자 (뉘앙스, 구글, 애플, MS 등)

음성인식 소프트웨어 하면 우리나라에는 카카오, 네이버, SK 텔레콤, KT 등에서 적극적으로 개발하고 상용화를 진행하고 있는 회사들입니다. 하지만 글로벌 마켓에서는 우리나라 기업의 음성인식 솔루션이 알려지지 않은 것으로 보입니다. 아무래도 음성인식은 언어 특성에 의존을 많이하기 때문에 한국어에 특화된 우리나라 음성인식서비스가 세계무대에서 힘을 쓰기 어려운 것 같습니다. 그래서 오늘은 해외 음성인식 상용솔루션에 대해서 확인해봤습니다. 해외에서 잘 나가고 있는 음성인식 솔루션은 다음과 같았습니다. 1) 뉘앙스 (Nuance) Dragon Professional, Dragon Anywhere 2) 구글 (Google) Now, Cloud Speech API, Docs Voice Typing 3) 애플 (App..

음성인식 2022.05.06

음성인식 자연어이해 및 자연어처리 간단 소개 #2

앞서 말씀드린 내용처럼 ASR 과정과 NLU 과정에는 확률이라는 개념이 많이 적용되고 있습니다. 하지만 NLU 과정에는 확률언어모델 말고도 문법기반의 NLU 모델 또한 존재하고 있습니다. 사람이 말하는 내용을 미리 모델 내에서 정의해 놓고, 말하는 내용이 정의된 내용과 일치할 경우에 미리 결정된 응답에 의해서 음성인식을 처리하는 방법입니다. 따라서 이 방법을 적용할 때는 Syntax와 Semantics을 얼마나 잘, 구체화시켜서 지정하는지가 모델의 성능을 좌지우지하는 척도가 될 것입니다. (이런 문법기반의 NLU 모델을 학습하기위해 향후 BNF - Backus–Naur form 표기법에 대해서도 포스팅해보도록 하겠습니다) Grammar 방법은 아무래도 미리 정의해놓는 방법이기에 미리 알고있는 내용에 대해..

NLU (Natural Language Understanding)에 대한 간단 소개 #1

자연어 이해는 정말 많이 사용되는 기술입니다. 텍스트분석에서도 이뤄지구요. 물론 음성인식에서도 음성인식 과정 중에 한 과정으로서 처리되는 기술입니다. 음성인식에서는 자연어 처리를 NLU라고 명칭합니다. Natural Language Understanding 입니다. NLU 없이는 뉴스, 소셜미디어, 음악검색, 일정예약 등의 음성명령을 내려도 이해를 못하니 아무 응답을 할 수 없을 것입니다. 보통 음성인식이라하면 하나의 단일기술이라고 이해하실 분들이 많을 것 같은데요. 그렇지 않습니다. 음성인식은 여러분야의 기술들이 음성인식이라는 것을 구현하기 위해 모여진 집합기술입니다. 우선 음성을 텍스트로 변환시켜야하겠구요. (ASR) 변환된 텍스트를 기계가 이해할 수 있도록 처리하는 기술도 필요하겠지요. (NLU) ..

자율주행 - Emergency Vehicle Detection (EVD) 기술 개요 #1

자율주행에 있어서 중요한 입력 Data는 카메라, 레이다 그리고 라이다를 통한 입력일 것이고 학계 그리고 많은 회사들에서 관련 기술개발을 위해서 막대한 비용을 투자하며 개발하고 있습니다. 하지만 이러한 시각정보로는 해결하지 못할 케이스가 존재할 것입니다. 오늘은 그런 케이스들 중 하나로서 EVD 기술에 대해서 소개해보고자 합니다. 상황을 한 가지 가정해보도록 하겠습니다. 길이 막힌 도로에서 자율주행차량이 운행되고 있습니다. 하지만 자율주행차량의 전방, 후방, 측방 카메라와 레이다, 라이다는 주변의 사물만 인지하고 있습니다. 또한 전방에 차가 있어서 앞의 앞의 차가 어떤 상태인지는 확인할 수 없습니다. 이런 경우에서도 자율주행을 가능하게 하기 위해 ITS (Intelligent Transport Syste..