1. AI 음성인식 스피커
- 전자상거래 및 검색 광고 분야 ex. 식당 예약
- 방송 분야 - 실시간 음성인식 자동 자막 방송
- 자동차 분야 - 차량 제어, 카투홈(Car To Home) 서비스
- 콜센터 분야 - 본인인증
- 공공 안전 분야 ex. 독거노인, 안심 화장실, 안심 보안등
- 국방분야 - AI 무인로봇 제어, 자동 번역
2. AI 음성인식과 정보보호
- 음성인식 분야는 음성 변조 기술과 같은 목소리 합성을 지원하는 기술의 발달로, 사이버 공격의 허점에 대한 고려가 필요하다.
3. 1차시 정리
Q1. 음성인식의 구성 요소 중 텍스트를 분석하여 모델을 만들어 현재 인식되고 있는 단어들 간의 결합 확률을 예측하는 과정은?
- 답: 언어 모델
Q2. 확률 관점에서 음성인식의 개념은?
- 입력된 음성이 어떤 단어들로 이루어져 있을 확률이 가장 높은가를 찾는 문제
- '일정 길이 T 동안 입력된 음성 sequence X에 대해서 인식기가 표현할 수 있는 모든 단어들의 조합 중 확률적으로 가장 가능성이 높은 단어 열 W는 무언인가'가 된다.
- 수식으로 표현하면 P(X|W)는 음향 모델 확률로 W라는 단어를 발성했을 때 X라는 신호적 특성이 발성될 확률이며, P(W)는 언어 모델이라고 하는데 음성신호 특징에 해당하는 X가 없다.
- 출처
- http://www.kocw.net/home/cview.do?cid=d10faf9660b7b0e5
- 해당 글은 KOCW에서 제공하는 'AI 보안 음성인식' 강의를 듣고 정리한 내용입니다.