▷ 책소개 음성인식이란 음성 신호로부터 발화 내용을 인식하는 기술, 즉 컴퓨터가 사람의 음성을 신호로 인식하여 처리하는 기술이다. AI 스피커와 스마트폰 음성 어시스턴트 등 음성인식 기술들은 이미 우리의 일상생활 속으로 깊이 스며들어 있다. 음성 번역 시스템의 전처리 단계, 회의록 자동 작성 시스템 등 다양한 곳에서 음성인식 기술이 사용된다. 특히나 음성인식 기술은 손을 사용하지 않고(Hands-free) 기계를 작동시킬 수 있어, 차량 내비게이션과의 연동 혹은 신체장애인의 입력 장치 등 다양한 방면에서 성장이 기대되는 기술이다.이 책은 지금까지의 음성인식 기술의 역사와 기술 발전 동향을 이해하고, 파이썬과 파이토치를 통해 최신 음성인식 시스템을 실습한다. 음성인식의 목적이나 알고리즘의 개요를 설명하고, 소스 코드를 상세하게 분석하고, 마지막으로 소스 코드를 첨부하여 독자들이 직접 구현할 수 있도록 한다. 특히 인공지능기술이 만들어진 목적이나, 해당 기술로 목적을 달성할 수 있을지에 대해 명확히 제시한다. 이 책은 음성인식을 제대로 구현하고자 하는 개발자 및 학부생에게 꼭 필요한 필독서가 될 것이다.
▷ 목차 제 1 장 음성인식이란?제1절 음성인식은 무엇이며, 어디에 사용되는가?제2절 음성을 인식한다는 것은? - 음성인식 원리-제3절 이 책의 목적과 구성제 2 장 음성인식 기초 지식제1절 음성인식과 확률제2절 음성인식 문제를 수식으로 정의하기제3절 텍스트 종류와 발음 사전 - 음소ㆍ히라가나ㆍ문자ㆍ단어 -제4절 음성인식 실험 두 가지제5절 음성인식 실험 프로세스제 3 장 음성 처리 기초와 특징 추출제1절 데이터 준비하기제2절 음성 파일 읽어보기제3절 푸리에 변환으로 음성을 주파수 분해하기제4절 음성을 단시간 푸리에 변환하여 스펙트럼 생성하기제5절 로그 Mel Filter Bank 특징제6절 Mel 주파수 켑스트럼 특징제7절 특징의 평균과 표준편차 계산해보기제 4 장 음성인식 첫걸음 DP Matching제1절 음성인식에서 떼어놓을 수 없는 정렬(얼라인먼트) 문제제2절 DP Matching제3절 DP Matching 구현해보기제 5 장 GMM - HMM 기반 음성인식제1절 템플릿이 아닌, 분포와 빈도 관점제2절 정규분포와 최빈 추정법을 활용한 매개변수 추정제3절 혼합 정규분포(GMM)와 EM 알고리즘제4절 은닉 마코프 모델(HMM)제5절 GMM - HMM 구현하기제 6 장 DNN-HMM 기반 음성인식제1절 ‘분포’에서 ‘Deep Neural Network’로제2절 Deep Neural Network제3절 DNN과 HMM을 조합한 DNN - HMM 하이브리드 시스템제4절 DNN - HMM을 파이썬과 파이토치로 구현해보기제5절 HMM 기반 대어휘 연속 음성인식제 7 장 End-to-End 모델 기반 연속 음성인식제1절 하이브리드 시스템에서 Full Neural Network Model로제2절 순환 신경망(Recurrent Neural Network)제3절 Connectionist temporal classification(CTC)제4절 CTC를 파이썬과 파이토치로 구현해보기제5절 Attention encoder-decoder 모델제6절 Attention 모델을 파이썬과 파이토치로 구현해보기제7절 기타 기법과 음성인식 모델제8절 참고 문헌
▷ 저자소개 다카시마 료이치高島遼一2013년 고베 대학 대학원 시스템 정보학 연구과 박사 후기 과정 수료(공학박사)2011년 4월~2013년 3월 일본 학술 진흥회 특별 연구원 [DC2]. 2013년 4월에 ㈜히타치 제작소 연구개발 그룹에 입사하여 장비 이상 검사와 음성인식을 위한 잡음 제거 등, 음성 및 음향 신호 처리에 관한 연구 개발에 종사했다. 2016년 10월부터 2018년 9월까지 국립 연구 개발 법인 정보 통신 연구 기구에 전출하여 음성인식에 관한 연구 개발에 종사했다. 2019년 4월부터 고베 대학 도시안전 연구 센터 겸 동 대학원 시스템 정보학 연구과 준교수로 부임했고, 현재는 음성인식 기반의 음성 처리, 기계 학습 기술과 복지 분야 응용 관련 연구에 종사하고 있다.
![](https://gi.esmplus.com/goldfox216/NOTICE.jpg)