스마트폰 및 카 네비게이션 등의 마이크에 민감한 지향성을 부여함으로써
깨끗한 음성을 실현하는 디지털 신호처리 LSI 개발

2012년 10월 5일

반도체 메이커 로옴 주식회사 (본사 : 교토)는 스마트폰 및 카 네비게이션 등에 사용되는 마이크용으로, 무지향성 마이크를 2개 사용하여 초지향성을 형성함으로써 (빔 포밍 기술) 음성 품질을 향상시킬 수 있는 디지털 신호처리 LSI 「BU8332KV-M」을 개발하였습니다.
본 제품은 빔 포밍 기술을 사용하여 지향성을 형성하고, 지향축을 목적음의 방향으로 향하게 함으로써 주위 노이즈를 저감시켰습니다. 또한, 지향축 방향에 남아있는 정상 노이즈는 노이즈 서프레션 기능을 통해 저감시킬 수 있습니다. 본 방식은 노이즈 캔슬만을 사용한 방법과 달리 목적음을 더욱 강조시킬 수 있습니다. 또한, 2개의 마이크를 10mm라는 좁은 간격으로 실장이 가능하여 스마트폰을 비롯한 모든 소형기기에 탑재할 수 있습니다. 처리의 최적화를 통해 빔 포밍 기능 사용 시의 처리 지연시간을 10msec 이하로 실현하여, 다른 어플리케이션에 대한 영향을 최소한으로 억제하였습니다. 이에 따라 다양한 기기의 음성 인식률 향상 및 핸즈프리 통화 품질 개선에 기여할 수 있습니다.
생산 거점은, 전공정 로옴 주식회사 본사 (교토), 후공정 ROHM Electronics Philippines, Inc. (필리핀)에서 실시하고 있으며, 이미 8월부터 월 8만개의 생산체제로 양산을 개시하였습니다.
본 제품은 10월 2일~6일에 치바 Makuhari Messe에서 개최되는 「CEATEC JAPAN 2012」의 로옴 부스에도 전시하고 있으므로 많은 관심 부탁드립니다.

BU8332KV-M

<배경>

오늘날, 음성인식 기술의 발달로 카 네비게이션 및 스마트폰을 비롯한 모바일 기기에 음성입력 시스템이 다수 채용되고 있으며, 향후 가전제품에 대한 전개도 검토되고 있습니다. 또한, 비즈니스 모델의 글로벌화에 따라 화상 통화 및 TV 회의가 증가하여 향후 성능이 한층 높은 집음 기술이 요구될 것으로 전망하고 있습니다.
이러한 경우의 집음 기술은 목적음을 보다 명료하게 할 필요가 있습니다. 기존에 지향성을 부여하기 위해 사용되던 마이크는 물리적인 구조 (통형 구조)에 의해 지향성을 생성하였으나, 지향성의 감도를 높이기 위해서는 마이크 사이즈가 커지거나, 물리적인 변경 없이 지향성의 제어가 불가능하다는 점 등이 문제가 되었습니다.

<신제품의 상세 내용>

로옴은 2개의 무지향성 마이크를 사용한 빔 포밍 기술을 통해 특정 방향의 음성을 명료화하는 디지털 신호처리 LSI를 실현하였습니다.
기존에도 2개의 마이크를 사용하여 지향성을 형성하는 기술이 있었지만, 기존 방법은 지향성을 높이기 위해 마이크간 거리를 넓힐 필요가 있어, 소형 포터블 기기에는 탑재가 적합하지 않았습니다. 또한, 디지털 신호처리에 의한 지연시간 및 음질의 열화도 과제였습니다.
이러한 상황에서 로옴은 ㈜ DiMAGIC Corporation의 지향성 제어 기술을 사용하여 주위 노이즈의 대폭적인 저감에 성공하였습니다. 빔 포밍 기술을 사용하여 지향성을 형성하고, 지향축을 목적음 방향으로 향하게함으로써 목적음 이외의 음을 저감시킴니다. 또한 지향축 방향에 남아있는 정상 노이즈는 노이즈 서프레션 기능을 통해 저감시킴으로써 목적음이 명료해집니다. 그 결과, 배면 방향의 감쇄량을 기존 마이크 대비 30dB 이상 개선할 수 있습니다. 이러한 성능을 불과 10mm의 마이크간 거리로 실현하여, 소형 포터블 기기에 탑재가 가능합니다. 또한, 처리의 최적화를 통해 빔 포밍 기능 사용 시의 처리 지연시간을 10msec 이하로 실현하여 다른 어플리케이션에 대한 영향도 최소한으로 억제하였습니다. 지향성의 형상 및 감도의 전환이 가능하므로 용도에 따라 최적의 지향성을 실현할 수 있습니다.

<특징>

1.초지향성으로 목적음을 깨끗하게 집음

독자적인 신호 처리 기술로 기존 마이크에 비해 초지향성을 실현하여 음성을 명료화시킵니다. 목적음 방향 (0°)에 대해 배면 방향 (180°)의 감쇄량이 기존 마이크에 비해 30dB 이상 대폭 개선되었습니다.
또한, 마이크간 거리는 10mm로 실장 가능합니다.
<BU8332KV-M과 기존 마이크의 지향성 특성 비교>
BU8332KV-Mと従来マイクの指向性特性比較

*상기 그림은 지향성을 시각적으로 표현한 그래프 (Polar Pattern) 입니다. 원은 중심으로부터의 방향을 나타내며, 적색 선은 각 방향의 gain을 나타냅니다. 0° 방향이 목적음 방향입니다.

2.음성 인식률 대폭 향상

음성 열화 없이 주위 노이즈를 저감시킬 수 있습니다. 따라서, 주위 노이즈가 존재하는 환경에서의 음성 인식률이 향상됩니다.
로옴 측정 결과, 주위 노이즈 레벨 55dBSPL의 환경하에서 음성 인식 정밀도는 5%에서 90%로 향상되었습니다.
<BU8332KV-M 사용 시의 음성 인식 정밀도>

미사용 시에는 노이즈 레벨 55dBSPL에서 인식률이 급격히 저하되지만, 사용 시에는
노이즈 레벨 65dBSPL에서도 45%의 인식률을 실현할 수 있습니다.

BU8332KV-Mを使用した時の音声認識精度

3.지향성 패턴 선택 가능

지향성 패턴을 4개의 형상으로 전환할 수 있습니다.
또한, 지향성의 방향을 180° 회전할 수 있으며, 지향성의 감도를 조정할 수 있습니다.
이러한 제어는 마이크 배치를 변경하지 않고도 레지스터 설정만으로 가능합니다.
① 무지향성 : 모든 방향의 음에 대응합니다.
② 단일 지향성 : 정면 방향의 음에 대응하며, 배면 (뒷면) 방향의 음을 저감시킵니다.
③ 초지향성 : 단일 지향성보다 측면 방향의 음을 저감시킵니다.
④ 양지향성 : 초지향성보다 더 측면 방향의 음을 저감시킵니다.

4.기타 기능

・빔 포밍 기능 사용 시의 처리 지연시간 10msec 이하
・지향축 방향에 남아있는 정상 노이즈를 저감시키는 노이즈 서프레션 기능 탑재 ・샘플링 주파수 16kHz
・아날로그 출력 (LINEOUT) 또는 디지털 출력 (PCM 인터페이스)
・3.3V의 1계통으로 동작 가능 (코어 전원용 레귤레이터 내장)
・마이크용 바이어스, 프리앰프 회로 내장
・2선 호스트 인터페이스
・stand-alone 동작 가능 (EEPROM용 SPI 인터페이스 내장)

<용어 설명>
・빔 포밍
여러개의 마이크의 위상차를 이용하여, 목적 방향 이외의 음을 저감시키는 기술.
주위 노이즈를 저감시켜 목적음의 명료도를 향상시킵니다.


・제품 정보 BU8332KV-M

본 제품에 대한 문의