보이스체인저에 대하여

admin~2019-05-21 /취미

작년부터 “버추얼 유튜버” 붐이 일기 시작하더니 현재 버튜버의 수가 수천 명쯤 된다. 대략 5000명 정도 된다는 자료를 본 것 같은데 현재는 그보다 더 늘었을 것이다. 이미 늦었다고 생각하지만, ‘나도 한 번 버추얼 유튜버가 되어볼까’ 라고 생각하는 사람들도 있으리라. 그리고 그런 생각을 하는 사람들의 대다수는 아저씨일 것이다. 그러나 버추얼 유튜버 랭킹에 따르면, 부동의 1위인 키즈나 아이 바로 아래에 위치한 소위 ‘사천왕’이라 부르는 이들부터, 상위권에 위치한 이들의 (캐릭터 상)성별은 아저씨가 아니다.

그러면 어떻게 할까? 어차피 버추얼 세계에서 활동하는 이들인데, 성별 정도야 어떻게든 바꿀 수 있지 않겠는가? 그래서 사람들은 보이스 체인저를 꺼내 들었다. 2010년 언저리에 만들어졌던 보이스체인저 “恋声“는 세팅이 간편하고 무료로 사용할 수 있다는 점에서 많은 사랑을 받고 있다. “코이고에”라고 읽는 이 물건은 버추얼 유튜버 세계에서는 유명하다.

보이스체인저의 원리는 간단하다. 입력한 음성의 높낮이, 즉 피치(pitch)를 조절하면 된다. 그러나 그것만으로는 많이 부족하다. 피치 조절은 윈도우 무비 메이커나 골드웨이브 해적판에서도 가능한 일이다. 그러나 피치만 높인다면 여성스러운 목소리가 나오기는 커녕 추적60분, 그것이 알고싶다 등에 나오는 음성변조된 목소리가 나올 것이다.

음향학에 대해서는 지식이 깊지 않지만, 인간의 음성에는 “포먼트”(formant)라고 하는 것이 있는데, 발성을 할 때 나오는 특정한 주파수군을 말한다는 것 같다. 포먼트가 인간의 음성에 개성을 부여하기 때문에, 성문(voiceprint) 분석에도 활용된다고 한다. 인간의 음성을 스펙트럼으로 볼 때, 유독 위로 솟아있는 부분들이 3~5개쯤 있는데, 이것들을 낮은 음부터 제1, 제2, 제3포먼트 같은 식으로 칭한다. 당연히 남성의 포먼트는 여성의 포먼트보다 낮다.

그래서 보이스체인저는 피치와 포먼트, 이 둘을 적절하게 조정해서 목소리를 변조시킨다. 피치만 변조시키면 범죄자 목소리가 나오는 반면, 포먼트까지 변조시키면 그럴듯한 목소리가 나오게 된다. 그럴듯하지 않다고? 안타깝지만 그것이 보이스체인저의 한계이다. 코이고에보다 더 성능이 좋은 것을 쓴다 하더라도 마찬가지다. 어차피 현재로선 피치와 포먼트의 변조밖에는 방법이 없기 때문에, 목소리 자체를 최적화 시키는 것이 답이다. 이 글을 쓰기 오래 전부터 여러가지 프로그램을 테스트 해보았으나, 들어보면 다 비슷한 목소리가 나온다. 그리고 마음에 들지도 않으며, 음질도 열화된다. 나는 그냥 포기하기로 했다.

정말로 보이스체인저를 써먹을 생각이 있다면, 여러분이 유튜브 등지에서 “여자 목소리 내는 법” 같은 것을 검색해서 직접 연습하는 수밖엔 없다. 하지만 강좌라고 하는 것들이 전부 밥 로스식 강좌인데다, 원래부터 목소리가 좋은 사람들이 더 잘 된다는 것이다. 원래 이 세상은 재능으로 먹고 사는 것이다. 세상 살기 힘든 것이다.