스펙트로그램 정규화 필요성 (음성처리)
·
미분류글
스펙트로그램 정규화 필요성 음성 구간(30초)이 "노래구간"인지 "광고구간"인지 분류하는 이진분류 모델을 만들고 있습니다. 지금까지는 정규화하지 않은 데이터로 만든 모델을 만들어서인지, 색다른 데이터에 해보니까 분류를 꽤 못했습니다. 당연스럽게도 적절한 정규화 방법을 선택했어야 합니다. 저는 음성 데이터로 STFT, MFCC, Mel spectrogram의 세가지 스펙트로그램 데이터를 사용하고 있습니다. 각각의 스펙트로그램은 어떤 방식으로 정규화되어야 할까요? 저는 이렇게 정규화했습니다.* 먼저, 이상치는 제거하지 않았습니다. 분류기로 선택한 모델이 음성분류에 특화되었다고 해서 어차피 이상치에 덜 민감하지 않을까 싶어서입니다. 그리고 이상치에 대한 세밀한 분석은 하지 않았기 때문에, 그냥 두고 진행했습니..