์์ง๋ ๋ฐ์ดํฐ ๋ณํ ๋ฐ ์ถ์ถ์ ์ํ ํ์ผ
python3 speaker_diarization_for_data.py --data_in_dir soundDataset/hyeongi --data_out_dir soundDataset/concatData/ --concat_filename test1
config ์ค์
data_in_dir : m4a ํ์ฅ์๋ฅผ ๊ฐ์ง ํตํ๋ฐ์ดํฐ ํ์ผ๋ค ๋๋ ํ ๋ฆฌ
data_out_dir : ํตํฉ ๋ฐ ์ถ์ถ๋ ๋ฐ์ดํฐ๊ฐ ์ ์ฅ๋ ๋๋ ํ ๋ฆฌ
concat_file_name : data_out_dir์ ์ ์ฅ๋ ์ต์ข ํ์ผ์ ์ด๋ฆ, โ(concat_file_name).wavโ ๋ก ํ์ผ์ด ์ ์ฅ๋จ
์ฌ๋ฌ๋ช ์ ๋ํ์ํฉ์์ ํ์๋ถ๋ฆฌ๋ฅผ ์ํ ํ์ผ
python3 spearker_diarization_for_conversation.py --data_in /home/hyeongikim/Desktop/์์ฑ์ธ์/soundDataset/hyeongi/01045221780_20230330122123.wav
data_in : wav ํ์ฅ์๋ฅผ ๊ฐ์ง ํ์ํ์ผ
data_out_dir : ํ์ ๋ถ๋ฆฌ๋ ํ์ผ๋ค์ด ์ ์ฅ๋ ๋๋ ํ ๋ฆฌ
๊ฐ์
์์์ ์ ์ํ ๋ชจ๋ธ์ ์ด์ฉํ์ฌ ๊ฐ์ธํ๋ ํ์ ๋ถ๋ฅ ๋ชจ๋ธ์ ๋ง๋ค ์์ ์ ๋๋ค.
๊ฐ์ธํ๋, ์์ ์ด ์ํ๋ ์ฌ๋๋ค์ ๋ชฉ์๋ฆฌ๋ฅผ ๊ตฌ๋ถํ๊ธฐ ์ํด์๋ ๊ทธ ์ฌ๋์ ๋ชฉ์๋ฆฌ๊ฐ ๋ง์ด ํ์ํ๋ฐ ์ ํฌ๋ ๊ทธ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋๋ค์ ๋ฅ๋ฌ๋์ ์ด์ฉํ์์ต๋๋ค.
๋ชจ๋ธ ์งํ์ํฉ
์ ํฌ๋ pytorch ํ๋ ์์ํฌ๋ฅผ ์ด์ฉํ pyannote-audio ์คํ์์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ์ฌ ์ํ๋ ์ฌ๋์ ๋ชฉ์๋ฆฌ๋ฅผ ์ถ์ถํ์ฌ ์์งํ๋ ๊ฒ์ ๋ชฉํ๋ก ํ์์ต๋๋ค.
๊ทธ๋์ ์งํ๋ ์ฌํญ์ ๋ํด ๋ง์๋๋ฆฌ๊ฒ ์ต๋๋ค.
์ ํฌ๋ ๋จผ์ ํด๋ํฐ์ ์๋ ํตํ๋ น์ 5๊ฐ๋ฅผ ๊ฐ์ ธ์์ ๊ฐ๊ฐ wav ํ์ฅ์๋ก ๋ฐ๊พธ์ด ํต์ผ ํด์ฃผ์์ต๋๋ค.
๊ทธ ํ ๋ชจ๋ wavํ์ผ๋ค์ ํตํฉํ์ฌ ํ๋์ ๊ธด ์์ฑํ์ผ์ ๋ง๋ค์๊ณ ์ฌ๊ธฐ์๋ ์ด 6๋ช ์ ์์ฑ์ด ๋ค์ด์์ต๋๋ค.
์ดํ pyannote audio ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ ์ด์ฉํ์ฌ speaker diarization์ ์ค์ํ์๊ณ ์ด 6๋ช ์ ์์ฑ์ผ๋ก ๊ตฌ๋ถ๋ ๊ฒฐ๊ณผ๊ฐ ๋์์ต๋๋ค. pyannote ์ค๋์ค ๋ชจ๋ธ์ lstm ์๊ณ์ด ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ์ด๋ฃจ์ด์ ธ ์์ต๋๋ค. pyannote ์ค๋์ค ๋ชจ๋ธ์ ์ฌ์ฉํ๋ฉด ํตํ ๋ น์์์ ๋ชฉ์๋ฆฌ์ feature์ ๋ฐ๋ผ ์์ฑ์ ์ถ์ถํ ์ ์์ต๋๋ค. ์ถ์ถ๋ ํด๋น ์์ฑ์ ๋น์ทํ feature ๋ผ๋ฆฌ ๋ฌถ๋ ๋ฐฉ์์ผ๋ก ๋ฐํ์๋ค์ ๊ตฌ๋ถํ์ฌ ๋ณด์ฌ์ฃผ๊ฒ ๋ฉ๋๋ค.
๊ทธ๋์ ํ๋์ ์์ฑํ์ผ์์ ์ด๋ ๊ฒ ๊ตฌ๋ถ๋์ด์ง ์คํผ์ปค๋ค์ feature ์ ๋ณด๋ฅผ ์ด์ฉํ์ฌ ์์ฑํ์ผ์์ ๊ฐ์ ์คํผ์ปค๋ก ๋ถ๋ฅ๋ ๊ตฌ๊ฐ์ ๊ทธ ์คํผ์ปค์ ์๋ฆฌ๋ง ๋ฐ๋ก ์ถ์ถํ์ฌ ๋ค์ ํ๋์ ์์ฑํ์ผ๋ค๋ก ๋ง๋ค์ด ๋ดค์ต๋๋ค.
๊ทธ ๊ฒฐ๊ณผ ๋ชฉํํ๋ ์ฌ๋์ ๊ฒฐํฉ๋์ด ์ถ์ถ๋ ์์ฑํ์ผ์ ๊ท๋ก ๋ค์ด๋ ํ ์ฌ๋์ ์๋ฆฌ๊ฐ ๋ค๋ ธ์ต๋๋ค.
๊ทธ๋ฌ๋ ์์ง ์ก์, ์๋๋ฐฉ์ ์งง์ ๋๋ต์ด ์์ฌ์์ด์ ์๋ฒฝํ์ง ์๊ธฐ๋๋ฌธ์ ์ถ์ถํ๋ ๋ฐฉ์ ๋๋ pyannote audio pipeline ๋ชจ๋ธ์ ์ถ๊ฐ ํ์ต ์ํค๋ ๋ฐฉ์์ ๊ธฐ๋ง๋๊น์ง ์ค๋นํ์ฌ ์ฑ๋ฅ์ ๋์ฌ์ผ ํ ๊ฒ ๊ฐ์ต๋๋ค.
contact : kimhun0505@naver.com