Audio Auto Tagging
유저의 맥락을 이해할 때 super vision을 준다!
말하지 않아도 제공할 수 있는 서비스에 대한 단서가 될 것.
ex) 사람이 싸우면 고성이 오고갈 것이다. 이 때 tag를 conflict라고 하고, 이에 걸맞은 적절한 서비스를 알아서 제공해준다.
label-weighted label-ranking average precision
information retrieval(정보 검색) part에서 많이 쓰는 measure를 사용.
검색을 통해 return되는 전체 집합을 통해 relevant한 document가 뭐가 있느냐를 통해 precision(정밀도)과 recall(재현율)을 나눠 연산. precision과 recall을 같이 볼 수 있는 metric은 F1 score / roc curve / average precision이 있다.
'AI > 음성 인식' 카테고리의 다른 글
[토크ON세미나] 딥러닝 기반 음성인식 기초 5강 - 음성인식 알고리즘 II - LAS (Listen Attend Spell) - DataLoader (0) | 2020.10.19 |
---|---|
[토크ON세미나] 딥러닝 기반 음성인식 기초 4강 - 음성인식 알고리즘 I - CTC - Data augmentation (0) | 2020.10.19 |
[토크ON세미나] 딥러닝 기반 음성인식 기초 2강 - 딥러닝 기초 II (0) | 2020.10.19 |
[토크ON세미나] 딥러닝 기반 음성인식 기초 1강 - 딥러닝 기초 (0) | 2020.10.16 |