劍橋大學(xué)團(tuán)隊開發(fā)的余弦間隔虛擬對立練習(xí)(CD-VAT)技能,精密調(diào)優(yōu)的監(jiān)督模型結(jié)合數(shù)據(jù)增強(qiáng)與輔佐方針即可體現(xiàn)優(yōu)異 。前端擔(dān)任將原始音頻轉(zhuǎn)換為模型可處理的特征方法 ,根據(jù)大規(guī)劃帶標(biāo)簽鳥類聲學(xué)數(shù)據(jù)練習(xí)的 BirdNET 模型,研討團(tuán)隊選用了 mixup 的數(shù)據(jù)增強(qiáng)變體 ,
嵌入網(wǎng)絡(luò)選用 EfficientNet-B3 架構(gòu)——這是一款包括 1.2 億參數(shù)的卷積殘差網(wǎng)絡(luò)