所謂的ICCV就是計算機視覺的三大國際學術會議之一,基本都是兩年舉行一場,每一年的會議都會吸引的無數的愛好者以及研究人員和開發者。在本月的20號,不少集團或是知名高校都參與了此次比賽中,如網易互娛、螞蟻集團、美團、加州大學伯克利分校、復旦大學等,此次令人意外的是,網易互娛在本次的競賽中奪得冠軍。
ICCV是計算機視覺的三大國際頂級學術會議之一,共同探討計算機視覺領域的前沿研究與應用。人體重識別(Person Re-ID)技術一直是計算機視覺研究的重要領域,在人體理解、行人跟蹤、智能安防、智慧零售等領域都有著廣泛的應用。該競賽主要目的在于,不使用任何預訓練模型、在數據量很少的前提下訓練高精度的人體重識別模型,同時能夠降低人體對視覺上的依賴性,能夠更好的增加模型的演練與實用。
此次競賽僅提供一個包含436個ID人物的8569張圖片的訓練集,并且要求不能使用任何預訓練模型和額外的數據。數據量少、預訓練先驗不可用、數據存在嚴重的遮擋等問題,嚴重影響著模型的準確性和泛化能力,而這些問題也是實際業務中經常會遇到的難點。網易互娛AI Lab團隊憑借以往對業務數據的敏感性和豐富的處理經驗,針對這些難點,提出了基于主干網絡+特征聚合+雙損失的人體重識別框架,利用三元組損失和中心損失、多主干網絡集成等方法提高所提取特征的判別性。同時,通過隨機擦除、局部灰度變換、非平衡ID修正等多種方法提高模型的泛化性。另外利用訓練損失大小過濾噪聲數據、以及挖掘難樣本數據,有效地解決了原始數據中不同程度的遮擋問題。最后,采用重排序和查詢拓展等技術,進一步提高模型的性能。最終在數據有限的情況下,Mean Average Precision(mAP)達到了96.52%的高準確度,相較于比賽方所提供的67% mAP的基線模型,大幅提升近30%。
以上人體重識別競賽方案的相關技術來自網易互娛AI Lab長期的技術儲備和積累,目前,這些技術已應用于Aegis圖像語音審核引擎中,依托前沿的計算機視覺和語音信號處理技術,該引擎每天處理數千萬圖片和音頻數據,目前該技術已跟進網易旗下的游戲軟件內,在休閑娛樂的同時也要注意社交禮儀,杜絕出現色情、暴力、辱罵等現象,為游戲的正常運營保駕護航。
網易互娛AI Lab正式創辦于17年,當前此技術已跟進網易所開發的游戲軟件內,如:《陰陽師》、《哈利波特—魔法覺醒》、《荒野行動》等這些都是網易所開發出的游戲。