能會(huì)有未經(jīng)審核的虛偽信息入庫(kù)進(jìn)而影響語(yǔ)料庫(kù)品質(zhì);數(shù)據(jù)處置懲罰加工階段 ,王楚文語(yǔ)料庫(kù)的標(biāo)注歷程可能無(wú)意識(shí)形態(tài)和價(jià)值不雅影響危害,王楚文同時(shí)算法也可能會(huì)有相稱水平的偏向性指導(dǎo) ,其運(yùn)算成果又會(huì)被潛移默化地注入后續(xù)數(shù)據(jù)處置懲罰;數(shù)據(jù)輸入階段,更是存在非真實(shí)世界批量主動(dòng)孕育發(fā)生的海量數(shù)據(jù)被看成新的語(yǔ)料庫(kù)