文本、中國視覺等多種模態(tài)上到達(dá)與人類智能相當(dāng)?shù)某潭?