莫伯峰教授正在辦公。本報(bào)記者 于晴 攝
□本報(bào)記者 馬愿 河南日?qǐng)?bào)社全媒體記者 李向華
10月25日上午,記者走進(jìn)首都師范大學(xué)甲骨文研究中心莫伯峰教授的辦公室。不到20平方米的房間,一側(cè)是滿(mǎn)墻書(shū)架,除了包括甲骨文、金文等在內(nèi)的古文字類(lèi)圖書(shū)外,其中一個(gè)書(shū)架上是《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》《信息檢索與深度學(xué)習(xí)》《人工智能:人臉識(shí)別與搜索》等涉及人工智能技術(shù)的諸多書(shū)籍。
莫伯峰的研究主要圍繞“甲骨刻辭字體分類(lèi)”展開(kāi),即根據(jù)字體把甲骨文細(xì)分為幾十個(gè)類(lèi)型,這是他在甲骨學(xué)領(lǐng)域的專(zhuān)長(zhǎng)。目前他的研究又增加了“人工智能在古文字研究中的應(yīng)用”類(lèi)的題目,這是他近年來(lái)重點(diǎn)關(guān)注的領(lǐng)域。熟悉他的人認(rèn)為他是甲骨文研究領(lǐng)域最懂AI(人工智能)的,他則幽默地說(shuō):“其實(shí)我是甲骨文研究領(lǐng)域踢足球最好的,只是現(xiàn)在沒(méi)那么多時(shí)間踢球了。”
用AI解放生產(chǎn)力
“識(shí)別是當(dāng)下甲骨文研究的基礎(chǔ)問(wèn)題。”莫伯峰介紹,全球約有16萬(wàn)片甲骨,按每一片有10個(gè)字計(jì)算,就是160萬(wàn)字,目前還有三分之二的甲骨文字未破解。
“甲骨綴合是將本屬同版的甲骨碎片,依據(jù)形態(tài)、卜辭等信息拼接在一起,盡可能恢復(fù)其本來(lái)面貌。”莫伯峰說(shuō),以前都是由甲骨學(xué)家手工綴合,全憑個(gè)人經(jīng)驗(yàn)和腦力記憶,耗費(fèi)大量時(shí)間和精力。
2019年,莫伯峰提出用計(jì)算機(jī)綴合甲骨作為“甲機(jī)會(huì)”的實(shí)驗(yàn)項(xiàng)目,2020年與河南大學(xué)聯(lián)合研發(fā)軟件“綴多多”,在甲骨學(xué)歷史上首次實(shí)現(xiàn)了人工智能批量綴合甲骨。
莫伯峰表示,AI能夠與專(zhuān)家綴合的方法互補(bǔ),這是這項(xiàng)工作最有價(jià)值之處。專(zhuān)家主要通過(guò)甲骨上文字內(nèi)容進(jìn)行綴合,而AI可根據(jù)甲骨斷裂處特征性邊緣形狀進(jìn)行綴合,這是專(zhuān)家很難實(shí)現(xiàn)的。未來(lái),隨著AI的發(fā)展,可以實(shí)現(xiàn)結(jié)合文字內(nèi)容來(lái)進(jìn)一步提升智能化綴合的水平和效率。
甲骨“拓本”圖像是研究甲骨文的基礎(chǔ)。從甲骨文首次發(fā)現(xiàn)至今,因?yàn)槭詹?、流轉(zhuǎn),大部分甲骨都留下了多個(gè)版本的拓本。這些拓本被稱(chēng)為重片,梳理重片的工作被稱(chēng)為校重。甲骨的拓本數(shù)量遠(yuǎn)遠(yuǎn)大于甲骨的數(shù)量,需要對(duì)這些重片進(jìn)行系統(tǒng)整理,才能理清這筆“糊涂賬”。因此,校重是甲骨學(xué)一項(xiàng)重要的基礎(chǔ)性整理工作,耗費(fèi)了甲骨學(xué)者大量時(shí)間。
莫伯峰教授團(tuán)隊(duì)與微軟亞洲研究院合作開(kāi)發(fā)了基于自監(jiān)督學(xué)習(xí)的甲骨文校重助手Diviner,系統(tǒng)比對(duì)了18萬(wàn)幅拓本,輔助甲骨學(xué)家在上百個(gè)甲骨文數(shù)據(jù)庫(kù)中發(fā)現(xiàn)了大量甲骨重片,而且經(jīng)過(guò)初步整理,已經(jīng)發(fā)現(xiàn)超過(guò)300組未被前人發(fā)現(xiàn)的校重新成果。該軟件可以讓專(zhuān)家徹底擺脫這項(xiàng)繁重的整理工作。
校重也體現(xiàn)了AI與專(zhuān)家的方法互補(bǔ)。甲骨學(xué)者校重,主要基于拓本上的文字內(nèi)容,準(zhǔn)確性非常高。但這種方法需要憑借對(duì)文字內(nèi)容的存儲(chǔ)和記憶,效率很低。而且由于種種原因,在甲骨拓本中的文字并不都很清晰,這也限制了這種方法的應(yīng)用范圍。AI校重模型不受文字信息的限制,也不受圖像數(shù)量的限制,直接運(yùn)用圖像比對(duì)就可以迅速完成圖像校重,雖然沒(méi)有甲骨學(xué)家準(zhǔn)確性那樣高,但勝在效率非常高。AI的結(jié)果再經(jīng)過(guò)甲骨學(xué)者的審核,就能實(shí)現(xiàn)又快又準(zhǔn)了。
跨學(xué)科提升新質(zhì)生產(chǎn)力
“集圖像和語(yǔ)言于一體的多模態(tài)模型,將成為AI發(fā)展的主要方向。”莫伯峰認(rèn)為,AI和甲骨文的結(jié)合仍處于初級(jí)階段。隨著AI技術(shù)的不斷進(jìn)步,甲骨文研究將會(huì)迎來(lái)更多可能。
甲骨文本身具有多模態(tài)屬性,既是一種圖像,又是一種語(yǔ)料,人工智能在甲骨文研究中的應(yīng)用,未來(lái)將匯集在統(tǒng)一的多模態(tài)大模型中。莫伯峰判斷,未來(lái)的多模態(tài)大模型可以同時(shí)處理圖像和語(yǔ)言。
AI以后將會(huì)成為“學(xué)術(shù)小助手”,對(duì)甲骨文破譯等研究發(fā)揮重要的輔助作用。
另外,AI對(duì)大數(shù)據(jù)的處理能力遠(yuǎn)超人類(lèi),甲骨文研究可以借助AI的數(shù)據(jù)挖掘技術(shù),更好理解和掌握甲骨文的發(fā)展演變規(guī)律、結(jié)構(gòu)和特征等方面的重要信息,從而推動(dòng)甲骨文研究不斷深入和發(fā)展。
“研究者要了解AI的基礎(chǔ)運(yùn)行規(guī)律和技術(shù)發(fā)展?fàn)顩r,我們和AI是共同成長(zhǎng)的關(guān)系。”莫伯峰說(shuō),“學(xué)術(shù)的研究往往同國(guó)家的經(jīng)濟(jì)、科技發(fā)展水平密切相關(guān),國(guó)內(nèi)AI的蓬勃發(fā)展,為我們提供了極大研究便利。”
“隨著AI技術(shù)與古文字研究結(jié)合逐步深入,學(xué)術(shù)界的研究方法和思維模式將隨之轉(zhuǎn)變。AI的運(yùn)用使得人文學(xué)科不再是孤立的學(xué)術(shù)小圈,而是一個(gè)與技術(shù)深度融合的開(kāi)放平臺(tái)。”莫伯峰認(rèn)為,甲骨學(xué)一直有著多學(xué)科協(xié)同的傳統(tǒng),現(xiàn)在更應(yīng)該被看作是一門(mén)新型交叉學(xué)科。相信隨著AI技術(shù)的不斷進(jìn)步,會(huì)有更多的跨學(xué)科研究參與,共同提升甲骨文研究的新質(zhì)生產(chǎn)力,助力更多成果的產(chǎn)生。
免責(zé)聲明:凡本網(wǎng)注明“來(lái)源:XXX(非駐馬店廣視網(wǎng)、駐馬店融媒、駐馬店網(wǎng)絡(luò)問(wèn)政、掌上駐馬店、駐馬店頭條、駐馬店廣播電視臺(tái))”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),作品版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。凡是本網(wǎng)原創(chuàng)的作品,拒絕任何不保留版權(quán)的轉(zhuǎn)載,如需轉(zhuǎn)載請(qǐng)標(biāo)注來(lái)源并添加本文鏈接:http://www.howtobuymyhome.com/showinfo-33-337742-0.html,否則承擔(dān)相應(yīng)法律后果。