打開瀏覽器,登錄“智慧古籍平臺”,可在線萬篇古籍,除了著述、篇目詳情等基本內(nèi)容外,還有著者小傳、人物行跡、世系圖及社會網(wǎng)絡(luò)關(guān)系圖等延伸信息,全面立體地展現(xiàn)古籍內(nèi)容,滿足讀者一站式查詢、閱讀與研究需求。
這是由浙江大學(xué)徐永明教授及其團(tuán)隊打造的人機交互式智慧數(shù)據(jù)共享平臺,將中國古典文獻(xiàn)和研究成果圖譜化、智能化,打造了集瀏覽、查詢、研究、欣賞于一體的古籍大數(shù)據(jù)平臺,通過科技賦能,讓古籍知識變得“觸手可及”。
在浙江大學(xué)文學(xué)院,記者見到技術(shù)團(tuán)隊負(fù)責(zé)人徐永明時,他正專心致志地坐在電腦前,忙著審核已完成校對的古籍篇目并準(zhǔn)備上線發(fā)布……
“目前平臺已上線萬字?!闭f罷,徐永明招呼記者上手體驗。在“智慧古籍平臺”,古籍內(nèi)容按“著述導(dǎo)覽”“篇目導(dǎo)覽”“著者導(dǎo)覽”等板塊分類呈現(xiàn),界面設(shè)計古典雅致、功能齊全,令人眼前一亮……
“平臺引入知識圖譜理念,綜合運用大數(shù)據(jù)進(jìn)行計量統(tǒng)計、定位查詢、聚類查詢等,讓讀者輕松便利地獲取古籍知識?!毙煊烂鬟呇菔具吔榻B,點擊“篇目導(dǎo)覽”按鈕,即可進(jìn)入文本閱讀界面,“文本閱讀是本平臺的特色功能,為提高文本的真實性和準(zhǔn)確性,平臺提供了古籍圖片與古籍?dāng)?shù)字化文本一一對應(yīng)的功能?!?
不僅如此,“智慧古籍平臺”還有許多其他亮點:為降低閱讀時查閱相關(guān)資料的頻率,平臺提供了關(guān)鍵字詞釋義功能,文本中重要信息及疑難詞按照人名、地名、職官、時間、典故等不同類型以不同顏色顯示,點擊即可查看釋義;借助地理信息系統(tǒng)軟件,結(jié)合在線地理信息系統(tǒng),古籍中留存的地理信息實現(xiàn)了可視化,點擊著者詳情,即可查看所鏈接的人物行跡圖……
而提及地理信息可視化,不得不提徐永明團(tuán)隊的另一個平臺——“學(xué)術(shù)地圖發(fā)布平臺”,其中匯集了李白、蘇軾等500多位中華歷史名人的行跡圖、《全元詩》作者分布圖等各類學(xué)術(shù)地圖……“其實這個平臺比‘智慧古籍平臺’還要早一些,是中國首個綜合性學(xué)術(shù)地圖平臺?!彼榻B,平臺迄今已發(fā)布1600余幅地圖,共有70余個國家100萬讀者的訪問量。
綜合利用這兩個平臺,徐永明團(tuán)隊將文史數(shù)據(jù)與數(shù)字地圖相結(jié)合,極大地增強閱讀體驗,旨在豐富讀者對古籍知識的綜合認(rèn)知。
在徐永明看來,完善豐富的前端體驗少不了強大的后臺技術(shù)支持,“比如,要將古籍圖像中的文字轉(zhuǎn)換成文本格式,就需要OCR識別,即‘光學(xué)字符識別’技術(shù),平臺現(xiàn)用的OCR技術(shù)能較為精確地識別版刻古籍,準(zhǔn)確率達(dá)到90%以上?!彼蛴浾呖破掌饋恚偃?,借助計算機學(xué)習(xí)技術(shù),平臺采用的“機器古籍標(biāo)點技術(shù)”,可根據(jù)特定算法為古籍文本自動標(biāo)注現(xiàn)代中文標(biāo)點符號,準(zhǔn)確率也穩(wěn)定在90%以上。
“但正所謂‘隔行如隔山’,僅靠我一人無法建起這個平臺,需要許多相關(guān)專業(yè)人員的支持。”他介紹,作為項目負(fù)責(zé)人,從2020年項目立項以來,他找來浙江大學(xué)計算機科學(xué)與技術(shù)學(xué)院、地球科學(xué)學(xué)院和校圖書館等相關(guān)學(xué)院和部門老師,組建起一支20余人的技術(shù)團(tuán)隊。
這期間,曾遇到不少難點,“比如,前期需要不斷跟第三方公司磨合,解決前、后臺頁面設(shè)計、框架布局、功能模塊等問題;到了后期,我們更換了合作方,又得重新磨合,主要解決地域?qū)в[、編輯器、職官圖譜、智能OCR服務(wù)引入等相關(guān)問題?!毙煊烂髡f。
緣何要研發(fā)這樣的古籍知識大數(shù)據(jù)平臺?徐永明坦言,這跟自己早年的經(jīng)歷有關(guān)。上世紀(jì)90年代末期,他曾在浙江圖書館古籍部工作過一段時間,目睹了讀者來看古籍善本有多不方便,比如只能抄錄,復(fù)制的話也要經(jīng)過許可,且費用很貴。
在他讀博期間,國內(nèi)還沒有出全文檢索的《四庫全書》電子產(chǎn)品。那時,他寫作博士論文材料,都是靠自己翻閱原書,一條一條抄錄。這些經(jīng)歷讓徐永明深深地感到,紙質(zhì)文獻(xiàn)難以保存?zhèn)鞑?,古籍信息存在“孤島化”“碎片化”現(xiàn)象,“如今,數(shù)字技術(shù)發(fā)展日新月異,我們便琢磨著能否將大數(shù)據(jù)技術(shù)與古籍進(jìn)行深度融合,為傳承中華優(yōu)秀傳統(tǒng)文化探索新的可能?!?
在“學(xué)術(shù)地圖發(fā)布平臺”開發(fā)階段,面對界面不美觀,操作不方便,功能有限,經(jīng)常出現(xiàn)程序故障等問題,文科背景出身的徐永明開始了他的自學(xué)Python(計算機編程語言)開發(fā)之路。在他的朋友圈,他時常發(fā)布學(xué)習(xí)編程的動態(tài)、用Python完成的各種小成果、自己編寫的代碼,等等。
面對海量數(shù)據(jù),徐永明善于利用團(tuán)隊的力量,“過去整理古籍,主要是個體作業(yè),以書為單位,不能修改、不可關(guān)聯(lián),效率不高?!彼f,“現(xiàn)在,我們將古籍整理任務(wù)通過勤工儉學(xué)、暑期社會實踐等形式,遴選相關(guān)專業(yè)學(xué)生、專家,在線上線下一同參與,努力發(fā)揮集體的智慧?!?
浙江大學(xué)中國古代文學(xué)專業(yè)的博士生郝亞潔認(rèn)領(lǐng)了新任務(wù):對《徐文長文集》《吟香室詩草》等古籍的OCR校對結(jié)果進(jìn)行二次審核。
“根據(jù)平臺不同時期的需求,我的工作內(nèi)容側(cè)重點都有不同。”郝亞潔介紹,比如,在平臺建設(shè)初期,同學(xué)們主要負(fù)責(zé)數(shù)據(jù)上傳整理,“數(shù)據(jù)一般以一部文集為單位,需要制作目錄文件把文集的文字內(nèi)容按照篇目和影像一一對應(yīng)。”后期,郝亞潔則負(fù)責(zé)OCR識別和機器標(biāo)點校對后的人工審核等工作。
全程參與“智慧古籍平臺”建設(shè),讓郝亞潔受益匪淺……在她眼中,徐永明是治學(xué)嚴(yán)謹(jǐn)?shù)膶?dǎo)師,自己從平臺維護(hù)中收獲良多?!氨热?,之前學(xué)過的Python計算機編程語言,就苦于沒機會實踐;現(xiàn)在的校對環(huán)節(jié)中,用Python代碼檢查不僅幫了我大忙,更體會到了什么叫‘活學(xué)活用’。”
平臺運行至今獲得各方好評,但徐永明坦言,“智慧古籍平臺”建設(shè)任重道遠(yuǎn),想要把浩如煙海的中華古籍資源利用起來,還有很長的路要走。“我們的初衷很簡單,就是想為讀者掃除古代文獻(xiàn)閱讀障礙,推動古籍閱讀普及化,激活學(xué)者的研究成果,突破學(xué)術(shù)壁壘,將前沿的學(xué)術(shù)研究成果轉(zhuǎn)化為社會大眾共享的文化資源,同時改變‘?dāng)?shù)據(jù)在中國,數(shù)據(jù)庫在國外’的現(xiàn)象?!?
面向未來,徐永明團(tuán)隊定下了新目標(biāo):利用“智慧古籍平臺”進(jìn)一步推進(jìn)古籍?dāng)?shù)據(jù)資源的整合和開放共享,用智慧化手段為中國古代典籍資源爭取“主動權(quán)”,讓古籍資源從“活下來”真正轉(zhuǎn)變?yōu)椤盎钇饋怼保。ū緢笥浾?江 南 竇瀚洋)
獻(xiàn)血前要空腹嗎? 獻(xiàn)血后會身體虛弱嗎?這9個獻(xiàn)血知識要了解! 世界獻(xiàn)血者日
學(xué)習(xí)貫徹習(xí)新時代中國特色社會主義思想主題教育開展以來,航空工業(yè)沈陽飛機工業(yè)(集團(tuán))有限公司黨委認(rèn)真貫徹落實黨中央和航空工業(yè)集團(tuán)黨組工作部署,堅持學(xué)思用貫通、知信行統(tǒng)一,做到學(xué)深悟透內(nèi)化于心、用好做實外化于行,把主題教育成果轉(zhuǎn)化為推動航空科技自立自強的不竭動力,闊步邁進(jìn)新時代航空工業(yè)高質(zhì)量發(fā)展的新征程。
記者從6月29日舉行的上海市政府新聞發(fā)布會上了解到,2023世界人工智能大會將于7月6日至8日在上海世博中心及世博展覽館舉辦,并在浦東張江、徐匯西岸設(shè)分會場,同步在閔行等產(chǎn)業(yè)集聚區(qū)開展同期活動。
工業(yè)和信息化部29日發(fā)布通告,自2023年7月1日起,正式啟用新型進(jìn)網(wǎng)許可標(biāo)志,逐步替代原紙質(zhì)標(biāo)志。新型進(jìn)網(wǎng)許可標(biāo)志由許可標(biāo)識、設(shè)備型號、數(shù)字編碼等要素組成。
短視頻以沉浸式的體驗讓孩子們輕松且快捷地獲得各種熱詞、熱梗和表情包?!袄狭薄袄翔F”“666”等逐漸進(jìn)入到他們的話語體系,甚至成為特定圈層的身份標(biāo)識。
生態(tài)環(huán)境部新聞發(fā)言人劉友賓29日介紹,我國將開展長江流域水生態(tài)考核試點工作,確定50個考核水體,分區(qū)分類開展水生態(tài)監(jiān)測評價,2025年將開展第一次考核。
在第十四屆夏季達(dá)沃斯論壇上,關(guān)于綠色經(jīng)濟(jì)、數(shù)字經(jīng)濟(jì)等新產(chǎn)業(yè)的討論不絕于耳,相關(guān)產(chǎn)業(yè)人才培養(yǎng)問題也引起關(guān)注。
6月28日,福建平潭外海海域晴空萬里,現(xiàn)場施工人員卻懸著一顆心,眼睛死死盯著對接中的風(fēng)機葉片。
制造業(yè)是立國之本、強國之基,是一個國家綜合實力和國際競爭力的核心體現(xiàn)。
截至2023年4月底,崖州灣科技城累計注冊南繁產(chǎn)業(yè)企業(yè)1195家,不少“國字號”及省市科研院所也紛紛落地,產(chǎn)學(xué)研聚集效應(yīng)不斷擴大。
放眼全國,在關(guān)鍵農(nóng)時大力開展人工增雨和防雹作業(yè),人工影響天氣成為糧農(nóng)果農(nóng)煙農(nóng)心目中致富脫貧的“定心丸”。
黑色素瘤多發(fā)生于皮膚,也會發(fā)生在黏膜、眼葡萄膜、軟腦膜等不同部位或組織。
三亞研究院所在的三亞市崖州區(qū)是海南冬季溫度最高的區(qū)域之一,年平均氣溫22攝氏度至31攝氏度,冬季降雨量小,光照充足,非常適合農(nóng)作物冬季加代繁育。
用雨燕衛(wèi)星紫外光學(xué)望遠(yuǎn)鏡發(fā)現(xiàn)了迄今為止人類探測到的最劇烈光學(xué)紫外耀發(fā)。
苔蘚屬于可以進(jìn)行光合作用的植物,地衣并不是嚴(yán)格意義上的植物,而是一類由共生藻和共生真菌結(jié)合而成的生物共生體
基因編輯技術(shù)是面向未來的關(guān)鍵技術(shù)之一,能否擁有自主知識產(chǎn)權(quán)的基因編輯技術(shù),是這一領(lǐng)域國際競爭的核心
生態(tài)環(huán)境部環(huán)境與經(jīng)濟(jì)政策研究中心26日發(fā)布《公民生態(tài)環(huán)境行為調(diào)查報告(2022)》(以下簡稱《報告》)?!秷蟾妗凤@示,我國公眾普遍具備較強環(huán)境行為意愿,但在不同領(lǐng)域?qū)嶋H行為表現(xiàn)存在差異。
對于考生和家長來說,“學(xué)什么”“怎么報”是一大考驗,特別是面對新專業(yè)、跨學(xué)科,免不了懵懂、無措。
鄉(xiāng)村振興是產(chǎn)業(yè)、人才、文化、生態(tài)、組織振興“五位一體”的系統(tǒng)工程。全面推進(jìn)鄉(xiāng)村振興,人才振興是關(guān)鍵。