国产91在线视频观看,欧美性猛交xxxx黑人猛交,色中色综合网,婷婷资源综合,国产色片在线观看,精品国产理论在线观看不卡,欧美亚洲国产人成aaa

您現(xiàn)在的位置:?臺(tái)海網(wǎng) >> 生活頻道 >> 文化 >> 文化大話堂  >> 正文

科技守護(hù)文明:中國古籍“回家”之路

www.8037eee.com 來源: 新華社 用手持設(shè)備訪問
二維碼

  中國是世界四大文明古國之一,中國浩如煙海的文獻(xiàn)典籍記錄了歷史。然而遺憾的是,近代以來超過400萬冊(cè)中國古籍由于種種原因流散海外。

  阿里巴巴達(dá)摩院、四川大學(xué)、美國加州大學(xué)伯克利分校近日公布,他們花費(fèi)兩年多的時(shí)間,教會(huì)了AI識(shí)別中國古籍,將它們以數(shù)字化的形式接回故土,置于網(wǎng)絡(luò)公益平臺(tái),向所有人開放。

  這個(gè)項(xiàng)目的名字叫“漢典重光”,意為讓失落的珍貴古籍重放光芒。“漢典重光”以97.5%的準(zhǔn)確率,識(shí)別了20萬頁古籍,覆蓋3萬多字的古籍字典。

  現(xiàn)代科技照亮中國古籍“回家”之路

  中國古籍擁有非常龐大且復(fù)雜的知識(shí)體系,包括甲骨簡牘、敦煌遺書、宋元善本、明清精槧、拓本輿圖、少數(shù)民族文獻(xiàn)等等。所涉及的范圍也是極其廣泛,有應(yīng)對(duì)自然災(zāi)害、流行疫病、經(jīng)濟(jì)波動(dòng)、政治斗爭(zhēng)、外交危機(jī)、氣候變遷等的經(jīng)驗(yàn),有戰(zhàn)爭(zhēng)、瘟疫、地震、洪澇災(zāi)害、病蟲害等方面的經(jīng)驗(yàn)總結(jié),還有醫(yī)療、中藥、養(yǎng)生、家具、服飾、飲食文化等生活經(jīng)驗(yàn)。

  加州大學(xué)伯克利分校的東亞圖書館是全美三大東亞圖書館之一,90萬冊(cè)藏書里四成都是中文書,還有不少甲骨文和拓片。第一次到這兒的中國學(xué)者總感覺在穿越歷史的“蟲洞”,這些古籍不能運(yùn)回中國,那就用數(shù)字化手段讓古籍的內(nèi)容“回家”。

  2019年,阿里巴巴和四川大學(xué)提出“數(shù)字化回歸”設(shè)想,四川大學(xué)歷史文化學(xué)院副院長王果與中央文史研究館館員陳力牽線搭橋,溝通北美、歐洲、日韓等地藏書機(jī)構(gòu),最后獲得加州大學(xué)伯克利分校支持,達(dá)成共識(shí),將伯克利東亞圖書館的中文古籍善本逐步數(shù)字化。

  前所未有的挑戰(zhàn)

  據(jù)王果介紹,“漢典重光”的分工非常明確——采集側(cè)把紙質(zhì)書變?yōu)橛坝“?,?shù)字化生產(chǎn)側(cè)把影印版變?yōu)槲淖职?,?yīng)用側(cè)為文字版增加檢索、字典和知識(shí)圖譜等研學(xué)系統(tǒng)。東亞圖書館完成第一個(gè)環(huán)節(jié)后,四川大學(xué)將和達(dá)摩院共同完成另外兩個(gè)步驟。其中,四川大學(xué)將提供一切非計(jì)算層面的專業(yè)支持,并與達(dá)摩院的機(jī)器視覺實(shí)驗(yàn)室合作,共同開發(fā)古籍AI技術(shù)。

  首批數(shù)字化的古籍共20萬頁,包含40余種珍貴宋元善本。剛開始大家對(duì)這個(gè)項(xiàng)目很有信心,但實(shí)際一上手才知道難度有多大。

  首先是中國古籍的載體很多,紙、布、竹子、木頭、甲骨、石碑……幾乎所有能用的載體都被古人留了字,不同載體上面的字識(shí)別起來差別非常大。年代久遠(yuǎn)的紙張大多殘缺不全,上面還布滿斑點(diǎn),而且排列非常復(fù)雜。古人喜歡從上到下,從右到左,還非常喜歡在上面做批注。

  字跡的精美也成了負(fù)擔(dān)。隸書、楷書、草書、行書都漂亮,但也真難認(rèn)。大部分字還是手寫的,不但兩個(gè)人寫的同一個(gè)字不一樣,同一個(gè)人寫的同一個(gè)字也差別很大,很多字還有不同寫法。

  團(tuán)隊(duì)原有的OCR(圖像文字識(shí)別)的識(shí)別準(zhǔn)確率只有40%,這顯然是不夠的,較早涉足古籍識(shí)別的Google Books(谷歌圖書)針對(duì)的都是英文古籍,對(duì)中文也不適用。

  大量創(chuàng)造性和創(chuàng)新性的辛勤勞動(dòng)

  沒有前車可鑒,只能自己來了。“這就像教小朋友識(shí)字,確實(shí)難,但也有簡單的部分,我們就由易到難慢慢做。”王果說。

  前所未有的開拓性成果,包含著中國學(xué)者大量創(chuàng)造性和創(chuàng)新性的辛勤勞動(dòng)。

  達(dá)摩院的古籍識(shí)別算法,用AI替代人工,大幅壓縮了專家標(biāo)注工作量。在機(jī)器為主進(jìn)行識(shí)別的97.5%的內(nèi)容中,約有1%(1萬字左右)需要專家錄入;機(jī)器不能識(shí)別的余下2.5%(2.5萬字)的文字,全部交給專家做后期標(biāo)注。相比人工專家錄入,百萬字書籍的數(shù)字化工作量從1000天降低到了35天,效率比人工專家錄入方案提升近30倍。這種古籍識(shí)別算法,為中華古籍的回歸提供了另一種可行可期的思路。

  非計(jì)算機(jī)層面的工作也非常重要,四川大學(xué)專門組織了30多個(gè)歷史系學(xué)生來做標(biāo)注,這很耗神,眼力、腦力缺一不可,但這個(gè)過程沒法省略,就像學(xué)生要學(xué)習(xí),算法也要迭代,“只有數(shù)據(jù)夠多夠好,機(jī)器才能搞定”。

  這是一件非常難但非常有意義的事情。古籍識(shí)別的挑戰(zhàn)巨大,但大家還是想通過技術(shù)讓古籍活起來,用科技守護(hù)文明。

  據(jù)了解,達(dá)摩院、四川大學(xué)、美國加州大學(xué)伯克利分校、中國國家圖書館、浙江圖書館將繼續(xù)投入人力、物力,擴(kuò)大古籍?dāng)?shù)字化回歸的數(shù)量,讓所有蒙塵的古籍重?zé)ㄐ律?/p>

  達(dá)摩院院長張建鋒表示,阿里計(jì)劃將這套技術(shù)工具連同古籍?dāng)?shù)字化平臺(tái)一并捐贈(zèng),交由權(quán)威公共機(jī)構(gòu)長期運(yùn)營,最終將成為一個(gè)開放的網(wǎng)絡(luò)平臺(tái),供大眾檢索學(xué)習(xí)。

(來源:新華社 記者童芳

相關(guān)新聞
“漢典重光”首批實(shí)現(xiàn)海外20萬頁中文古籍“數(shù)字化回歸”

中國海外古籍“數(shù)字化回歸”項(xiàng)目“漢典重光”平臺(tái)18日下午在北京中國科技館正式發(fā)布,通過先進(jìn)的人工智能(AI)技術(shù),一批珍藏于美國加州大學(xué)伯克利分校的中文古籍善本,以數(shù)字化方式回歸故土,落地“漢典重光”古籍平臺(tái)。   “漢典重光”平臺(tái)稱,首批20萬頁古籍已完成數(shù)字化,并沉淀為覆蓋3萬多字的古籍字典,公眾可通過該平臺(tái)翻閱、檢索古籍,這20萬頁古籍的識(shí)別準(zhǔn)...

“護(hù)書人”讓藏文古籍“重生”【組圖】

這是一場(chǎng)持續(xù)了近九年的“搶救”,古籍專家們朝夕必爭(zhēng)只為讓幾近損毀的珍貴藏文古籍早日“重生”。當(dāng)下,這場(chǎng)和時(shí)間的“角力”仍在繼續(xù)。   2013年10月,位于西藏自治區(qū)山南市隆子縣的白嘎寺發(fā)現(xiàn)了大量珍貴的藏文古籍散葉,搶救性保護(hù)工作隨即展開。歷經(jīng)挖掘、整理、修復(fù)、數(shù)字化...

全國累計(jì)發(fā)布古籍資源達(dá)7.4萬部(件)

第二十六個(gè)世界讀書日到來之際,國家圖書館(國家古籍保護(hù)中心)、天津圖書館、南京圖書館、安徽省圖書館、湖北省圖書館、四川省圖書館、云南省圖書館、西藏自治區(qū)圖書館、杭州圖書館、河南省唐河縣圖書館等10家單位,21日在京聯(lián)合發(fā)布古籍?dāng)?shù)字資源。   本次聯(lián)合發(fā)布新增古籍資源1700余部(件),目前全國累計(jì)發(fā)布古籍資源達(dá)7.4萬部(件)。本次新增發(fā)布一批藏文和中醫(yī)藥...

四川率先完成文旅資源普查 總量超300萬處【組圖】

4月15日,四川省文化和旅游資源普查工作總結(jié)電視電話會(huì)在成都召開。會(huì)上公布了四川文化和旅游資源普查系列成果,共查明六大類文化資源305.7萬余處,旅游資源24.5萬余處,數(shù)量和質(zhì)量目前居全國第一。四川也是全國第一個(gè)完成文化和旅游資源“雙普查”的省份。   據(jù)悉,四川文化和旅...

古籍“零頁殘片”成文創(chuàng)產(chǎn)品

民國古籍零頁殘片辭句做的樹脂掛件成了文創(chuàng)產(chǎn)品。北京青年報(bào)記者近日在北京圖書訂貨會(huì)中國書店展場(chǎng)看到了這些別具一格兼具收藏價(jià)值的古籍文創(chuàng)產(chǎn)品。   中國書店成立于1952年,至今已近七十載。長期以來,中國書店對(duì)古代典籍文獻(xiàn)進(jìn)行整理、保護(hù)和再利用。于此過程中,一些古籍零頁...

子长县| 竹溪县| 樟树市| 清水河县| 黄陵县| 嘉荫县| 凉城县| 晴隆县| 清新县| 舟山市| 陵水| 荣成市| 襄汾县| 灵山县| 华蓥市| 青龙| 岑溪市| 类乌齐县| 灵寿县| 涞源县| 收藏| 静乐县| 济源市| 顺昌县| 大港区| 芒康县| 明溪县| 嘉黎县| 武平县| 丰原市| 佛学| 平陆县| 台州市| 中牟县| 五指山市| 张家川| 讷河市| 广灵县| 轮台县| 上饶市| 海宁市|