詩人作品中提到“酒”
一半是在追思,三成是開心
團隊不僅分析了《全宋詞》文本表面的信息,還深入挖掘宋詞所表達的意象含義,整合成意象情緒圖。
意象情緒圖選取了30個像“月”“酒”等常見的字詞,以蘇軾、李清照等24位高產詞人作為代表。通過大數據分析,得出這些意象詞匯所表示的情緒,并將情緒分為五種——“喜怒哀樂思”,然后用餅狀圖表現出各種字詞所表示的不同情緒的比例。
比如詩人在寫“酒”時,近半數想要表現的意象是懷念和思考。陸游寫“紅酥手,黃滕酒”,或者晏殊寫“一曲新詞酒一杯,去年天氣舊亭臺”,都是在追憶故人以及對人生的思考。還有近三成,是類似朱敦儒筆下“日日深杯酒滿,朝朝小圃花開”的開懷一笑。
那么,大數據技術是如何從宋詞的字里行間體察到詞人當時的情緒呢?
首先,團隊需要將基本只表示某種特定情緒的典型意象整理出來。張瑋說,為了更精確,團隊還專門請來浙大文學院博士胡秋研進行了核對。
負責數據分析和前端開發(fā)的潘如晟告訴記者,他們會用大數據分析上下文,根據典型意象去計算該字詞屬于某一情緒的概率,得出詩人最有可能想要表達的情感。
簡單來說,比如詩人張在的《題興龍寺老柏院》中寫到:“南鄰北舍牡丹開,年少尋芳日幾回。惟有君家老柏樹,春風來似不曾來。”其中,“松柏”表達的就是一種“追思”的情緒。再聯(lián)系上下文,可以得出“牡丹”和“春風”想要傳達的也是“思”。
通過可視化的數據呈現
讓唐詩宋詞真正通俗易懂
當問及這項研究的難點所在,張瑋首先提到的是圖表的選擇。為了找到最合適的數據呈現方式,許多圖表都是幾易其稿。
合適的圖表,既要美觀,又要能涵蓋所需要呈現的信息,同時還要表現得直觀,還要與讀者進行比較順暢的互動,這著實讓團隊費了不少工夫。據張瑋介紹,團隊曾嘗試用“小山峰”視圖去表現詞的抑揚頓挫,但考慮到圖像重疊影響觀感,又不利于擺放意象圖像,最后只能作罷。
“人是視覺性的,可視化形式的科普手段,可以把晦澀的古詩詞變得通俗易懂,讓科普擺脫說教或者沉悶的刻板印象,從而起到推廣傳統(tǒng)文化的作用。”浙江大學計算機科學與技術學院副院長陳為說。
這項研究定位是科普,因此選擇分析的對象也以唐詩宋詞最基本的內容為主。張瑋說:“這個產品的制作并不是為了得出某一結論,而是給人們提供一種探索唐詩宋詞的有趣工具。”因此,更多有意思的結論還有待于讀者們去發(fā)現。
