元宵佳節(jié),也少不了猜燈謎,現(xiàn)在隨著AI技術(shù)的廣泛應(yīng)用,一些市民在猜燈謎時(shí),也會(huì)尋求AI的幫助。那么AI猜燈謎,到底準(zhǔn)不準(zhǔn)呢?一起來(lái)試試。
記者實(shí)測(cè)!正確率不盡人意
記者 王爽:元宵佳節(jié)享團(tuán)圓,今天是元宵節(jié),我身后不少市民正在猜燈謎?,F(xiàn)場(chǎng)的1800多道謎題都是原創(chuàng)的,題目確實(shí)有點(diǎn)難,可以看到不少的市民現(xiàn)在正拿著手機(jī)查找題目。
市民 沈女士:我猜不出來(lái),借助(AI)也沒有用,也猜不出來(lái),這個(gè)它答出來(lái)了。是周潤(rùn)發(fā),但是不對(duì)。
市民 王女士:AI里面有一些它不是很具體,比如說AI跳出來(lái)一個(gè),這個(gè)是出自三國(guó)演義,我們還得再繼續(xù)去了解三國(guó)演義里面的人物,這個(gè)(燈謎)很有深意,而且像套娃一樣。
記者 王爽:大家都在用AI,那么AI真的能猜出我們的燈謎嗎?我找了三張不同的謎面,一起來(lái)測(cè)測(cè)它的準(zhǔn)確性。
將提示詞設(shè)為“你是一位猜燈謎的高手”,在對(duì)話框中輸入“聚在一起過滿月,打一二字電視劇”的謎面,Deepseek、Kimi智能助手和豆包三款A(yù)I馬上就給出了正確答案——團(tuán)圓,還貼心地附上了解析。雖然這一題都答對(duì)了,但其他兩個(gè)謎面的答案卻不盡人意,不僅答案五花八門,還都沒答對(duì)。像“每到上崗更清心”的謎底是“山海情”,Kimi智能助手給出的答案“上崗”,豆包雖然解析得頭頭是道,但答案“青盲”也是錯(cuò)的,Deepseek思考了273秒,認(rèn)為是“瑯琊榜”,也錯(cuò)了。
記者 王爽:根據(jù)搜索我們發(fā)現(xiàn),同一個(gè)謎面用不同的AI軟件,可能會(huì)出現(xiàn)不同的答案,就算是同一個(gè)謎面,不同的表述,答案也有可能不同,這是為什么呢?
易聯(lián)眾智鼎(廈門)科技有限公司副總經(jīng)理 莊國(guó)強(qiáng):AI每一個(gè)大模型的訓(xùn)練數(shù)據(jù)集,其實(shí)都是有差異的,讓AI猜燈謎的話,它輸出內(nèi)容有一定的隨機(jī)性,這種隨機(jī)性跟它的模型本身有關(guān)系,然后跟我們用戶輸入的提示詞的上下文,或者內(nèi)容也有關(guān)系。
燈謎規(guī)則復(fù)雜 AI模型訓(xùn)練不足“猜不透”
專家表示,AI的語(yǔ)言模型需要經(jīng)過大規(guī)模的訓(xùn)練,如果AI學(xué)習(xí)的數(shù)據(jù)庫(kù),對(duì)燈謎及相關(guān)的文化背景了解較少,AI的分析也就不夠準(zhǔn)確。另外,燈謎不僅規(guī)則復(fù)雜,還涉及大量雙關(guān)、隱喻、典故等修辭手法,因此AI很難判斷。
廈門市職工燈謎協(xié)會(huì)副會(huì)長(zhǎng)兼秘書長(zhǎng) 繆建金:我們猜燈謎的話,很大的一個(gè)特點(diǎn),它所使用的是別解的手法,AI在分析的時(shí)候,它是按正常的語(yǔ)言習(xí)慣來(lái)分析的。比如說“方便”這個(gè)詞,我們?cè)诓煌恼Z(yǔ)境里面它有不一樣的意思,如果AI沒辦法分析到我們是用這樣的手法的話,它就肯定是猜不出來(lái)。
專家介紹,想要提高AI猜燈謎的能力,可以在樣本中加入大量謎面謎底、推理過程及解析等內(nèi)容加以訓(xùn)練,提高AI的邏輯性和理解能力。用戶在使用AI時(shí),也需要提供清晰、準(zhǔn)確的提示詞,轉(zhuǎn)化燈謎中的修辭手法,引導(dǎo)AI答題。
易聯(lián)眾智鼎(廈門)科技有限公司副總經(jīng)理 莊國(guó)強(qiáng):從技術(shù)角度來(lái)講,可以收集很多跟燈謎相關(guān)的,進(jìn)行一些相關(guān)訓(xùn)練,或者說我們對(duì)大模型進(jìn)行進(jìn)一步的微調(diào),從用戶的角度,可以從關(guān)鍵詞,還有燈謎的隱喻,謎底的特征,文化背景等等這些來(lái)入手,引導(dǎo)猜燈謎的用戶進(jìn)行思考,同時(shí)又不不至于直接暴露謎底。
來(lái)源: 特區(qū)新聞廣場(chǎng)
