国产91在线视频观看,欧美性猛交xxxx黑人猛交,色中色综合网,婷婷资源综合,国产色片在线观看,精品国产理论在线观看不卡,欧美亚洲国产人成aaa

您現(xiàn)在的位置:?臺海網(wǎng) >> 新聞中心 >> 天下 >> 國際聚焦  >> 正文

英國研究人員發(fā)現(xiàn):用AI訓(xùn)練AI,可能越練越“傻”

www.8037eee.com 來源: 新華網(wǎng) 用手持設(shè)備訪問
二維碼

對于人工智能(AI)大語言模型來說,通常給予的訓(xùn)練數(shù)據(jù)越多,模型就會越“聰明”。但英國《自然》雜志新發(fā)表的一項關(guān)于大模型的研究顯示,如果只用AI生成的數(shù)據(jù)來訓(xùn)練大模型,會使模型性能下降、越練越“傻”。

  英國牛津大學(xué)、劍橋大學(xué)等機(jī)構(gòu)研究人員發(fā)現(xiàn),如果在訓(xùn)練大模型時,只用AI生成的內(nèi)容,會導(dǎo)致大模型出現(xiàn)不可逆的缺陷,逐漸忘記真實數(shù)據(jù)的分布,這被稱為“模型崩潰”。

  研究人員首先使用大語言模型創(chuàng)建類似維基百科詞條的文本,然后利用這個內(nèi)容來訓(xùn)練該模型的新版本,并反復(fù)使用前代模型生成的文本訓(xùn)練更新的版本。隨著AI生成的信息“污染”訓(xùn)練集,模型的輸出逐漸失去意義。在模型的第九次迭代中,它完成了一篇關(guān)于英國教堂塔樓的文章,其中一段文字卻在講述野兔尾巴的多種顏色。

  研究發(fā)現(xiàn),導(dǎo)致“模型崩潰”的重要原因是,由于模型只能從其訓(xùn)練數(shù)據(jù)中采樣,一些在第一代數(shù)據(jù)中本就低頻出現(xiàn)的詞匯,在每次迭代后出現(xiàn)的頻率變得更低,而一些常見詞匯出現(xiàn)的頻率則逐漸增加。

  這種變化的結(jié)果就是,模型逐漸無法正確模擬真實世界的復(fù)雜性。隨著時間推移,這種錯誤會在迭代中被層層累積、逐漸放大,最終導(dǎo)致“模型崩潰”。這有點像生物學(xué)中“近親繁殖”會導(dǎo)致后代缺陷,如果不能保證基因庫的多樣性,最終會導(dǎo)致一個物種的崩潰。

  研究人員還發(fā)現(xiàn),由于訓(xùn)練數(shù)據(jù)被“污染”而導(dǎo)致“模型崩潰”的情況不止發(fā)生在大語言模型中,高斯混合模型、圖片生成器等也可能出現(xiàn)類似情況。

  不過,應(yīng)對“模型崩潰”并非束手無策。研究人員發(fā)現(xiàn),如果能在模型微調(diào)過程中保留10%左右的真實數(shù)據(jù),崩潰就會發(fā)生得更緩慢。還可使用水印技術(shù),將AI生成的數(shù)據(jù)與真實數(shù)據(jù)區(qū)分開來,這需要大型科技公司的協(xié)作。此外,在AI生成的文本重新進(jìn)入數(shù)據(jù)池之前,可由人類先篩選過濾。

(來源:新華網(wǎng))

相關(guān)新聞
龍巖AI盛宴:華為引爆人工智能革命,200位大咖現(xiàn)場揭秘產(chǎn)業(yè)升級秘籍!

7月22日,由龍巖市工業(yè)和信息化局、科學(xué)技術(shù)局、數(shù)據(jù)管理局指導(dǎo),華為技術(shù)有限公司主辦,龍巖市信息協(xié)會、龍巖市工業(yè)互聯(lián)網(wǎng)協(xié)會、龍巖市互聯(lián)網(wǎng)協(xié)會、龍巖市物聯(lián)網(wǎng)協(xié)會和龍巖市數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)工會協(xié)辦的人工智能技術(shù)創(chuàng)新交流活動成功舉辦。本次活動邀請了人工智能產(chǎn)業(yè)領(lǐng)域的專家學(xué)者、...

民企競逐未來產(chǎn)業(yè)新賽道

人形機(jī)器人、量子計算機(jī)、腦機(jī)接口、超大規(guī)模新型智算中心……未來產(chǎn)業(yè)是帶動產(chǎn)業(yè)升級、改變競爭格局、催生增長動能的關(guān)鍵力量,吸引了一大批民營企業(yè)布局。如何更好布局未來產(chǎn)業(yè)賽道,記者采訪了民營企業(yè)和專家學(xué)者。   爭先,搶抓發(fā)展主動權(quán)   “這根頭發(fā)絲粗細(xì)的微針上有64個通道,可以采集單個神經(jīng)元放電情況,把腦電信號轉(zhuǎn)化為數(shù)字信號并進(jìn)行解析,同時每個...

人工智能賦能新型工業(yè)化步伐提速

2024中國互聯(lián)網(wǎng)大會7月9日在京開幕。記者從會上獲悉,當(dāng)前國產(chǎn)大模型產(chǎn)品不斷涌現(xiàn),相關(guān)部門將進(jìn)一步推動人工智能賦能新型工業(yè)化,加快人工智能領(lǐng)域關(guān)鍵核心技術(shù)攻關(guān),加快培育行業(yè)大模型,面向工業(yè)領(lǐng)域大模型建設(shè)一批高質(zhì)量的工業(yè)數(shù)據(jù)庫,同時圍繞重點領(lǐng)域推動打造人工智能賦能新型工業(yè)化的應(yīng)用試驗場。   當(dāng)前,我國人工智能發(fā)展取得積極進(jìn)展。來自工信部的信息顯...

丰宁| 肥西县| 吴忠市| 平塘县| 冷水江市| 东乡族自治县| 昌宁县| 惠东县| 海盐县| 报价| 丘北县| 县级市| 胶州市| 海南省| 揭东县| 曲麻莱县| 永宁县| 城口县| 苗栗县| 枣庄市| 大化| 乌兰察布市| 灵宝市| 兴业县| 万全县| 沭阳县| 太原市| 珲春市| 额尔古纳市| 惠安县| 麻阳| 汝州市| 宜兰市| 兴城市| 佛冈县| 化德县| 高邮市| 稻城县| 五河县| 宁国市| 离岛区|