與GPT-4 Turbo相比,OpenAI最新旗艦生成式AI模型GPT-4o的價格減半,速度提升2倍,速率限制高出5倍。
除了擁有多種模態(tài)的能力,GPT-4o的推出還伴隨著一大亮點:免費(fèi)。據(jù)悉,它將在未來幾周內(nèi)分階段集成至OpenAI的各個產(chǎn)品之中。
“有史以來最好的模型”
北京時間14日凌晨,OpenAI首席技術(shù)官米拉·穆拉蒂在發(fā)布會上搬出新模型GPT-4o,并展示了公司的一系列創(chuàng)新之處。
GPT-4o在速度和價格方面都較上一代有顯著優(yōu)勢,可以處理50種不同的語言,同時擁有處理文本、圖像、音頻等多種模態(tài)的能力,可以為用戶帶來更自然、流暢的交互體驗。
本次發(fā)布會,穆拉蒂主要列舉了幾個點。
第一,新模型GPT-4o用戶不用注冊,功能全部免費(fèi)。
在此之前,ChatGPT的免費(fèi)用戶只能使用GPT-3.5。而更新后,用戶可以免費(fèi)使用GPT-4o來進(jìn)行數(shù)據(jù)分析、圖像分析、互聯(lián)網(wǎng)搜索、訪問應(yīng)用商店等操作。
當(dāng)然,免費(fèi)的前提被限制在一定的消息數(shù)量上,一旦超過規(guī)定數(shù)量,免費(fèi)用戶的模型將被切換回GPT-3.5。而付費(fèi)用戶將獲得更高的消息數(shù)量,至少是免費(fèi)用戶的5倍。
同日,OpenAI首席執(zhí)行官山姆·奧特曼發(fā)推文表示,新的GPT-4o是OpenAI“有史以來最好的模型”。
第二,ChatGPT增設(shè)了PC端桌面版本。
蘋果電腦用戶將迎來一款為macOS設(shè)計的ChatGPT桌面應(yīng)用,用戶可以通過快捷鍵“拍攝”桌面,然后將截屏同步給ChatGPT并向它提問。這種輕量化的使用體驗可以無縫融入用戶的工作流程中,減少了登錄網(wǎng)頁消耗的時間。
OpenAI還表示,Windows版本將在今年晚些時候推出。穆拉蒂表示,這也是他們第一次在易用性上做出改進(jìn)。
此外,ChatGPT還優(yōu)化了用戶界面,旨在提升用戶體驗,使交互更加流暢自然,確保用戶聚焦于與ChatGPT的高效合作,而非界面操作本身。
發(fā)布會后,業(yè)界一片嘩然。有媒體稱這預(yù)示著“智能時代的一次進(jìn)化”,未來移動設(shè)備中的互聯(lián)網(wǎng)可能會被濃縮在一個程序之中,用戶可以通過它解決一切需求:發(fā)短信、導(dǎo)航、識物、打車等。
更加健談
前幾天,奧特曼就在一檔播客中預(yù)告,OpenAI將改進(jìn)并提升ChatGPT的語音功能質(zhì)量,并表示相信語音交互是通向未來交互方式的一個重要途徑。
首先,它的響應(yīng)速度大幅提升。
GPT-4o與人類在對話中的反應(yīng)速度一致。也就是說,它已經(jīng)可以達(dá)到“實時”響應(yīng)的狀態(tài),不再像以前那樣,在得到回答前需要尷尬地等上幾秒鐘。
同時,就像與真人聊天一樣,用戶可以在GPT-4o回應(yīng)的過程中打斷它,并提出更多的要求,比如轉(zhuǎn)變話題、要求它改變語音語調(diào)甚至讓它用機(jī)器人或音樂劇的形式回答。
其次,它對情緒的捕捉顯得更敏感細(xì)膩。
發(fā)布會上,GPT-4o能夠從主持人的喘氣聲中理解“緊張”的含義,并指導(dǎo)他進(jìn)行深呼吸。當(dāng)受到稱贊后,它還會馬上接話:“別說了,你讓我臉都紅了。”
發(fā)布會上,主創(chuàng)團(tuán)隊還展示了GPT-4o各種功能的使用情況,包括實時翻譯、教學(xué)如何解方程式、識別人物表情等。目睹了GPT-4o應(yīng)答如流的過程,不少用戶評論這一新模型“顯得更加健談了,有時甚至有些輕浮”。
但GPT-4o的功能呈現(xiàn)也伴隨著一些失誤。它在現(xiàn)場把主持人的笑臉誤認(rèn)為是一個桌面,還在方程式尚未顯示的情況下嘗試解題。
消除神秘感
去年,馬斯克旗下xAI團(tuán)隊發(fā)布的首個人工智能大模型產(chǎn)品Grok,因回答用戶問題“無所忌諱”而出圈。xAI團(tuán)隊在介紹該產(chǎn)品時還說:“如果你不喜歡幽默,請不要使用它!”
其實不管是Grok,還是谷歌子公司DeepMind聯(lián)合創(chuàng)始人蘇萊曼開發(fā)的AI機(jī)器人Pi,都具有鮮明的個性化特點。
有評論稱,相較之下,GPT-4o穩(wěn)定處理文本、圖像、音頻的能力,讓OpenAI在這場人工智能爭霸賽中領(lǐng)先。
有趣的是,穆拉蒂在介紹GPT-4o時將其描述為“神奇的”。但她同時補(bǔ)充,隨著產(chǎn)品的推出,公司將“消除這種神秘感”。
有分析指出,GPT-4o實行免費(fèi)是一大關(guān)鍵,這意味著OpenAI開始加大將大模型推向市場的力度。
近日,蘋果公司被曝正與OpenAI敲定一項協(xié)議,今年將后者的部分技術(shù)引入iPhone。借此蘋果將能提供由ChatGPT支持的“聊天機(jī)器人”,作為iOS 18中人工智能功能的一部分。
雖然關(guān)于OpenAI與蘋果合作的傳聞一直存在,且都未得到證實。但眼尖的人也發(fā)現(xiàn),在OpenAI發(fā)布會的現(xiàn)場,蘋果的產(chǎn)品被廣泛使用。
與此同時,谷歌2024年I/O開發(fā)者大會將于北京時間5月15日1時舉行,正好在OpenAI最新發(fā)布會的24小時后。據(jù)悉,谷歌將在大會上展示其最新的人工智能開發(fā)成果,并發(fā)布Gemini大模型的最新動態(tài)。
去年底,谷歌宣布推出其認(rèn)為規(guī)模最大、功能最強(qiáng)大的人工智能模型Gemini,同樣在識別文本、圖像、視頻上具備強(qiáng)理解和推理能力。
當(dāng)各大科技巨頭都亮出自己的法寶爭做王者,公眾也很好奇,誰會更受市場和業(yè)界青睞。
(來源:解放日報)
