,,

谷歌發(fā)布最新人工智能模型Gemini 智力測(cè)試優(yōu)于“專家級(jí)”人類

科技日?qǐng)?bào)記者張夢(mèng)然

據(jù)《新科學(xué)家》雜志網(wǎng)站報(bào)道，谷歌公司6日宣布推出一種名為Gemini的新人工智能模型，聲稱該模型在一系列智力測(cè)試中的表現(xiàn)優(yōu)于OpenAI的GPT-4模型和“專家級(jí)”人類。

Gemini已針對(duì)不同的應(yīng)用創(chuàng)建了3個(gè)版本，分別是Nano、Pro和Ultra，它們的大小和功能均有所增加。谷歌拒絕回答有關(guān)Pro和Ultra的規(guī)模、它們包含的參數(shù)數(shù)量或訓(xùn)練數(shù)據(jù)的規(guī)模或來(lái)源等問(wèn)題。

其最小版本Nano旨在在智能手機(jī)上本地運(yùn)行，實(shí)際上有兩種模型：一種用于速度較慢的手機(jī)，擁有18億個(gè)參數(shù)，另一種用于功能更強(qiáng)大的設(shè)備，擁有32.5億個(gè)參數(shù)。據(jù)傳GPT-4包含多達(dá)1.7萬(wàn)億個(gè)參數(shù)，而Meta的LLAMA-2則包含700億個(gè)參數(shù)。

谷歌聲稱，Gemini的中檔Pro版本擊敗了其他一些模型，例如OpenAI的GPT3.5，但更強(qiáng)大的Ultra超過(guò)了所有現(xiàn)有AI模型的能力。它在行業(yè)標(biāo)準(zhǔn)MMLU基準(zhǔn)上的得分為90%，而“專家級(jí)”的人類預(yù)計(jì)能達(dá)到89.8%。

這是人工智能首次在測(cè)試中擊敗人類，也是現(xiàn)有模型中得分最高的。該測(cè)試涉及一系列棘手的問(wèn)題，主題包括邏輯謬誤、日常場(chǎng)景中的道德問(wèn)題、醫(yī)療問(wèn)題、經(jīng)濟(jì)和地理。

在同一測(cè)試中，GPT-4的得分為87%，LLAMA-2的得分為68%，Anthropic Claude 2的得分為78.5%。Gemini在其他9項(xiàng)常見(jiàn)基準(zhǔn)測(cè)試中的8項(xiàng)中擊敗了所有這些模型。

Pro模型將集成到谷歌今年3月推出的在線聊天機(jī)器人Bard中。該公司表示，名為Bard Advanced的新版本將于明年初推出，并配備更大的Gemini Ultra模型。

谷歌“深度思維”的艾力·柯林斯表示，Gemini是該公司最大、能力最強(qiáng)的模型，但也是最通用的模型，這意味著它可適應(yīng)各種任務(wù)。與當(dāng)前許多專注于文本的模型不同，Gemini接受過(guò)文本、圖像和聲音方面的訓(xùn)練，據(jù)稱能接受所有這些格式的輸入并提供輸出。

柯林斯稱，Gemini“幾乎在每個(gè)領(lǐng)域都是最先進(jìn)的”，并且仍在測(cè)試中，以確定它在不同媒體、語(yǔ)言和應(yīng)用程序中的工作能力。

在發(fā)布會(huì)上，Gemini沒(méi)有提高可供測(cè)試的版本，但谷歌展示了人工智能解決家庭作業(yè)問(wèn)題和處理實(shí)時(shí)視頻輸入的演示。據(jù)稱，它比以前的模型更擅長(zhǎng)開(kāi)發(fā)軟件。去年，“深度思維”發(fā)布了一款名為AlphaCode的人工智能代碼生成器，它可擊敗50%的人類開(kāi)發(fā)人員，新發(fā)布的Gemini聲稱可擊敗85%的人類編程師。

Gemini可處理文本、音頻和視頻。圖片來(lái)源：谷歌公司

无人码一区二区三区视频-午夜.dj高清在线观看免费8-午夜a视频-午夜dy888理论-播放个毛片看看-播放毛片

谷歌發(fā)布最新人工智能模型Gemini 智力測(cè)試優(yōu)于“專家級(jí)”人類