谷歌公司6日宣布推出一種名為Gemini的新人工智能模型,
聲稱該模型在一系列智力測試中的表現(xiàn)優(yōu)于OpenAI的GPT-4模型和“專家級”人類。
Gemini已針對不同的應(yīng)用創(chuàng)建了3個(gè)版本,分別是Nano、Pro和Ultra。
谷歌拒絕回答有關(guān)Pro和Ultra的規(guī)模、它們包含的參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)的規(guī)?;騺碓吹葐栴}。
其小版本Nano旨在在智能手機(jī)上運(yùn)行,實(shí)際上有兩種模型:
一種用于速度較慢的手機(jī),擁有18億個(gè)參數(shù);另一種用于功能更強(qiáng)大的手機(jī),擁有32.5億個(gè)參數(shù)。
谷歌聲稱,Gemini的中檔Pro版本擊敗了其他一些模型,但更強(qiáng)大的Ultra超過了所有現(xiàn)有AI模型的能力。
它在行業(yè)標(biāo)準(zhǔn)MMLU基準(zhǔn)上的得分為90%,而“專家級”的人類預(yù)計(jì)能達(dá)到89.8%。
這是人工智能在測試中擊敗人類,也是現(xiàn)有模型中得分高的。該測試涉及一系列棘手的問題,包括邏輯謬誤、日常道德問題、醫(yī)療問題、經(jīng)濟(jì)和地理。
在同一測試中,GPT-4的得分為87%,LLAMA-2的得分為68%,Anthropic Claude 2的得分為78.5%。Gemini在其他9項(xiàng)常見基準(zhǔn)測試中的8項(xiàng)中擊敗了所有這些模型。
去年,谷歌“深度思維”發(fā)布的AlphaCode可擊敗50%的人類開發(fā)人員,而新發(fā)布的Gemini聲稱可擊敗85%的人類編程師。
谷歌“深度思維”的艾力·柯林斯表示,Gemini“幾乎在每個(gè)領(lǐng)域都是先進(jìn)的”。