阿布扎比技術(shù)創(chuàng)新研究所(TII)上周推出的阿聯(lián)酋首個(gè)大規(guī)模開(kāi)源、400億參數(shù)人工智能模型 Falcon 40B飆升至Hugging Face最新開(kāi)放大型語(yǔ)言模型(LLM)排行榜榜首。Hugging Face是一家尋求通過(guò)開(kāi)源和開(kāi)放科技實(shí)現(xiàn)人工智能民主化的美國(guó)公司,被公認(rèn)為全球權(quán)威的AI模型獨(dú)立驗(yàn)證者。
本新聞稿包含多媒體。此處查看新聞稿全文: https://www.businesswire.com/news/home/20230529005055/zh-CN/
在成功擊敗Meta的LLaMA(包括其65B模型)、Stability AI的StableLM和Together的 RedPajama等成熟模型后,F(xiàn)alcon 40B獲得此夢(mèng)寐以求的排名。該指數(shù)使用評(píng)估生成性語(yǔ)言模型的綜合框架Eleuther AI Language Model Evaluation Harness的四個(gè)關(guān)鍵基準(zhǔn):AI2推理挑戰(zhàn)(25-樣本)、一組小學(xué)科學(xué)問(wèn)題;對(duì)人類很容易、但對(duì)SOTA模型有難度的常識(shí)推理測(cè)試HellaSwag (10-樣本);衡量文本模型多任務(wù)準(zhǔn)確性測(cè)試MMLU(5-樣本);以及衡量語(yǔ)言模型在生成問(wèn)題答案時(shí)是否真實(shí)的測(cè)試TruthfulQA (0-樣本)。
Hugging Face的Open LLM排行榜是向AI社區(qū)開(kāi)放的客觀評(píng)估工具,可在發(fā)布LLM和聊天機(jī)器人時(shí)對(duì)其進(jìn)行跟蹤、排名和評(píng)估。
Falcon 40B采用1萬(wàn)億個(gè)令牌進(jìn)行訓(xùn)練,標(biāo)志著阿聯(lián)酋邁向AI領(lǐng)導(dǎo)地位的重大轉(zhuǎn)折點(diǎn),使該模型的權(quán)重能夠廣泛用于研究和商業(yè)應(yīng)用。新排名證實(shí)了該模型的超凡能力,讓AI更透明、更包容,并且更易于訪問(wèn),為人類帶來(lái)更大福祉。
憑借這一最新進(jìn)展,TII成功確保阿聯(lián)酋在生成性AI模型領(lǐng)域占有一席之地,并讓該國(guó)成為致力于推動(dòng)AI創(chuàng)新和協(xié)作的少數(shù)國(guó)家之一。
TII已經(jīng)著手開(kāi)發(fā)下一版本Falcon:180B AI模型。要了解有關(guān)當(dāng)前開(kāi)源Falcon 40B AI模型的更多信息,請(qǐng)?jiān)L問(wèn):FalconLLM.TII.ae。有關(guān)Falcon 40B的初始公告,請(qǐng)參閱以下鏈接:阿聯(lián)酋技術(shù)創(chuàng)新研究所推出用于研究和商業(yè)應(yīng)用的開(kāi)源“Falcon 40B”大型語(yǔ)言模型。
有關(guān)更多信息,請(qǐng)?jiān)L問(wèn)www.tii.ae
*來(lái)源:AETOSWire
免責(zé)聲明:本公告之原文版本乃官方授權(quán)版本。譯文僅供方便了解之用,煩請(qǐng)參照原文,原文版本乃唯一具法律效力之版本。
在 businesswire.com 上查看源版本新聞稿: https://www.businesswire.com/news/home/20230529005055/zh-CN/
CONTACT:
Jennifer Dewan
溝通高級(jí)總監(jiān)
jennifer.dewan@tii.ae
Falcon 40B雄踞Hugging Face Open LLM排行榜全球首位(圖片來(lái)源:AETOSWire)
Falcon 40B雄踞Hugging Face Open LLM排行榜全球首位(圖片來(lái)源:AETOSWire)