3 月 27 日與波士頓的領(lǐng)導(dǎo)人一起度過一個獨(dú)特的社交之夜、見解和對話。 在此請求邀請。
今天,由 DeepMind 聯(lián)合創(chuàng)始人 Mustafa Suleyman 和 LinkedIn 聯(lián)合創(chuàng)始人 Reid Hoffman 創(chuàng)立的位于帕洛阿爾托的初創(chuàng)公司 Inflection AI 宣布了一個名為 Inflection-2.5 的新基礎(chǔ)模型。
基于迄今為止所做的工作,Inflection-2.5 的性能顯著優(yōu)于該公司最初的 Inflection-1,并且?guī)缀跖c OpenAI 的 GPT-4 模型相匹配,尤其是在 STEM 科目中。
它現(xiàn)在為該公司的 Pi 助手提供支持,該助手旨在與 ChatGPT 和 Gemini 競爭,并且可以通過移動和網(wǎng)絡(luò)進(jìn)行測試。
此舉標(biāo)志著快速發(fā)展的人工智能領(lǐng)域為挑戰(zhàn) OpenAI 的主導(dǎo)地位所做的最新努力,OpenAI 繼續(xù)闡明其為人類開發(fā)人工智能的方法。
就在最近,Anthropic 發(fā)布了 Claude 3 Opus,成為第一個擊敗 GPT-4 的模型。
表現(xiàn)更好,但仍落后于 GPT-4
自成立以來,Inflection AI 一直在構(gòu)建一個“有同理心、有用且安全”的人工智能,其行為比其他模型(包括 GPT 系列)更加個性化和口語化。
該公司利用獨(dú)特的同理心微調(diào),賦予 Pi 背后的模型標(biāo)志性的個性和卓越的 EQ(情商)。
VB事件
AI 影響力之旅 – 波士頓
我們對 3 月 27 日在波士頓舉行的 AI Impact Tour 的下一站感到興奮。
這項僅限受邀人士參加的獨(dú)家活動與 Microsoft 合作,將討論 2024 年及以后的數(shù)據(jù)完整性最佳實踐。
空間有限,請立即申請邀請。
請求邀請
隨著升級版 Inflection 2.5 的推出,這家初創(chuàng)公司于 2023 年 6 月籌集了 13 億美元資金,正在加強(qiáng) IQ 方面的開發(fā),涵蓋物理和數(shù)學(xué)等領(lǐng)域。
在今天發(fā)布的一篇博客文章中,該公司表示,在 Inflection 2.5 的支持下,用戶與 Pi 交談可以討論一系列主題,從討論愛好到編碼、檢查生物學(xué)論文的答案或起草商業(yè)計劃。
數(shù)百萬用戶,數(shù)十億條消息。
來認(rèn)識一下全新升級的 Pi,它將有用的 IQ 與友好的 EQ 融為一體。
現(xiàn)在由我們世界一流的基礎(chǔ)模型提供支持:Inflection-2.5 https://t.co/bws0K9G7Hl
— 穆斯塔法·蘇萊曼 (@mustafasuleyman) 2024 年 3 月 7 日
就基準(zhǔn)測試性能而言,升級后的模型比 Inflection 1 全面改進(jìn),并接近 GPT-4,盡管仍然落后。
例如,在 MMLU 基準(zhǔn)測試中,衡量從高中到專業(yè)難度的各種任務(wù)的表現(xiàn),Inflection-2.5 得分為 85.5,僅落后于 GPT-4 的 87.3。
同樣,在 STEM 考試中,該模型的表現(xiàn)幾乎與 OpenAI 模型一樣,在匈牙利數(shù)學(xué)考試中得分為 63 分(GPT4 為 68 分),在物理 GRE 考試中得分為 85%,而 GPT-4 為 97%。
在由 8.5K 個高質(zhì)量小學(xué)數(shù)學(xué)問題組成的 GSM8K 基準(zhǔn)測試中,Inflection 模型得分為 86.3,而 GPT-4 的得分為 92。在旨在評估代碼生成能力的 0-shot HumanEval 中,它得分為 73.8,而 GPT4 的得分為 79.3。
通過網(wǎng)絡(luò)搜索進(jìn)行有效訓(xùn)練的模型
雖然性能并不比 GPT 4 更好,但 Inflection AI 確實指出,這種“94% GPT-4 級別的性能”是通過比 OpenAI 大語言模型 (LLM) 更高效的訓(xùn)練實現(xiàn)的。
據(jù)該公司稱,Inflection-2.5 僅需 GPT-4 訓(xùn)練 FLOP(計算)的 40% 即可獲得這些結(jié)果。
此外,與GPT-4一樣,該模型還集成了實時網(wǎng)絡(luò)搜索功能,為用戶提供最新的時事信息。
鑒于該公司已將 Pi 助手定位為每個人的人工智能,這將是一次重大升級。
然而,值得注意的是,網(wǎng)絡(luò)檢索的結(jié)果質(zhì)量可能有點不同,因為沒有基準(zhǔn)測試使用它。
如何訪問 Inflection-2.5?
Inflection AI 已經(jīng)推出了 Pi 聊天機(jī)器人的新模型。
這意味著任何使用該助手的人都可以開始測試其功能。
該公司尚未透露用戶如何從升級后的模型中受益,但表示這一變化對用戶情緒、參與度和保留率產(chǎn)生了重大影響,加速了聊天機(jī)器人的有機(jī)用戶增長。
目前,Pi 聊天機(jī)器人可在 Android、iOS、Web 和桌面應(yīng)用程序上使用,每天有 100 萬活躍用戶,每月有 600 萬活躍用戶。
與人工智能交換了超過 40 億條消息,平均對話持續(xù) 33 分鐘。
VentureBeat 的使命
是成為技術(shù)決策者獲取有關(guān)變革性企業(yè)技術(shù)和交易知識的數(shù)字城鎮(zhèn)廣場。
了解我們的簡報。