文章來(lái)源:AI科技評(píng)論
作者:郭思
AI 科技評(píng)論獨(dú)家獲悉,月之暗面近日正在進(jìn)行 2 億美元融資,本輪投資由螞蟻和阿里集團(tuán)共同投資,投前估值預(yù)計(jì) 15 億美元。
據(jù)了解,月之暗面團(tuán)隊(duì)成員人數(shù)在100人至200人之間。
團(tuán)隊(duì)創(chuàng)始人楊植麟是一個(gè)90后,本科畢業(yè)于清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系,博士就讀于全美自然語(yǔ)言處理排名第一的卡內(nèi)基梅隆大學(xué)語(yǔ)言技術(shù)研究所(LTI),師從蘋(píng)果AI研究負(fù)責(zé)人Ruslan Salakhutdinov、谷歌首席科學(xué)家William Cohen。
在博士期間,楊植麟用4年時(shí)間完成了一般6年才能完成的博士課程,并連續(xù)作為第一作者發(fā)表了兩項(xiàng)關(guān)鍵研究成果——Transformer-XL和XLNet。Transformer-XL 成為首個(gè)全面超越 RNN 的注意力語(yǔ)言模型,相關(guān)論文是 NeurIPS 2019 與 ACL 2019 的最高引論文之一;XLNet 則在 20 項(xiàng)任務(wù)上超越谷歌 BERT 模型。截至目前,楊植麟本人學(xué)術(shù)引用量自2019年起已超2萬(wàn)余次。
楊植麟個(gè)人谷歌學(xué)術(shù)界面
此外,團(tuán)隊(duì)的聯(lián)合創(chuàng)始人周昕宇與吳育昕,均為清華大學(xué)校友,具備深厚的技術(shù)底蘊(yùn)。團(tuán)隊(duì)現(xiàn)已匯聚了來(lái)自 CMU LTI、Google、Meta(原Facebook)、Amazon等全球頂級(jí)學(xué)術(shù)機(jī)構(gòu)及科技公司的諸多海外高層次人才,共同致力于前沿AI技術(shù)的研發(fā)與創(chuàng)新。
AI 科技評(píng)論獲知,月之暗面在人工智能領(lǐng)域持有明確立場(chǎng),特別是在大語(yǔ)言模型的應(yīng)用與融合方面,楊植麟的理解獨(dú)到,堅(jiān)定走 To C 道路,路線也一直是產(chǎn)品驅(qū)動(dòng)。
技術(shù)優(yōu)勢(shì)上,月之暗面最為稱道的則是 Kimi Chat 的長(zhǎng)文本基礎(chǔ)技術(shù)能力。
11月,Kimi Chat宣布全面對(duì)外開(kāi)放,不再限制內(nèi)測(cè)資格,能高效處理約20萬(wàn)漢字的上下文。楊植麟曾在演講中表示,規(guī)?;峭ㄏ駻GI的核心,而隨著模型不斷迭代,長(zhǎng)文本會(huì)逐漸取代微調(diào),成為定制模型的關(guān)鍵技術(shù)。但通過(guò)滑動(dòng)窗口、降采樣、小模型等技術(shù)捷徑實(shí)現(xiàn)上下文窗口延長(zhǎng),都是“技術(shù)捷徑”。目前符合大模型技術(shù)原理的做法是通過(guò)對(duì)數(shù)據(jù)的無(wú)損壓縮,以真正提升模型能力。
近期頻繁霸榜熱門(mén)游戲應(yīng)用“哄哄模擬器”受益于月之暗面的技術(shù)支撐。該模擬器設(shè)計(jì)了各類情侶互動(dòng)情境,由AI角色模擬真實(shí)對(duì)話,通過(guò)系統(tǒng)計(jì)算的“原諒值”動(dòng)態(tài)反饋用戶的溝通技巧。
哄哄模擬器在短時(shí)間內(nèi)迅速走紅,在線用戶人數(shù)突破一萬(wàn),快速消耗了過(guò)億 tokens。創(chuàng)始人王登科透露,為應(yīng)對(duì)龐大的 token 消耗需求,哄哄模擬器團(tuán)隊(duì)已與月之暗面展開(kāi)深度合作,全面采用其API接口,實(shí)際效果優(yōu)于此前使用的GPT系列技術(shù),尤其在遵循指定文本格式及刺激用戶互動(dòng)方面表現(xiàn)出色。
這個(gè)成功案例凸顯了月之暗面在中文語(yǔ)境理解和C端用戶體驗(yàn)上的顯著優(yōu)勢(shì)。
知情人士透露,月之暗面預(yù)計(jì)下月或?qū)⒌驼{(diào)推出媲美 GPT-4 級(jí)別的新模型,直接整合至 Kimi Chat并同步發(fā)布兩款相關(guān)應(yīng)用,但不會(huì)過(guò)多張揚(yáng),而是以實(shí)際行動(dòng)展現(xiàn)其技術(shù)領(lǐng)先性。