50033 蘋果GPT披上谷歌的外衣?

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇

服務熱線:400-858-9000 咨詢/投訴熱線:
國內專業的一站式創業服務平臺
蘋果GPT披上谷歌的外衣?
鋅產業 ·

山竹

03/20
如果Gemini最終真出現在了今年9月即將發布的iPhone 16上,那就意味著,MacBook好不容易擺脫了英特爾的噩夢,iPhone卻又著了谷歌的道。
本文來自于微信公眾號“鋅產業”(ID:xinchanye2021),作者:山竹,投融界經授權發布。

我是在出差途中看到關于蘋果MM1消(xiao)息(xi)的(de)(de),當(dang)時并沒有覺(jue)得(de)驚訝,畢(bi)竟蘋果放棄造車、轉(zhuan)戰(zhan)生成式AI的(de)(de)消(xiao)息(xi)早已(yi)不是秘密(mi)。

讓(rang)我感到驚訝的是,最懂蘋果的彭博社記者Mark Gurman爆料(liao)稱,蘋果正(zheng)在和(he)谷歌洽(qia)談“將Gemini植入iPhone事宜”。

如果Gemini最(zui)終真出現在(zai)了(le)(le)今年9月即(ji)將發布的iPhone 16上,那(nei)就意味著,MacBook好不容易擺脫(tuo)了(le)(le)英特爾(er)的噩夢,iPhone卻又著了(le)(le)谷歌(ge)的道。

即(ji)便只(zhi)是暫時聯(lian)姻,但(dan)Android陣營(ying)的大模型滲透(tou)到蘋果系統中,這也堪稱是前無古(gu)人了。

話雖(sui)如此,但我們(men)還是(shi)有必要了解(jie)一(yi)下蘋果對于生(sheng)成式AI的(de)(de)態度轉變,以及(ji)關于下一(yi)代AI iPhone的(de)(de)猜想(xiang)。

01

MM1的戰略意圖

就(jiu)在上周,蘋果團隊(dui)產出了一篇(pian)關于多模態預訓練大(da)(da)模型的(de)論文,蘋果名為MM1的(de)多模態預訓練大(da)(da)模型在這篇(pian)論文中(zhong)也(ye)浮出水面。

MM1,大多數果粉聽起來都會覺(jue)得這名(ming)字耳熟得很。

無論(lun)蘋果(guo)是有意還(huan)是無意,這(zhe)名字確實容易讓人想起蘋果(guo)MacBook搭載的第一代基于ARM架(jia)構自研(yan)的處理器M1,也(ye)是憑借M1,蘋果(guo)最終擺脫了英特(te)爾多年的噩夢,真正實現了絕(jue)對的軟(ruan)硬一體(ti)。

蘋果將自己(ji)的大模(mo)型命(ming)名(ming)為MM1,似乎(hu)(hu)也有(you)想要(yao)擺脫現在市面上幾乎(hu)(hu)一手遮天的OpenAI影響的寓意。

每篇研究論文,關鍵之(zhi)處在于獨(du)創(chuang)性,這也就是所(suo)謂的研究成果。

蘋(pin)果公(gong)司這(zhe)篇名為MM1的論文(wen),雖(sui)然沒(mei)有(you)透露(lu)出(chu)太多(duo)公(gong)司戰略(lve)層面的想法,但是(shi)也輸出(chu)了一(yi)些蘋(pin)果AI研(yan)究團隊的認(ren)知:

例如,蘋(pin)果(guo)AI研究團隊在論(lun)文(wen)中(zhong)指出(chu),對(dui)于多模態預訓練大模型(xing)而(er)言,使用(yong)圖像字幕、圖像文(wen)本交錯(cuo)內容、純文(wen)本內容的(de)組(zu)合對(dui)于在多個(ge)基準測試中(zhong)實現少量優(you)秀測試結(jie)果(guo)至關重要。

蘋果(guo)AI研究團隊在論文中還(huan)指出(chu),在模型設計過程中,相關要素(su)的重要性依(yi)次為:圖像分辨率(image resolution)、視(shi)覺編碼器(qi)的損(sun)耗和容量(visual encoder loss and capacity)、視(shi)覺編碼器(qi)預訓練數據(visual encoder pre-training data)。

蘋果MM1大(da)模型(xing),則是基于LLM(大(da)語言(yan)模型(xing))+MoE(混合專家系統)搭建而(er)成的多模態大(da)模型(xing),參數規模有3B、7B、30B三(san)個版本。

蘋果GPT披上谷歌的外衣?

實(shi)際上,MM1更像是蘋(pin)果(guo)在(zai)放棄造車后,一次(ci)不那么正(zheng)式地對外官宣,官宣自(zi)己確實(shi)已經在(zai)將大模型作為(wei)研發重心來對待。

早(zao)在(zai)2023年ChatGPT火遍(bian)全球時(shi),Mark Gurman就(jiu)曾爆(bao)料,蘋果這年2月在(zai)喬(qiao)布斯劇院(yuan)舉辦了(le)一場人工智(zhi)能年度峰會。大模型和AI工具,正是這場僅允許(xu)蘋果內部員工參與的(de)(de)活(huo)動的(de)(de)主要議題。

隨后,《紐約時報(bao)》報(bao)道(dao)稱,盡管Siri存在(zai)設計缺陷已經(jing)(jing)毋庸置疑,但蘋果工程師已經(jing)(jing)在(zai)開發類似ChatGPT的人工智能。

不過,這個五年(nian)前在蘋(pin)果(guo)(guo)內部成立,由蘋(pin)果(guo)(guo)人(ren)工(gong)智能負責(ze)人(ren)John Giannandrea領(ling)導的(de)16人(ren)團隊,彼時的(de)研究方向還是(shi)對(dui)話式AI基(ji)礎模型。

直到(dao)去(qu)年,一(yi)個名為“Ajax”的(de)大(da)模型框架,以及一(yi)個被蘋果內部(bu)員(yuan)工稱為“Apple GPT”的(de)聊天機器人項(xiang)目再次浮出水面,關于蘋果大(da)模型的(de)消息(xi)才有了些苗(miao)頭。

而(er)這些無論是被稱作對話式(shi)AI,還是大模型的項目(mu)(mu),主要目(mu)(mu)標(biao)就是改(gai)善Siri、搜索(suo)、地圖、Apple Music在內的軟(ruan)件體驗。

這(zhe)樣(yang)的商業導向,讓蘋果(guo)(guo)人(ren)工智能(neng)團隊(dui)一(yi)直有(you)著充足的預算(suan),彭博社在(zai)2023年10月的一(yi)份報道中指出,蘋果(guo)(guo)每(mei)年在(zai)人(ren)工智能(neng)技(ji)術開發上的預算(suan)高達(da)10億美元。

只不過,雖然(ran)Siri這兩年已經(jing)正在變得(de)好用,但由于蘋果的戰略搖擺,讓它(ta)沒能(neng)在百模大戰中嶄露頭角。

MM1的(de)悄然(ran)上(shang)線,算是蘋果在放棄汽車(che)、選(xuan)定(ding)生成式AI這樣的(de)業務調整后,一個(ge)戰略意圖上(shang)的(de)顯露。

02

谷歌的GPT外衣

從蘋果(guo)AI研究團(tuan)隊這篇(pian)論文的測試(shi)報告中(zhong)可以(yi)看到(dao),和(he)OpenAI、谷(gu)歌的多模(mo)態大模(mo)型相比(bi),蘋果(guo)的MM1并(bing)不占優勢,甚至(zhi)可以(yi)用差(cha)強人意來形容。

這就不難(nan)理解,為什么會(hui)傳出蘋(pin)果正在(zai)與谷歌談判,希望將Gemini應用到iPhone中,Mark Gurman甚至爆(bao)料(liao)稱(cheng),蘋(pin)果也在(zai)與OpenAI進行了(le)接(jie)觸,在(zai)考慮使用OpenAI的(de)大模型(xing)。

在手機上應用(yong)谷歌(ge)的(de)Gemini大模型,按理(li)來說也不足(zu)為奇,畢竟,谷歌(ge)Gemini Nano(18億/32.5億參數規模)本身就是專為手機這樣智能硬件(jian)設計的(de)一款大模型。

更何況,這一模型不僅(jin)用(yong)在了(le)谷歌自己的Pixel 8 Pro上(shang),還被三星(xing)用(yong)到(dao)了(le)今年年初發布的旗艦手機Galaxy S24上(shang)。

蘋果GPT披上谷歌的外衣?

所以,嚴(yan)格意義上(shang)來說(shuo),這是一個在主流手機上(shang)已經(jing)經(jing)過(guo)驗證的端側大(da)模型,保真保熟(shu)。

只(zhi)不(bu)過,如果將三星換成蘋(pin)果,這件(jian)事兒的意義(yi)就不(bu)一(yi)樣了。

眾(zhong)所周(zhou)知,蘋(pin)果(guo)是自成一體的封閉(bi)系(xi)統,而且還是一套和(he)谷歌陣(zhen)營的Android一向(xiang)對立的第(di)二(er)大手機生態體系(xi),如果(guo)選擇聯姻,意味著蘋(pin)果(guo)手機在軟硬一體上的優勢將在一定(ding)程(cheng)度(du)將被打破(po)。

畢竟大(da)模型(xing)和其它軟件不(bu)太(tai)一(yi)樣,雖然(ran)現在在手(shou)機上還看不(bu)出有什么石破驚天的創新應用,但在未來將會是一(yi)個(ge)不(bu)亞于芯片的根技術。

實(shi)際上(shang),從Mark Gurman的爆料來看,蘋果這次與谷歌談合(he)作,也是打算在(zai)(zai)本(ben)地(di)用(yong)自(zi)己的大模型(xing),在(zai)(zai)云端用(yong)谷歌的Gemini提供(gong)文(wen)本(ben)生成和圖像生成等功能。

這樣看(kan)來(lai),蘋果的這一舉措更(geng)像是一個”緩兵(bing)之(zhi)計(ji)“。

既然(ran)打不(bu)過,那就(jiu)先拿來(lai)用吧。

庫(ku)克畢(bi)竟(jing)不是喬布(bu)斯,沒(mei)有技術潔癖(pi),這(zhe)樣的(de)(de)技術組合,商業上依然是成(cheng)功的(de)(de),對于當下的(de)(de)iPhone來說也未嘗不可。

只不過,蘋果以往在人(ren)工智(zhi)能(neng)技術上的高投入,似乎就打了水漂。

郭明錤在2023年10月就(jiu)曾(ceng)預測,蘋果每(mei)年至少需要投資數十億美(mei)元,才有可能在生成式(shi)AI上追(zhui)上競爭對手。

這樣算來,蘋果一年10億美元的(de)AI投入,還是(shi)顯得少(shao)了些(xie)。

而關于(yu)蘋果(guo)在生成式(shi)AI到底有哪些(xie)關鍵(jian)成果(guo),在今(jin)年2月(yue)的蘋果(guo)一季度(du)電話(hua)會議上,庫克透(tou)露,“我們很高興將在今(jin)年晚(wan)些(xie)時候分享我們正在進行的人工智能工作的相(xiang)關細節。”

這(zhe)一(yi)時間節點很可(ke)能是今年6月的(de)WWDC 2024,搭載蘋果生成(cheng)式AI的(de)產(chan)品則很可(ke)能是iOS 18,以及今年秋季即將發布(bu)的(de)iPhone 16。

03

關于AI iPhone的猜想

就(jiu)在(zai)昨(zuo)天,高(gao)通高(gao)調對外發(fa)布了一顆新(xin)處(chu)理器——驍龍8s Gen 3。

芯片廠商(shang)的產品(pin)向來版(ban)本眾多,新名字(zi)聽得大家(jia)也是云(yun)里霧里,而(er)這(zhe)顆芯片,其實是驍龍8 Gen 3的低配版(ban)(官方稱之為性(xing)能(neng)版(ban))。

即(ji)便(bian)如此,這仍是一顆最(zui)高支(zhi)持100億(yi)參數大模(mo)型的手機處理器。

低(di)配(pei)版的處理器都已經(jing)開(kai)始支持百億參數(shu)大(da)模(mo)型,由此可見,大(da)模(mo)型已經(jing)成了智(zhi)能手機的標配(pei)。

就在(zai)智(zhi)能手(shou)機都開(kai)始(shi)標配(pei)大模(mo)型(xing)、換殼“AI手(shou)機”時(shi),如何使用(yong)大模(mo)型(xing)就成了那個(ge)最關鍵(jian)的問題。

現在(zai)來看,就新一代蘋(pin)果手機(ji)或iOS系統而言,我們能夠期待的是(shi):

1、語音(yin)助(zhu)手Siri能夠通(tong)過(guo)生成式(shi)AI變得聰明些;

2、百年不變(bian)的攝像(xiang)/攝影功能通過生成式AI搞一(yi)些新玩法;

3、攝影功能在生成式AI的加持下可以和(he)Vision Pro進(jin)一步(bu)聯動,讓(rang)為Vision Pro創(chuang)造3D內容(rong)變得更簡單;

4、在Pages、Keynote等辦公軟(ruan)件(jian)上加(jia)入自動摘要、文生(sheng)圖等內(nei)容生(sheng)成(cheng)功能(neng)(neng),那種(zhong)能(neng)(neng)夠更容易(yi)上手和使用的內(nei)容生(sheng)成(cheng)功能(neng)(neng);

5、最好能(neng)再(zai)通過生成式AI創造出兩個我們(men)都不曾想到(dao)的新鮮(xian)玩法。

當然(ran)(ran),鋅產(chan)業認為(wei),毫無(wu)懸(xuan)念的是,這次(ci)通過生成式AI,蘋(pin)果Siri必(bi)然(ran)(ran)會迎來一次(ci)空前升(sheng)級。

憑借(jie)超10億優質iPhone活躍用戶,這(zhe)次,借(jie)助生(sheng)成式AI,蘋果或許能夠(gou)重(zhong)啟語音交互時代。

蘋(pin)果 MM1 谷歌
評論
還可輸入300個字
400-858-9000
免費服務熱線
郵箱
09:00--20:00
服務時間
投訴電話
投融界App下載
官方微信公眾號
官方微信小程序
Copyright ? 2024 浙江投融界科技有限公司(xxccv.cn) 版權所有 | ICP經營許可證:浙B2-20190547 | | 浙公網安備330號
地址:浙江省杭州市西湖區留下街道西溪路740號7號樓301室
浙江投融界科技有限公司xxccv.cn版權所有 | 用戶協議 | 隱私條款 | 用戶權限
應用版本:V2.7.8 | 更新日期:2022-01-21
 
在線客服
微信訂閱