我們報(bào)道了微軟在Build 2023開(kāi)發(fā)者大會(huì)發(fā)布的Windows Copilot——深度集成在Windows 11人工智能助手。
至此,Copilot已經(jīng)出現(xiàn)在了微軟幾乎所有重要產(chǎn)品之中,包括輔助編程的Github Copilot、輔助辦公的Microsoft 365 Copilot、輔助客戶溝通的Viva?Copilot、輔助業(yè)務(wù)流程的Dynamic 365 Copilot等等。
微軟比那些宣告自己AI first、All in AI的公司還要更進(jìn)一步,選擇All in Copilot,即全面轉(zhuǎn)向人工智能輔助技術(shù)。
我們來(lái)到了轉(zhuǎn)折點(diǎn)
看到這里,相信有相當(dāng)一部分不那么關(guān)心AI技術(shù)的讀者還不太了解,“Copilot”到底是什么。
“Copilot”一詞源自飛行術(shù)語(yǔ),意思是副駕駛員(Co-pilot)。在飛機(jī)上,副駕駛員是協(xié)助主駕駛員操作飛機(jī)的人,通常當(dāng)主駕駛員需要休息或處理其他任務(wù)時(shí),副駕駛員就會(huì)接管控制權(quán),二者共同負(fù)責(zé)飛機(jī)的安全飛行。
對(duì)照這個(gè)定義,我們就不難理解:每個(gè)使用計(jì)算機(jī)程序的人都是“駕駛員”,AI則是輔助我們航行的“副駕駛”。
舉個(gè)例子,當(dāng)你準(zhǔn)備沉下心來(lái)辦公,你就可以在Windows 11調(diào)出Copilot,把你的需求敲進(jìn)去:
Windows Copilot會(huì)建議你打開(kāi)專(zhuān)注模式,并把系統(tǒng)界面調(diào)整成更沉浸的暗色模型。
這時(shí)候你還想聽(tīng)一點(diǎn)音樂(lè),再敲入需求:
Windows Copilot會(huì)根據(jù)你喜歡的音樂(lè)類(lèi)型,在Spotify等音樂(lè)軟件上播放對(duì)應(yīng)的歌單。
聽(tīng)起來(lái)我們像是又回到了命令行界面時(shí)代,通過(guò)一個(gè)輸入框?qū)崿F(xiàn)所有的計(jì)算機(jī)操作。但不同的是,你不再需要花時(shí)間去學(xué)習(xí)和理解編程這門(mén)專(zhuān)屬于計(jì)算機(jī)的語(yǔ)言,你只要用人類(lèi)的自然語(yǔ)言把你的需求拋給它,它就能幫你解決。
Windows Copilot還可以幫你解決很多問(wèn)題,例如當(dāng)你收到一份冗長(zhǎng)到讀不下去的文件,你可以直接把它從桌面拖到Copilot上,讓AI幫你總結(jié)這份文檔,實(shí)現(xiàn)“量子速讀”。
你還可以讓它幫你重寫(xiě)或者解釋文檔的內(nèi)容,提高工作的效率。簡(jiǎn)單來(lái)說(shuō),Copilot不能完全取代你的工作,但它能幫你節(jié)約很多不必要的重復(fù)性勞動(dòng),從而節(jié)約你在“數(shù)字瑣事”上花費(fèi)的時(shí)間。
這也是微軟對(duì)于Copilot的定義:一種使用自然語(yǔ)言處理技術(shù)或大語(yǔ)言模型(如GPT-4),幫助人們完成復(fù)雜或認(rèn)知任務(wù)的應(yīng)用程序或組件。
從撥號(hào)上網(wǎng)年代一路走來(lái)的朋友可能就察覺(jué)到了一些關(guān)鍵要素:
操作系統(tǒng)+助手,等等,這不就是Windows 97時(shí)代的Clippy和Windows Phone時(shí)代的Cortana嗎???
沒(méi)錯(cuò),Clippy、Cortana和Copilot(微軟是不是對(duì)C開(kāi)頭的單詞有執(zhí)念?)在定位上確實(shí)存在一定的重合,你甚至可以把它們看作同一款產(chǎn)品在不同交互界面時(shí)代的三種形態(tài)。
Clippy:圖形交互界面的系統(tǒng)助手,其設(shè)計(jì)初衷是提供了一個(gè)平易近人、友好的界面,以簡(jiǎn)化復(fù)雜的操作任務(wù)。然而,由于Clippy需要通過(guò)一個(gè)彈窗進(jìn)行交互,它總會(huì)不合時(shí)宜地彈出來(lái),導(dǎo)致用戶在使用時(shí)失焦。
Cortana:語(yǔ)音交互界面的系統(tǒng)助手,對(duì)標(biāo)Siri和Google助手,定位個(gè)人數(shù)字助手。但受限于功能局限,Cortana能做的事情很有限,即便微軟盡可能地把Cortana推向Windows之外的更多平臺(tái),也很難吸引用戶使用。
Windows Copilot:自然語(yǔ)言交互時(shí)代的AI助手,它深植于系統(tǒng)之中,又不局限于系統(tǒng),它可以集成于各種程序和應(yīng)用中,并且能夠理解用戶的需求并提供幫助,在功能性、靈活性和集成度方面遠(yuǎn)超Clippy和Cortana。
從技術(shù)發(fā)展的路線來(lái)看,你會(huì)發(fā)現(xiàn)Copilot與Cortana的路徑類(lèi)似但方向截然不同。
2014年,Cortana作為Windows Phone 8.1的默認(rèn)語(yǔ)音助手首次亮相,提供語(yǔ)音搜索、日程管理和個(gè)性化建議等功能,標(biāo)志著微軟正式進(jìn)入語(yǔ)音助手市場(chǎng),與蘋(píng)果和Google競(jìng)爭(zhēng)。
隨后,Cortana隨Windows 10操作系統(tǒng)一同推出,拓展到PC和平板電腦之上,集成了更多的系統(tǒng)功能,為更多人熟知。
在接下來(lái)的時(shí)間,微軟把Cortana塞進(jìn)了包括Microsoft 365套件、Teams等更多的產(chǎn)品之中,希望能獲取更多的用戶。
但到了2021年,微軟決定停止Cortana大部分服務(wù),退出這場(chǎng)語(yǔ)音助手大戰(zhàn)。
Cortana的失敗不僅是因?yàn)槠涫姓悸室恢鄙喜蝗?,還因?yàn)檎Z(yǔ)音助手功能本身很難再翻起太大的浪花:10年前的語(yǔ)音助手能幫你寫(xiě)郵件、查天氣,10年后它仍然只能做這些基礎(chǔ)型的工作,用戶的感知并不強(qiáng)。
直到ChatGPT的出現(xiàn),語(yǔ)音AI助手給人留下的“愚蠢”刻板印象才被打破。
ChatGPT能夠通過(guò)自然語(yǔ)言理解人們的需求,幫助人們完成一些需要高智能的任務(wù),雖然GPT模型時(shí)而會(huì)出現(xiàn)生成錯(cuò)誤的答案,但已經(jīng)解決了AI助手長(zhǎng)期以來(lái)的痛點(diǎn)——語(yǔ)義理解。
這是一個(gè)關(guān)鍵的轉(zhuǎn)折點(diǎn),微軟迅速地把大語(yǔ)言模型技術(shù)與其產(chǎn)品結(jié)合起來(lái),丟出了一個(gè)又一個(gè)讓人瞠目結(jié)舌的技術(shù)Demo:用聊天的方式在Bing搜索、用幾句需求做出個(gè)精美的PPT、讓Edge瀏覽器一鍵總結(jié)網(wǎng)頁(yè)內(nèi)容……
很快,Copilot將無(wú)處不在,AI將無(wú)處不在,我們與計(jì)算機(jī)交互的固有邏輯開(kāi)始出現(xiàn)裂縫,一個(gè)新的交互邏輯準(zhǔn)備破殼而出,重新定義新一代的計(jì)算機(jī)和互聯(lián)網(wǎng)。
比爾·蓋茨在AI爆發(fā)后給出了他的判斷。
也就是說(shuō),側(cè)邊欄AI助手將會(huì)成為一個(gè)新的常態(tài),你的語(yǔ)言會(huì)變成像鼠標(biāo)點(diǎn)擊、手指觸碰一樣具有“魔力”的新交互方式。
只不過(guò),如果你只是把Copilot看作是一個(gè)新時(shí)代的AI助手,那你就太小看微軟的野心了。
全新的軟件形式
前面我們說(shuō)到,微軟為旗下的很多產(chǎn)品都接入了Copilot,讓Bing、Edge、Office煥發(fā)出新的活力。
更重要的是,這些散落在不同軟件的Copilot彼此之間并非獨(dú)立,而是相互打通的。
這里我們要引入一個(gè)很重要的概念——插件集。
你可以把這些基于大語(yǔ)言模型的Copilot理解成Chrome瀏覽器(當(dāng)然,這是一個(gè)非常不恰當(dāng)?shù)谋扔鳎寮褪菫g覽器上面的擴(kuò)展程序,有了第三方的插件,Copilot就能實(shí)現(xiàn)很多不同的功能。
此前,我們?cè)敿?xì)介紹過(guò)ChatGPT的插件集體驗(yàn),有了這些第三方插件,ChatGPT可以實(shí)現(xiàn)訂餐、查航班、解答數(shù)理化難題等等功能。
現(xiàn)在,這些插件同樣可以應(yīng)用在Bing、Edge、Office甚至Windows之中,因?yàn)檫@些產(chǎn)品都采用了同樣的開(kāi)放插件標(biāo)準(zhǔn)。
簡(jiǎn)單來(lái)說(shuō),開(kāi)發(fā)者只要開(kāi)發(fā)一次插件,就能應(yīng)用在微軟的一系列Copilot之中,這給開(kāi)發(fā)者和用戶都帶來(lái)了極大的靈活度。
還是拿實(shí)際應(yīng)用舉例。
很快,你可以在Bing調(diào)用Zillow插件(租房信息查詢(xún)),然后直接向Bing提問(wèn),“用XX預(yù)算在X地租房有什么房源推薦?”。Bing就能直接給出對(duì)應(yīng)的房源信息。
或者你可以在Edge瀏覽器上讓AI幫你總結(jié)食譜,然后調(diào)用Instacart插件,一鍵購(gòu)買(mǎi)你缺少的食材。
這是一種全新的信息獲取方式,它跳過(guò)了從搜索引擎到服務(wù)商網(wǎng)站、再到具體信息的過(guò)程,直接提取了你最需要的內(nèi)容,然后以平鋪直敘的方式呈現(xiàn)給你。
Copilot+插件,或許會(huì)改變我們使用網(wǎng)絡(luò)獲取服務(wù)的方式。
另一方面,在我們最熟悉的Office套件上,也能夠使用插件。
例如當(dāng)你想用Word起草一份法律合同,但是你并不熟悉當(dāng)?shù)氐姆?,你就可以調(diào)用Thomson Reuters、Westlaw等法律插件來(lái)幫你起草和修改具體的內(nèi)容。
插件集的出現(xiàn)豐富了大語(yǔ)言模型的可能性,而一個(gè)共同的插件標(biāo)準(zhǔn)又讓插件集的作用變得最大化,這就是微軟正在構(gòu)建的Copilot技術(shù)堆棧,最終共同拼成了微軟眼中Copilot最理想的形態(tài):
不僅是一種新的程序,不僅是一種新的用戶界面,還是一個(gè)新的平臺(tái)。
正如前面所說(shuō),大語(yǔ)言模型的出現(xiàn)賦予了軟件前所未有的易用性和可操作性,“AI助手化”會(huì)成為軟件設(shè)計(jì)的新常態(tài)。
像Adobe等廠商都已經(jīng)開(kāi)始在自家的軟件加入AI功能,越來(lái)越多的開(kāi)發(fā)者會(huì)考慮為自己的產(chǎn)品設(shè)計(jì)“Copilot”。
微軟瞄準(zhǔn)的正是這么一個(gè)尚處于萌芽時(shí)期的新機(jī)會(huì),它想要利用自己在桌面系統(tǒng)和辦公軟件超高占有率的優(yōu)勢(shì),搶先建立起這個(gè)全新的平臺(tái),領(lǐng)先一眾對(duì)手。
微軟CTO Kevin Scott在Build大會(huì)上誠(chéng)摯地向開(kāi)發(fā)者們介紹了這個(gè)宏大的愿景,他引用了比爾·蓋茨的一段話:
Kevin Scott認(rèn)為像GPT-4這樣的基礎(chǔ)模型很強(qiáng)大,非常強(qiáng)大,但它并不能做所有的事,這需要更多開(kāi)發(fā)者將這樣的技術(shù)應(yīng)用到相對(duì)應(yīng)的程序之中,把大語(yǔ)言模型作為構(gòu)建程序的一部分,AI才能創(chuàng)造出全新的用戶體驗(yàn)。
這是一種全新的程序開(kāi)發(fā)方式。Kevin Scott拋出了一個(gè)觀點(diǎn):
當(dāng)下,AI正在以不可思議的速度重塑著人們對(duì)科技、對(duì)世界的認(rèn)知,它不僅改變了我們處理數(shù)據(jù)的方式,也在重新定義我們與機(jī)器的交互方式,甚至是我們理解和解決問(wèn)題的方式。
大語(yǔ)言模型的崛起,突破了傳統(tǒng)的程序設(shè)計(jì)框架,AI開(kāi)始能理解我們的語(yǔ)言,預(yù)測(cè)我們的需求,甚至理解我們的情感,用數(shù)據(jù)和算法的力量解決了以前我們難以想象的問(wèn)題。
值得敬畏的是,面對(duì)這樣一場(chǎng)全新的科技巨變,48歲的微軟依然走在技術(shù)變革的最前沿。
來(lái)源:虎嗅
文章轉(zhuǎn)載于其他網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系我們及時(shí)刪除!