文心大模型上車 智能座艙邁入大模型時(shí)代_環(huán)球速遞
隨著AI大模型的持續(xù)演進(jìn),其應(yīng)用場景也在不斷更新。
“今天我們正站在大語言模型的技術(shù)基點(diǎn)去思考,汽車?yán)锼枰淖畋举|(zhì)的核心變革點(diǎn)是什么?!?月26日,在21世紀(jì)經(jīng)濟(jì)報(bào)道科技峰會“潮起AIGC:大模型崛起”北京閉門會上,百度智能汽車事業(yè)部智艙業(yè)務(wù)部產(chǎn)品架構(gòu)師徐嘉南介紹稱。
(資料圖片)
在徐嘉南看來,未來可移動的汽車機(jī)器人應(yīng)當(dāng)具備自主移動及人機(jī)對話式交互兩大方向的能力,大語言模型則以其更強(qiáng)的自然語言理解、邏輯推理及創(chuàng)造性為汽車的智能應(yīng)用帶來全新的想象空間。
需要注意的是,百度正在進(jìn)行大模型上車的持續(xù)探索。就在日前,百度Apollo汽車智能化業(yè)務(wù)展示了以文心大模型為基礎(chǔ)的新一代AI智艙探索成果,這也是國內(nèi)首個(gè)基于文心大模型在車載場景下的探索成果,并有望在未來推進(jìn)量產(chǎn)。
據(jù)介紹,基于文心大模型能力,百度Apollo推出的智艙將具備出行場景對話式交互、邏輯推理、策略規(guī)劃和知識問答等多項(xiàng)能力,同時(shí)也能夠?qū)崿F(xiàn)在當(dāng)前智艙命令式交互下覆蓋全車多音區(qū)、毫秒級響應(yīng)、免喚醒全時(shí)交互的極致體驗(yàn)。
“從整個(gè)發(fā)展角度來看,我們認(rèn)為未來文心大模型會重塑車內(nèi)的應(yīng)用和交互,基于文心這樣的能力,把過去可能我們想到的體驗(yàn),但是過去的技術(shù)做不到的能力,去進(jìn)行一次重構(gòu),給大家?guī)砣麦w驗(yàn)?!毙旒文现赋觥?/p>
文心大模型上車
作為智能汽車的核心,智能座艙隨著汽車智能化的演進(jìn)而持續(xù)發(fā)生著變化,它也愈發(fā)成為用戶購車決策的決定因素之一。
徐嘉南指出,當(dāng)前智能座艙的功能正在持續(xù)增加,同時(shí)語音交互的覆蓋率也在持續(xù)增加。據(jù)相關(guān)機(jī)構(gòu)調(diào)研,2022年1-8月,語音交互功能在智能座艙的滲透率達(dá)到73.3%,百度方面則預(yù)測稱,未來智能座艙的語音交互覆蓋量還會快速拓展,到2025年會實(shí)現(xiàn)超過95%的搭載。
不過當(dāng)前,智能座艙的語音交互更多是命令式的交互工具,并且系統(tǒng)功能單一,交互系統(tǒng)毫無智能可言。大模型的落地,則帶來了全新的可能性,有望推動座艙語音助手向“AI智能助手”升級。
就此,百度Apollo正式推出國內(nèi)首個(gè)基于文心大模型在車載場景下的探索成果。據(jù)介紹,基于文心大模型能力,百度Apollo針對車載場景進(jìn)行專項(xiàng)訓(xùn)練和模型精調(diào),無需人工數(shù)據(jù)標(biāo)注,AI便會具備更出色的語言理解和學(xué)習(xí)能力。
例如,在出行場景中,小度車載語音可以幫用戶進(jìn)行旅途行程規(guī)劃、沿途景點(diǎn)美食推薦。在家庭出行時(shí),靈感畫畫可起到給兒童娛樂陪伴的作用。只需用一句話描述想要的畫作內(nèi)容,AI即可在幾秒內(nèi)按照完成一幅創(chuàng)意畫作。
同時(shí),百度也在探索如何借助文心大模型能力重塑個(gè)性化駕駛空間。在未來,百變?nèi)嗽O(shè)功能可針對不同場景和不同用戶特點(diǎn)、偏好,定制個(gè)性化的語音助手人設(shè),與用戶進(jìn)行情感化交流。用戶也可以擁有一個(gè)用車顧問,拋棄陳舊的產(chǎn)品說明書,用戶可以隨時(shí)隨地、詳細(xì)了解車輛功能。
此外,大模型融入智艙場景后,百度Apollo智艙也將演變?yōu)椤暗谌羁臻g”的核心載體。可以依托語音助手完成朋友圈文案撰寫、沿途景色拍照并一鍵發(fā)送至手機(jī),也可以在開車途中讓語音助手完成一天的日程安排和會議預(yù)定等等。
據(jù)介紹,在未來,大模型加持下的智艙將具備出行場景對話式交互、邏輯推理、策略規(guī)劃和知識問答等多項(xiàng)能力,讓車內(nèi)助手在未來有能力像真人一樣跟用戶交流,可以理解并滿足用戶在車內(nèi)場景的深層次需求。
“未來基于文心大模型的能力,車?yán)锼薪换タ梢杂米匀徽Z言的方式進(jìn)行,而不是以點(diǎn)擊頁面然后跳轉(zhuǎn)的邏輯進(jìn)行交互,這是大模型給未來車機(jī)交互體驗(yàn)帶來的非常大的變化?!毙旒文媳硎?,“用戶直接表達(dá)需求,系統(tǒng)根據(jù)分析和理解,調(diào)動應(yīng)用資源進(jìn)行需求滿足。這將改變?nèi)伺c應(yīng)用、甚至人與車之間的關(guān)系?!?/p>
技術(shù)推動變革
身處汽車行業(yè)劇變的時(shí)代,智能化成為汽車品牌差異化的重要因素,而智艙是當(dāng)前階段用戶最容易有感知的智能汽車配置。
百度智能座艙產(chǎn)品由小度車載SDK及小度車載OS構(gòu)成。官方數(shù)據(jù)顯示,百度Apollo始終助力OEM打造智能化競爭優(yōu)勢,其汽車智能化解決方案已在31個(gè)汽車品牌的134個(gè)車型上實(shí)現(xiàn)量產(chǎn),累計(jì)搭載超700萬輛。
同時(shí),考慮到車企希望進(jìn)行個(gè)性化、定制化而非千篇一律的體驗(yàn),希望形成自身的品牌調(diào)性,因而百度進(jìn)一步推出了小度車載SDK,從而讓車企實(shí)現(xiàn)差異化設(shè)計(jì)。
其中,在小度車載語音SDK方面,百度Apollo已經(jīng)實(shí)現(xiàn)了最新的技術(shù)升級,使其變得更加智能化和易用。
基于大模型本地化,小度車載語音SDK持續(xù)推動座艙極致交互體驗(yàn)?!八^的大模型本地化,是指將云端參數(shù)非常大的模型通過蒸餾和裁剪的方式,把整個(gè)體積和運(yùn)行資源占用變得更小,然后移動到端上,利用本地化的算力去進(jìn)行加速運(yùn)行,從而帶來更極致的語音交互體驗(yàn)?!毙旒文辖忉尫Q。
具體而言,小度車載語音能夠?qū)崿F(xiàn)流暢的免喚醒多路同時(shí)交互、全頁面所見所說、全域毫秒級響應(yīng),讓用戶像是擁有了一個(gè)隨時(shí)待命的私人助理。
尤其值得注意的是,小度車載語音還能夠?qū)崿F(xiàn)真多路同時(shí)對話能力,最大支持8路同時(shí)交互精確處理,覆蓋整個(gè)座艙內(nèi)外,可以實(shí)現(xiàn)多路同時(shí)、快速、連續(xù)對話的極限挑戰(zhàn)。坐在駕駛位、副駕駛位、和后排的每一個(gè)人都可以同時(shí)提出自己的訴求,語音助手不僅可以識別不同位置用戶的需求并且可以依次解決。
此外,小度車載語音還實(shí)現(xiàn)了全領(lǐng)域毫秒級響應(yīng),且通過自動識屏方式實(shí)現(xiàn)用戶全場景的語音交互體驗(yàn)。“車?yán)锼械墓δ芏伎梢哉Z音交互,而不是只在某些應(yīng)用里面才能交互,這在我們行業(yè)上是非常大的改變?!毙旒文媳硎尽?/p>
在徐嘉南看來,大語言模型正在推動行業(yè)走向真正的對話式交互,而它也將帶來用戶及產(chǎn)業(yè)層面的深刻變革。
從用戶層面而言,隨著通用語言模型置入設(shè)備中,其能夠在不同場景下化身不同類型的助手,并解決用戶的專業(yè)問題。從產(chǎn)業(yè)層面來看,車企未來在進(jìn)行語音交互功能開發(fā)時(shí),也將從儲備語音開發(fā)人員進(jìn)行具體功能設(shè)計(jì),到配備提示詞工程師進(jìn)行大模型調(diào)教,訓(xùn)練車機(jī)更好地響應(yīng)用戶需求。
而想要達(dá)到這樣的變革,就需要堅(jiān)實(shí)的技術(shù)支撐?!鞍俣仍谡麄€(gè)行業(yè)內(nèi)擁有深刻的AI技術(shù)積累,擁有全棧自研的AI架構(gòu),從底層芯片的昆侖芯,到上層深度學(xué)習(xí)框架飛槳,再到AI大模型層,我們能夠基于文心大模型的能力實(shí)現(xiàn)用戶及車企所需要的體驗(yàn)?!毙旒文媳硎?。
(文章來源:21世紀(jì)經(jīng)濟(jì)報(bào)道)
標(biāo)簽: