文心大模型上車智能座艙邁入大模型時(shí)代_環(huán)球速遞

2023-05-30 07:31:17|

來源：21世紀(jì)經(jīng)濟(jì)報(bào)道作者：

隨著AI大模型的持續(xù)演進(jìn)，其應(yīng)用場景也在不斷更新。

“今天我們正站在大語言模型的技術(shù)基點(diǎn)去思考，汽車?yán)锼枰淖畋举|(zhì)的核心變革點(diǎn)是什么?！?月26日，在21世紀(jì)經(jīng)濟(jì)報(bào)道科技峰會“潮起AIGC：大模型崛起”北京閉門會上，百度智能汽車事業(yè)部智艙業(yè)務(wù)部產(chǎn)品架構(gòu)師徐嘉南介紹稱。

(資料圖片)

在徐嘉南看來，未來可移動的汽車機(jī)器人應(yīng)當(dāng)具備自主移動及人機(jī)對話式交互兩大方向的能力，大語言模型則以其更強(qiáng)的自然語言理解、邏輯推理及創(chuàng)造性為汽車的智能應(yīng)用帶來全新的想象空間。

需要注意的是，百度正在進(jìn)行大模型上車的持續(xù)探索。就在日前，百度Apollo汽車智能化業(yè)務(wù)展示了以文心大模型為基礎(chǔ)的新一代AI智艙探索成果，這也是國內(nèi)首個(gè)基于文心大模型在車載場景下的探索成果，并有望在未來推進(jìn)量產(chǎn)。

據(jù)介紹，基于文心大模型能力，百度Apollo推出的智艙將具備出行場景對話式交互、邏輯推理、策略規(guī)劃和知識問答等多項(xiàng)能力，同時(shí)也能夠?qū)崿F(xiàn)在當(dāng)前智艙命令式交互下覆蓋全車多音區(qū)、毫秒級響應(yīng)、免喚醒全時(shí)交互的極致體驗(yàn)。

“從整個(gè)發(fā)展角度來看，我們認(rèn)為未來文心大模型會重塑車內(nèi)的應(yīng)用和交互，基于文心這樣的能力，把過去可能我們想到的體驗(yàn)，但是過去的技術(shù)做不到的能力，去進(jìn)行一次重構(gòu)，給大家?guī)砣麦w驗(yàn)?！毙旒文现赋觥?/p>

文心大模型上車

作為智能汽車的核心，智能座艙隨著汽車智能化的演進(jìn)而持續(xù)發(fā)生著變化，它也愈發(fā)成為用戶購車決策的決定因素之一。

徐嘉南指出，當(dāng)前智能座艙的功能正在持續(xù)增加，同時(shí)語音交互的覆蓋率也在持續(xù)增加。據(jù)相關(guān)機(jī)構(gòu)調(diào)研，2022年1-8月，語音交互功能在智能座艙的滲透率達(dá)到73.3%，百度方面則預(yù)測稱，未來智能座艙的語音交互覆蓋量還會快速拓展，到2025年會實(shí)現(xiàn)超過95%的搭載。

不過當(dāng)前，智能座艙的語音交互更多是命令式的交互工具，并且系統(tǒng)功能單一，交互系統(tǒng)毫無智能可言。大模型的落地，則帶來了全新的可能性，有望推動座艙語音助手向“AI智能助手”升級。

就此，百度Apollo正式推出國內(nèi)首個(gè)基于文心大模型在車載場景下的探索成果。據(jù)介紹，基于文心大模型能力，百度Apollo針對車載場景進(jìn)行專項(xiàng)訓(xùn)練和模型精調(diào)，無需人工數(shù)據(jù)標(biāo)注，AI便會具備更出色的語言理解和學(xué)習(xí)能力。

例如，在出行場景中，小度車載語音可以幫用戶進(jìn)行旅途行程規(guī)劃、沿途景點(diǎn)美食推薦。在家庭出行時(shí)，靈感畫畫可起到給兒童娛樂陪伴的作用。只需用一句話描述想要的畫作內(nèi)容，AI即可在幾秒內(nèi)按照完成一幅創(chuàng)意畫作。

同時(shí)，百度也在探索如何借助文心大模型能力重塑個(gè)性化駕駛空間。在未來，百變?nèi)嗽O(shè)功能可針對不同場景和不同用戶特點(diǎn)、偏好，定制個(gè)性化的語音助手人設(shè)，與用戶進(jìn)行情感化交流。用戶也可以擁有一個(gè)用車顧問，拋棄陳舊的產(chǎn)品說明書，用戶可以隨時(shí)隨地、詳細(xì)了解車輛功能。

此外，大模型融入智艙場景后，百度Apollo智艙也將演變?yōu)椤暗谌羁臻g”的核心載體。可以依托語音助手完成朋友圈文案撰寫、沿途景色拍照并一鍵發(fā)送至手機(jī)，也可以在開車途中讓語音助手完成一天的日程安排和會議預(yù)定等等。

據(jù)介紹，在未來，大模型加持下的智艙將具備出行場景對話式交互、邏輯推理、策略規(guī)劃和知識問答等多項(xiàng)能力，讓車內(nèi)助手在未來有能力像真人一樣跟用戶交流，可以理解并滿足用戶在車內(nèi)場景的深層次需求。

“未來基于文心大模型的能力，車?yán)锼薪换タ梢杂米匀徽Z言的方式進(jìn)行，而不是以點(diǎn)擊頁面然后跳轉(zhuǎn)的邏輯進(jìn)行交互，這是大模型給未來車機(jī)交互體驗(yàn)帶來的非常大的變化?！毙旒文媳硎?，“用戶直接表達(dá)需求，系統(tǒng)根據(jù)分析和理解，調(diào)動應(yīng)用資源進(jìn)行需求滿足。這將改變?nèi)伺c應(yīng)用、甚至人與車之間的關(guān)系?！?/p>

技術(shù)推動變革

身處汽車行業(yè)劇變的時(shí)代，智能化成為汽車品牌差異化的重要因素，而智艙是當(dāng)前階段用戶最容易有感知的智能汽車配置。

百度智能座艙產(chǎn)品由小度車載SDK及小度車載OS構(gòu)成。官方數(shù)據(jù)顯示，百度Apollo始終助力OEM打造智能化競爭優(yōu)勢，其汽車智能化解決方案已在31個(gè)汽車品牌的134個(gè)車型上實(shí)現(xiàn)量產(chǎn)，累計(jì)搭載超700萬輛。

同時(shí)，考慮到車企希望進(jìn)行個(gè)性化、定制化而非千篇一律的體驗(yàn)，希望形成自身的品牌調(diào)性，因而百度進(jìn)一步推出了小度車載SDK，從而讓車企實(shí)現(xiàn)差異化設(shè)計(jì)。

其中，在小度車載語音SDK方面，百度Apollo已經(jīng)實(shí)現(xiàn)了最新的技術(shù)升級，使其變得更加智能化和易用。

基于大模型本地化，小度車載語音SDK持續(xù)推動座艙極致交互體驗(yàn)?！八^的大模型本地化，是指將云端參數(shù)非常大的模型通過蒸餾和裁剪的方式，把整個(gè)體積和運(yùn)行資源占用變得更小，然后移動到端上，利用本地化的算力去進(jìn)行加速運(yùn)行，從而帶來更極致的語音交互體驗(yàn)?！毙旒文辖忉尫Q。

具體而言，小度車載語音能夠?qū)崿F(xiàn)流暢的免喚醒多路同時(shí)交互、全頁面所見所說、全域毫秒級響應(yīng)，讓用戶像是擁有了一個(gè)隨時(shí)待命的私人助理。

尤其值得注意的是，小度車載語音還能夠?qū)崿F(xiàn)真多路同時(shí)對話能力，最大支持8路同時(shí)交互精確處理，覆蓋整個(gè)座艙內(nèi)外，可以實(shí)現(xiàn)多路同時(shí)、快速、連續(xù)對話的極限挑戰(zhàn)。坐在駕駛位、副駕駛位、和后排的每一個(gè)人都可以同時(shí)提出自己的訴求，語音助手不僅可以識別不同位置用戶的需求并且可以依次解決。

此外，小度車載語音還實(shí)現(xiàn)了全領(lǐng)域毫秒級響應(yīng)，且通過自動識屏方式實(shí)現(xiàn)用戶全場景的語音交互體驗(yàn)。“車?yán)锼械墓δ芏伎梢哉Z音交互，而不是只在某些應(yīng)用里面才能交互，這在我們行業(yè)上是非常大的改變?！毙旒文媳硎尽?/p>

在徐嘉南看來，大語言模型正在推動行業(yè)走向真正的對話式交互，而它也將帶來用戶及產(chǎn)業(yè)層面的深刻變革。

從用戶層面而言，隨著通用語言模型置入設(shè)備中，其能夠在不同場景下化身不同類型的助手，并解決用戶的專業(yè)問題。從產(chǎn)業(yè)層面來看，車企未來在進(jìn)行語音交互功能開發(fā)時(shí)，也將從儲備語音開發(fā)人員進(jìn)行具體功能設(shè)計(jì)，到配備提示詞工程師進(jìn)行大模型調(diào)教，訓(xùn)練車機(jī)更好地響應(yīng)用戶需求。

而想要達(dá)到這樣的變革，就需要堅(jiān)實(shí)的技術(shù)支撐?！鞍俣仍谡麄€(gè)行業(yè)內(nèi)擁有深刻的AI技術(shù)積累，擁有全棧自研的AI架構(gòu)，從底層芯片的昆侖芯，到上層深度學(xué)習(xí)框架飛槳，再到AI大模型層，我們能夠基于文心大模型的能力實(shí)現(xiàn)用戶及車企所需要的體驗(yàn)?！毙旒文媳硎?。

（文章來源：21世紀(jì)經(jīng)濟(jì)報(bào)道）

標(biāo)簽：