小鵬的“全語音車載系統”最近很火。
我經常被問,“你去試過,到底怎麼樣 “?
不吹不黑的回答:
雖然還有一些小問題和小BUG,但小鵬P7的車載語音互動體驗,已經做到了目前全行業最強,沒有之一。
強在哪?為什麼強?強有什麼意義?
表面看單純語音技術的事情,其實往深了看,很有意思。我們繼續說。
強在哪?
最直觀的,是強在體驗。
這點之前很多文章裡都提到了,就不復讀了,我簡單總結兩點:
第一:它越來越像真人;
雖然這兩年很多車機的語音系統都已經做的不錯,但使用者在下達語音指令時,還是會明顯感覺到一種“和機器講話的感覺“,機器沒我聰明,也經常領會不到我的真實意圖。
比如,每次喚醒語音系統後,我只能下達一個指令。
例如“幫我導航到XXX“,系統此時最多會給你選擇幾條路線,問你”要選第幾個“,我選擇之後,開始執行導航。但如果我還想開啟喜歡聽的歌,關閉導航音量,順便把對著我吹的空調換個方向,車機基本都是懵逼的。
這時候,小鵬的“全語音車載系統”就體現出能力了。
它支援“連續對話“和“語義打斷”,在20秒內可以連續接收多個指令。
一方面不用每執行完一個指令,就得很麻煩
的
再次“你好小P”喚醒;另一方面可以在其執行上一個指令時,直接開始下一個指令的下達。
另外,很多車機的語音系統還有一個痛點,當然也是難點。比如喚醒語音識別並下達指令後,副駕駛的人突然接了一個電話,叨叨了一大堆,這時候車機也會懵逼,因為“它無法知道哪些話要識別,哪些話不要識別”。
就好像人一樣,“知道哪些話是對我說的,是需要我回答的,哪些話是不關我事情的”,這個對機器而言很難。
但我體驗的過程中發現,小P在這點上已經做的很強了。比如喚醒語音系統後,我和小夥伴在車上閒聊天,它都會識別出來,但不會作出反應。如果在聊天的過程中,我突然插入一句“關閉空調”,車機卻會很快反應並執行。
左上角的“廢話”,小P會識別但不會做執行動作
還有一點很重要,小鵬的語音能力已經支援一定程度的“盲想”。
和之前必須按照固定詞彙給車機下指令不同,我在小鵬P7上可以比較自由提出自己的需求,例如我想調節駕駛模式,不需要所調節到“運動、舒適、節能”,只需要直接說”我想調下駕駛模式“,小鵬就可以很好的理解你的意圖,給出可以調的選項。甚至,我可以直接透過語音來調節車艙內音響聲源的位置。
透過語音控制車艙音源位置
類似的例子還有很多,我們之後會找時間做一個影片,幫大家更直觀的理解,小鵬的車機語音是如何“更像人”的。
第二:它比真人做的更好;
這體現在一些精準操控上。比如我可以說:
“小P,把車窗開到1%,開到81%”;
“小P,讓歌曲前進 20 秒,後退1秒“;
這個很驚豔,我們自己是絕對沒法把這些操控拿捏到如此精準的。不過,是不是有點技術過度的嫌疑,調那麼精準有什麼用?彆著急,最後會聊到。
為什麼強?
先來回答第二個問題,為什麼小鵬的“全語音車載系統”能做到這麼強?
技術問題不多聊了。因為事實上,各家的技術差異並不算那麼大,車企本身的技術投入,加上供應商的能力不斷提升,以及行業人才的流動,讓包括語音識別、語意理解、機器學習等核心技術在這兩三年突飛猛進。因此客觀來說,理論上小鵬的“全語音車載系統”,只要別的車企想做,也不是沒有可能做到的。
那麼,為什麼是小鵬?
我覺得首先是態度問題。
從品牌和產品的標籤來看,小鵬是押注“智慧化”的。這就產生了一種情況,
例如語音團隊這種與智慧化有關體驗背後的產品和技術團隊,在公司內部資源的整合和調動能力上,是擁有足夠的話語權的。
這個很重要。因為我們要知道,語音技術本身的強弱,並不絕對消費者體驗的好壞。每一項語音指令,都對應一項或幾項功能,這些功能的體驗,決定了消費者整體的感知。小鵬的語音團隊,需要完成任何一項體驗的最佳化,都需要進行跨部門的溝通和協作,但凡不是自上而下的重視,那麼在專案推進中,輕則優先順序排後,重則擱淺。這是在大公司待過的小夥伴都明白的事情。
據我所知,目前小鵬的語音能力已經解決了“能不能”的問題,可以簡單理解為,只要想做,那麼語音這層能力可以疊加到任何可操作的整車軟硬體上。
目前小鵬的語音團隊更多思考的是“要不要”的問題,要不要讓語音控制某個功能,控制到什麼程度,甚至是否符合人性?
舉個簡單的例子,目前小鵬的語音控制還不支援後視鏡的調節,但不是因為做不到,是因為考慮到使用者體驗的方便程度和調節角度和對應的體驗無法資料標準化的問題,小鵬暫時沒有去做。很明顯,這方面小鵬已經超前了。
考慮“要不要”問題,小鵬沒讓語音直接調節鏡調節
其次,是公司整體的能力問題。
剛剛說了,語音體驗要做好,核心還包括語音控制的服務和功能能否一起做好。
這不僅僅涉及公司內部,也涉及外部供應商的掌控和調動能力,包括導航、音樂、影片等等,不僅僅是直接把手機版的APP搬上車,而是車載端最佳化,再匹配好相應的語音呼叫邏輯。
兩三年前,小鵬從品牌到產品都才起步,銷量也不夠,因此對這塊的供應商吸引力有限。但現在,除了何小鵬本身在網際網路圈的資源呼叫能力外,不斷上漲的銷量和股價,都在合作的過程中增加了籌碼。“你覺得未來我能行麼?如果行,那還不趕緊一起好好幹”?
有什麼意義?
可能有很多人會質疑:
小鵬的“全語音車載系統”,是不是技術過度了?
畢竟大機率不會有使用者,上車硬是要把“車窗開啟到81%”,更不需要“把車窗關小1%”。
那麼,這些功能,是不是太過炫技而沒有實用價值了?我更願意站在整體的角度去思考這個問題。
我曾問過身邊一些將小鵬P7列出購買列表,或者已經買了小鵬P7的朋友和群友。
他們都一個很明顯的共同點:心態年輕、願意接受新的事物、對新科技敏感。從使用者屬性來看,他們和特斯拉Mode 3的潛客是更相近的一群人,和比亞迪漢EV使用者相對實用主義的心態不太一樣。
對於這群人來說,小鵬的“全語音車載系統”,像極了iphone X剛推出時的Face ID。
當朋友、尤其是想追的姑娘坐上你的小鵬P7,你對它說“來一個‘變形模式’,把車窗開啟到81%,讓空調不要對著人吹”,然後看著它一項項的執行完成。
那種感覺,就好像三年前你在一群人好奇的眼光中演示Face ID刷臉登陸一樣,儘管用指紋、用密碼都能登陸,但當手機成功人臉識別並登陸後,那種快樂懂的人都懂。
產品帶給人的滿足感和優越感,不恰恰就在這些細節上麼?