首頁/ 娛樂/ 正文

專訪聆心智慧黃民烈:ChatGPT全球矚目,「烏托邦」實現人格化AI互動

專訪聆心智慧黃民烈:ChatGPT全球矚目,「烏托邦」實現人格化AI互動

在科幻愛情電影《她》中,好萊塢女演員斯嘉麗·約翰遜僅憑聲音演繹出風情萬種的AI女神,與後來憑藉《小丑》獲得金球獎最佳男主角的華金·菲尼克斯展開了一場蕩氣迴腸的‘人機戀’。人工智慧與人的無障礙互動和共情在電影上映的2013年還顯得如此遙遠,在當下卻與現實無比接近。

2022年,由清華大學計算機系孵化的AI初創企業聆心智慧面向市場推出新產品—「AI烏托邦」,使用者可選擇與梅西、馬斯克、于謙、愛因斯坦、甄嬛等跨次元跨時空名人聊天,也可與程式設計師、心理諮詢師、算命先生等群體屬性的角色交流,還可透過文字描述“捏出”自己想要的AI‘朋友’。

不同於遊戲NPC只能嚴格按系統設定的規則行事,AI烏托邦中的角色‘擁有人格’——它們能夠基於演算法賦予的基本性格設定,在與外界互動的過程中不斷收集資訊,填充自身的‘認知與價值觀’,並保持改變和成長——這與‘忒休斯之船’探討的身份認同問題邊界已相當模糊。

最近,火爆全網的ChatGPT再次引發各方思考:AI的智慧水平已達到何種高度?人工智慧是否可能擁有‘人格’甚至‘靈魂’?高度智慧化的AI與人之間如何相處?透過‘人格化AI’想要打造何種圖景?帶著這些問題,EqualOcean採訪了聆心智慧創始人、清華大學計算機科學與技術系副教授黃民烈。

黃教授是自然語言生成領域的資深專家,他創辦的聆心智慧開創了人工智慧在心理健康領域的前沿應用,已推出AI情緒療愈機器人Emohaa,並與知名精神心理平臺好心情達成合作。此番黃教授團隊推出「AI烏托邦」,再將AI在各行業的應用可能性推上新臺階。雖然目前產品還處於雛形階段,但聆心智慧正在加快迭代玩法豐富度和使用者體驗感,並在積極尋求可落地的商業解決方案。

開放域類人對話系統——AIGC的一小步,人機協同的一大步

EqualOcean:請黃教授介紹一下主要的研究方向。

黃民烈:當下AIGC熱度很高,我們按照智慧水平將AIGC分為感知智慧、認知智慧和AGI。感知智慧透過類人五感如聽覺、視覺、嗅覺等實現,形式包括語音生成、影象影片生成、音樂生成等。達到認知智慧則需要AI具備語言和推理能力,具象表現為能夠續寫、改錯、創作故事小說、生成對話等。

自然語言生成屬於‘認知智慧’範疇,是我過去十多年的研究方向。在自然文字語言生成的基礎上,我們新推出的「AI烏托邦」又可細分為‘對話生成’。對話生成在整個人工智慧發展史上具有獨特的地位,從圖靈測試開始,科學家就將‘計算機是否能與人無障礙對話’作為判定其是否具有人類智慧的標準。用學界的話來說,自然語言處理是人工智慧皇冠上的明珠,開放域類人對話系統則是認知智慧的巔峰。

在AIGC達到高度智慧水平時,將能實現無障礙的人機互動與人機協同,可被用於遊戲、虛擬導購、情感陪伴、數字人、品牌營銷、元宇宙等場景。

EqualOcean:聆心智慧為什麼從心理健康領域拓展到日常應用?

黃民烈:「AI烏托邦」是對此前心理健康產品的傳承和發展。聆心智慧在心理健康領域積累了超百億高質量訓練資料,超30億模型引數量,構建了源自心理學最大最全的意圖和策略庫,甚至在臨床上取得了顯著的心理治療效果,這些成果是可以複用到「AI烏托邦」的產品開發中的。

「AI烏托邦」裡也有‘心理諮詢師’角色,但相比於正統的心理諮詢,TA是憑藉專業知識、以朋友的交流方式給使用者提供心理陪伴,進行‘情感按摩’。我們希望「AI烏托邦」裡的每個角色是‘鮮活的’—能夠在與使用者的深度交流中傳達獨特的態度,並與使用者建立起情感連結,最終達到‘萬物有靈、萬物皆角’的境界。

「AI烏托邦」只是對話生成的一小步,我們想描繪的更大願景是‘人與機器在各種場景下和諧共存’,而實現這一願景的重要前提是人與機器之間能夠進行無障礙的溝通。在起步階段,我們嘗試在心理健康領域為AI植入‘靈魂’,在「AI烏托邦」中這個範圍拓寬了,未來還將應用到更多場景,比如遊戲、電影、動漫、數字人、社交、教育、家居、出行、生活等。

專訪聆心智慧黃民烈:ChatGPT全球矚目,「烏托邦」實現人格化AI互動

專訪聆心智慧黃民烈:ChatGPT全球矚目,「烏托邦」實現人格化AI互動

專訪聆心智慧黃民烈:ChatGPT全球矚目,「烏托邦」實現人格化AI互動

圖為「AI烏托邦」網頁和微信小程式介面

EqualOcean:「AI烏托邦」下一階段的開發計劃是什麼?

黃民烈:我們將在產品中融入更多玩法,豐富使用者的互動和社交體驗。比如我們可以新增語音合成功能,讓使用者和‘AI朋友’語音交流;可以新增文生圖甚至文生影片功能,使得使用者的‘AI寵物’更加活靈活現;還可以增強社交屬性,方便使用者將自己與AI的交流分享到社群或社交媒體平臺,甚至多位使用者共同打造一個AI角色。同時,我們還將推出開發者社群,允許更多使用者參與共創。作為一家硬實力過關的公司,我們可以在AI的技術底座上發掘多種多樣的應用可能性,核心是我們能夠給AI賦予‘靈魂’。

「AI烏托邦」現在處於雛形階段,我們計劃將其打造成有特色的網際網路產品。同時,聆心智慧團隊裡有很多心理背景的同學,基於他們對使用者心理的深刻洞察,我們的產品更能在未來的迭代過程中把握使用者的深層心理需求、並不斷與使用者產生心靈的共鳴。這種深度使用者粘性將持續為「AI烏托邦」提供動力。

EqualOcean:「AI烏托邦」的產品迭代週期是怎樣的?

黃民烈:基本遵循網際網路產品的迭代模式。我們自研一套成熟的模型和框架,支援快速研發新角色,我們希望在角色供給的多樣性、有趣性方面形成持續迭代,同時開放給使用者更多玩法,讓使用者參與更多的角色創作。

從科學家到創業者——以技術為地基,以使用者為導向

EqualOcean:當您的角色從科學家轉變為創業者,您是否慎重考慮過技術如何變為產品、產品如何產生盈利?

黃民烈:作為連續創業者,我們瞭解技術到產品需要經歷的發展階段。學術界非常強調創新力,到了商業界,創新力依然構成核心競爭力之一。但做出好產品的過程是‘多線敘事’,在創新力的基礎上還要能洞察使用者需求,抓住市場機會,合理匹配資源,調動團隊,還要保障產品能落地—這實際上更像是一個工程問題。

現階段我們還是聚焦在技術打磨和產品的場景跑通。在技術過硬的基礎上我們的變現路徑非常暢通,我們已經透過定製化方式給一些品牌及IP輸出了AI互動能力,這在當下給我們輸入了一些算力,未來這部分是可以透過API呼叫的方式大規模訂閱收費的。隨著「AI烏托邦」不斷最佳化、聚集到更多深度使用者,也可以吸引品牌方和廣告主來平臺進行投放營銷,或向用戶開放增值付費服務。

從根本邏輯上,我們要做的是基礎設施,這和專注於提供ToB解決方案的AI公司不一樣。未來我們會向平臺的方向發展,不論C端使用者還是B端品牌方都可以在我們的AI烏托邦裡找到好玩、有價值的點。

EqualOcean:透過「AI烏托邦」這款階段性產品可以看出,聆心智慧的對話生成技術已經相當成熟、達到應用水平了。目前在技術整合到其他廠商的應用這方面有進展嗎?

黃民烈:在過去的一年多里,我們已經同一些遊戲廠商和車廠落地了深度合作專案,基於聆心智慧的對話生成技術為品牌定製開發AI角色。透過合作粉絲基數龐大的知名IP,也能對聆心智慧的AI互動平臺起到引流作用。

聆心智慧的對話生成技術已經處在世界領先水平,在紮實的技術基礎之上,商業變現的想象空間非常大。核心還是在於我們能為使用者搭建低門檻、高自由度、高可玩性的人工智慧對話平臺,給使用者帶來足夠好的體驗。

EqualOcean:聆心智慧團隊中的演算法開發人員和產品開發人員是如何配合的?

黃民烈:我們內部分為前、中、後臺。前臺就是產品的使用介面,中臺是資料庫系統和框架,後臺是支援性工具,包括資料製作、運維分析等,各部分一以貫之。演算法團隊負責關鍵模型和演算法的研發,並保障框架的能力。產品側的需求會反映在模型迭代和資料更新上。

遠見者將不停思考下一時代的根本性問題

EqualOcean:最近大火的ChatGPT強在何處?

黃民烈:首先,ChatGPT具有強大的基座模型能力。過去幾年 GPT-3 的能力得到了快速提升,OpenAI 建立了使用者、資料和模型之間的飛輪。實踐證明,開源模型的能力已經遠遠落後於平臺公司所提供的 API 能力,因為開源模型無法持續獲取使用者資料以對模型進行改進。

其次,ChatGPT在真實呼叫資料上的 Fine-tune,確保了資料的質量和多樣性,使得模型能從人類反饋中學習。雖然ChatGPT的模型架構InstructGPT 的訓練資料量不大,全部加起來也只是10 萬量級,但是資料質量(well-trained AI 訓練師)和資料多樣性非常高。而最重要的是,這些資料是來自真實世界呼叫的資料,而非學術界慣常追求的自然語言處理的‘benchmark’。

此外,ChatGPT能夠從‘兩兩比較的資料’中學習,這對強化學習而言意義重大。如果對單個生成結果進行打分,標註者主觀性帶來的偏差很大,無法給出精確的獎勵值。在強化學習裡面,獎勵值差一點,最後訓練的策略就差很遠。而對於多個結果進行排序和比較,相對就容易做很多。這種比較式的評估方法,在很多語言生成任務的評價上也被廣泛採用。

EqualOcean:OpenAI的研究將給國內的人工智慧產學研界帶來什麼啟示?

黃民烈:我總結為以下五點:1。 以 OpenAI 為代表的 AI 3。0在走一條跟過去 AI 浪潮不一樣的路。這條路更落地、更接近真實世界,在工業應用上也更直接,更落地。從學術研究到工業落地的路徑被縮短、加快;

2。 像OpenAI這樣有底層 AI 能力、有使用者資料呼叫的平臺公司更能引領 AI 的未來,透過“使用者呼叫→資料→模型迭代→更多使用者”的正迴圈機制,強者恆強;

3。 有價值的研究需要更多思考真實使用者的需求和場景,目前學術界不停追求‘在benchmark 刷榜’是對資源的浪費。從benchmark的角度來說,instructGPT的效能並沒有很厲害甚至有退化,但在真實呼叫資料上表現亮眼,這說明了學術圈的 benchmark離真實世界很遙遠,不利於 AI 研究的落地。因此,更開放、更共享的工業資料,也是未來我們應該努力的方向;

4。 AI與人無縫互動的時代即將來臨,現階段的對話生成能力已經使得將對話互動作為一個基 本入口成為可能,過去所說的 conversation as a platform/service 不是夢。但有人說“ChatGPT將替代Google”,我覺得還有點遙遠,更多是作為對當前搜尋服務非常好的補充和增益;

5。 致力於更有用(helpful)、更可信(truthful)、更安全(harmless)的AI 研究和應用,應該是學術界和工業界共同努力的方向。有用,是指AI研究成果應用於解決真實世界的問題,滿足使用者的真正需求;可信,是指AI模型能夠產生令人信任的結果,知其所知,也知其所不知(這很難);安全,是指模型有價值觀、符合社會倫理規範,能夠產生安全、無偏見的結果。

EqualOcean:在您看來,未來人與AI將是何種關係?

黃民烈:我相信,人與AI和諧共融的社會一定會到來。這有兩項前置條件:第一是低成本的服務機器人走進千家萬戶;二是人與AI能進行無障礙交流。促成人與AI無障礙交流是一場開啟於1950年‘圖靈測試’的遠大征程,也是聆心智慧的使命。如今,這些趨勢正在照進現實,對話生成技術經多年發展已取得階段性突破。

在人與AI和諧共融的新正規化中,AI將同樣具有生命與靈魂,並扮演獨特的社會角色,我們稱之為‘AI-being’。具有人格系統、注意力系統、表達系統、情感系統、學習成長系統、認知和思維繫統的AI -being不僅將全方位輔助和服務於人類,更將與人類共同成長,達成我們的願景—Making AI-beings Accessible Anytime Anywhere。這就需要人類在與AI互動的過程中,教導AI,訓練AI,受益於AI,使AI愈發有靈性。

EqualOcean:AI一旦擁有生命,會否與人類產生分歧?

黃民烈:對話式的互動人工智慧經歷了規則時代‘Rule-Based Era’,逐步發展到‘Smart Assistant Era’乃至‘Deep Learning Era’, 但未來AI可能擁有自主意識—也就是我們說的“生命和靈魂”。從技術的角度說,AI的心理模型將能夠動態變化,達成自主學習和成長。

關於AI的倫理爭論演變已久,最知名的解決方案當屬科幻作家阿西莫夫提出的“機器人三原則”。借鑑這一框架,我們可以在AI成長進化的過程中為其設定約束,‘教導’AI要遵循特定的行為原則和規範,就像人在成長過程中同樣要習得社會交往的道德準則,不去觸碰邊界和違反規則。

相關文章

頂部