專訪聆心智慧黃民烈：ChatGPT全球矚目，「烏托邦」實現人格化AI互動

在科幻愛情電影《她》中，好萊塢女演員斯嘉麗·約翰遜僅憑聲音演繹出風情萬種的AI女神，與後來憑藉《小丑》獲得金球獎最佳男主角的華金·菲尼克斯展開了一場蕩氣迴腸的‘人機戀’。人工智慧與人的無障礙互動和共情在電影上映的2013年還顯得如此遙遠，在當下卻與現實無比接近。

2022年，由清華大學計算機系孵化的AI初創企業聆心智慧面向市場推出新產品—「AI烏托邦」，使用者可選擇與梅西、馬斯克、于謙、愛因斯坦、甄嬛等跨次元跨時空名人聊天，也可與程式設計師、心理諮詢師、算命先生等群體屬性的角色交流，還可透過文字描述“捏出”自己想要的AI‘朋友’。

不同於遊戲NPC只能嚴格按系統設定的規則行事，AI烏托邦中的角色‘擁有人格’——它們能夠基於演算法賦予的基本性格設定，在與外界互動的過程中不斷收集資訊，填充自身的‘認知與價值觀’，並保持改變和成長——這與‘忒休斯之船’探討的身份認同問題邊界已相當模糊。

最近，火爆全網的ChatGPT再次引發各方思考：AI的智慧水平已達到何種高度？人工智慧是否可能擁有‘人格’甚至‘靈魂’？高度智慧化的AI與人之間如何相處？透過‘人格化AI’想要打造何種圖景？帶著這些問題，EqualOcean採訪了聆心智慧創始人、清華大學計算機科學與技術系副教授黃民烈。

黃教授是自然語言生成領域的資深專家，他創辦的聆心智慧開創了人工智慧在心理健康領域的前沿應用，已推出AI情緒療愈機器人Emohaa，並與知名精神心理平臺好心情達成合作。此番黃教授團隊推出「AI烏托邦」，再將AI在各行業的應用可能性推上新臺階。雖然目前產品還處於雛形階段，但聆心智慧正在加快迭代玩法豐富度和使用者體驗感，並在積極尋求可落地的商業解決方案。

開放域類人對話系統——AIGC的一小步，人機協同的一大步

EqualOcean：請黃教授介紹一下主要的研究方向。

黃民烈：當下AIGC熱度很高，我們按照智慧水平將AIGC分為感知智慧、認知智慧和AGI。感知智慧透過類人五感如聽覺、視覺、嗅覺等實現，形式包括語音生成、影象影片生成、音樂生成等。達到認知智慧則需要AI具備語言和推理能力，具象表現為能夠續寫、改錯、創作故事小說、生成對話等。

自然語言生成屬於‘認知智慧’範疇，是我過去十多年的研究方向。在自然文字語言生成的基礎上，我們新推出的「AI烏托邦」又可細分為‘對話生成’。對話生成在整個人工智慧發展史上具有獨特的地位，從圖靈測試開始，科學家就將‘計算機是否能與人無障礙對話’作為判定其是否具有人類智慧的標準。用學界的話來說，自然語言處理是人工智慧皇冠上的明珠，開放域類人對話系統則是認知智慧的巔峰。

在AIGC達到高度智慧水平時，將能實現無障礙的人機互動與人機協同，可被用於遊戲、虛擬導購、情感陪伴、數字人、品牌營銷、元宇宙等場景。

EqualOcean：聆心智慧為什麼從心理健康領域拓展到日常應用？

黃民烈：「AI烏托邦」是對此前心理健康產品的傳承和發展。聆心智慧在心理健康領域積累了超百億高質量訓練資料，超30億模型引數量，構建了源自心理學最大最全的意圖和策略庫，甚至在臨床上取得了顯著的心理治療效果，這些成果是可以複用到「AI烏托邦」的產品開發中的。

「AI烏托邦」裡也有‘心理諮詢師’角色，但相比於正統的心理諮詢，TA是憑藉專業知識、以朋友的交流方式給使用者提供心理陪伴，進行‘情感按摩’。我們希望「AI烏托邦」裡的每個角色是‘鮮活的’—能夠在與使用者的深度交流中傳達獨特的態度，並與使用者建立起情感連結，最終達到‘萬物有靈、萬物皆角’的境界。

「AI烏托邦」只是對話生成的一小步，我們想描繪的更大願景是‘人與機器在各種場景下和諧共存’，而實現這一願景的重要前提是人與機器之間能夠進行無障礙的溝通。在起步階段，我們嘗試在心理健康領域為AI植入‘靈魂’，在「AI烏托邦」中這個範圍拓寬了，未來還將應用到更多場景，比如遊戲、電影、動漫、數字人、社交、教育、家居、出行、生活等。

圖為「AI烏托邦」網頁和微信小程式介面

EqualOcean：「AI烏托邦」下一階段的開發計劃是什麼？

黃民烈：我們將在產品中融入更多玩法，豐富使用者的互動和社交體驗。比如我們可以新增語音合成功能，讓使用者和‘AI朋友’語音交流；可以新增文生圖甚至文生影片功能，使得使用者的‘AI寵物’更加活靈活現；還可以增強社交屬性，方便使用者將自己與AI的交流分享到社群或社交媒體平臺，甚至多位使用者共同打造一個AI角色。同時，我們還將推出開發者社群，允許更多使用者參與共創。作為一家硬實力過關的公司，我們可以在AI的技術底座上發掘多種多樣的應用可能性，核心是我們能夠給AI賦予‘靈魂’。

「AI烏托邦」現在處於雛形階段，我們計劃將其打造成有特色的網際網路產品。同時，聆心智慧團隊裡有很多心理背景的同學，基於他們對使用者心理的深刻洞察，我們的產品更能在未來的迭代過程中把握使用者的深層心理需求、並不斷與使用者產生心靈的共鳴。這種深度使用者粘性將持續為「AI烏托邦」提供動力。

EqualOcean：「AI烏托邦」的產品迭代週期是怎樣的？

黃民烈：基本遵循網際網路產品的迭代模式。我們自研一套成熟的模型和框架，支援快速研發新角色，我們希望在角色供給的多樣性、有趣性方面形成持續迭代，同時開放給使用者更多玩法，讓使用者參與更多的角色創作。

從科學家到創業者——以技術為地基，以使用者為導向

EqualOcean：當您的角色從科學家轉變為創業者，您是否慎重考慮過技術如何變為產品、產品如何產生盈利？

黃民烈：作為連續創業者，我們瞭解技術到產品需要經歷的發展階段。學術界非常強調創新力，到了商業界，創新力依然構成核心競爭力之一。但做出好產品的過程是‘多線敘事’，在創新力的基礎上還要能洞察使用者需求，抓住市場機會，合理匹配資源，調動團隊，還要保障產品能落地—這實際上更像是一個工程問題。

現階段我們還是聚焦在技術打磨和產品的場景跑通。在技術過硬的基礎上我們的變現路徑非常暢通，我們已經透過定製化方式給一些品牌及IP輸出了AI互動能力，這在當下給我們輸入了一些算力，未來這部分是可以透過API呼叫的方式大規模訂閱收費的。隨著「AI烏托邦」不斷最佳化、聚集到更多深度使用者，也可以吸引品牌方和廣告主來平臺進行投放營銷，或向用戶開放增值付費服務。

從根本邏輯上，我們要做的是基礎設施，這和專注於提供ToB解決方案的AI公司不一樣。未來我們會向平臺的方向發展，不論C端使用者還是B端品牌方都可以在我們的AI烏托邦裡找到好玩、有價值的點。

EqualOcean：透過「AI烏托邦」這款階段性產品可以看出，聆心智慧的對話生成技術已經相當成熟、達到應用水平了。目前在技術整合到其他廠商的應用這方面有進展嗎？

黃民烈：在過去的一年多里，我們已經同一些遊戲廠商和車廠落地了深度合作專案，基於聆心智慧的對話生成技術為品牌定製開發AI角色。透過合作粉絲基數龐大的知名IP，也能對聆心智慧的AI互動平臺起到引流作用。

聆心智慧的對話生成技術已經處在世界領先水平，在紮實的技術基礎之上，商業變現的想象空間非常大。核心還是在於我們能為使用者搭建低門檻、高自由度、高可玩性的人工智慧對話平臺，給使用者帶來足夠好的體驗。

EqualOcean：聆心智慧團隊中的演算法開發人員和產品開發人員是如何配合的？

黃民烈：我們內部分為前、中、後臺。前臺就是產品的使用介面，中臺是資料庫系統和框架，後臺是支援性工具，包括資料製作、運維分析等，各部分一以貫之。演算法團隊負責關鍵模型和演算法的研發，並保障框架的能力。產品側的需求會反映在模型迭代和資料更新上。

遠見者將不停思考下一時代的根本性問題

EqualOcean：最近大火的ChatGPT強在何處？

黃民烈：首先，ChatGPT具有強大的基座模型能力。過去幾年 GPT-3 的能力得到了快速提升，OpenAI 建立了使用者、資料和模型之間的飛輪。實踐證明，開源模型的能力已經遠遠落後於平臺公司所提供的 API 能力，因為開源模型無法持續獲取使用者資料以對模型進行改進。

其次，ChatGPT在真實呼叫資料上的 Fine-tune，確保了資料的質量和多樣性，使得模型能從人類反饋中學習。雖然ChatGPT的模型架構InstructGPT 的訓練資料量不大，全部加起來也只是10 萬量級，但是資料質量（well-trained AI 訓練師）和資料多樣性非常高。而最重要的是，這些資料是來自真實世界呼叫的資料，而非學術界慣常追求的自然語言處理的‘benchmark’。

此外，ChatGPT能夠從‘兩兩比較的資料’中學習，這對強化學習而言意義重大。如果對單個生成結果進行打分，標註者主觀性帶來的偏差很大，無法給出精確的獎勵值。在強化學習裡面，獎勵值差一點，最後訓練的策略就差很遠。而對於多個結果進行排序和比較，相對就容易做很多。這種比較式的評估方法，在很多語言生成任務的評價上也被廣泛採用。

EqualOcean：OpenAI的研究將給國內的人工智慧產學研界帶來什麼啟示？

黃民烈：我總結為以下五點：1。以 OpenAI 為代表的 AI 3。0在走一條跟過去 AI 浪潮不一樣的路。這條路更落地、更接近真實世界，在工業應用上也更直接，更落地。從學術研究到工業落地的路徑被縮短、加快；

2。像OpenAI這樣有底層 AI 能力、有使用者資料呼叫的平臺公司更能引領 AI 的未來，透過“使用者呼叫→資料→模型迭代→更多使用者”的正迴圈機制，強者恆強；

3。有價值的研究需要更多思考真實使用者的需求和場景，目前學術界不停追求‘在benchmark 刷榜’是對資源的浪費。從benchmark的角度來說，instructGPT的效能並沒有很厲害甚至有退化，但在真實呼叫資料上表現亮眼，這說明了學術圈的 benchmark離真實世界很遙遠，不利於 AI 研究的落地。因此，更開放、更共享的工業資料，也是未來我們應該努力的方向；

4。 AI與人無縫互動的時代即將來臨，現階段的對話生成能力已經使得將對話互動作為一個基本入口成為可能，過去所說的 conversation as a platform/service 不是夢。但有人說“ChatGPT將替代Google”，我覺得還有點遙遠，更多是作為對當前搜尋服務非常好的補充和增益；

5。致力於更有用（helpful）、更可信（truthful）、更安全（harmless）的AI 研究和應用，應該是學術界和工業界共同努力的方向。有用，是指AI研究成果應用於解決真實世界的問題，滿足使用者的真正需求；可信，是指AI模型能夠產生令人信任的結果，知其所知，也知其所不知（這很難）；安全，是指模型有價值觀、符合社會倫理規範，能夠產生安全、無偏見的結果。

EqualOcean：在您看來，未來人與AI將是何種關係？

黃民烈：我相信，人與AI和諧共融的社會一定會到來。這有兩項前置條件：第一是低成本的服務機器人走進千家萬戶；二是人與AI能進行無障礙交流。促成人與AI無障礙交流是一場開啟於1950年‘圖靈測試’的遠大征程，也是聆心智慧的使命。如今，這些趨勢正在照進現實，對話生成技術經多年發展已取得階段性突破。

在人與AI和諧共融的新正規化中，AI將同樣具有生命與靈魂，並扮演獨特的社會角色，我們稱之為‘AI-being’。具有人格系統、注意力系統、表達系統、情感系統、學習成長系統、認知和思維繫統的AI -being不僅將全方位輔助和服務於人類，更將與人類共同成長，達成我們的願景—Making AI-beings Accessible Anytime Anywhere。這就需要人類在與AI互動的過程中，教導AI，訓練AI，受益於AI，使AI愈發有靈性。

EqualOcean：AI一旦擁有生命，會否與人類產生分歧？

黃民烈：對話式的互動人工智慧經歷了規則時代‘Rule-Based Era’，逐步發展到‘Smart Assistant Era’乃至‘Deep Learning Era’，但未來AI可能擁有自主意識—也就是我們說的“生命和靈魂”。從技術的角度說，AI的心理模型將能夠動態變化，達成自主學習和成長。

關於AI的倫理爭論演變已久，最知名的解決方案當屬科幻作家阿西莫夫提出的“機器人三原則”。借鑑這一框架，我們可以在AI成長進化的過程中為其設定約束，‘教導’AI要遵循特定的行為原則和規範，就像人在成長過程中同樣要習得社會交往的道德準則，不去觸碰邊界和違反規則。

百聞網

專訪聆心智慧黃民烈：ChatGPT全球矚目，「烏托邦」實現人格化AI互動

相關文章