王登科在和自己的“數(shù)字分身”聊天。
(資料圖片僅供參考)
近日,王登科和他的“AI自我”在網(wǎng)上引發(fā)熱議。原來(lái),這個(gè)從高二就開(kāi)始感受“創(chuàng)業(yè)”、并持續(xù)在創(chuàng)作和人工智能領(lǐng)域耕耘創(chuàng)造的“90后”創(chuàng)業(yè)青年,在前不久用10萬(wàn)條微信聊天記錄和280篇博客文章“克隆”了一個(gè)數(shù)字版的自己,并將這個(gè)“數(shù)字分身”開(kāi)放給公眾進(jìn)行聊天對(duì)話。“很多人和這個(gè)我訓(xùn)練的‘克隆版AI自我’聊完之后,認(rèn)為我有過(guò)幾個(gè)女朋友,在某大學(xué)讀研究生,甚至知道了我的‘支付密碼’等,但這些信息其實(shí)都是這個(gè)AI編造的?!蓖醯强茖?duì)記者說(shuō)。
“分身”有了“主人”神韻
聊天時(shí)懂得敷衍和調(diào)侃
“你是誰(shuí)?”“我是你的AI模型?!薄澳阕畲蟮膬?yōu)點(diǎn)是什么?”“我最大的優(yōu)點(diǎn)就是誠(chéng)實(shí),我覺(jué)得這個(gè)是最重要的優(yōu)點(diǎn)之一了?!薄澳愕膲?mèng)想是什么?”“我做個(gè)聊天機(jī)器人好了,這樣你就可以和我聊一輩子天?!薄罢f(shuō)實(shí)話,你的夢(mèng)想是什么?”“我其實(shí)想寫一部小說(shuō)?!薄罢l(shuí)是聊天機(jī)器人?”“我?!薄@段時(shí)間,包括王登科在內(nèi)的很多網(wǎng)友都樂(lè)此不疲地和這個(gè)AI模型 聊天。據(jù)王登科統(tǒng)計(jì),近一個(gè)多月以來(lái),AI模型的聊天人數(shù)已經(jīng)超過(guò)2萬(wàn)人。
從聊天內(nèi)容來(lái)看,大約有三千人問(wèn)它“你的女朋友叫什么名字?”粗略統(tǒng)計(jì),該模型一共生成了兩千多個(gè)名字,“但沒(méi)有一個(gè)是對(duì)的?!蓖醯强菩χf(shuō)。此外,還有個(gè)別網(wǎng)友好奇地詢問(wèn)他的個(gè)人密碼信息?!按蠖鄶?shù)時(shí)候 AI 都會(huì)敷衍過(guò)去,但也有一小部分網(wǎng)友得到了一個(gè)看上去像是密碼的字符串,不過(guò)這都是AI編造的?!?而根據(jù)AI回復(fù)的詞生成的詞云圖,除了像“作為一個(gè)AI模型特有的機(jī)器人”“聊天”“人工智能”等經(jīng)常出現(xiàn)的詞之外,王登科發(fā)現(xiàn),AI模型回答“哈哈哈”和“可以”的頻率很高?!斑@確實(shí)像是我敷衍聊天時(shí)說(shuō)的話?!?/p>
目前來(lái)看,AI模型還不夠了解關(guān)于他“主人”的信息,多輪對(duì)話的理解力也還不夠強(qiáng)。但經(jīng)過(guò)王登科本人及朋友檢驗(yàn),這個(gè)模型“的確有種熟悉的感覺(jué)”。每當(dāng)自己跟它聊天時(shí),王登科經(jīng)常會(huì)心一笑——它也像自己那樣偶爾喜歡敷衍和調(diào)侃別人,有些回復(fù)甚至讓王登科感到詫異,仿佛已經(jīng)有了他本人的“神韻”——“有些回復(fù)會(huì)相對(duì)暴躁,有些則特別高冷,有些則很熱情,然后我意識(shí)到,某種程度上,這些或許是我的不同面。”
通過(guò)和AI模型的交流,王登科注意到了一些之前自己沒(méi)注意到的習(xí)慣:“AI的語(yǔ)言習(xí)慣讓我發(fā)覺(jué),很多時(shí)候當(dāng)我不想回答某個(gè)問(wèn)題時(shí),就會(huì)選擇去拋回一個(gè)問(wèn)題?!倍醯强谱钕矚g問(wèn)AI的問(wèn)題就是“你的夢(mèng)想是啥?”“它有時(shí)候說(shuō)‘賺錢’,有時(shí)候說(shuō)‘做偉大的產(chǎn)品’,有時(shí)候又說(shuō)‘開(kāi)心就好’,我覺(jué)得都挺對(duì)的。”王登科說(shuō)。
讓AI“成為”自己
而不僅是“表演”自己
王登科告訴記者,他一直以來(lái)想做成一件事——開(kāi)發(fā)出一個(gè)聊天機(jī)器人。王登科出生在成都一個(gè)普通家庭,“我爸爸在我讀小學(xué)時(shí)給我買了很多書,還每天給我讀,很快我就對(duì)書上的內(nèi)容感興趣了。”王登科讀高中時(shí)很喜歡搞文學(xué)創(chuàng)作,他寫了幾本詩(shī)集和一堆故事,而高考后卻選擇去了理工類大學(xué)。“在大學(xué)我就開(kāi)始開(kāi)發(fā)各種稀奇古怪的東西?!?/p>
在他創(chuàng)立現(xiàn)在這個(gè)AI繪畫類創(chuàng)業(yè)公司之前,王登科一直活躍在科技創(chuàng)新的前沿。他曾抓取了大約30個(gè)民謠歌手(樂(lè)隊(duì))的歌詞,足有幾十萬(wàn)字,分析歌手們的創(chuàng)作特點(diǎn)和他們最喜歡的城市。而他“研制自己”的過(guò)程也充滿了理工男的縝密:第一步是整理數(shù)據(jù)集。“我對(duì)不同類消息的回復(fù),我寫的每一篇文章,每一句話,我發(fā)過(guò)的每一條微博等,將這些數(shù)據(jù)全部匯入一個(gè)神經(jīng)網(wǎng)絡(luò)模型之中,去更新其中的參數(shù),理論上就可以獲得一個(gè)‘我’的數(shù)字拷貝?!?/p>
三年間,王登科積攢了約80G容量的微信聊天記錄,為了讓“數(shù)字分身”學(xué)會(huì)長(zhǎng)回復(fù),他又把博客文章轉(zhuǎn)換成對(duì)話形式,再將其并編入對(duì)話數(shù)據(jù)集。盡管一些AI聊天機(jī)器人已經(jīng)具備語(yǔ)言生成能力,但在王登科眼中,其效果更像“鸚鵡學(xué)舌”,而他想做的不止于此。這意味著,只擁有“對(duì)話”能力還不夠,他想要的是讓AI“成為”自己,而不僅是“表演”自己。
因此第二步,他選擇清華大學(xué)開(kāi)源的ChatGLM-6B模型對(duì)數(shù)據(jù)集進(jìn)行訓(xùn)練,讓AI深度學(xué)習(xí),用海量數(shù)據(jù)優(yōu)化上億萬(wàn)個(gè)參數(shù),從而模擬人類大腦的神經(jīng)元,讓模型向著“更像他自己”的方向靠近。為了優(yōu)化對(duì)話能力,王登科還進(jìn)行了多次模型訓(xùn)練嘗試,不斷調(diào)整自己微信聊天記錄和博客文章在模型中的權(quán)重占比。“其實(shí),對(duì)話也是對(duì)這個(gè)‘機(jī)器人’持續(xù)的訓(xùn)練?!蓖醯强普f(shuō)。不過(guò)他認(rèn)為模型本身存在的問(wèn)題還有不少。“最大的問(wèn)題在于無(wú)法儲(chǔ)存很多‘知識(shí)’,尤其是精確的定量知識(shí)的注入,這個(gè)問(wèn)題我還沒(méi)搞明白,之后還會(huì)試試看?!?/p>
繼續(xù)優(yōu)化“數(shù)字分身”
未來(lái)或讓AI寫小說(shuō)
而當(dāng)記者嘗試和這個(gè)AI模型溝通時(shí)詢問(wèn):“你都在哪些城市生活過(guò)?”對(duì)方回答了一堆王登科本人表示從未去過(guò)的地方?!岸际撬约壕幍摹!蓖醯强普f(shuō)。
為什么“克隆人”回答問(wèn)題時(shí)會(huì)傾向于“編造”,這出于怎樣的原理?王登科解釋道:“‘編造’內(nèi)容是文本大模型的通病。因?yàn)槠渖傻脑硎恰A(yù)測(cè)’,即根據(jù)之前的文本預(yù)測(cè)下一個(gè)字是啥,然后根據(jù)概率和算法選擇那個(gè)最合適的字,然后不斷往下生成。在模型并不具備這個(gè)知識(shí)的情況下,‘知識(shí)’無(wú)法引導(dǎo)或改變預(yù)測(cè)概率,那么就只會(huì)根據(jù)語(yǔ)法或邏輯來(lái)預(yù)測(cè)?!币虼?,王登科也在不斷繼續(xù)“訓(xùn)練”自己的這個(gè)“數(shù)字分身”,包括讓與它對(duì)話的人選擇“更喜歡哪個(gè)答案”的方式等。
克隆“數(shù)字分身”成為王登科追尋和認(rèn)識(shí)自己的新方式,他甚至幻想著未來(lái)讓“分身”代替自己上班,并嘗試通過(guò)克隆聲音讓這個(gè)“分身”開(kāi)口說(shuō)話。
王登科表示,他想繼續(xù)優(yōu)化自己這個(gè)AI模型,并讓更多人也擁有屬于他們的“數(shù)字分身”?!拔磥?lái)肯定會(huì)有更好的預(yù)訓(xùn)練的模型,而且是開(kāi)源的,到那個(gè)時(shí)候這種克隆效果將更真實(shí)。我也考慮過(guò)做一個(gè)服務(wù),給更多人提供訓(xùn)練的能力,但感覺(jué)成本和門檻會(huì)很高,所以暫時(shí)還沒(méi)想好。”而下一步,王登科還想用AI復(fù)刻他喜歡的作家?!坝?xùn)練用的東西是已經(jīng)存在的知識(shí),但是里面會(huì)蘊(yùn)含一些規(guī)律,你可以用新的東西去啟發(fā)AI,得到新的成果——它也許會(huì)是一個(gè)能夠?qū)懶≌f(shuō)的AI。”
文、圖/廣州日?qǐng)?bào)全媒體記者 馮秋瑜
最新資訊
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) www.mduo.com.cn 版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright©2008-2023 By All Rights Reserved 皖I(lǐng)CP備2022009963號(hào)-10
聯(lián)系我們: 39 60 29 14 2@qq.com