很多人用 “機(jī)器不會(huì)有思維能力” 的理由來反駁人工智能威脅論,但是 NLP(自然語言理解)技術(shù)的出現(xiàn)又一次打破了這樣的認(rèn)知。機(jī)器通過數(shù)據(jù)訓(xùn)練,深度學(xué)習(xí)也可以理解人類表達(dá)的模糊的指令并自如的進(jìn)行對(duì)話,目前它們能做到多聰明多智能?近期,有媒體接觸了基于 NLP 技術(shù)的人工智能生活語音對(duì)話助理“玩秘”,創(chuàng)始人余軻曾經(jīng)說過他們的愿景是:讓人類把部分思考的工作交給機(jī)器。
玩秘隸屬于北京輪子科技有限公司,是一家 NLP 語音對(duì)話助理服務(wù)商。玩秘于 2018 年正式服務(wù)于智能音箱小米小愛同學(xué)、天貓精靈,于 2019 年正式服務(wù)于小米手機(jī)。在 2019 年 8 月于上海舉辦的世界人工智能大會(huì)閉幕式上,玩秘作為 8 家被選中的優(yōu)秀企業(yè),與上海市人工智能產(chǎn)業(yè)投資基金完成了意向性簽約。
玩秘通過語言對(duì)話與用戶交互,與 Siri 等語音助手的簡(jiǎn)單百科式問答不同,玩秘強(qiáng)調(diào)思考和分析能力,能模仿人類復(fù)雜的決策過程,做出基于眾多數(shù)據(jù)和因素的智能決策和推薦。
玩秘選擇從生活消費(fèi)和吃喝玩樂這個(gè)領(lǐng)域入手,余軻介紹說是因?yàn)榕c購(gòu)物和資訊相比,本地休閑生活除了具備人性化需求和豐富供給的特點(diǎn),還包含時(shí)間、地點(diǎn)、場(chǎng)景等更多維度,AI 個(gè)性化給用戶創(chuàng)造的附加值更大,優(yōu)于傳統(tǒng)個(gè)性化推薦方法的人工智能架構(gòu)功效也會(huì)發(fā)揮得更加充分。
目前,玩秘已經(jīng)明確了三個(gè)主要的 B 端終端場(chǎng)景:手機(jī)、智能音箱、汽車。手機(jī)語音助手是玩秘主要的應(yīng)用場(chǎng)景,針對(duì)手機(jī)語音助手,玩秘采用 GUI(圖像交互)和 VUI(語音交互)相結(jié)合的展現(xiàn)形式,通過多條件指令識(shí)別、多輪對(duì)話、模糊指令識(shí)別等功能,為用戶提供深度語義理解交互服務(wù),讓用戶不用打開任何 App 即可完成院線觀影、訂酒店、外賣等服務(wù)閉環(huán)。
玩秘近期可以做到多智能?余軻舉例說,在人性化升級(jí)完成后,比如用戶發(fā)出指令:幫我買兩張晚上十點(diǎn)在天幕影城的復(fù)聯(lián) 4 的票。玩秘獲取之后會(huì)根據(jù)已知的海量院線信息,輸出自己的人性化建議:有一個(gè)場(chǎng)次是十點(diǎn)半的,但電影結(jié)束就凌晨 1:30 了,會(huì)不會(huì)有點(diǎn)晚,要不要換成 9 點(diǎn)半的場(chǎng)次?在此基礎(chǔ)上,用戶可以進(jìn)行下一輪對(duì)話,比如:9 點(diǎn)有點(diǎn)早了;還有別的影院選擇么?玩秘會(huì)根據(jù)進(jìn)一步的指令做出下一個(gè)推薦。除了像這樣多條件的指令,還可以向玩秘發(fā)起多樣化或非模版式的指令,比如詢問某個(gè)電影怎么樣?附近有什么電影院推薦,價(jià)錢比對(duì)等,玩秘都可以一一作答。甚至用戶搞不清想看電影的名字,只要說起其中演員的名字等比較模糊的指令,玩秘也可以理解用戶的意圖。具體而言,「玩秘」將根據(jù)用戶特征進(jìn)行類人腦推理,生成智能化的生活解決方案。隨著深度學(xué)習(xí)訓(xùn)練,「玩秘」將越來越人性化,理解率和應(yīng)答率也會(huì)逐漸提高。
余軻表示,做人工智能語音助理面臨兩大難點(diǎn):NLP 語義理解和人性化推薦。團(tuán)隊(duì)核心的挑戰(zhàn)以及技術(shù)壁壘便是 NLP 技術(shù),即機(jī)器對(duì)人類指令的準(zhǔn)確理解。“這是我們首先要做到的第一步,讓機(jī)器更好的理解人類的意圖。” 余軻說,人性化推薦則依靠數(shù)據(jù)和機(jī)器學(xué)習(xí),核心是在于對(duì)用戶和 POI 的刻畫,標(biāo)簽經(jīng)緯度要足夠多、足夠深,數(shù)據(jù)來源玩秘則通過與業(yè)內(nèi)知名互聯(lián)網(wǎng)票務(wù)平臺(tái)、酒旅平臺(tái)、外賣等合作來獲取。
在盈利模式上,玩秘目前主要方向是在用戶產(chǎn)生消費(fèi)以后,從電影票務(wù)平臺(tái)、酒店平臺(tái)等內(nèi)容提供商獲得服務(wù)分成。
目前,玩秘已經(jīng)覆蓋全國(guó) 95% 以上的地級(jí)市,主要提供電影和酒店的服務(wù)信息。今年 6 月份,玩秘的功能在小米手機(jī)中上線(只需對(duì)「小愛同學(xué)」說 “電影助手” 即可通過語音對(duì)話的方式很便捷的購(gòu)買電影票)。除了小米手機(jī)之外,中國(guó)四大手機(jī)品牌中的另外兩家也已與「玩秘」達(dá)成合作,服務(wù)預(yù)計(jì)將于今年四季度上線。余軻表示,未來人類與機(jī)器以及機(jī)器人的交互形式一定會(huì)過渡到語音對(duì)話。與文字編輯、手動(dòng)按鍵等現(xiàn)有的方式相比,自然語言傳達(dá)的信息密度和效率要高得多。玩秘也將深耕吃喝玩樂的生活服務(wù)領(lǐng)域,打造生活全場(chǎng)景人工智能服務(wù)大腦。
據(jù)了解,玩秘目前已經(jīng)完成了三輪融資,最近一輪是今年一月份由越榕資本領(lǐng)頭的 A 輪融資。創(chuàng)始人兼 CEO 余軻牛津本科畢業(yè),在斯坦福和普林斯頓分別完成了深度學(xué)習(xí)專業(yè)碩士和博士學(xué)位,有 10 年 NLP 自然語言理解與大數(shù)據(jù)分析行業(yè)領(lǐng)域研究和行業(yè)經(jīng)驗(yàn),曾任摩根大通公司的全球人工智能算法交易總負(fù)責(zé)人(能源與資源);其余核心成員來自平安集團(tuán)陸金所、思必馳、豆瓣等公司。