5月24日至26日,2019浦江創(chuàng)新論壇在上海舉行,本次論壇聚焦“科技創(chuàng)新新愿景新未來”,深入探討未來科技領(lǐng)域的發(fā)展趨勢。在論壇上,思客專訪了香港中文大學(xué)終身教授、騰訊優(yōu)圖實驗室科學(xué)家賈佳亞,就如何發(fā)現(xiàn)用戶痛點、AI手語翻譯機、計算機視覺技術(shù)應(yīng)用及安全等話題展開探討,以下為專訪內(nèi)容:
賈佳亞接受新華網(wǎng)思客專訪 陳振 攝
人臉支付能再節(jié)省80%的付款時間
思客:在未來生活里,計算機視覺給我們帶來的應(yīng)用場景有哪些變化?刷臉識別的時代是不是已經(jīng)到來?
賈佳亞:未來AI對人的生活各方面都會產(chǎn)生巨大影響。未來線下商超會出現(xiàn)很多人臉支付的機器。不是已經(jīng)有非常便利的微信支付了嗎?為什么還要做人臉支付?我的感覺是即使線下的微信支付也還是需要拿著手機掃二維碼然后付款,而使用人臉支付機器,可以節(jié)省更多時間,甚至把我們付費的時間再減少80%。這對于很多女生而言,既可以享受線下逛街的樂趣,又不會為了付錢去喪失自己的耐心。
人臉支付對于個人生活的便利性一定會有非常大的推動作用。我相信以后越來越多的活動和行為會轉(zhuǎn)移到線上。這需要AI技術(shù)保障安全,需要用各種驗證方式。我們希望能夠通過人臉識別,或者是其它手段,來保證信息的正確性。為了防止不法分子的欺詐,我們要進行反欺詐實驗、安全性對公演練并推動技術(shù)不斷演進和迭代。
隨著AI技術(shù)的不斷地迭代,我們會感受到它越來越好用、越來越安全,甚至當(dāng)我們很多東西遷移到線上的時候,你會發(fā)現(xiàn)我們現(xiàn)在所謂的個人信息泄漏及濫用、假冒電話、詐騙電話會越來越少。因為線上的管理比線下要嚴(yán)謹(jǐn)?shù)枚?,很多事情自然而然會推到一個非常正確的道路上去運行。
思客:現(xiàn)狀行業(yè)里有一種說法,計算機視覺已經(jīng)從“跑高分”到了“跑場景”的時代,您對于當(dāng)下這個行業(yè)的市場競爭態(tài)勢是怎么看的?
賈佳亞:競爭態(tài)勢現(xiàn)在越來越多地出現(xiàn)在玩家里面,從商業(yè)角度來看這個事情,目前有很多非常好的小公司,大公司也會有不同的技術(shù)演進。以往我就賣視覺數(shù)字,現(xiàn)在能真正幫業(yè)界解決問題和痛點,能開發(fā)出一個產(chǎn)品,能夠做成好的服務(wù),能夠建立起口碑,形成一種生態(tài)模式,或者是發(fā)展模式。
我認(rèn)為計算機視覺對我們能力和競爭力上的要求會越來越高。同時,我相信也會不斷有新的方向開拓出來,以前做不了的事情,或者完全不可以想象的東西可能慢慢地都會突然有一家公司在做。會不斷有新的方向,這個方向一定需要對這個行業(yè)很熟悉的人,同時他又有高技術(shù),才會開創(chuàng)一個新的商業(yè)模式做下去,這里面肯定會有競爭。
但是我總體認(rèn)為,人工智能的產(chǎn)業(yè)發(fā)展是非常良性的,快速推動了社會進步,而且讓整個社會提升了對科技的理解。每一個社會成員,甚至是家庭主婦都可以通過各種方式了解到科技對他們生活的影響,他們不會懼怕。最怕的是因為懼怕某一件事情,就不讓這個事情發(fā)生,我相信這在中國接下來的發(fā)展里是不太會存在的。
不斷積累技術(shù)迅速應(yīng)對新欺詐
思客:安全的問題是我們用戶非常關(guān)心的大問題,能不能具體講一講欺詐與反欺詐的演練,這個保護用戶的過程大概是什么樣的?
賈佳亞:這個事情沒有在別的地方講過,故事還是挺多的,比如你用人臉驗證,你要線上銀行開戶,這個名詞叫做金融界的人臉核審,就是我怎么樣讓拿的身份證和開戶的人是一同個人,這個人臉核審的案例非常多。比如,有的不法分子會拿一個照片擺在照相機前面,看著照片只要跟這個人一樣,說不定就會審核通過了。我們?yōu)榱说挚惯@個事情,就要求真人要動一下?,F(xiàn)在大家在各種APP上開戶已經(jīng)嘗試過這樣的過程,比如說我讓你說幾個數(shù)字,把聲音、動作、人臉結(jié)合起來判定這是真人,而不是一張照片。
現(xiàn)在又有了新的欺詐方式,比如找人錄一段視頻,知道你要問什么,知道你要說什么,就先錄出來。我們?yōu)榇司鸵S機改變你要說的東西,每個人都不一樣。
后來有一個更可怕的事情,比如有人在網(wǎng)上買一個硅膠頭套,或者把人臉的一部分遮擋掉,或者買一個類似于口罩的東西改變五官的樣子,是不是能達到欺詐目的?為此,我們優(yōu)圖又創(chuàng)造了一些新的算法。比如,手機是發(fā)射光源,我們要讓手機在人臉上照射出一些光的形態(tài),我們采集下來分析,通過反射率和反射的形態(tài)去判別到底反射的是塑料還是人的皮膚。這里面有非常多的技術(shù)是在演進的,而且我相信目前階段沒有什么欺詐方式是我們不能預(yù)防的,我們需要不斷地積累技術(shù),以便一個新的欺詐方式出來以后,我們能迅速應(yīng)變。每一個操作系統(tǒng)、每一個APP都可能有Bug,只要你能迅速修復(fù)它,這個事情就能繼續(xù)往前走,AI肯定也會慢慢變得越來越強。當(dāng)我們發(fā)現(xiàn)沒有漏洞的時候,安全性自然就會非常高,可能比線下甚至面對面去驗證某個人還要安全。
賈佳亞接受新華網(wǎng)思客專訪 陳振 攝
解決用戶痛點,AI手語翻譯機未來發(fā)展空間大
思客:能不能舉個例子,怎樣在一個垂直領(lǐng)域去發(fā)現(xiàn)用戶痛點,又怎么樣解決?
賈佳亞:優(yōu)圖實驗室目前致力于產(chǎn)業(yè)互聯(lián)網(wǎng)的發(fā)展,對于傳統(tǒng)零售業(yè)、旅游業(yè)等方面的深度觸達,使我們明白各行各業(yè)對技術(shù)的需求完全不一樣。
在工業(yè)領(lǐng)域,商家一般沒有客戶獲取和留存的需求,他們反而希望盡量減少人手,能夠把傳統(tǒng)意義上需要招聘很多人的工種慢慢轉(zhuǎn)移成機器,或者用智能的方式完成。這樣,他們能減少商品成本、提高競爭力,進而擴大商機、促進企業(yè)發(fā)展。
思客:最近優(yōu)圖實驗室發(fā)布了一個AI的手語翻譯機,為什么會選擇這個項目?
賈佳亞:我們參加很多公益活動之后慢慢意識到,在社會中有一些群體,他們完全觸達不到我們的生活圈子,我們也不了解他們,溝通交流都很困難,比如說盲人、聽力或者說話方面有障礙的人。這時,我們就想,技術(shù)上能不能做些事來改變這種現(xiàn)狀。
當(dāng)我們的科技水平達到一定程度之后,我們就想能不能把自然語言處理、圖像技術(shù)、姿態(tài)分析技術(shù),最終集結(jié)成一個落地產(chǎn)品?,F(xiàn)在的手語翻譯機,就是要實現(xiàn)兩種語言的交流,一個是普通話或者說是中文,另一個是手語。這是兩種語言,語法、結(jié)構(gòu)、內(nèi)容完全都是不一樣的,手語翻譯比各種外語翻譯更難,里面涉及到形態(tài)的識別、分析、理解,相比只從語音或者文字去做處理和分析的的翻譯更加復(fù)雜。
目前我們做了國內(nèi)第一套,相信也是國內(nèi)唯一的一個最大數(shù)量級的數(shù)據(jù)庫。我們?nèi)ヌ厥鈱W(xué)校,一個一個地采訪學(xué)生和老師,甚至通過一些付費的方式去讓他們幫我們收集素材,目前這套語言系統(tǒng)構(gòu)建得比較完善,但后面依然還有很長的路要走,我們未來想把它硬件化并投入到公共服務(wù)上。
思客:未來可能在各種無障礙設(shè)施當(dāng)中會應(yīng)用到AI的手語翻譯機嗎?
賈佳亞:手語翻譯機絕不僅僅是一個概念,我希望它能觸達到成千上萬的手語需要者,讓他們能夠跟普通人一樣順暢地進行交流和溝通,甚至通過手語翻譯機無障礙地處理各種事物,而且非??焖?,又科技感十足。當(dāng)我們慢慢去推動這件事情的時候,你會發(fā)現(xiàn),原來AI有很多的東西可以做。
AI除了在企業(yè)、消費等領(lǐng)域有應(yīng)用之外,其實,在推動社會公益事業(yè)方面也存在非常大的空間,因為我們有太多的人需要它的幫助。