AI落地場(chǎng)景在不斷增多,但賺錢(qián)依舊艱難。
根據(jù)億歐報(bào)告顯示,2018年全年,近90%的人工智能公司處于虧損狀態(tài),而10%賺錢(qián)的企業(yè)基本是技術(shù)提供商。從談概念、講技術(shù),到拼場(chǎng)景、搶落地,建立在大數(shù)據(jù)基礎(chǔ)之上的人工智能,仍面臨數(shù)據(jù)本身帶來(lái)的挑戰(zhàn)。
數(shù)據(jù)割裂致使落地難
“我們經(jīng)常提及大數(shù)據(jù),但事實(shí)上我們并不需要那么多的數(shù)據(jù),AI未來(lái)一個(gè)趨勢(shì)是小數(shù)據(jù)崛起。”在市北·GMIS 2019全球數(shù)據(jù)智能峰會(huì)上,斯坦福大學(xué)教授、Landing.ai創(chuàng)始人、CEO吳恩達(dá)表示。
一個(gè)具體的案例是工廠手機(jī)屏幕劃痕檢測(cè)。目前不少是利用人眼來(lái)檢測(cè)手機(jī)是否存在劃痕,如果擁有100萬(wàn)個(gè)劃痕手機(jī),AI可以非常高效的識(shí)別手機(jī)劃痕。但現(xiàn)實(shí)情況是沒(méi)有任何工廠會(huì)有幾百萬(wàn)不同劃痕的手機(jī),這個(gè)時(shí)候小樣本學(xué)習(xí)(few shot learning),即利用較少的數(shù)據(jù)得出同樣準(zhǔn)確結(jié)論的人工智能,將有助于推動(dòng)整個(gè)領(lǐng)域的發(fā)展。
小樣本學(xué)習(xí)的迫切性更在于落地過(guò)程面臨的數(shù)據(jù)孤島、數(shù)據(jù)隱私保護(hù)導(dǎo)致的數(shù)據(jù)割裂問(wèn)題,讓AI技術(shù)很難充分發(fā)揮價(jià)值。
“和AI用于比賽需要上千萬(wàn)的圖片訓(xùn)練不同,當(dāng)AI深入行業(yè)我們看到數(shù)據(jù)往往是小數(shù)據(jù)和細(xì)碎的數(shù)據(jù),也就是沒(méi)有聯(lián)通起來(lái)的數(shù)據(jù),再先進(jìn)的AI技術(shù)也很難用上。”國(guó)際人工智能學(xué)會(huì)理事長(zhǎng)、香港科技大學(xué)教授、微眾銀行首席人工智能官楊強(qiáng)說(shuō)道。
今年5月,國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布了《數(shù)據(jù)安全管理辦法(征求意見(jiàn)稿)》,提出在中國(guó)境內(nèi)利用網(wǎng)絡(luò)開(kāi)展數(shù)據(jù)、存儲(chǔ)、傳輸、處理、使用等活動(dòng),以及數(shù)據(jù)安全的保護(hù)和監(jiān)督管理意見(jiàn)。
楊強(qiáng)認(rèn)為“中國(guó)版GDPR”即將到來(lái),數(shù)據(jù)隱私在走向嚴(yán)格化、全面化,這使得企業(yè)在實(shí)際應(yīng)用中可以使用的數(shù)據(jù)維度和范圍并不大。數(shù)據(jù)隱私保護(hù)的趨嚴(yán),為人工智能技術(shù)升級(jí)提供了契機(jī)。
以保險(xiǎn)行業(yè)利用AI進(jìn)行個(gè)性化定價(jià)為例,背后需要業(yè)務(wù)數(shù)據(jù)和用戶(hù)互聯(lián)網(wǎng)行為數(shù)據(jù)融合,理想的狀態(tài)是可以拿到非常豐富的用戶(hù)畫(huà)像,與用戶(hù)的ID高度匹配,但實(shí)際情況迫于隱私、安全、法規(guī)等原因,企業(yè)可以應(yīng)用的數(shù)據(jù)是非常有限的。
再例如在小微企業(yè)貸款應(yīng)用方面,AI需要引入票據(jù)數(shù)據(jù)、資產(chǎn)數(shù)據(jù)、輿情數(shù)據(jù)等,但由于數(shù)據(jù)的割裂,實(shí)際應(yīng)用中只能使用一些政府的數(shù)據(jù),例如央行的征信報(bào)告,但這些報(bào)告只能覆蓋不到10%的人群。這一問(wèn)題在醫(yī)療領(lǐng)域更為明顯,不同醫(yī)院的醫(yī)療影像數(shù)據(jù)很難匯聚到一起,形成大數(shù)據(jù)來(lái)訓(xùn)練一個(gè)醫(yī)療模型。
“小數(shù)據(jù)”崛起
針對(duì)數(shù)據(jù)割裂帶來(lái)的人工智能落地難問(wèn)題,楊強(qiáng)提出了聯(lián)邦學(xué)習(xí)。所謂聯(lián)邦學(xué)習(xí),是多個(gè)數(shù)據(jù)方之間組成一個(gè)聯(lián)盟,共同參與到全局建模的建設(shè)中,各方之間在保護(hù)數(shù)據(jù)隱私和模型參數(shù)基礎(chǔ)上,僅共享模型加密后的參數(shù),讓共享模型達(dá)到更優(yōu)的效果。
據(jù)楊強(qiáng)介紹,聯(lián)邦學(xué)習(xí)分為橫向聯(lián)邦和縱向聯(lián)邦,橫向聯(lián)邦是指企業(yè)各方數(shù)據(jù)維度相同、ID維度不同,更多存在于消費(fèi)者應(yīng)用中;縱向聯(lián)邦是指企業(yè)各方數(shù)據(jù)的ID維度相同(樣本重疊)、數(shù)據(jù)維度不同,更多存在于B端應(yīng)用。
例如針對(duì)保險(xiǎn)行業(yè)的個(gè)性化保險(xiǎn)定價(jià)問(wèn)題,一家互聯(lián)網(wǎng)企業(yè)和一家保險(xiǎn)企業(yè)進(jìn)行數(shù)據(jù)合作,這種合作數(shù)據(jù)的ID重合度相當(dāng)大,數(shù)據(jù)特征維度大大增加,使模型的個(gè)性化定價(jià)效果顯著提升,為保險(xiǎn)企業(yè)帶來(lái)8倍覆蓋率提升和1.5倍利潤(rùn)率提升。
橫向聯(lián)邦學(xué)習(xí)方面,在手機(jī)行業(yè),通過(guò)在本地建立加密上傳的小模型,服務(wù)器端看不到內(nèi)容卻可以把模型匯聚起來(lái),進(jìn)行云端模型的更新,新的通用模型再釋放給手機(jī),幫助用戶(hù)自動(dòng)化進(jìn)行圖片標(biāo)注。這樣既保護(hù)了用戶(hù)隱私,也可以進(jìn)行模型學(xué)習(xí)和更新。
楊強(qiáng)認(rèn)為聯(lián)邦學(xué)習(xí)最大的優(yōu)勢(shì)是保證數(shù)據(jù)不出戶(hù),通過(guò)生態(tài)在不同行業(yè)選取合作伙伴,用群體智能不斷提升模型效果。因此聯(lián)邦學(xué)習(xí)一定是多方共同協(xié)作組成一個(gè)聯(lián)盟,生態(tài)的建設(shè)十分重要。
面對(duì)AI落地難、盈利難問(wèn)題,吳恩達(dá)則認(rèn)為,在期待AI為企業(yè)帶來(lái)紅利之前,企業(yè)需要避免幾個(gè)陷阱。首先AI技術(shù)會(huì)影響很多企業(yè)做業(yè)務(wù)的核心,所以選擇項(xiàng)目是非常重要的,從小的項(xiàng)目開(kāi)始,可以建立好的基礎(chǔ),同時(shí)幫團(tuán)隊(duì)獲得動(dòng)能。
其次團(tuán)隊(duì)建設(shè)不能僅依靠明星工程師,而是要建立一個(gè)完善的、跨學(xué)科、跨職能的團(tuán)隊(duì)。同時(shí)不要期待AI立刻產(chǎn)生作用,而是要多次嘗試,對(duì)AI發(fā)展的回報(bào)曲線進(jìn)行合理預(yù)算。不要使用傳統(tǒng)的流程評(píng)估人工智能項(xiàng)目,應(yīng)該為AI項(xiàng)目團(tuán)隊(duì)設(shè)立合適的KPI和目標(biāo)。
“有關(guān) AI 的應(yīng)用越來(lái)越多了,但企業(yè)的 AI 轉(zhuǎn)型并不是開(kāi)發(fā)一個(gè) APP 這么簡(jiǎn)單,不要指望AI解決所有的問(wèn)題,也不要指望AI項(xiàng)目一次性就成功。”吳恩達(dá)表示。