AI本身已經(jīng)進入到人們的日常生活中,比如為數(shù)字助理Siri和Alexa的大腦提供動力。它讓消費者能夠更準確、更**地在網(wǎng)上購物和搜索,以及執(zhí)行其他人們認為理所當然的任務(wù)。
Coursera聯(lián)合創(chuàng)始人、斯坦福大學教授吳恩達博士上周在硅谷舉行的AI前沿會議上發(fā)表主題演講時表示:“AI就像是一種新的電力。大約100年前,電力改變了每一個主要行業(yè)。AI已經(jīng)發(fā)展到同樣的水平,有能力在未來幾年改變所有主流行業(yè)。”
吳恩達說,盡管人們認為AI是一種相當新的技術(shù),但它實際上已經(jīng)存在了幾十年。但它之所以現(xiàn)在才實現(xiàn)騰飛,這要歸功于數(shù)據(jù)和計算能力的擴展。
吳恩達表示,目前通過AI創(chuàng)造的大部分價值都是通過監(jiān)督學習完成的。但有兩大波的進步:一波利用深度學習來預(yù)測消費者是否會在算法獲得有關(guān)他的信息后點擊在線廣告。而當輸出不再是一個數(shù)字或整數(shù),而是語音識別、另一種語言或音頻的句子結(jié)構(gòu)時,第二波進步就出現(xiàn)了。例如,在無人駕駛汽車中,圖像的輸入會形成其他在路上的車輛位置輸出。
微軟**科學家黃學東表示,實際上,深度學習(即電腦從數(shù)據(jù)集學習到執(zhí)行功能,而不是執(zhí)行它被編程的特定任務(wù))對實現(xiàn)與人類相媲美的語音識別目標是有幫助的。
2016年,黃學東領(lǐng)導微軟團隊取得了歷史性成就,當時他們的系統(tǒng)記錄到5.9%的錯誤率,這與人類轉(zhuǎn)錄員的情況相同。黃學東在會議上說:“多虧了深度學習,我們能夠在20年之后達到人類的程度。”此后,該團隊將錯誤率進一步降低至5.1%。
數(shù)字助理的崛起
從2010年開始,語音識別的質(zhì)量開始改善,***終Siri和Alexa誕生了。吳恩達說:“現(xiàn)在,你幾乎認為這是理所當然的。亞馬遜Alexa總監(jiān)Ruhi·Sarikaya說,除此之外,預(yù)計語音將取代觸控輸入。提高準確性的關(guān)鍵是理解上下文語境,
例如,如果一個人問Alexa晚餐應(yīng)該做什么,這位數(shù)字助理必須評估他的意圖。他是想讓Alexa去餐館預(yù)訂位置、點餐還是尋找食譜?如果他要求Alexa找到《饑餓游戲》(Hunger·Games),他是想要聽音樂、看視頻亦或是聽有聲讀物?
谷歌的研究科學家迪勒克·哈卡尼-圖爾(Dilek·Hakkani-Tur)表示,數(shù)字助理的下一步研究將是一項更先進的任務(wù),即理解“超越文字的意義”。舉例來說,如果用戶使用“今天晚些時候”這樣的短語,可能意味著晚上7點到9點之間,或者下午3點到5點開會。
哈卡尼·圖爾說,下一階段還需要更復雜、更生動的對話、多領(lǐng)域任務(wù)以及超越領(lǐng)域界限的互動。此外,數(shù)字助理應(yīng)該能夠做更多事情,比如輕松閱讀和總結(jié)電子郵件。
語音識別之后,就是“計算機視覺”,即計算機識別圖像并對其進行分類的能力。隨著許多人上傳圖片和視頻,將元數(shù)據(jù)添加到所有內(nèi)容中變得很麻煩,這就需要一種將它們分類的方法。
Facebook人工智能研究院可視化識別技術(shù)專家Manohar·PaluriLumos說,F(xiàn)acebook開發(fā)了一種能夠理解和大規(guī)模分類視頻的AI,名為Lumos。Facebook利用Lumos進行數(shù)據(jù)收集,例如,收集煙花圖像和視頻。該平臺還可以利用人們的姿勢來識別視頻,比如將人們在沙發(fā)周圍忙碌的場景歸類為“即將外出閑逛”。
谷歌視頻理解主管拉胡爾·蘇山卡爾(Rahul·Sukthankar)補充說,關(guān)鍵是要確定上傳視頻的主要語義內(nèi)容。為了幫助計算機正確識別視頻中的內(nèi)容,蘇山卡爾的團隊在YouTube上挖掘了AI可以學習的類似內(nèi)容,比如針對非專業(yè)內(nèi)容的特定幀率。蘇山卡爾補充說,未來研究的一個重要方向是使用視頻對計算機進行訓練。所以,如果機器人看到一個人把麥片倒進碗里的多個角度視頻,它應(yīng)該能通過觀察視頻來學習。
阿里巴巴用AI來促進銷售。例如,淘寶電商網(wǎng)站上的購物者可以上傳自己想買的產(chǎn)品照片,比如街上某個陌生人的時髦手袋,網(wǎng)站會提供***接近照片的手袋。
阿里巴巴還使用了增強現(xiàn)實(AR)/虛擬現(xiàn)實(VR)技術(shù),讓人們可以在Costco這樣的商店里瀏覽和購物。在Youku視頻網(wǎng)站上,阿里巴巴正在開發(fā)一種方法,將虛擬3D物體插入用戶上傳的視頻中,以此來增加收入。這是因為許多視頻網(wǎng)站都在致力于增強盈利能力。阿里巴巴AI**科學家任曉峰(Xiaofeng·Ren)說:“YouTube仍然在虧損。”
商業(yè)對AI的態(tài)度
麥肯錫全球研究所主席兼董事詹姆斯·曼伊卡(James·Manyika)認為,美國和中國在AI領(lǐng)域的投資居于***地位。去年,北美地區(qū)的AI投資從150億美元到230億美元不等,而亞洲(主要是中國)的投資額為80億美元至120億美元,歐洲則僅有30億美元至40億美元,處于落后狀態(tài)。
科技巨頭是AI領(lǐng)域的主要投資者,其資金規(guī)模在90億美元至300億美元之間,另外還有60億至200億美元,投資方包括風險資本家和私人股本公司。
他們把錢投到哪里去了?機器學習占投資總額的56%,計算機視覺位居其次,占28%。自然語言占7%,無人駕駛汽車占6%,其余部分則被虛擬助理瓜分。不過,曼伊卡表示,盡管投資不斷增加,但AI的實際應(yīng)用仍然有限,即使是那些知道其能力的公司也是如此。大約40%的公司都在考慮部署AI,40%的公司進行了實驗,只有20%的公司在某些領(lǐng)域采用了AI。
之所以保持沉默,是因為41%的受訪企業(yè)認為自己的***不高,30%的受訪企業(yè)表示,它們的商業(yè)價值還不夠充分,其他公司則表示,它們沒有掌握AI技能。然而,麥肯錫認為,AI可以將其他分析的影響提高一倍以上,并有可能大幅提升企業(yè)業(yè)績。
有些公司能做到這一點,比如在AI領(lǐng)域**的行業(yè)包括電信和科技公司、金融機構(gòu)以及汽車制造商。曼伊卡說,這些早期采用者往往是更大的、數(shù)字化成熟的公司,它們將AI融入到核心活動中,專注于增長和創(chuàng)新,而不是節(jié)省成本,并需要**執(zhí)行官的力挺。***慢的采用者是醫(yī)療保健、旅游、專業(yè)服務(wù)、教育以及建筑行業(yè)的公司。
然而,專家表示,隨著AI的普及,企業(yè)大規(guī)模采用AI也只是時間問題。