ICML和MLSS兩大機器人會議齊聚北京,被業(yè)界認為是破天荒的第一次。由此可見,中國人工智能的發(fā)展在國際上已經(jīng)異軍突起,越來越吸引各界的目光。
最近在科技界,人工智能、機器學習可謂炙手可熱。回想這一年,機器學習大佬們紛紛從學術界“跳槽”工業(yè)界,祖師爺Geoffrey Hinton被谷歌招入麾下,泰斗Yann Lecun加盟Face book,前“谷歌大腦之父”Andrew Ng成為百度首席科學家。作為人工智能最重要的分支,近幾年,機器學習取得的突破進展,讓世界不得不為之矚目。
這個六月,一場機器學習領域的饕餮盛宴正在上演。國際機器學習大會(ICML)和機器學習暑期國際研討會(MLSS)這兩個機器學習頂級會議首次來到北京。人工智能為何如此火爆?學術界與工業(yè)界有哪些新進展?人工智能下一突破會在何處?筆者抓住這個千載難逢的機會,來到現(xiàn)場,不僅能近距離膜拜大師,更期待找到問題的答案。
兩大盛會首來中國,原因何在
今年,ICML和MLSS齊聚北京,可謂史無前例。究竟是什么吸引兩大機器學習頂級會議從歐美移駕中國、各位人工智能大師千里迢迢赴京?筆者認為,中國目前在人工智能領域可謂異軍突起,無論學術界還是工業(yè)界都有亮眼表現(xiàn)。
從國家層面,政府高度重視發(fā)展人工智能技術,人才方面,越來越多就讀于世界頂級名校的中國學子學成歸國,工業(yè)方面,中國真正做到了技術的工業(yè)落地,尤其在互聯(lián)網(wǎng)產(chǎn)品上變現(xiàn)能力極強。
人工智能研究新成果
去年ICML大會上,Andrew Ng帶領學生Adam Coates利用2萬美金的GPU集群做到了谷歌價值約100萬美金服務器集群識別貓臉同樣的效果。今年,谷歌實驗室科學家QuocLe帶來了提取語句和文本特征的新方法。通過加入一層Paragraph Vector來表示語境,巧妙的解決了傳統(tǒng)“bag-of-words”(詞袋)模型無序和語意缺失的問題。
自然語音處理領域鼻祖,加拿大蒙特利爾大學的Yoshua Bengio教授將傳統(tǒng)Denoising Auto-encoder(DAE)算法訓練循環(huán)(training epoch)中數(shù)據(jù)的損失邊緣化(marginalized),實現(xiàn)了用少量的訓練循環(huán)達到或超過DAE模型的效果。
機器學習泰斗GeoffreyHinton的學生,加拿大多倫多大學教授Ruslan Salakhutdinov則介紹了關于自然語言的多模態(tài)神經(jīng)語言模型(multi modal neural language)。在圖文(image-text)模型中,通過一個卷積網(wǎng)絡,可以同時學到關鍵詞和圖像特征。
每屆ICML,最受關注的便是Best Paper花落誰家。要知道,ICML的評委們對文章的篩選一向以“苛刻”著稱。今年,最終歸屬于北京大學2009級博士生唐建的《Understanding the Limiting Factors of Topic Modeling via Posterior Contraction Analysis》,這是繼去年百度深度學習實驗室負責人余凱獲得Best Paper銀獎后再次爭得國際頂級榮譽。
百度引領人工智能創(chuàng)新
據(jù)筆者不完全統(tǒng)計,本次大會收錄了17篇來自中國的regular paper,其中來自工業(yè)界共計5篇,百度4篇,阿里1篇。百度大數(shù)據(jù)實驗室負責人張潼從理論上解決了機器學習不同方向上的優(yōu)化問題。例如,他提出AccProx-SDCA框架,優(yōu)化了機器學習三大關鍵問題SVM、Lasso和Ridge Regression的運行時間。
從MLSS到ICML,AndrewNg、張潼、余凱等豪華陣容先后亮相百度展臺;產(chǎn)品上,從搜索廣告CTR預估到各種預測的實現(xiàn),再到移動產(chǎn)品的落地,顯示出了領跑人工智能、機器學習領域的雄心和決心。
人工智能的下一突破
那么,人工智能新的突破在哪里?在深度學習晚宴的Panel discussion環(huán)節(jié)中,從AndrewNg的回答中或許能找到答案。Andrew Ng談到,近些年深度學習取得的顯著進展,得益于基于大量標記數(shù)據(jù)(tagged data)的有監(jiān)督學習(supervised learning)的研究。隨著物理世界的數(shù)字化,大量標記數(shù)據(jù)產(chǎn)生,并且被提供給深度學習算法。如谷歌、百度這樣的互聯(lián)網(wǎng)公司已經(jīng)從中獲得價值。所以,有監(jiān)督學習將在短期內仍是人工智能的研究重點,并在機器視覺、語音識別、廣告和推薦系統(tǒng)等方面產(chǎn)生重要作用。
Andrew Ng認為,基于深度學習技術,App和硬件都將變得更加智能。試想這樣一個應用場景,在開車的時候,只要說出“發(fā)件人我”,“回復給誰”,再說出郵件內容,手機會自動將語音準確轉化為文本郵件,最終成功將郵件發(fā)送給接收人。在Andrew看來,未來幾年手機將會是連接一切的橋梁,人類通過手機將開啟智能生活。
另一方面,神經(jīng)學家相信,動物和孩子往往是通過無標記數(shù)據(jù)(untagged data)來學習的。目前已經(jīng)有科學家嘗試在無標記數(shù)據(jù)上應用深度學習技術,但還沒有找到合適的算法。未來,在這方面,可能會出現(xiàn)很多突破。據(jù)說,Andrew Ng帶領的百度人工智能實驗室將在這方面有所建樹。