<var id="7jbtz"></var>
<menuitem id="7jbtz"></menuitem>
<var id="7jbtz"><video id="7jbtz"></video></var>
<var id="7jbtz"></var>
<var id="7jbtz"></var><var id="7jbtz"><strike id="7jbtz"><thead id="7jbtz"></thead></strike></var>
<var id="7jbtz"></var>
<cite id="7jbtz"><strike id="7jbtz"></strike></cite>
<menuitem id="7jbtz"></menuitem>
<menuitem id="7jbtz"></menuitem>
<cite id="7jbtz"><video id="7jbtz"></video></cite>
<var id="7jbtz"><video id="7jbtz"></video></var><ins id="7jbtz"><span id="7jbtz"></span></ins>
<var id="7jbtz"></var>

關于我們

ABOUT VIONVISION

關于我們 公司動態 聯系我們 加入VION

辭別美國終身教授,AI創業12年,陶海的商業感悟與AI理解

發布時間:2017.05.15 分享:

陶海介紹

陶海博士在清華大學本科和研究生學習期間,師從邊肇祺教授從事指紋識別方面的研究。后在美國伊利諾伊大學香檳分校(UIUC)攻讀博士,在Thomas S. Huang(黃煦濤)教授指導下,進行人臉表情識別、非剛體運動跟蹤和超低碼率視頻傳輸方面的研究。 2001年至2010年期間,陶海博士任加利福尼亞大學圣塔克魯茲分校助理教授、副教授(終身教授)。2005年創立北京文安智能技術股份有限公司,于2016年10月掛牌新三板。


人工智能的三個不同層次

第一層是記憶和有規則的計算與推理。記憶力是人類智能的重要組成部分,在這方面,計算機系統早就打敗人類了。早期的人類用繩子、甲骨文作為記憶符號,后來有了文字和更抽象的二進制數字,載體從石片、甲骨、紙片發展到現在的磁帶、光盤、閃存。人類大腦能夠存儲的信息量,早就比不上計算機。


在數字計算上,最聰明的速算家,也比不過一個簡單的計算器。在有固定規則的博弈方面,Deep Blue在1997年打敗國際象棋世界冠軍卡斯帕羅夫。圍棋最復雜,但終于也被Alpha Go拿下了。Alpha Go算法根據棋形訓練兩個網絡,對棋招和局面進行篩選和評估,利用深度學習實現了一個更好的搜索和評價方法,但是總體思路還是搜索的優化,需要大量的計算力支撐。


大家都說人工智能迎來了革命性的發展,其實還言之過早。在我讀大學的時候,正趕上上一輪神經元網絡的熱潮,還是同樣的BP算法,不過網絡很淺?,F在計算芯片能力幾個數量級地提高,加上一些關鍵的BP算法改進技巧,大型的神經元網絡可以訓練了,但是還是在做回歸擬合。

但為什么大家覺得人工智能這個熱潮來了呢?

人工智能第二層是語音識別、圖像識別與計算機視覺、NLP(自然語言處理)。深度神經元網絡在這個層面上帶來了AI技術產業化的巨大機會。以前語音識別到90%,用戶體驗很差,現在有了深度學習和大量的訓練數據,識別率突然可以到99%了,用戶體驗好,很多產品成為可能。未來幾年,在這方面我們會看到大量的技術創新。在基礎能力方面的創新,包括存儲和高性能計算,因為投入巨大,比較適合大型公司做。而在應用領域,因為AI技術可以應用于各行各業,非常適合創業公司。


那么現在有一種說法,未來80%的工作都會被人工智能和機器人替代,人類將失業,后果很嚴重。其實未必。如果你多到工廠里看看,看到工人在生產線上像電影《摩登時代》里一模一樣,一天重復著一個動作,艱辛勞作,你會覺得這是違反人類天性的。自第一次工業革命以來,機器就開始取代人類的工作,時至今日,很多重復性體力工作已經被機器替代,而機器替代不了的是要求柔性和靈活度比較高的工序。


展望未來,所有生產環節越來越多地會被機器替代的,世界上只要有清潔能源比如聚變,就能使海水淡化、糧食生長、分散了的金屬元素聚合、機器人工作,總之,就可以熵減、有序。人類是永遠不會因為機器來了就導致失業的,因為我們有更多的事情需要做,我們需要教育我們的后代,需要贍養照顧我們的老人,需要治療照顧醫患,需要對未來進行探索,需要創造藝術和美。這都需要消耗大量的人力,且機器無法替代。我們現在只是忙于機械勞作,忙于糊口,沒有辦法花全部時間來做這些事。


人工智能的第三層,也就是強人工智能,就是實現人類創新,探索,思辨等高級能力。目前這方面你如果認真去讀AI領域NIPS,ICML或者CVPR,ICCV等國際會議最新論文,應該會很失望。即使是學術領域,在這方面的進展,也是非常緩慢。就好像在等著一個AI領域的愛因斯坦出現。

 

人工智能的優勢和限制


DNN(深度神經網絡)既然是在NN(神經網絡)的基礎上深入,依然是一個回歸擬合器,以往輸入大量的圖片信息,BP算法要算上一年,還不收斂?,F在最新的GPU可以把這個訓練過程縮短到幾個小時。DNN的規模也越來越大。微軟孫劍博士領導的研究小組,提出了可以達到成百上千層的ResNet,這個神經網絡性能優異,能記住的內容更多,輸出的結果更準確。


另一方面,實際應用當中,數據往往是不充足的,甚至是稀缺的。人類的認知能力其實也不需要大數據,這樣的AI怎么做?舉個例子,一些無人駕駛企業夸耀自己擁有一百萬小時的駕駛數據,甚至一億小時的數據,認為這是其核心競爭力。但是一般人學一兩個月就拿到駕照了。所以思路上肯定有些問題。在場景無法窮盡的領域,比如全自動駕駛,寄希望于基于深度網絡這樣的擬合器加海量數據,使得所有未來場景,過去都見過的方法論,注定是要失敗的。


創業到了好時機

三方面的量變引起了視覺乃至AI技術的廣泛應用


1、更高分辨率的圖像傳感器。60年代圖片像素只有100*100,早期的安防攝像圖片像素也是影影綽綽的,低像素的圖片缺乏深度挖掘的價值, 現在視頻的像素都是1080P,也就是200萬像素,再過幾年將會步入4K的分辨率,物體細節都看清了,人、車、物、文字都可以識別了。


2、先進的深度學習神經網絡:以卷積神經元網絡(CNN)和遞歸神經元網絡(RNN)為基礎,幾年來物體檢測、物體識別、圖像分割、圖像生成、語音識別、人臉識別等領域的算法突飛猛進,性能指標不斷提高,很多都達到了產品化的實用水平。我們聽說過“寧可錯殺1萬,不能放過1個”,這代表著早期的智能識別產品高檢測率,高誤報率的特點。但是好的產品應該是“不能錯殺1個,也不能放過1個”,亦即高檢測率,低誤報率?,F在技術的進步,正在向這個方向快速推進。


3、高性能、低功耗、低成本深度學習芯片:隨著以nVidia、Xilinx、Movidius為代表的處理器廠家大力推動GPU、FPGA和VPU芯片的發展,使得文安智能能夠開發出高性能“繁星”GPU集群服務器。在一個2U服務器的體積內,集成40顆GPU芯片,能處理80路1080P分辨率的攝像頭視頻。相比之前一臺PC服務器只能處理8路視頻,效能提高一個數量級,單路視頻處理的硬件成本大幅下降??梢灶A期未來幾年,基于視頻分析的各種商業場景的應用將會得到普及。


AI商業模式探索

陶海博士認為,文安智能做了12年,嘗試過很多模式,觀察下來有幾條路可以走:


1、開放的算法平臺/開放的AI芯片。這個不一定適合創業型公司做,因為BAT等大公司有快速、低成本獲得用戶基數的優勢。一些識別功能甚至免費打包到云服務中去。對于初創型公司,芯片也要慎重,芯片成功的要素除了優異的識別性能,更在于成本和出貨量。芯片開發人員成本和流片成本都很高,一定要看準再動手。但是沒有芯片,就開發不出有量的應用,有點雞生蛋,蛋生雞的困惑。


2、做硬件模塊或者軟件SDK。這兩類的企業都會面臨著終端產品企業的價格壓榨。在技術不成熟、成本居高不下的大背景下,硬件模塊和軟件SDK的銷量有限。當量起來,技術也成熟的時候,又會有巨頭切入,高毛利會在競爭對手的拉鋸戰中漸漸降到合理水平,而最后采購話語權在終端廠家手里。


結論:成功的創業一定是模式上端到端(直接做出產品,面對客戶)


陶海博士分析現有的業務,產業鏈長的行業,文安智能目前還是提供產品和解決方案的形式,在上游依靠專業的集成商。但是在產業鏈相對短的行業,是能夠做到全產業貫通的,能夠做到端到端的。但不管怎么樣,作為技術公司,都應做到完整解決方案。雖然隨著人工智能技術的出現,市面上出現很多初創型的技術型公司,但在國內,長期下去,技術型公司也要發展自己的渠道,并建立起牢固的渠道壁壘。


結論:成功的創業一定是三位一體(算法、硬件、數據與應用平臺)


3、To B 還是To C?To B相對于To C,對技術的不成熟有比較高的容忍度,面向To B,可以有售后服務作為補充,面向To C,不可能做到細致的售后服務。對產品成熟度要求更高。


面向To B市場,在視頻技術和音頻技術都有大公司的身影。視頻技術有??低?,音頻技術有科大訊飛,如何與巨頭共舞是所有創業者必須面臨的思考,最好是技術特別牛,與巨頭形成互補,或者與巨頭的業務形成區隔,尋找新的利基市場,并迅速形成行業壁壘。



本文作者極客王子,億歐專欄作者;轉載請注明作者姓名和“來源:億歐”;文章內容系作者個人觀點,不代表億歐對觀點贊同或支持。

秒速飞艇彩票