人工智能產業(yè)鏈主要分為三個層次:基礎層、技術層和應用層,技術層面包括計算機視覺、語言識別、深度學習等。據清華大學數據顯示,計算機視覺作為作為人工智能的三大應用領域之一,占比達34.9%,已在交通、醫(yī)療、金融、教育、安防等多個垂直領域得到應用,并成為各行業(yè)發(fā)展的重要支撐。
(圖片來源:前瞻產業(yè)研究院)
計算機視覺中,圖像識別、人臉識別這兩個分支頗為重要。而安防深度依托于圖像處理,人臉識別技術也落地安防多年,c端商業(yè)應用成熟。在海量視頻存儲時代,人力無法完成對監(jiān)控視頻的有效處理。人們需要借助計算機視覺技術,讓監(jiān)控攝像機代替人眼對目標完成識別、分析和跟蹤等工作。對智能安防來說,計算機視覺就是感知外界的“智眼”。通過計算機視覺技術的加持,監(jiān)控攝像頭具有實時識別人臉、車輛、物體的能力。因此,???、大華、易華錄等傳統安防廠商均在積極布局,縱向打通計算機視覺框架、自主研發(fā)關鍵技術,即依托深厚行業(yè)基礎和渠道資源開拓新市場,以高性能安防設備為基礎,推出特定場所的視覺安防總體解決方案并快速落地應用。
盡管計算視覺領域充斥著大大小小的公司,但其發(fā)展主要力量還是ai創(chuàng)企。根據新思界產業(yè)研究中心發(fā)布的報告顯示,得益于市場快速發(fā)展,計算機視覺領域創(chuàng)業(yè)潮興起,成為人工智能行業(yè)中創(chuàng)業(yè)公司扎堆的領域。這些創(chuàng)業(yè)公司吸金屢創(chuàng)新高,取得的成績較好,*、金融機構、零售商、手機廠商等等都是ai創(chuàng)企客戶,其中*的計算機視覺“四小龍”,市場份額合計占比達到69.4%。具體來看,依圖科技在人臉識別、語音識別領域表現不俗,其人臉識別算法在千萬分之一誤報下的識別準確率超過99%,短語音聽寫字錯率僅為3.71%,并聯合微軟azure推出依圖語音開放平臺,攜手華為發(fā)布“智能語音聯合解決方案”和“智能醫(yī)療云”,為醫(yī)療科學發(fā)展和生物識別技術水平提升帶來更多可能;商湯科技進入安防監(jiān)控、金融、手機、移動互聯網和深度學習芯片等領域,核心技術包括人臉識別、視頻監(jiān)控識別算法、自動駕駛識別算法、醫(yī)療影像識別算法等;曠視科技則從互聯網金融切入,然后拓展到安防、手機、新零售、機器人、行業(yè)物聯等行業(yè);云從科技主攻金融、安防,以及交通、新零售等行業(yè),在3d結構光技術上持續(xù)發(fā)力,以打破蘋果技術壟斷,為身份識別再筑“防火墻”。國內除ai創(chuàng)企和安防廠商外,互聯網巨頭如騰訊、百度、阿里、金山等也在加緊布局,使計算機視覺賽道更為火熱。值得玩味的是,人工智能四小龍中,除了ai隊云從,曠視、商湯、依圖,或多或少與阿里巴巴發(fā)生了聯系。細而言之,商湯與曠視均獲得過阿里投資,曠視還是螞蟻金服戰(zhàn)略合作伙伴,而馬云、虞鋒共同發(fā)起設立的“云峰基金”已成依圖重要股東,依圖科技聯合創(chuàng)始人林晨曦還曾任職阿里云技術總監(jiān)。
(圖片來源:易觀)
放眼海外,蘋果、亞馬遜等科技巨頭持續(xù)收購成熟的技術團隊完善技術體系,陸續(xù)推出開源計算機視覺開發(fā)平臺,吸引初創(chuàng)企業(yè)協作開發(fā)面向不同場景的解決方案,以平臺為核心立體式地推進,打造全產業(yè)生態(tài)。例如,谷歌以tensorflow及google cloud為核心,橫向上,進軍圖像分析、文字識別等技術,推出google lens等視覺服務產品;縱向上,向下拓展基礎硬件推出tpu芯片,向上拓展無人駕駛、醫(yī)療等垂直領域,逐漸打造包括計算機視覺在內的人工智能大生態(tài)。ic半導體公司英偉達在cvpr 2018大會上,開源數據增強和數據解碼庫,解決計算機視覺性能瓶頸,數月后其ai團隊為gan創(chuàng)造一種新的生成器,該結構不需要人類監(jiān)督,可自動分離圖像中的各種屬性。結語:金鱗豈是池中物,一遇風云便化龍。從監(jiān)控攝像頭到車牌識別,從人臉識別到出入境管理,從深度學習到人工智能,計算機視覺都擔當著重要角色。相信隨著ai落地生花,計算機視覺將扶搖直上,解鎖更多場景,為行業(yè)應用帶來更大的價值。