采訪背景:隨著工業4.0和智能制造時代的到來,3D機器視覺在工業和行業領域的應用越來越重要,涉及物件辨識、產品檢測、尺寸測量、機械手的視覺引導定位等。上海圖漾信息科技有限公司(以下簡稱“圖漾科技”)是一家專業的3D機器視覺技術公司,提供3D工業相機硬件和應用軟件配套,組成豐富和可靈活伸縮擴展的軟硬件協同產品方案,為工業和行業應用、機器人、智能安防、智慧商業等應用提供產品及服務,目前產品已經在諸多行業大客戶上線并大量部署。麥姆斯咨詢有幸邀請到圖漾科技出席今年9月5日在深圳舉辦的『第二十七屆“微言大義”研討會:機器視覺及工業檢測』。在此之前,麥姆斯咨詢與圖漾科技創始人兼CEO費浙平先生,就3D機器視覺發展及工業應用進行了深入交談!
圖漾科技CEO費浙平
麥姆斯咨詢:請您介紹下圖漾科技的發展歷程和現狀?
費浙平:圖漾科技已經成立近4年時間了,目前員工約50人,一直以來專注于3D機器視覺的技術研發和應用落地,致力于產品在工業行業領域的大規模普及性應用,助推工業人工智能和生產力水平的提升。3D視覺在過去的幾年里概念迭出,如體感娛樂、人機交互、視覺導航、智能手機、增強現實/虛擬現實(AR/VR)等,我們有不少客戶和合作伙伴也在積極探索這些新興應用,但我們自己的的主要資源和精力集中于工業和行業解決方案的技術研發和產業落地,從核心技術研發、產品方案設計、現場測試、工程優化,到最終實現并交付超高性價比的軟硬件整合方案,在物流、工業自動化、工業測量、智慧商業等多個場景的龍頭客戶生產現場開始了大量部署,夯實了我們在3D機器視覺領域的核心競爭力,形成了明顯的行業優勢地位。去年我們已經實現了幾千萬人民幣的主營業務收入,今年預計將實現第一個盈利年度,可以說目前公司已經實現了從0到1的突破,后續將在產品持續演進、更多的行業解決方案落地和商業化進程中加速發展,實現我們“3D機器視覺無處不在”的愿景。
麥姆斯咨詢:業界都說3D視覺的出現,是繼黑白到彩色、低分辨率到高分辨率、靜態圖像到動態影像后的第四次視覺革命。請您為大家分享一下相比2D視覺,3D視覺的優勢有哪些?3D視覺會為哪些應用領域帶來突破性的發展?
費浙平:毫無疑問,3D視覺正在多個領域中為智能視覺帶來新的技術能力和應用可能。但整體而言,3D視覺目前還處于早期,落地場景都還比較分散,只能算是有了一些點的突破,還談不上線和面的普及。3D視覺無可替代的關鍵點在于幾何數據的采集和利用,在傳統的圖像顏色信息之外增加了額外的空間維度,定性而言,在傳感器的數據采集層面就同人的視覺系統持平了,往后如果機器視覺的“人工智能”能力再不如人的話,就只能歸咎于數據質量和機器的聰明程度了。
就具體技術角度來看,2D顏色和3D幾何數據的采集是從兩個不同的物理通道進行的,在應用方案的選擇過程中必然存在一個選擇2D還是3D的問題(或者兩者協同),而3D的應用機會只能來自于2D做不到或者做不好的場景,目前市場上有一些盲目樂觀的人宣稱3D視覺將全面替代2D的觀點,我認為是很不恰當的,3D的價值還是在于能做到一些2D做不了或做不好的事情。舉幾個例子,如果要測量某些物體的相對尺寸比例,2D視覺可以勝任,但如果要測量物體絕對幾何尺寸的話,那3D視覺將是唯一選項;又比如在工業自動化中,如果能夠保證目標物體的有序平鋪,2D視覺通常能夠做得又快又好又經濟,但如果目標物體是無序的話,則必須有3D視覺加持;我們最近還碰到一個有趣的客戶案例——數雞蛋:通過2D識別雞蛋的技術也并不難,但是在實際工況條件下出錯率很高,2D視覺系統受到雞蛋的顏色、包裝材料的顏色、背景顏色、環境光照條件等諸多約束條件的影響,方案的標準化和效果一致性問題難以令人滿意,而如果采用3D方法的話,雞蛋的幾何形狀完全不受這些顏色類因素的影響,約束條件少、識別精度高,方案可以做到完全的標準化,這種就屬于3D能比2D做得更好的案例。諸如此類的真實行業需求,正在源源不斷地涌現并落地,無論是2D還是3D,機器視覺的春天都才剛剛露出苗頭而已。
麥姆斯咨詢:當前市面上主流的3D視覺技術有三種:雙目視覺、飛行時間(ToF)和結構光。請問圖漾科技3D視覺技術主要基于哪種方案?相比其它方案,請您詳細介紹一下圖漾科技3D視覺方案的特點和優勢。
費浙平:你提到的這些方案都是消費類產品中的常見技術方案,在工業中其實都難以應用,工業領域基本上都是采用“雙目+結構光”的方案,其中的結構光又有動態結構光和靜態結構光的差別。
(1)雙目視覺即大家一般認知上的“立體視覺”,更正確的名稱應該叫“被動雙目”,有些附加了輔助照明光學系統的雙目,也還是被動雙目,除了避障和ADAS這兩類應用,幾乎沒有更多的其他適用場景;
(2)目前大家一般所言的結構光,是指蘋果Face-ID采用的“單目結構光”,即一收一發的架構,這種方案在體感消費娛樂、近場人臉的活體檢測等場景是經驗證成熟可用的,產業鏈在蘋果的帶領下也相對成熟了,問題是技術方案本身存在的制約因素阻擋了產品性能向上演進的可能性,其主要適用范圍在低成本的近場低精度場景,跟ToF有高度的重合,ToF模組量產成熟后將面臨激烈競爭;
(3)ToF因為采用了特殊專用的傳感器芯片,導致其技術規格和產業鏈成熟度大受制約,ToF模組的收發器件無需基線隔離的特點能夠幫助把模組尺寸做到最小,加工工藝也簡單,有助于成本降低,因此在近場低精度應用上可能可以超越單目結構光,但同樣地限于分辨率和技術特點本身限制,其測量精度受限,遠距離所需付出的功耗代價太大,難以成為工業3D測量需求的選擇;
(4)上述三種消費類3D產品中的常見技術路線,在工業領域基本沒有大的應用空間。在工業高端檢測和測量應用中,目前常見的是兩種產品,一是激光線掃描相機、二是雙目動態結構光。這兩種方案在原理上能夠實現最高精度的視覺測量,常見精度范圍為0.1~0.01mm甚至更高,但是量程通常很小(幾厘米到幾十厘米)、體積功耗非常大、對工況條件要求比較高、價格奇高,目前在工業檢測和自動分揀中有局部應用,平均價格超過1萬美金,全球的年出貨在千臺(K)數量級,因此是一個極細分的專門市場,國外機器視覺大廠和國內進口替代產品市面上都有。
我們圖漾科技采用的技術方案屬于雙目結構光路線,但是我們在結構光設計和物理實現方法上面做了很多創新,針對不同產品規格,我們采用了靜態散斑結構光、多模態組合結構光、動態結構光等,以實現多種不同規格和價格的完整產品線。不同的結構光組合方式配合不同的雙目算法,結合我們的算法優化和算法的硬化實現,在低成本、小尺寸和低功耗約束條件下實現了超高性價比的工業級3D相機產品線,售價范圍在1000到20000人民幣之間,滿足絕大多數工業和行業應用的需求。我們的目標愿景是行業普及,而不是簡單幾個點或者某些進口產品的替代而已。
圖漾科技的部分產品及規格指標
麥姆斯咨詢:請您再談談動態結構光和靜態結構光之間的差異,謝謝。
費浙平:動態結構光和靜態結構光是指結構光投射器投射的圖形(pattern)是否可以變換,顯然動態結構光有條件得到更多的信息并生成更高精度的3D數據,但是適用場景會受到一些限制并顯然需要付出更高的成本。兩者的主要差別在于:
(1)動態結構光因為一次拍攝需要動態變換多幀pattern,只能進行靜止拍攝,而靜態結構光只需投射一副pattern,只要成像時間快就可以支持動態拍攝,動態拍攝能力主要取決于面陣圖像傳感器芯片的曝光速度,如圖漾科技目前的量產型號中有可支持1.5m/s帶速的運動拍攝產品;
(2)動態結構光的設計目的是為了更高的精度,一般單幀測量精度能到0.1mm甚至更高,靜態結構光的單幀測量精度多數為mm級別,優化好的相機能到0.5mm,兩者在精度上碰巧可以形成一種銜接關系,可自然形成產品規格的補充,各有所用;
(3)量程方面,動態結構光的量程受制于投影設備因素一般偏小,靜態結構光的量程只要付出光功率的代價范圍可以很廣;
(4)價格方面,成熟的動態結構光相機成本目前都在數萬元以上,靜態結構光相機產品,不同規格從數百元到上萬元的不同性價比產品選擇面很廣;
(5)動態結構光的尺寸和功耗通常比較大,靜態結構光則可以做到非常緊湊、超低功耗。
從發展和應用角度來看,在工業檢測領域,尤其是需要0.1mm以下的超高精度場景里,動態結構光的靜態拍攝方法目前是合理選項,而在大量的普及化應用場景中,靜態結構光產品將是不二之選。
另外多補充一點,雙目加偽隨機編碼靜態結構光的基礎方法是圖漾科技早在5年前就申請的發明專利,且已經獲得授權,這是一條非常重要的核心專利。
動態結構光和靜態結構光特性比較
麥姆斯咨詢:當前iPhone X人臉識別帶火了3D視覺技術在消費領域的應用。請您為大家講一講,3D視覺在消費類和工業類應用中,軟硬件方面主要有何差異?
費浙平:消費類產品和工業產品幾乎就是兩個不同的世界,2D機器視覺就是一個現成的好例子,消費類相機和手機的品牌大家都耳熟能詳,但在工業相機中幾乎是零存在,工業相機中的傳統大廠是康耐視、基恩士、巴斯勒這些,這些都是行業中的巨頭,但在消費市場可能就默默無聞。
無論2D還是3D,消費和工業產品之間的玩家和產業鏈都大不一樣。從具體硬件來看,經常會發生消費類的規格參數看起來比工業產品還高的情況,這里面存在一些非常誤導的因素,比如圖像質量和測量精度,消費類產品幾乎都存在過度美化和拔高的情況,或者可以說,大家習慣于標稱“best case”條件下的參數,而工業類產品需要比較嚴格標稱“worst case”數據,另外工業產品需要保證不同工況條件和大規模工作負載下的高度一致、穩定和可靠性,這在光學、電學和結構設計上有很多一般規格參數所不能體現的極高門檻,當然工業相機可以在相機體積和功耗層面稍微做出一些折衷以滿足工作穩定性和可靠性的挑戰。
另外一個巨大的差別是軟件和服務,消費類產品的功能軟件和算法種類相對比較少,通用和標準化程度極高,所以基本上是由一些專業軟件公司甚至互聯網和云服務公司提供,琳瑯滿目的各種常見濾鏡、圖像識別等炫酷功能,底層的圖像算法和軟件公司數量其實并不多,而工業和行業應用是需要切切實實解決某個具體問題的,不同問題通常需要差異化程度很高的不同成像參數、算法和軟件來實現,因此工業視覺產業鏈里面存在一個為數眾多的集成商和二次開發商環節,需要針對某些具體問題進行針對性的算法研發,或者參數調整等落地工程開發和優化問題。綜合來看,工業用機器視覺的實現代價要遠遠高于消費類產品,而且標準化程度相對較低,導致門檻和價格都要高出一大截。
我喜歡用一個大家天天都能碰到的例子來說明消費和工業視覺的差別:掃二維碼。飯店和咖啡店里面的二維碼POS機,其掃碼方案軟硬件加起來可能只有200塊錢的成本,而物流行業里面的掃碼相機,迄今都還是進口方案為主,最便宜的產品也要大幾千、貴的大幾萬也很常見,都是完成掃二維碼的單一功能,但是不同的工況條件,比如掃碼距離、條碼質量、掃描速度、單次掃描正確率、工作負荷等這些因素,導致了成本和價格幾十、幾百倍的差異。這個例子還可以很生動地說明一個問題,今天很多人,尤其是剛起步的創業者,容易把工業機器視覺的難度低估,機器視覺實現70、80分的程度的確可能很不難,但是要做到90分以上就超級難了,而客戶往往要到95分以上才愿意實際部署使用,過程中所需要付出的工程技術投入和時間成本都是非常高的。所以國外的機器視覺公司通常都有70%以上的毛利、30%以上的凈利,人家還是憑技術和積累吃飯的,我們國內公司需要在機器視覺行業取得成功,完全沒有捷徑,必須要從這條荊棘之路突圍。以我們自己的例子來看,在公司成立的第一年就能夠獲得行業里面最優質標桿客戶的小單子、進入客戶現場進行測試,但一直經過了近2年時間的市場真刀實槍錘煉后,才真正得到客戶的完全認可,并且客戶自己也完成了他們的系統集成和流程改造工作,才開始大規模上線。
麥姆斯咨詢:機器視覺在工業自動化系統的應用由來已久,但比起3D攝像頭在智能手機等消費領域的爆發式發展,3D工業相機的產業化進度似乎并不快,請您談談其中的原因以及影響3D機器視覺在工業領域普及的關鍵障礙是什么?
費浙平:我覺得機器視覺和消費市場兩個不同陣營之間無論產業鏈、產品型態還是行業玩家的差異還是非常大的。比如從我的個人角度看來,3D工業視覺目前的行業產值和產出,可能是遠遠大于消費類3D視覺的!比如從我們自己的一手數據和經驗、以及諸多工業相機公司如康耐視、基恩士他們的公開年報,不完全統計可以得到3D工業相機當前的單點年產值應該已經有幾億美金規模,而3D機器視覺的設備和配套軟件,一般都在相機價格的10~20倍左右,3D機器視覺有清晰的專有3D“相機+設備+軟件”產品型態,目前的產值至少在20億美元之上。如果排除蘋果的iPhone Face-ID,我覺得目前消費類3D的真實市場規模可能要比工業要少一個數量級?這當然有消費類產品和產業鏈的特征原因,以手機為例,只有3D模組可以納入到3D產業鏈,手機上的3D算法和軟件、APP,如刷臉、建模等等,都沒法成為新的增值點,還是由極少數的平臺軟件公司和互聯網公司給吞噬了,3D之于消費類影像市場的增量,我只看到了上游器件和中游模組環節。當然消費類產品在數量上永遠有人手n個的想象空間,這個想象超越了我的認知能力,不作評論。
但是從另外一個角度看,機器視覺目前的行業滲透率的確是很低的,一定程度上也可以說發展進度是不夠快的,大家比較公認的一個觀點是,2D機器視覺的當前滲透率只有5%,應該用但還沒有用上機器視覺的比例還有95%,而3D視覺的數字還要更加小很多。所以這里就有了兩個數字:
(1)當前3D工業相機的規模在幾億美金區間,設備和軟件在20億美金水平;
(2)行業市場有50倍以上的滲透率增長空間。
這就是百億美金狹義3D機器視覺、千億美金廣義3D機器視覺市場規模數字的來源所在。但是這個50倍增量市場的實現,一定是困難重重的,我看到的主要挑戰有以下三點:真實需求落地時間、產品能力、使用成本。
工業和行業市場的源頭都來自于終端用戶的技術升級和技術改造,終端用戶包含制造、物流、廠礦、商超等等傳統行業,行業終端客戶的需求、這些需求的重要性和價值、行業和客戶的買單能力,這些制約因素都會在相當長的時間里把需求出現的節奏拉到很慢,事實上目前能夠落地的都是盈利能力強、信息化和自動化程度高、客戶投入帶來的降本增效價值明顯的行業。其他產品能力和使用成本兩個因素,似乎是不言自明的,就不多說了。
麥姆斯咨詢:價格是影響3D機器視覺應用的關鍵障礙之一,能不能對這個問題稍微再展開一下?
費浙平:沒錯,價格的確是一個極端重要的條件,即使需求成熟了,一個產品的價格沒達到一個合適的“甜蜜點”的話,應用普及的速度也上不來,尤其在國內市場。
以工業自動化領域為例,有一個傳統的說法是一個機器換人的自動化系統,價格如果不能做到2年的人工成本,業主方就會缺乏采用的動力。我的觀點更加激進,2年的投入回報周期太長了,“甜蜜點”應該是1年,必須要讓最終用戶看到后有兩眼發光、拍腦袋就上的沖動。在“手+眼+腦”的三大件當中,我們能夠做好的,就是要把3D視覺機器之眼做到前所未有的性價比,具體來說,根據不同的場景需求和產品規格,我認為產品價格要控制在2000~20000人民幣之間,包含3D工業相機和軟件算法的完整方案、軟硬價都滿足工業級成熟穩定可靠性要求,且軟件要做到極致優化,能在普通工控機上運行,不能動輒就用到GPU,計算單元也是成本大頭。當然這里不包括差異化的非標定制和服務。
極致的成本優化一定是來自于技術創新的,而非簡單的壓榨供應鏈和犧牲毛利這類手段。同時,作為上游的核心視覺零部件供應商,我們一定要做到產品的標準化,提高合作客戶數量和行業應用滲透率。
麥姆斯咨詢:這些產品已經有哪些典型客戶和應用案例?
費浙平:我們每年已經有幾十K的出貨量了,在3D機器視覺的工業應用方面應該能夠說已經走在了全球的最前沿。這除了我們在產品上的領先原因之外,關鍵外因是行業客戶的降本增效和技術升級需求時間窗口的到來。目前我們已經在物流科技、工業測量、工業安全等多個領域成功落地,客戶都是物流、機器人、食品飲料、鋼鐵煤炭、商業零售等行業最大的龍頭企業,這些大行業大客戶都是在經過近2年的技術導入和小批量運營之后才正式上線規模部署的,產品和方案的成熟穩定可靠性驗證過程非常苛刻。在這些大客戶場景完全落地之后,我們現在才有充分的信心來說,公司已經完成了從0到1的跨越,后面就是從1到10的商業化復制和推廣的新挑戰。
圖漾科技一些落地的應用場景案例
麥姆斯咨詢:3D視覺產業鏈很長,需要上下游廠商通力合作,可以分享一下圖漾科技的產業合作情況嗎?
費浙平:跟很多人想象的不一樣,我們7、8年前就開始研發和實現3D相機產品,所有的核心技術和技術訣竅(know-how),包括光學設計及光學設計的物理實現、算法和算法的硬件實現,都是我們自己掌握并有長期的積累的,供應鏈方面一直不是問題,這方面跟大家熟知的手機3D供應鏈完全不同,我們使用的光學器件、生產和標定工藝都跟手機不一樣。產業鏈方面我們更關注的其實是3D視覺的開發者社區規模和開源軟件資源這兩點,開發工程師數量和軟件資源這兩個因素事關下游客戶的使用門檻、事關能否在更多的地方把3D視覺用起來,是我們業務能否快速增長的重要外部因素,也是3D視覺行業規模的直接體現。手機的3D軟件資源限于有限的人臉和建模相關,由極少數幾家手機軟件公司掌控就跑通了,而行業應用面臨的常見和所需的算法無窮多樣,需要龐大的開發者和生態系統支撐才能蓬勃發展。
麥姆斯咨詢:請您暢談一下圖漾科技未來五年產品發展路線圖以及企業愿景。
費浙平:我們的夢想和愿景是3D機器視覺無處不在,增強生產效率、改善人們生活。為此目的,我們需要解決產品先進性、產品的普適性和產品的價格三大問題,而產品的內涵包括了硬件和軟件,早期的難點在于硬件,而隨著應用范圍的擴大、硬件逐步收斂到位成為標品后,更多的價值會轉向軟件。從發展階段來看,我把目前的3D機器視覺發展階段概括為“高成本的樣板工程”階段,圖漾科技可能思考和行動得稍微前面一點,已經在某些垂直行業應用中實現了“標準化的特定行業應用標準方案”,在同一應用市場內的復制推廣已經可以實現,但跨行業或不同應用需求下的研發和工程落地依舊代價很高,我們的下一步目標就是提煉和實現二次開發平臺的標準化和工具化,希望在2~3年的時間內能夠實現突破,幫助我們的客戶和合作伙伴開發新的應用場景時降低門檻,在此之上我們就有機會來構建我們的生態系統了。
麥姆斯咨詢:圖漾科技最近是否有融資計劃?如果有,請您介紹下融資需求吧。
費浙平:迄今為止我們公司的發展都是依賴于外部融資的,去年開始我們有了千萬以上的主營業務收入,財務虧損已經收窄到很少,今年全年預計能夠開始盈利。我們近期會披露一次財務融資消息,這可能是我們最后一次財務融資了,后續在自身業務增長和盈利能力保障的前提下,在資本層面我們應該會更多地轉向同產業資本合作。