3D機(jī)器視覺所帶來的技術(shù)發(fā)展趨勢

時間:2023-07-26 17:06來源:今日光電作者:網(wǎng)絡(luò) 點(diǎn)擊: 次

在科幻小說中，機(jī)器人要么是與人類對立，要么是變異成壞人。但如今現(xiàn)實(shí)生活中機(jī)器人的應(yīng)用大為不同。機(jī)器正代替人眼來看世界并加以行動，它們所到之處讓生活變得智慧化。
通過攝取圖像模擬人眼的視覺功能，提取信息然后加以分析處理，機(jī)器視覺已成為智慧城市過程中不可或缺的“第三只眼睛”，其應(yīng)用領(lǐng)域也從食品生產(chǎn)流程管理、農(nóng)業(yè)種植控制、醫(yī)學(xué)檢測等方面的個體需求到交通及安防等公共項(xiàng)目。其中我司深圳朗銳智科實(shí)業(yè)有限公司研發(fā)的雞蛋收集線計數(shù)器，就被投放到家禽養(yǎng)殖場使用，在使用過程中可以提高效率和降低成本。
隨著機(jī)器視覺的發(fā)展與進(jìn)步，3D機(jī)器視覺迎來了自動化行業(yè)的巨大機(jī)遇，主要用于質(zhì)量保證和檢測。據(jù)數(shù)據(jù)預(yù)測，2017年到2022年期間的復(fù)合年增長率將達(dá)到11.07%，2022年全球3D機(jī)器視覺市場規(guī)模有望達(dá)到21.3億美元。
在機(jī)器視覺頂會中，差不多會有半壁江山那么多的論文都是跟3D有關(guān)。前沿探索可謂瘋狂進(jìn)行，那么有哪些三維圖像+機(jī)器視覺的新技術(shù)趨勢，今天正隱藏在未知迷霧中眺望這個世界？今天我們來說幾種很有科幻感的技術(shù)突破點(diǎn)。說不定這些能力明年就會出現(xiàn)在你的手機(jī)、VR設(shè)備和無人機(jī)中，又或許即將成為某個被資本瘋狂親吻的創(chuàng)業(yè)熱潮。
超大場景的3D數(shù)據(jù)感知
3D機(jī)器視覺包括很多方面，既有讓智能體去理解3D數(shù)據(jù)，也包括如何通過機(jī)器視覺的解決方案，去獲取3D模型數(shù)據(jù)。
傳統(tǒng)意義上的3D數(shù)據(jù)獲取，或者稱其為3D感知技術(shù)，一般來說可以利用多角度拍照或者深度傳感器的方式實(shí)現(xiàn)3D數(shù)據(jù)收集。這種技術(shù)的局限在于，收集的3D數(shù)據(jù)不能太大。
然而在3D資料要求不斷升級的今天，對于超大場景的3D數(shù)據(jù)感知，正在成為一個熱門議題。比如無人駕駛中使用的城市高精地圖，就可以看做一個個超大3D場景的拼接。智能城市領(lǐng)域運(yùn)用到的很多城市數(shù)據(jù)推演，也要根植于對城市3D場景的收集。
機(jī)器視覺正在為超大場景的3D數(shù)據(jù)感知提供很多新的方法。比如自動化的成像方法，像視覺SLAM在線處理連續(xù)幀的圖像，實(shí)現(xiàn)實(shí)時重建巨大3D場景。再比如說對航拍數(shù)據(jù)進(jìn)行點(diǎn)云分割和點(diǎn)云數(shù)據(jù)的語義理解，幫助快速低成本獲取城市3D數(shù)據(jù)。
總體來看，今天超大場景的3D數(shù)據(jù)感知，有三個主要應(yīng)用方向，很可能分別成為各自技術(shù)領(lǐng)域中新的投資和創(chuàng)業(yè)熱點(diǎn)：
1、建筑物的3D高精度模型，運(yùn)用在工程監(jiān)理、智能設(shè)計、物流和智能城市領(lǐng)域。
2、高精地圖與3D數(shù)據(jù)感知的結(jié)合，這是無人駕駛的重要一環(huán)。
3、室內(nèi)外一體的3D建模，這對于智能家居設(shè)計、環(huán)境監(jiān)控、VR/AR體驗(yàn)來說都有重要幫助。
手機(jī)與3D視覺進(jìn)入蜜月期
目前，智能手機(jī)已經(jīng)成為AR/AR以及計算視覺等先進(jìn)技術(shù)發(fā)展的最大載體，人臉識別、AR功能成為當(dāng)前智能手機(jī)發(fā)展的熱點(diǎn)，其實(shí)無論是在AR/VR領(lǐng)域還是識別技術(shù)，都離不開計算視覺。計算視覺領(lǐng)域其實(shí)就是運(yùn)用計算機(jī)技術(shù)對生物視覺的一種模擬，其中深度識別和多維成像使其核心技術(shù)。
深度識別是計算視覺的關(guān)鍵前提，能夠?qū)ι镆曈X進(jìn)行識別，其中包括當(dāng)前流行的蘋果人臉識別技術(shù)，多維成像將包括目前的3D顯示結(jié)局即對圖片以及視頻等進(jìn)行3D畫面的再現(xiàn)。利用深度識別和多維成像技術(shù)，除了還原我們?nèi)庋鬯芸吹降漠嬅?，未來隨著技術(shù)的不斷融合，深度識別技術(shù)還能是立體的展示我們?nèi)庋鬯床坏降臇|西。例如，未來的智能手機(jī)可以在陽光下利用深度識別技術(shù)和人工智能技術(shù)的分析，識別紫外線的強(qiáng)度，提醒我們的防曬護(hù)膚。
AR/VR中的眼球追蹤技術(shù)
隨著技術(shù)的進(jìn)步，我們現(xiàn)在已經(jīng)能夠利用人類眼睛進(jìn)行虹膜識別，虹膜識別相較面部識別、指紋識別都更加有效和安全，很多手機(jī)廠商開始開發(fā)使用虹膜識別功能。
除了虹膜識別之外，還有眼球追蹤技術(shù)。所謂眼球追蹤，是指一項(xiàng)技術(shù)能夠追蹤眼球的運(yùn)動，并利用這種眼球運(yùn)動來增強(qiáng)某個產(chǎn)品或服務(wù)的體驗(yàn)。
眼球追蹤技術(shù)曾經(jīng)在智能手機(jī)領(lǐng)域火了一陣，這可能要追溯到2013年Galaxy S4手機(jī)率先搭載了眼球追蹤功能，這項(xiàng)功能主要應(yīng)用在視頻播放上面。舉個例子，如果你正在觀看一個視頻，然后你身后的同學(xué)拍了一下你肩膀，在你轉(zhuǎn)過頭的時候，由于你的眼睛已經(jīng)不再看著屏幕，視頻會自動暫停，而當(dāng)你回過頭來，視頻會自動繼續(xù)播放。不需要你用手去點(diǎn)擊暫停和播放;或者你在手機(jī)上看網(wǎng)頁，當(dāng)你眼睛看到屏幕底部的時候，網(wǎng)頁會自動翻頁。同年，LG也推出了一款擁有眼球追蹤功能的LG Optimus G Pro手機(jī)。
可惜，眼球追蹤未能在手機(jī)領(lǐng)域掀起大風(fēng)大浪，原因大概有兩點(diǎn)。首先用戶沒有需求，一款智能手機(jī)的平均尺寸大約只有5英寸，在這么一丁點(diǎn)兒大的地方，人們更喜歡直接用手指進(jìn)行交互，何況手機(jī)絕大部分功能都是使用手指進(jìn)行交互，所以也不多播放/暫停這個環(huán)節(jié);第二個原因就是，當(dāng)時技術(shù)不太成熟，分辨率低，識別不夠精準(zhǔn)，導(dǎo)致有用戶覺得眼睛累。
3D視覺助力機(jī)器人產(chǎn)業(yè)智能化轉(zhuǎn)型
3D視覺作為一項(xiàng)激動人心的新技術(shù)，早已經(jīng)出現(xiàn)在微軟Kinect、英特爾RealSense等消費(fèi)級產(chǎn)品中。近幾年，隨著硬件端技術(shù)的不斷進(jìn)步，算法與軟件層面的不斷優(yōu)化，3D深度視覺的精度和實(shí)用性得到大幅提升，使得“3D深度相機(jī)+手勢/人臉識別”具備了大規(guī)模進(jìn)入移動智能終端的基礎(chǔ)。作為全球手機(jī)當(dāng)之無愧的龍頭，蘋果率先大規(guī)模采用3D視覺技術(shù)，將徹底激活3D視覺市場，開啟全新時代。
3D視覺技術(shù)不僅僅在識別精度方面大幅提升，更重要的是打開了更加廣闊的人工智能應(yīng)用空間。隨著機(jī)器視覺、人工智能、人機(jī)交互等科學(xué)技術(shù)的發(fā)展，各種高智能機(jī)器人開始走進(jìn)現(xiàn)實(shí)，3D視覺技術(shù)成為助力制造業(yè)實(shí)現(xiàn)“智能化”轉(zhuǎn)型的好幫手。
大家耳熟能詳?shù)纳疃葦z像頭技術(shù)和應(yīng)用有英特爾的RealSense、微軟的 Kinect、蘋果的 PrimeSense、以及谷歌的Project Tango等。不過可以看到這一技術(shù)的研究和開發(fā)多為國外公司，國內(nèi)計算視覺方面的公司或創(chuàng)業(yè)團(tuán)隊(duì)屈指可數(shù)，技術(shù)上的壁壘依舊較大。
關(guān)于目前市場上的深度相機(jī)的技術(shù)方案主要有以下三種：雙目被動視覺、結(jié)構(gòu)光、TOF。雙目被動視覺主要是利用兩個光學(xué)攝像頭，通過左右立體像對匹配后，再經(jīng)過三角測量法來得到深度信息。此算法復(fù)雜度高，難度很大，處理芯片需要很高的計算性能，同時它也繼承了普通RGB攝像頭的缺點(diǎn)：在昏暗環(huán)境下以及特征不明顯的情況下并不適用。
結(jié)構(gòu)光的原理是通過紅外激光發(fā)射相對隨機(jī)但又固定的斑點(diǎn)圖案，這些光斑打在物體上后，因?yàn)榕c攝像頭距離不同，被攝像頭捕捉到的位置也不盡相同。然后先計算拍到的圖的斑點(diǎn)與標(biāo)定的標(biāo)準(zhǔn)圖案在不同位置的位移，引入攝像頭位置、傳感器大小等參數(shù)計算出物體與攝像頭的距離。
微軟在Kinect二代采用的是ToF的技術(shù)。ToF是Time of flight的簡寫，直譯為飛行時間的意思。所謂飛行時間法3D成像，是通過給目標(biāo)連續(xù)發(fā)送光脈沖，然后用傳感器接收從物體返回的光，通過探測光脈沖的飛行（往返）時間來得到目標(biāo)物距離。相比之下，結(jié)構(gòu)光技術(shù)的優(yōu)勢是比ToF更加成熟，成本更低，更加適合用在手機(jī)等移動設(shè)備上。
深度攝像頭是所有需要三維視覺設(shè)備的必需模塊，有了它，設(shè)備就能夠?qū)崟r獲取周圍環(huán)境物體三維尺寸和深度信息，更全面的讀懂世界。深度攝像頭給室內(nèi)導(dǎo)航與定位、避障、動作捕捉、三維掃描建模等應(yīng)用提供了基礎(chǔ)的技術(shù)支持，成為現(xiàn)今行業(yè)研究熱點(diǎn)。如今iPhone X搭載3D深度攝像頭勢必會大力推動機(jī)器視覺領(lǐng)域的發(fā)展，助力機(jī)器人產(chǎn)業(yè)實(shí)現(xiàn)完美“智能化轉(zhuǎn)型”。
更好的深度傳感器解決方案
還有一個機(jī)器視覺技術(shù)和3D的交匯，主要發(fā)生在無人機(jī)領(lǐng)域。
無人機(jī)今天進(jìn)行測繪和航拍時，必須附帶對空間的理解能力，否則拍照不準(zhǔn)事小，撞了南墻事大。而這個能力主要來自于攝像頭和傳感器進(jìn)行空間閱讀。
隨著消費(fèi)級無人機(jī)的不斷升級，人們對無人機(jī)拍攝效果要求也不斷升高。無人機(jī)必須不斷在更遠(yuǎn)的距離、更極端的天氣、更復(fù)雜的運(yùn)動中拍攝畫面。然而傳統(tǒng)的傳感系統(tǒng)解決方案已經(jīng)快要跟不上用戶的期許。
今天的消費(fèi)級無人機(jī)，一般采取兩種感知解決方案，一種是雙目視覺技術(shù)，比如大疆的某些產(chǎn)品；一種是結(jié)構(gòu)光傳感器，比如微軟的Kinect。而這兩種主流方案都是有一定局限的，比如感知范圍都有限，難以完成遠(yuǎn)距離作業(yè)。再比如雙目視覺技術(shù)在黑夜中會失靈，所以無人機(jī)夜拍一直是個大坑，然而結(jié)構(gòu)光技術(shù)應(yīng)對不來強(qiáng)光，一到中午無人機(jī)就石樂志也是很心塞的。
更好的解決方案，在于將傳感器與智能攝像頭結(jié)合起來，達(dá)成可以適應(yīng)不同天候與天氣，并且可以長距離感知的新型傳感系統(tǒng)解決方案。
今天，用機(jī)器視覺技術(shù)中的很多算法，協(xié)調(diào)不同的傳感設(shè)備工作，讓無人機(jī)變成“多眼無人機(jī)”，正在成為流行的解決方案。機(jī)器視覺算法大量加入無人機(jī)傳感器，還可能帶來軌跡拍攝能力提升，讓無人機(jī)獲得拍攝整體環(huán)境，或者精準(zhǔn)捕捉動態(tài)物體，比如說運(yùn)動中的動物和車輛的能力。
以上幾個技術(shù)趨勢，都可能成為機(jī)器視覺和圖形學(xué)應(yīng)用的下一步熱點(diǎn)。這個領(lǐng)域看似偏門，事實(shí)上卻能影響今天科技市場中的風(fēng)吹草動。
讓機(jī)器看到立體世界的游戲才剛剛開始，機(jī)器與人類在某一天可以用同樣的視角相互凝視，或許才是這個故事的終點(diǎn)。

上一篇：“智”造業(yè)下的新民工：面對機(jī)器，他們靠什么
下一篇：60V以下低壓電機(jī)與變頻器市場備受關(guān)注

91精品国产综合久久久亚州日韩|亚洲av人人夜夜澡人人|久久99热这里只有精品免费看|人妻丰满AV无码中文字幕

3D機(jī)器視覺所帶來的技術(shù)發(fā)展趨勢

時間:2023-07-26 17:06來源:今日光電作者:網(wǎng)絡(luò) 點(diǎn)擊: 次

友情鏈接

91精品国产综合久久久亚州日韩|亚洲av人人夜夜澡人人|久久99热这里只有精品免费看|人妻丰满AV无码中文字幕

3D機(jī)器視覺所帶來的技術(shù)發(fā)展趨勢

時間:2023-07-26 17:06來源:今日光電 作者:網(wǎng)絡(luò) 點(diǎn)擊: 次

友情鏈接

時間:2023-07-26 17:06來源:今日光電作者:網(wǎng)絡(luò) 點(diǎn)擊: 次