關(guān)鍵技術(shù)梳理,告訴你AR并沒(méi)有那么神秘

巫盼 9年前 (2016-11-15)

巨頭們都關(guān)注的AR關(guān)鍵技術(shù)有哪些?它們目前的發(fā)展狀況又是如何呢?

關(guān)鍵技術(shù)梳理,告訴你AR并沒(méi)有那么神秘

最近又有爆料稱(chēng),蘋(píng)果要在明年發(fā)布iPhone 8的時(shí)候推出支持AR技術(shù)的設備。雖然蘋(píng)果對于A(yíng)R的關(guān)注度一直很高,但是現在并沒(méi)有明確的證據表明蘋(píng)果正在研發(fā)AR硬件設備,很多消息都是科技圈內爆料大神們各種捕風(fēng)捉影的猜測。

除了蘋(píng)果之外,國內外很多巨頭都非常關(guān)注AR的發(fā)展。此前易觀(guān)智庫發(fā)布的《中國AR行業(yè)應用專(zhuān)題研究報告》中顯示,這些巨頭正在基于自身的業(yè)務(wù)生態(tài),以實(shí)驗室或者收購的形式搶先布局AR的底層技術(shù)。那么AR關(guān)鍵技術(shù)有哪些?它們目前的發(fā)展狀況又是如何呢?

關(guān)鍵技術(shù)梳理,告訴你AR并沒(méi)有那么神秘

根據AR科研帶頭人Ronald Azuma提出的定義,增強現實(shí)應用系統開(kāi)發(fā)的三大關(guān)鍵技術(shù)可總結為三維注冊技術(shù)、虛實(shí)融合顯示技術(shù)以及人機交互技術(shù)。

系統顯示技術(shù)

AR的簡(jiǎn)單定義就是將計算機生成的虛擬數字信息疊加到現實(shí)的生活場(chǎng)景中。這個(gè)“疊加”是需要通過(guò)顯示設備作為中介來(lái)實(shí)現。AR的顯示技術(shù)包括三種類(lèi)型:頭戴式顯示、手持顯示以及投影顯示技術(shù)。

目前最常見(jiàn)的就是手持顯示技術(shù),它的載體包括移智能手機、平板電腦等移動(dòng)設備。此前火爆全球的AR游戲《Pokemon Go》就是借助手機的顯示屏在現實(shí)生活中捉小精靈,這些移動(dòng)設備的屏幕充當的就是一個(gè)窗口或者放大器的作用,用來(lái)顯示那些模擬的數字信息。

頭戴式顯示是國內外眾多AR硬件廠(chǎng)商研究關(guān)注的重點(diǎn),按照工作原理可以分為光學(xué)透視式和視頻透視式兩種。光學(xué)透視技術(shù)是通過(guò)安裝在設備眼前的光學(xué)透鏡來(lái)呈現出真實(shí)和虛擬世界。首先計算機生成的虛擬信息經(jīng)過(guò)光學(xué)系統放大后反射后進(jìn)入視野,透過(guò)透鏡又能直接看到現實(shí)場(chǎng)景,兩部分的信息匯聚到人眼的視網(wǎng)膜上實(shí)現AR的效果。微軟的Hololens就是屬于光學(xué)透視式的頭戴顯示器。這種顯示技術(shù)的優(yōu)點(diǎn)就在于結構簡(jiǎn)單,真實(shí)感和安全性更高,但是易受光線(xiàn)外部光線(xiàn)的干擾。

關(guān)鍵技術(shù)梳理,告訴你AR并沒(méi)有那么神秘

視頻透視技術(shù)是借助安裝在頭顯上的攝像頭來(lái)捕捉獲取外部真實(shí)環(huán)境,計算機將數字模擬信息疊加到攝像機的視頻信號上,再將真實(shí)場(chǎng)景和虛擬場(chǎng)景進(jìn)行融合。相比較光學(xué)透視技術(shù),它的視角場(chǎng)更大,而且不受外界的強光干擾。不過(guò)一旦攝像機與用戶(hù)的視點(diǎn)不能保持完全重合,會(huì )產(chǎn)生一些偏差。

關(guān)鍵技術(shù)梳理,告訴你AR并沒(méi)有那么神秘

投影式顯示是將生成的虛擬對象信息直接投影到需要融合的真實(shí)場(chǎng)景中。它可以不借助任何硬件設備,直接用肉眼看到被投射出在現實(shí)環(huán)境下的虛擬場(chǎng)景。但是投影設備體積龐大,比較容易受到光照變化影響,這塊目前的實(shí)際應用比較少。

現在還有一種光場(chǎng)顯示技術(shù),以Magic Leap的光場(chǎng)技術(shù)為例,它不需要任何屏幕為載體,通過(guò)記錄并復現光場(chǎng)就能完成虛擬物體的顯示。通過(guò)呈現不同深度的圖像,使用戶(hù)在觀(guān)察近景或遠景時(shí),可以實(shí)現主動(dòng)的對焦。

關(guān)鍵技術(shù)梳理,告訴你AR并沒(méi)有那么神秘

對比這三種顯示技術(shù),手持式顯示技術(shù)的載體是最為常見(jiàn)的,所以在面向C端用戶(hù)的AR電商、游戲上應用廣泛。而頭戴式顯示在TOC端的工業(yè)應用上潛力巨大,比如宇航制造業(yè),通過(guò)使用這種設備來(lái)提高生產(chǎn)工作的效率。

三維注冊技術(shù)

在實(shí)際的AR體驗中,因為人的觀(guān)察視線(xiàn)會(huì )不斷地變化,AR系統需要實(shí)時(shí)的根據用戶(hù)的視場(chǎng)重新建立位置坐標系,進(jìn)行追蹤。而三維注冊技術(shù)就是實(shí)時(shí)地跟蹤用戶(hù)頭部的位置和視線(xiàn)方向,根據這些信息來(lái)確定虛擬物體在真實(shí)空間坐標中的位置,并將它實(shí)時(shí)地顯示在顯示器中的正確位置。它具體包含了跟蹤技術(shù)、標定技術(shù)和匹配技術(shù)。

三維注冊技術(shù)又可以分為基于硬件設備和計算機視覺(jué)兩種。

基于硬件設備的追蹤技術(shù)主要是通過(guò)硬件傳感器跟蹤技術(shù)來(lái)實(shí)現,主要包括慣性導航系統、全球定位系統(GPS)、電磁、光學(xué)或超聲波位置跟蹤器等。谷歌的Project Tango就是通過(guò)手機的傳感器來(lái)進(jìn)行運動(dòng)追蹤。雖然它無(wú)需通過(guò)計算機復雜的算法來(lái)獲取位置信息,速度比較快,但是相應的注冊精度不是很高,比如GPS定位很容易受到復雜地形位置的干擾,而慣性定位追蹤的偏差度會(huì )隨時(shí)間增長(cháng)不斷增大。

關(guān)鍵技術(shù)梳理,告訴你AR并沒(méi)有那么神秘

基于計算機視覺(jué)的注冊技術(shù)主要是指利用計算機視覺(jué)獲取真實(shí)場(chǎng)景的信息后,經(jīng)過(guò)圖像處理方面的知識來(lái)識別和跟蹤定位真實(shí)場(chǎng)景。細分可以劃為基于傳統標志的注冊算法和基于自然特征點(diǎn)無(wú)標志注冊算法?;谟嬎銠C視覺(jué)的注冊技術(shù)的精度較高,但是對計算量非常大,而且算法復雜,對系統的要求非常高。

為了取長(cháng)補短,得到更加精確的注冊結果,現在有結合兩種技術(shù)的混合注冊方法。通常是先由跟蹤傳感器大概估計位置姿態(tài),再通過(guò)視覺(jué)法進(jìn)一步精確調整定位。一般采用的復合法有視覺(jué)與電磁跟蹤結合、視覺(jué)與慣導跟蹤結合、視覺(jué)與GPS跟蹤結合等。

人機交互技術(shù)

因為AR是將虛擬的數字信息疊加在現實(shí)環(huán)境中,所以非常注重用戶(hù)在真實(shí)環(huán)境中和虛擬物體的自然交互。這就需要有針對性的設計用來(lái)交互的“工具”,保證能夠執行用戶(hù)對虛擬物體發(fā)出的各種指令。

AR的交互方式現在有通過(guò)外界的硬件設備來(lái)實(shí)現,如鼠標鍵盤(pán),數據手套等等。還有一種更自然的交互方式,就是通過(guò)基于計算機視覺(jué)的手勢識別,以及語(yǔ)音識別等等。它們不需要借助其他硬件載體,就可以直接和虛擬物體進(jìn)行交互,而這種人機交互依賴(lài)于以深度學(xué)習算法為基礎的人工智能的發(fā)展?,F在的AR硬件設備大多都可以實(shí)現簡(jiǎn)單的語(yǔ)音和手勢動(dòng)作的識別交互,但是涉及到一些復雜的指令的時(shí)候,可能會(huì )無(wú)法進(jìn)行及時(shí)的命令反饋。

上面提到的三大塊只是AR技術(shù)的主干支,在每一個(gè)主干下面都能衍生出其他分支技術(shù)。隨著(zhù)技術(shù)的不斷深入發(fā)展,未來(lái)的AR會(huì )和真實(shí)世界完全融合。就像《黑鏡》第三季的《游戲測試》故事那樣,人們或許會(huì )逐漸無(wú)法分辨何為現實(shí)何為虛擬。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到