計算機視覺發展趨勢范文

時間:2023-12-22 18:04:03

導語:如何才能寫好一篇計算機視覺發展趨勢,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

篇1

關鍵詞 疲勞駕駛 人眼、人臉 嘴巴 專利

中圖分號:C18 文獻標識碼:A

0引言

造成交通事故的原因25%-30%產生于疲勞駕駛,因此疲勞駕駛已成為誘發交通事故的重要因素。國內外專家和學者針對疲勞駕駛的檢測開展了大量的研究工作,目前研究的重心主要集中在基于計算機視覺的疲勞駕駛檢測,因此對基于計算機視覺的疲勞駕駛檢測的相關專利進行分析尤為必要。

1基于計算機視覺的疲勞駕駛檢測專利申請數據分析

1.1全球專利申請量趨勢

從圖1可以看出,基于計算機視覺的疲勞駕駛檢測專利申請量從1990-2001年間處于技術研發初期,專利申請量相對較少。從2002年開始該領域的專利申請量逐漸呈現持續增長趨勢,并在2014年達到最大值153件。由此可知,隨著疲勞駕駛的增多,人們對疲勞駕駛的檢測也越來越重視,相應的研究也正不斷增加。基于此,在今后的一段時間內,相關的專利申請量有望繼續保持。

1.2專利申請產出地區分布

目前各領域的專利申請量主要集中在中國、美國、韓國、日本和歐洲,通過對該領域在中國、美國、韓國、日本和歐洲的專利申請量進行統計分析發現,中國的申請量以48%的占比雄居第一,其他幾個地區的申請量相差不大,具體如圖2所示。

1.3在華專利申請量變化趨勢

圖3為1990年至2014年基于計算機視覺的疲勞駕駛檢測在華的申請量變化趨勢圖,由該圖可以看出,1990-2002年是技術的萌芽期,在2003年以后申請量才呈現逐年增長的趨勢,并且在2012年-2014年將均維持在較高的申請量。因此,該領域國內雖然起步較晚,但是最近幾年申請量相對其他地區卻具有壓制性的優勢。

1.4在華主要申請人分析

圖4展示了在華主要申請人的申請量份額,主要以科研院所和大型汽車企業為主,其中吉利汽車公司以領先優勢排名第一。

2主要技術分支的專利申請分析

基于計算機視覺的疲勞駕駛檢測的主要技術分支有:基于人眼的駕駛疲勞檢測、基于人臉的駕駛疲勞檢測、基于嘴巴的疲勞檢測。下面從三個技術分支的發展概況、三個技術分支的主要工作原理及重點專利等方面進行分析。

2.1全球專利申請主要技術分支的申請量趨勢圖

由圖6可知,近年來基于人眼和人臉的駕駛疲勞檢測的申請量呈現較快增長,申請量也較基于嘴巴的疲勞檢測的申請量大,體現了該領域近年來的發展趨勢,并體現出基于人眼和人臉的駕駛疲勞檢測的技術分支發展已較為成熟。三個技術分支在2006年之前,申請量的差別不大且數量均較小,顯示出在2006年以前三個分支的區別并不明顯,發展也較為緩慢,這說明基于計算機視覺的疲勞駕駛檢測也是近10年才興起的一項技術,它依賴于圖像處理技術的發展水平。

2.2在華專利申請主要技術分支的申請量趨勢圖

由圖7可知,三個技術分支在2006年以前均只有零星的申請量,這與該領域在全球的發展情況相符合,基于人眼的疲勞駕駛檢測在華申請量自2006年以來呈現穩步增長,且近年來申請量最大。基于人臉的疲勞駕駛檢測申請量雖小于基于人眼的疲勞駕駛檢測,但近年來的申請量也呈現出穩步增長的勢頭。然而,基于嘴巴的疲勞駕駛檢測雖有增長趨勢,但申請量一直都較小。由此可知,在國內疲勞駕駛的檢測主要是采用人眼檢測和人臉檢測,這兩個分支是國內的研究的熱門,也是今后國內在該領域的發展趨勢。

3結語

通過對基于計算機視覺的疲勞駕駛檢測專利的申請量的總體分析,以及基于人眼、基于人臉、基于嘴巴三個技術分支的申請量趨勢分析可知,基于計算機視覺的疲勞駕駛檢測在近10年取得了較快發展,這與計算機圖像處理技術的發展密不可分;同時,科研院所作為該領域研究的主體,應加強與中小企業的合作。國內疲勞駕駛的檢測研究主要集中在人眼檢測和人臉檢測,這兩個分支是國內的研究的熱門,同時,基于人眼的疲勞檢測其發展方向明確,后續發展將集中在眼睛定位算法的研究上,并且定位精度將越來越高,越來越滿足實際的要求。

參考文獻

[1] 朱淑亮.基于視頻圖像分析與信息融合的駕駛員疲勞檢測技術研究[J].濟南:山東大學,2011.

[2] 劉學.基于人臉圖像分析的疲勞駕駛檢測方法研究[J].南京:南京航空航天大學,2012.

[3] 張靈聰,王正國,朱佩芳,等.汽車駕駛疲勞研究綜述[J].人類工效學,2003.

篇2

關鍵詞:計算機; 交通運輸; 視覺; 信號控制

中圖分類號:TP39 文獻標識碼:A 文章編號:1006-3315(2013)06-175-001

近20年來,隨著我國經濟社會的快速發展,大家直接的感覺是交通和運輸行業呈現出井噴式的發展:在1990年的時候,我國機動車保有量是1476.26萬輛,我國公路的總里程102.83萬公里;到了2010年,我國汽車的保有量已經達到了2706.13萬輛,我國公路總里程已經達到了482萬公里。交通運輸對經濟的發展起著至關重要的作用,高效的運輸保障能力是促進經濟發展的重要措施;自上世紀計算機技術在交通運輸領域應用以來,其高運算性、集成性為交通運輸系統的發展提供了充分的技術支持,提高了運輸效率,緩解了交通運輸壓力。隨著計算機技術的飛速發展,在交通運輸系統中將會有更為廣泛的運用。

1.計算機視覺技術在交通運輸中的應用

基于圖像處理的計算機視覺技術是通過攝像機獲取場景圖像,并借助于計算機軟件構建一個自動化或半自動化的圖像/視頻理解和分析系統,并提供及時準確的圖像/視頻處理結果,以模仿人的視覺功能。采用人工值守的方式來處理交通問題是一種勞動力成本高昂且效率極為低下的一種工作模式,為了極大地提高工作效率并降低勞動力成本,計算機視覺技術應用于交通領域則成為了近年來的熱點之一,其主要應用于以下幾個方面:

①基于計算機視覺技術的車輛牌照自動識別。

②基于計算機視覺技術的車輛檢測與流量統計。

③基于計算機視覺技術的公交車輛乘客人數統計。

④基于計算機視覺技術的公交專用道非法占道抓拍。

⑤基于計算機視覺技術的駕駛員工作狀態判斷。

⑥基于計算機視覺技術的行人檢測。

隨著圖像處理、模式識別與人工智能技術的發展,更多的基于計算機視覺新技術將在智能交通系統中涌現,并以此進一步便利人們的出行方式與交通職能部門管理水平與工作效率。

2.車輛收費系統中計算機技術的應用

在近期我國興起的不停車收費系統(ETC系統)是一種先進的電子收費系統,它包括自動車輛識別系統、計算機網絡、監控系統和車道系統4個部分。與之前人工的收費系統相比,節約資源、減少污染、杜絕票款流失、減少車輛延誤、提高通行能力與服務水平;該系統普遍采用非接觸式的射頻卡,以天線的方式對車輛上卡中信息進行讀寫,采用高速率的半雙工協議來進行車輛識別與數據交換,實現車輛不停車收費,不停車收費系統將是未來收費系統的發展趨勢,具有極其廣闊的應用前景。

3.在交通信號控制領域計算機技術的應用

隨著大、中城市不斷增加的車輛和有限的道路空間矛盾日益加劇,交通系統面臨著越來越多的問題。合理的運用計算機控制管理技術是緩解城市交通問題的重要措施之一,交通信號自動控制是交通控制的重要組成部分。智能交通中的信號燈控制顯示出了越來越多的重要性,采用計算機技術、自動化控制技術和現代網絡通訊技術,使車輛行駛和道路導航實現智能化,從而緩解道路交通擁堵,減少交通事故,改善道路交通環境,節約交通能源,減輕駕駛疲勞等功能,最終實現安全、舒適、快速、經濟的交通環境。

隨著我國交通建設的發展,未來的交通控制將在道路、車輛和駕駛員之間建立快速通訊聯系。哪里發生了交通事故,哪里交通擁擠,哪條路最為暢通,會以最快的速度提供給駕駛員和交通管理人員。同時專為外出旅行人員及時提供各種交通信息,提供信息的媒介是多種多樣的,如電腦、電視、電話、路標、無線電、車內顯示屏等,任何一種方式都可以。無論你是在辦公室、大街上、家中、汽車上,只要采用其中任何一種方式,你都能從信息系統中獲得所需要的信息。有了該系統,外出旅行者就可以眼觀六路、耳聽八方了。

4.總結

21世紀將是計算機技術高速發展并更加廣泛應用的世紀,也是公路交通智能化的世紀,人們將要利用計算機技術,構建更加智能的交通運輸體系。計算機技術在將來的交通運輸管理中將發揮更加重要的作用。計算機技術將使未來的車輛靠自己的智能系統和道路交通管理體系在道路上自由行駛;公路交通依靠自身的計算機視頻傳感技術將交通流量調整至最佳狀態。計算機技術使得交通運輸的效率更高,更好的為經濟飛速發展做好支持。

參考文獻:

篇3

【關鍵詞】OpenCV視覺庫 圖像處理 Android平臺

Opencv全稱:Open Source Computer Vision Library,是一個可以移植到其他開發工具中的一個跨平臺的圖像處理視覺庫,它由C++語言編寫,主要有C++、C語言接口,為了能在手機等移動端更方便的進行圖像處理,我們利用其JAVA接口將opencv視覺庫添加到Android的開發工具中,實現了在移動端的圖像處理功能。

1 opencv的特點

(1)跨平臺,有很好的移植性。Opencv由跨平臺的中高層API構成,可以運行在Linux、Windows和Mac OS操作系y上,該庫有C++、C、Java接口,我們運用Java接口就可以將Opencv視覺庫移植到Android studio開發工具中。

(2)免費、開源,與耗費很高的商業化工具(比如 MATLAB+Simulink)有很大的區別。

(3)高效、快速、使用方便。Opencv視覺庫具有強大的圖像運算功能,API中有比較完善的處理函數,能夠明顯提高開發效率。

2 Opencv在Android studio中的環境搭建流程

2.1 安裝Java JDK

需要完成JDK的下載、安裝和環境配置的流程,安裝完成后,要運行資源管理器輸入 Java Version來驗證是否安裝成功,若顯示Java版本信息,則安裝成功。

2.2 下載Android Studio開發工具并安裝

在Android Studio的中文社區下載最新的Android Studio開發工具(要包含Java SDK),并運行Android Studio,根據安裝提示進行安裝,并運行開發工具。

2.3 配置Opencv Android SDK

在Opencv官網(http://)下載Opencv Android SDK并解壓。在Android Studio中,新建一工程,點擊File并import Module,并選中解壓的Opencv SDK文件夾中的Java文件夾,這樣就將Opencv視覺庫移植到了Android Studio中。然后右鍵App project,打開open Module Settings中的Depencies,點擊Module Dependency,添加OpencvLibrary,這樣就完成了深層配置。最后把Opencv SDK文件夾中的native文件夾中的libs的4個文件夾復制到所建好的工作空間中的project中的libs中。

3 圖像的灰度處理和像素取反處理的應用舉例

本文中是用的移動端為魅族MX3,Android版本號為5.0.1。

3.1 灰度處理

使用OpenCv將一幅圖像轉換為灰度圖像在實際應用中也不少,轉換為灰度圖像比較簡單,關鍵函數: cvCvtColor:cvCvtColor(IplImage* src, IplImage* dst, CV_BRG2GRAY)。值得注意的是:最后一個參數為 CV_BRG2GRAY ,表示將BRG圖片(彩色圖片)轉換為灰度圖片(黑白),參數src、dst必須事先分配好內存空間,使用完之后必須要釋放空間。

3.2 像素操作―取反

OpenCV中圖像取反是將圖像中的像素點變為原來像素點的反色。例如,如果一副灰度圖像的每個像素值由2^8=256個,假設點i點像素值為brga[i] ,則取反后的像素值為 255- brga[i]&oxff。

關鍵代碼為:

int cnum = src.channels();

byte[] bgra = new byte[cnum];

for (int i = 0;i

bgra[i] = (byte) (255 - bgra[i]&0xff);}

然后運用matToBitmap函數將Mat格式的圖像轉換成Bitmap的圖像,并顯示在android手機移動端。

經過編寫代碼并運行得到的處理結果如圖1所示。

4 結束語

OpenCV視覺庫是一套簡單易用且完整的計算機視覺框架,幫助開發人員完成大量的底層工作,減少了工作量,更有效提高了設計出復雜計算機圖形處理的能力。并且我們將OpenCV移植到Android操作系統中去,也是圖像處理領域的一大進步。我們相信,在OpenCVForAndroid的應用不斷拓展中,眾多圖像處理領域會有廣泛的前景。

參考文獻

[1]陳雪嬌.基于Open CV的計算機視覺技術研究[J].電腦知識與技術,2015(30).

[2]張家怡.圖像識別的技術現狀和發展趨勢[J].電腦知識與技術,2010(21).

[3]黎松,平西建,丁益洪.開放源代碼的計算機視覺類庫Open CV的應用[J].計算機應用與軟件,2005.22(08).

[4]何鵬,王連鵬,楚艷紅.基于Open CV 的機器視覺在智能手機中的應用[J].計算機工程與設計,2011(10).

[5]王福斌,李迎燕,劉杰,陳至坤.基于OpenCV的機器視覺圖像處理技術實現[J].機械與電子,2010(06).

作者簡介

劉賢輝(1992-),男,山東省青島市人。現為青島市山東科技大學在讀研究生。主要研究方向為移動端的圖像處理研究

篇4

關鍵詞: 計算機視覺; 車輛檢測; 速度檢測; 消除車輛陰影

中圖分類號: TN911.73?34 文獻標識碼: A 文章編號: 1004?373X(2016)09?0164?03

Abstract: On the basis of the comparison of the traditional moving vehicle real?time detection methods, a new G?C double difference method is proposed. The edge detection of a certain current frame and background frame in video stream is conducted, and then the results are subtracted from the two frames to get the gradient difference. After that the ″or″ operation for the difference result and background color difference result is performed to greatly improve the accuracy of the vehicle judgment. This algorithm can accurately detect the existing moving vehicle on the road and effectively eliminate the effect of vehicle shadow, which provides a strong guarantee for the real?time detection of the following vehicle moving velocity. Based on the results of moving vehicle detection, the programming realization was conducted in VC environment to automatically detect the real?time speed of the moving vehicle. The test results show that the effect of the algorithm is perfect.

Keywords: computer vision; vehicle detection; speed detection; vehicle shadow elimination

0 引 言

計算機視覺(Computer Vision)主要研究如何運用照相機和計算機獲取被拍攝對象的數據與信息,形象的說,就是給計算機安裝上“眼睛”(照相機)和“大腦”(算法)。目前,計算機視覺技術的應用領域十分廣泛,其在道路交通管理中的應用更是取得了很好的效果。隨著科學技術的飛速發展,現代交通在經濟發展中所起的作用越來越大,而交通現代化帶來的問題也越來越多,諸如交通擁擠、交通事故頻發、交通環境惡化等。在這樣的大背景下,智能交通系統(Intelligent Traffic System,ITS)作為一種強有力的交通管理手段應運而生,其高效率的管理特點使其成為當今世界道路交通管理的發展趨勢,而計算機視覺技術則是ITS的重要技術支持。

實時車輛運動速度檢測是ITS對交通實施監測和管理的重要一環,對車輛速度的檢測一方面可以監控超速等違章問題,減少交通事故的發生,另一方面可以根據車速判斷道路擁擠程度,進而迅速采取措施,保證道路交通的安全和暢通,從而實現智能交通管理的目的。在上一代ITS中,實時車輛運動速度檢測的方法主要有線圈檢測、激光檢測、雷達檢測等,這些速度檢測方法多多少少都存在一定的問題,如容易受路基狀況、自然環境等的影響精度降低,而在新一代ITS中基于計算機視覺的車輛速度檢測法則大大提高了測速的精度,這有賴于計算機有一個“超強大腦”,即好的算法。

1 運動車輛的檢測

運動車輛的檢測是實時運動車輛速度檢測的基礎,使計算機能夠自動的把相機攝取的視頻里的靜止物體與運動物體區別開,并且自動提取出運動物體。所以,在研究實時車輛速度檢測算法前,先要研究運動車輛的檢測算法。

1.1 現有運動目標檢測方法比較

目前,常用的運動車輛實時檢測方法主要有幀間差分法和背景差分法。

1.2.2 預處理幀的顏色差分

由于無論車身像素值是否低于路面像素值,其梯度邊緣必然存在,而交通路面一般都很平坦,除了車道線外檢測不到邊緣,將當前幀與路面背景模型均進行邊緣檢測,再將兩個邊緣圖像按式(8)做差得到運動物體的邊緣梯度差分圖像:

3 實驗結果與分析

筆者用實際拍攝的視頻圖像對上述算法進行了試驗測試,實驗時模擬實際交通攝像機的安裝情況,使其固定不動,計算機處理的速度約為20 f/s。首先將視頻中的某一幀進行邊緣檢測,與背景做梯度差分,并與背景顏色差分的結果進行“或”運算,最后對圖像去噪并二值化,通過測試多種路況、天氣和光照條件,試驗結果顯示該算法可以在陽光充足、遇到物體陰影明顯的情況下準確地將運動車輛從視頻的背景中提取出來,并能準確檢測出車輛的速度,如圖3所示。

4 結 語

計算視覺的應用提高了智能交通系統的準確性,本文在對比了傳統運動車輛實時檢測方法的基礎上,提出了一種新的運動車輛實時速度檢測算法,此算法與傳統的算法相比,可以更加準確地檢測出路面運動車輛的存在,同時有效消除車輛陰影的影響,為后續車輛運動速度的實時檢測提供有力保證。基于運動車輛檢測的結果,進行編程實現,可以自動檢測出運動車輛的實時速度,測試結果表明該算法效果很好。

參考文獻

[1] MARR D, HILDRETH E. Theory of edge detection [J]. Royal society of London proceedings, 1980, 207(1167): 187?217.

[2] 高富榮,方強.機動車地感線圈測速監測系統性能和檢測方法研究[J].上海計量測試,2008(2):27?28.

[3] 安福東.機動車的幾種測速方式原理及性能的分析比較[J].警察技術,2003(3):33?35.

[4] 姜永林,孫國棟.交通車輛視頻測速技術[J].儀表技術與傳感器,2007(9):69?70.

[5] 弼程,彭天強,彭波.智能圖像處理技術[M].北京:電子工業出版社,2004.

[6] 邢霄飛,李永寧,林木華.一種基于紋理分析的視頻車輛測速方法[J].計算機應用,2005(12):2803?2805.

[7] 周許超,屠大維,陳勇,等.基于相位相關和差分相乘的動態背景下運動目標檢測[J].儀器儀表學報,2010(5):980?983.

[8] 王芳林.穩健視覺跟蹤算法中的關鍵問題研究[D].上海:上海交通大學,2009.

篇5

關鍵詞:農業生產;機械制造;應用;自動化技術

我國是一個農業大國,農業生產和農業經濟對于我國而言非常重要。為了更好地提高農業生產效率,在農業生產過程中,合理地應用行之有效的機械制造自動化技術,對于提升農業生產有著明顯的推動作用。在農業生產當中借助機械制造自動化,不僅可以大大減少農民的工作量,還可以顯著提升勞動生產的舒適性以及效率,實現成本節約的同時,還可以顯著優化農產品的生產。因此,探討農業機械制造自動化的應用具有顯著意義。

1機械制造自動化技術

機械制造主要是按照機械設計的最終效果發展生產以及制造的過程,其中會涉及許多類型的設備,例如工業當中的儀器儀表、機床等機械設備,在農業生產中主要是一些能夠提高農業生產行為效率的機械設備。近些年,我國機械制造行業的發展速度十分明顯,并且也獲得了大量的創新成就。通過相應的研究,我國機械制造行業目前已經處于國際先進水準,同時逐漸向自動化、數字化、智能化的方向發展。其中,虛擬化、自動化是主要發展目標,通過虛擬化的控制,自動化的操作與控制可以實現更好的優化生產效率和效果的目的。機械自動化技術可以為農業生產提供至少以下幾個方面的優勢和特點:優化產品質量、提高生產效率、控制生產周期、控制生產成本、提升經濟效益、降低人工勞動力投入、實現生產環境環保型,推動相應行業與技術不斷發展和創新。

2農業機械制造自動化的應用現狀

機械自動化技術是農業生產中最為重要且應用意義巨大的一種技術,國外一些發達國家,已經能夠將大量的農業機械制造自動化技術應用到農業生產當中,并且在農業生產中的收割、整理、篩選、加工、包裝等流程中應用自動化機械,可以實現自動化的生產效果。農業機械制造自動化技術仍然需要堅實的科學技術為基礎,其中主要包含計算機集成制造系統、計算機輔助設計技術、高精度的加工技術等,目前我國機械制造自動化技術仍然處于萌芽階段,仍然需要更加深入的研究和創新。根據機械自動化技術的制造規模劃分,農業行業當中的機械自動化主要可以分為自動化制造、自動化制造系統、制造線、制造工廠等。就農業機械制造領域而言,我國僅僅達到了自動化制造、自動化制造系統的建設和創新,在其他方面仍然有待提高。

3農業中機械制造自動化的未來發展前景

3.1自動化視覺技術的應用

計算機的視覺技術是新時期的一種重要技術之一,國外許多發達國家已經針對這一技術開展了相應的工程性應用。計算機視覺技術在農業生產當中的應用主要表現在評判農產品的質量、管理農業種植的資源、記錄農作物的生產信息以及自動收貨等方面。例如,英國通過計算機視覺技術制造了專用于采蘑菇的機器人,通過其中的視覺處理技術以及圖像處理功能,可以讓機器人在采蘑菇時準確定位并有效采集。當前,這一技術在我國仍然不夠成熟,需要進步一研究和應用。

3.2農產品檢驗與包裝技術

就目前的農產品檢驗與包裝效率而言,大多數屬于密集勞動的方式,想要有效提升這項工作的工作效率,可以應用自動化檢測包裝設備,其中可以借助攝像機或X射線等方式探測農產品的病害程度以及受損害程度,并將包裝完好的農產品挑選出來,并計算農產品的數量以及體積,之后再借助包裝機,根據不同質量等級以及體積將農產品包裝好。這一技術在許多發達國家已經達到了生產線密集型的應用,但是在我國存在著明顯的問題,仍然需要相關研究人員不斷探究和實踐,并根據我國實際的農業生產現狀,設計出符合我國農業生產的農產品檢驗與包裝自動化技術。

4總結

綜上所述,農業機械制造的自動化技術未來必然是農業社會經濟發展的必然,對農業生產均有著明顯的意義和作用。因此,在農業機械生產以及制造過程中,需要不斷提高對機械自動化技術的重視和探討,提升農業機械制造設備以及管理的自動化狀況,從而更好地推動我國農業生產。

作者:李洪芹 顏廷婷 魯鴻 單位:1、山東省臨沂市費縣農機監理站 2、山東省臨沂市蘭山區方城農機管理服務站

參考文獻:

篇6

智能家居是以住宅為平臺,基于物聯網技術,由硬件(智能家電、智能硬件、安防控制設備、家具等)、軟件系統、云計算平臺構成的一個家居生態圈,實現人遠程控制設備、設備間互聯互通、設備自我學習等功能,并通過收集、分析用戶行為數據為用戶提供個性化生活服務,使家居生活安全、舒適、節能、高效、便捷。智能家居包括家居生活中多種產品,涵蓋多個家居生活場景。

2016年中國智能家居市場規模達到1140億元,2017年第二季度智能家居活躍用戶規模達到4600萬。隨著物聯網技術、人工智能技術的發展,及90后婚育潮的到來,智能家居將成為主流的發展趨勢。

從智能家居發展階段來看,中國智能家居市場正處于市場啟動階段,尚未進入爆發期,智能家居產品滲透率較低。目前,智能家居領域依然存在諸多制約因素,如產品本身智能化程度低,多數產品是按既定的程序完成任務,在主動感知和解決用戶需求、人機互動等方面達到的體驗依然較初級,因此沒有形成廣泛的用戶粘性,消費者對智能家居產品抱有觀望態度。而相較于亞馬遜的echo和GoogleHOME,國內還沒有成熟的智能家居控制中心,仍處于以手機APP向智能音箱、智能電視、機器人等控制中心的過渡時期。

人工智能技術可以帶來硬件背后的軟件及服務能力、與智能硬件相匹配的交互技術。人工智能+智能家居,有利于形成適配下一代硬件的真正的“智能化”及深入場景體驗的個性化計算,語音及視覺等人機交互技術有助于提升與智能家居產品的交互體驗。

“AI+智能家居”提升智能家居產品交互體驗

語音交流更傾向于日常交流方式:通過人類的語言給機器下指令,從而完成自己的目的,而無需進行其他操作,這一過程將更為自然。同時語音交互在特定的場景中具有優勢,比如遠程操縱、在行車過程中等,能夠實現在特定場景中解放雙手的作用,在家居相對封閉的環境中,語音識別成為主流的人機交互方式。

近年來,語音交互的核心環節取得重大突破,語音識別環節突破了單點能力,達到97%以上的中文語音識別準確率,從遠場識別,到語音分析和語義理解技術都日趨成熟,多輪對話的實現等都有利于語音交互取代傳統的觸屏交互方式,整體的語音交互方案已被應用到智能家居領域中。

計算機視覺、手勢識別等交互方式成為語音交互的輔助,echo在新推出的echoshow產品中已搭載屏幕,而智能電視除語音交互之外,通過計算機視覺分析視頻內容,并對內容相關的資料進行下一步操作,包括短視頻剪輯、邊看邊買等,比如Yi+搭載在天貓魔盒中的“瞄一下”功能。再比如在智能冰箱中,通過計算機視覺實現對冰箱內食品的分析,以及衍生出的用戶健康管理和線上購物等功能,多種交互方式將統一在家居生活場景中,從而提供更為自然的交互體驗。

另一方面伴隨著智能家居平臺的發展,通過“IFTTT”的場景布局,智能家居實現多種家居產品的聯動,用戶可以自定義多個使用場景,實現定制化、個性化。在人工智能技術的發展將使得個人身份識別、用戶數據收集、產品聯動在潛移默化中變成現實,未來家居生活場景中將提供千人千面,家庭成員的個性化服務。

“AI+智能家居”實現內容和服務的拓展

找到合適的語音入口是挖掘智能家居背后用戶價值的關鍵。硬件本身具有入口價值,智能音箱,智能電視,家庭機器人等都有可能成為合適的入口。

傳統的鼠標操作、觸屏操作逐漸向語音交互這種更為自然的交互方式演進,語音交互的未來價值在于用戶數據挖掘,以及背后內容、服務的打通,以語音作為入口的物聯網時代將會產生新的商業模式。智能音箱、服務機器人、智能電視等智能化產品成為現階段搭載語音識別技術和自然語言處理技術的載體,作為潛在的智能家居入口,智能音箱、服務機器人和智能電視等產品在提供原有的服務的同時,接入更多的移動互聯網服務,并實現對其他智能家居產品的控制。這些產品為付費內容、第三方服務、電商等資源開拓了新的流量入口,用戶多方數據被記錄分析,廠商將服務嫁接到生活中不同的場景中,數據成為基礎,服務更為人性化。

“AI+智能家居”的未來發展趨勢

a.帶來更好的智能化、更高體驗的人機交互

從最早的WiFi聯網控制到如今的指紋識別、語音識別,人機交互性能大大提升,智能家居產品正在由弱智能化向智能化發展。而智能家居產品受眾也將從嘗鮮者轉向更為普通的用戶,甚至包括老人和小孩。更智能化的技術應用、更復雜的用戶結構和更廣泛的用戶覆蓋等因素必將促使智能家居產品趨于簡單實用。

智能化和人機交互體驗的升級將大大擴寬智能家居應用場景,2016年,智能安防類產品落地,指紋鎖、智能攝像頭等產品受到了廣泛關注。隨著智能感知、深度學習等技術的提升,智能燈光、智能溫控等產品也逐漸趨于成熟,2017年智能音箱成為爆款產品。當用戶需求不斷擴大,產品愈加豐富,智能家居將會滲透到家居生活的方方面面。智能家居市場將迎來爆發,2019年,智能家居市場規模有望達到1950億元。

b.智能音箱、智能電視、管家型機器人將繼續搶占智能家居控制中心,智能家居趨于系統化

篇7

關鍵詞:機器視覺;自動化;圖像處理

中圖分類號:TP391.4 文獻標識碼:A 文章編號:1006-8937(2013)23-0012-021 機器視覺的定義

機器視覺是用機器來代替人的眼精來做測量和判斷的一門技術。機器視覺系統是通過圖像攝取裝置將被攝取目標轉換成圖像信號,并且傳送給專用的圖像處理系統,把圖像信息轉變成數字化信號;圖像系統對處理好的信號進行運算抽取目標特征,從而根據目標特征來控制現場設備的動作。

2 機器視覺技術的發展

機器視覺這門技術從80年代開始全球獲得了蓬勃發展,不斷涌現出新的理念。在中國該項技術自起步發展至今,機器視覺已經有20多年的歷史,其功能以及應用范圍隨著工業自動化的發展逐漸完善和推廣。研究領域發展十分迅速。機器視覺的發展已有20多年。1990年以前,僅僅在大學和研究所中有一些研究圖像處理和模式識別的實驗室。1990~1998年為初級階段。主要的國際機器視覺廠商還沒有進入中國市場。越來越多的電子和半導體工廠帶有機器視覺的整套的生產線和高級設備被引入中國。1998~2002年定義為機器視覺概念引入期。在此階段,許多著名視覺設備供應商,開始接觸中國市場尋求本地合作伙伴。從2002年至今,我們稱之為機器視覺發展期,中國機器視覺呈快速增長趨勢并且應用范圍廣泛。

現在,機器視覺仍然是一個非常活躍的研究領域,目前國際上從事機器視覺技術研究較為成功的企業主要有:美國邦納工程公司、捷達科技有限公司、東芝泰力株式會社等。國內深圳、廣州、西安等地此項技術發展較為迅速。比如深圳市視覺龍科技、廣州三拓識別技術有限公司等。

3 機器視覺技術的工作原理

機器視覺是一項包括了光學成像、傳感器、圖像處理、機械工程等光、機、電及計算機圖像處理的綜合技術。

它一般包括照明、鏡頭、CCD相機、圖像處理軟件、圖像處理單元、監視器和動作執行機構等。其工作流程如圖1所示。首先光源投射到被測物體,通過CCD相機捕捉獲取被測目標的相關圖像信息,然后通過PC機等設備A/D變換轉換成數字信號傳給圖像處理單元,圖像處理單元對捕捉到的像素進行分析運算來提取目標特征,輸出判別結果,最后把處理過的相關信息傳輸給執行機構。

4 機器視覺技術的特點

機器視覺系統最大特點是可以提高生產的柔性和自動化程度。通常機器視覺可以代替一些人的視覺難以滿足要求的場合或者不適合人工作業的工作環境。另外機器視覺系統在檢查大批量生產過程中體現了速度快、精度高等特點。比如產品包裝生產線的自動化程度很高,用視覺識別系統代替人工進行在線檢測,可以大大提高生產效率。雖然機器視覺系統的優點很突出但是也有它的局限性,所以要根據檢測對象的不同特點采取適合的方案。

5 機器視覺技術的應用

當前機器視覺的應用主要體現在以下三個方面:

第一是檢測功能,它是機器視覺系統在實際中應用最多的一項功能。能夠檢測出包裝、印刷有無錯誤、劃痕等表面的相關信息。

第二是定位功能,能夠自動判斷被檢測物體的位置,并將位置信息輸出。它主要在全自動裝配和生產過程中使用。比如自動包裝、機械手等執行機構。

第三是測量功能,主要是自動測量被檢測物體的外輪廓尺寸等,提高了人工作業的測量精度。

6 機器視覺技術的發展趨勢

構建一個合格的機器視覺系統離不開合理的硬件搭配和可靠的控制程序。對于視覺系統的未來研究過程中,圖像處理技術和運動控制技術將是整個視覺控制系統開發工作的重點。機器視覺的發展趨勢主要有四點。

趨勢一:產品標準化。目前從事機器視覺軟硬件開發研究的公司中都開發自己獨立的產品,導致各個公司生產的硬件產品不能通用,軟件兼容性也存在一定的問題,造成了資源的浪費。因此,有必要設立產品軟硬件的行業標準,規范各種接口定義和技術指標,降低用戶使用成本。

趨勢二:產品集成化。越來越多的公司正在開發集成有圖像處理芯片的攝像機,這類攝像機在完成圖像采集任務的同時,可以對圖像進行預定的處理,輸出用戶指定的信息或者一定標準的圖像,由于采用硬件處理圖像,一般可以達到很高的處理速度,減少系統等待時間。

趨勢三:圖像處理軟件的人性化。雖然現在的圖像處理軟件還需要具有圖形處理知識背景的工程人員去使用,但是這些軟件都在向著一個共同的趨勢改變,那就是軟件使用變得越來越簡單,功能劃分越來越細致具體。很多開發軟件還提供了開發助手等工具,使即使沒有專業知識的工程人員也可以很快的編寫出滿足要求的處理流程并自動生成程序代碼。

趨勢四:機器視覺與運動控制、網絡化等技術的結合。視覺系統涉及到多種領域,是一種高度專業化的產品,在實際產品生產線上對多工序同步連續檢測時,必須使視覺系統具備分布式聯網能力。

7 機器視覺技術存在的問題

機器視覺系統在應用中也同時存在著一定的問題,比如:如何準確高速地識別出目標、解決實時性問題的能力、多傳感器融合問題、視覺系統與執行機構的協調問題、系統的穩定性問題等問題。機器視覺技術比較復雜,機器視覺不能通過省法來來描述整個視覺過程。所以機器視覺系統的建立十分復雜。但隨著機器視覺技術逐漸的成熟和發展,它一定將在制造企業中得到越來越廣泛的應用。

參考文獻:

[1] 梅江平.高速包裝機器人技術與應用[J].機器人技術與應用,2007,(5):18-20.

[2] 謝勇,彭濤.機器視覺及其在現代包裝中的應用[J].株洲工程院學報,2002,(4):1-4.

篇8

關鍵詞:禽蛋 無損檢測 機器視覺技術 光學無損檢測 新鮮度 大小分級 孵化蛋成活性檢測

中圖分類號:TS253 文獻標識碼:A 文章編號:1672-3791(2017)04(b)-0109-02

1 國內禽蛋產業發展現狀

我國是世界第一禽蛋生產大國,禽蛋產業不但在我國農業中占有重要地位,而且是關系國計民生和社會穩定的重要產業。據統計數據分析,雞蛋消費以鮮蛋為主,鴨蛋大部分是經過再制和加工后再使用,鵪鶉蛋的鮮銷和再加工比例接近1∶1。

相比較產業集中、加工趨升、品質提升的國際蛋業未來發展趨勢而言,我國蛋品的集中化程度和產業發展水平都較低,而且相比較發達國家集約化產銷體系規模大、產業集中度高等特征,我國較大型的蛋品加工企業較少,蛋品集中化程度和產業化發展水平較低。但是,近年來,我國的禽蛋加工業也有了一定的發展,尤其是禽蛋的無損檢測方面。

無損檢測,即非破壞性檢測,是在不破壞待測物原來的狀態、化學性質等前提下,為了獲取與待測物品質有關的內容、性質或成分等物理、化學情報所采用的檢測方法。

目前,我國禽蛋的無損檢測主要集中在以下幾個方面:禽蛋的內部品質檢測、外部品質檢測、禽蛋儲存時間的檢測、孵化蛋成活性的檢測以及大小的自動分級等方面。

2 禽蛋無損檢測的現狀

2.1 禽蛋的內部品質檢測

禽蛋的內部品質檢測主要是針對新鮮度的檢測。禽蛋新鮮度的主要檢測指標包括3個方面:氣室的大小、蛋黃哈夫值、蛋黃指數。根據國際上新鮮禽蛋內部品質的檢測標準,用蛋黃指數和蛋黃哈夫值作為禽蛋新鮮度的評價標準[1]。禽蛋新鮮度的檢測可以利用光學特性、計算機視覺等方法來實現。

光學無損檢測的原理是:光照射到物體上以后,光能一部分被外表面反射;一部分進入物體內遇到細胞結構或產生散射,或被物體所吸收;其余部分則透過物體。由于被測物體的內部成分、表面狀況、入射光波長以及折射率等因素都各不相同,因此通過入射光照射物體得到反射、折射和散射等比例不一樣。2002年,劉燕德等利用光學無損檢測原理,取波長為200~600 nm的入射光,通過實驗分析該波段內雞蛋新鮮度的光特性,分析雞蛋內部品質與透射特性的關系,對雞蛋新鮮度做出估量,證實了利用雞蛋投射特性對雞蛋進行無損檢測和分級是可行的[2]。

機器視覺技術是人工智能的一個分支。簡單來說,機器視覺就是用機器代替人眼來做測量和判斷。計算機視覺系統利用相機獲得被測目標的圖像并將其轉換為數字信號,再將該信號傳送給專用的圖像處理系統,得到被攝對象目標的形態信息,根據像素分布和亮度、顏色等信息,轉變成數字化信號;并通過合適的算法提取圖像特征值作為圖像分析的依據。2014年,楊簡等人利用機器視覺裝置獲取雞蛋透射圖像,進行圖像處理并提取合適的特征參數,在BP神經網絡中引入灰色理論,建立灰色神經網絡,并以該參數集為樣本訓練灰色神經網絡,預測雞蛋哈夫值,檢測雞蛋的新鮮度。試驗結果表明,灰色神經網絡預測精度較高,哈夫值殘差為5.268 4,雞蛋分級的正確率為92.7%[3]。2015年,劉艷等人通過冷光源照射獲取雞蛋彩色透光圖像,在自適應灰度調整和改進空間濾波等預處理的基礎上,利用閾值分割法并結合最小二乘法進行蛋黃橢圓擬合,提取與雞蛋新鮮度相關的3個特征參數,采用梯度下降算法得到雞蛋透光圖像三元新鮮度模型。經檢驗,該模型具有較高的可靠性,可對禽蛋進行實施新鮮度檢測與分級[4]。

2.2 禽蛋的外部品質檢測

禽蛋分級檢測的主要指標是輪廓特征,可用蛋形指數(蛋形指數=蛋的縱軸/蛋的橫軸)表示。根據國內外禽蛋分級標準,蛋殼顏色、外形輪廓、質量、顏色等都可以作為禽蛋外部品質分級的特征參數。禽蛋外部品質檢測的主要方法有利用動力學、聲學特性和機器視覺等。2003年,丁幼春利用機器視覺技術,分別對鴨蛋蛋心顏色、蛋殼厚度、蛋的新鮮度以及質量進行檢測,利用光密度值進行模糊識別,建立相應模型并得到鴨蛋大小及蛋心顏色自動分級系統[5]。2004年,王樹才等人利用敲擊聲音信號進行禽蛋破損檢測和模糊識別,該試驗結果表明,可以利用正常蛋、破損蛋、鋼殼蛋、尖嘴蛋的敲擊聲音信號在衰竭時間、最小共振峰頻率和四點最大頻率差等參數上存在的差異性,實現破損蛋的識別,準確率達95% [6]。2006年,熊利榮等人利用機器視覺系統得到雞蛋圖像,經圖像處理技術提取能夠表征雞蛋大小的特征參數(蛋的像素和A、長軸長L、短軸長S、蛋型指數K),建立了重量和短軸之間的線性回歸模型,該模型能夠檢測雞蛋的外形尺寸。試驗結果表明,雞蛋的大小與像素和A以及短軸之間均存在顯著線性相關關系,修正后的模型相關系數達到了0.981[7]。

2.3 孵化蛋成活性的檢測

種蛋孵化率的高低是影響養殖業經濟效益的一個重要因素,而種蛋受精率的高低在很大程度上決定了孵化率的高低。據統計數據研究表明,種蛋的受精率一般低于90%。鑒別孵前或孵化早期無精蛋是禽蛋生產的難題之一,目前主要有有機器視覺、利用近紅外光譜和高光譜等方法實現孵前種蛋的檢測。2000年,陳家娟等人在獲取孵化雞蛋色度直方圖的基礎上提取孵化雞蛋表面顏色作為特征值,并結合遺傳神經網絡,建了一套適合于孵化雞蛋可成活性自動檢測的機器視覺系統[8]。 2012年,祝志慧等人利用近紅外漫反射光譜分析技術對種蛋中的無精蛋和受精蛋進行檢測,通過對不同波段范圍、不同主成分因子數和不同光譜預處理方法對種蛋類型檢測結果的比較分析,建立種蛋的定性檢測模型。該研究為孵前無精蛋和受精蛋的無損檢測提供了新的途徑[9]。2015年,祝志慧等人運用高光譜成像技術將圖像信息與光譜信息結合起來,通過研究孵化前受精蛋與無精蛋的圖像差異、光譜差異,運用高光譜成像技術,結合D像信息和光譜信息,提取圖像的特征值,運用不同的方法建立關于孵化前受精蛋和無精蛋分類的判別模型,并比較。實驗結果表明,利用RVM檢測孵化前受精信息具有可行性,可以提高檢測模型的精度[10]。

3 禽蛋無損檢測的現狀分析

在廣泛閱讀國內禽蛋品質無損檢測技術相關文獻的基礎上,了解到,目前我國禽蛋品質的無損檢測主要集中在禽蛋新鮮度,儲藏時間;禽蛋大小、顏色分級以及禽蛋蛋殼裂縫檢測;孵化蛋、種蛋和無精蛋檢測等方面。禽蛋新鮮度和大小顏色分級的檢測方法主要通過有機器視覺技術、光學無損檢測技術、利用聲學特性結合機器視覺技術,建立新鮮度相關的數學模型和大小分級模型;孵化前種蛋和無精蛋的鑒別雖然暫時還沒有實現精度很高的鑒別方法和模型,但是近紅外光譜漫反射光譜分析技術和高光譜成像技術的運用,為禽蛋孵化前受精信息的定性檢測提供了新的方法和思路。但是,綜合以上分析來看,目前我國禽蛋品質的無損檢測仍存在一些問題有待改進。

(1)目前,有關禽蛋品質檢測的研究和實驗品種及檢測功能都比較單一,相關研究應該在現有成熟技術手段和方法的基礎上結合實際生產的需要,適當拓展試驗品種,綜合檢測項目,以滿足禽蛋業發展品質提升的趨勢。

(2)利用光學、聲學特性無損檢測雖然已經取得一定成果,但與實際生產需要仍有距離。可以考慮將這些成熟技術與一些精密儀器和機械結合起來,投入到實際的生產線中。

(3)禽蛋孵化前種蛋的鑒別檢測仍然是需要攻克的難題,雖然目前已經提出了可行的檢測方法,并實現了定性的檢測,但是孵化中死胚蛋的鑒別檢測方法有待進一步研究。

針對以上問題,在今后的禽蛋品質檢測的探索中,研究者一方面需要跟蹤世界先進技術,另一方面尋求圖像增強、分割、特征提取、提高無損檢測準確性的算法和判別模型。

參考文獻

[1] 楊旭,鄭麗敏.計算機視覺在禽蛋品質檢測中的應用研究進展[J].農機化研究,2008,9(9):168-170.

[2] 劉燕德,喬振先.雞蛋光特性及其與新鮮度的相關性研究[J].江西農業大學學報,2002,24(1):45-48.

[3] 楊簡,潘賀,李太浩,等.基于灰色神網絡的蛋品新鮮度無損檢測的研究[J].中國農機化學報,2014,35(1):229-234.

[4] 劉艷,李慶武,黃小微,等.雞蛋圖像特征提取與新鮮度檢測模型研究[J].科學技術與工程,2015,15(25):72-77.

[5] 丁幼春.基于機器視覺鴨蛋品質無損自動檢測分級系統的改進[D].華中農業大學,2003.

[6] 王樹才,任奕林,陳紅,等.利用敲擊聲音信號進行禽蛋破損檢測和模糊識別[J].農業工程學報,2004,20(4):130-133.

[7] 熊利榮,王樹才,任奕林,等.雞蛋大小等級模型的修正[J].農機化研究,2006(2):104-105.

[8] 陳佳娟,陳曉光.采用計算機視覺進行孵化雞蛋成活率可能性的自動檢測[J].計算應用與軟件,2001(18):5-10.

篇9

僅在一年前,被譽為“世紀之戰”的李世石對戰AlphaGo令人工智能(AI)進入公眾視野。彼時,VR市場頹勢已現,漸入谷底。AI概念的及時出現拯救了寥落許久的資本市場,凜冽的“資本寒冬”一度回暖。根據CBInsights的數據,2016年,全球人工智能領域的投資數量達到698筆,是2012年的近5倍。而在國內,BAT帶頭布局,創業項目四起,一時間全民AI,2016年也因此被稱為“人工智能元年”。

潮水退去,才展現出行業的本來面目。“有一些泡沫,但沒有‘’、O2O那會兒那么多。”創新工場技術副總裁、人工智能工程院副院長王詠剛告訴《21CBR》記者。

“扎實”、“踏實”是眾多投資人談及人工智能時提到的關鍵詞。對創業者而言,技術的重大突破、龐大的用戶市場以及多方政策的利好,似乎預示著人工智能的商業春天才剛剛開始。然而,要想站在下一波浪潮的潮頭,成為這場堪比工業革命的時代獲益者,既要比拼硬實力的突破,也依仗對行業的理解,二者缺一不可。在人工智能的商業化進程中,脆弱的科學家式創業將難以沖破重重阻礙。

李開復重倉

當下提及人工智能,不能不關聯至創新工場。2016年,這家專注于Pre-A到C輪的早期投資機構重倉人工智能,投資相關領域創業公司超過30家。早年研究語音識別的創始人李開復身體力行,一舉一動不離人工智能:演講、出書、為投資公司站臺、成立人工智能工程院。直到今年初,李開復公開表示:“能投的已經不多了。”

王詠剛告訴《21CBR》記者,人工智能尚處在行業發展的早期階段,“我們看好整體的發展趨勢,但現階段項目的絕對數量是少的,找好項目相對來說也就困難一些。”對創新工場而言,好項目各有各的好,不投的項目歸結起來則離不開三個方面:技術、團隊和模式。

第一類是技術令人難以信服的概念炒作式項目。“開復就是搞人工智能出身的,我之前在谷歌工作,接觸的項目比較多。有的創業公司說得天花亂墜,實際技術上是做不到的。”對于技術本身的發展趨勢、在哪個領域能夠解決哪些問題,創新工場自信在國內VC界的判斷是較為準確的。

其次,對于純科學家團隊創業,由于不具備足夠的商務落地渠道,“我們也會非常謹慎。當然不排除有的科學家確實技術很好,我們就幫他做孵化”。至于商業模式,在當下的國內互聯網企業中,阿里、騰訊紛紛成立人工智能實驗室,百度索性稱自己是一家“人工智能公司”。那些巧妙避開了巨頭現有業務沖擊,自身具備不可復制和可持續性的創業項目,成功幾率自然更高。

元Z資本合伙人陳洪亮認為,在人工智能這一強技術領域,圖像和語音是已被驗證的兩個賽道。過去10年間,得益于深度學習算法和GPU等計算設備的發展,計算機視覺技術快速落地金融、安防、醫療等B2B領域。相比之下,語音技術偏重在客服、車載、智能家居等消費端領域,背后也有賴于語音識別、聲紋識別等工業級算法的日趨成熟,“未來在這兩塊,將會出來一批比較扎實的成果。”

2014年底創立的Rokid(若琪)是元Z資本在語音賽道的代表項目,從天使輪到B輪一路跟進。5月15日,Rokid旗下第二款產品、名為Pebble(月石)的智能音箱在天貓開售。用戶運用語音指令可以操控音箱播放音樂、報告天氣,甚至控制家中的照明、電視等智能家居設備。Pebble意在通過日復一日的“自我學習”,無限趨近用戶的偏好習慣。

相比用智能家居APP開關燈,一條語音指令顯然要簡單得多。無論是手機還是PC,都需要人去適應機器,聲音似乎是人與機器更自然的交流方式。從天氣到音樂,從新聞播報到童話朗讀,元Z資本相信,聲音將作為一種人機交互的無形界面,成為下一個平臺級入口。而新入口的誕生,將帶來變革性的機會。

不過,在陳洪亮眼中,對領域知識的依附使得創業初期的技術優勢正在減弱,“行業細分,客戶分散,即便有強悍的技術背景,過了一年左右的時間窗口,最后比拼的還是對商業的理解。”從這個角度而言,人工智能更以行業為導向,而非純技術項目。“是行業+,不是AI+。”陳洪亮稱。

這也是創新工場成立人工智能工程院的目的之一:源源不斷向創業者推送產業項目,挖掘適合團隊技術的商業模式并加以驗證,為創業科學家尋覓商業合伙人,從而幫助團隊盡快步入創業正軌。王詠剛表示,“商業合伙人具備的行業經驗,必須令其懂得如何在行業里面拿到項目,純科學家式的B2B創業很難。”

4月,在一次企業家公開活動上,北極光創投創始人鄧鋒面對兩位業界人士發問:“講究強關系的B2B行業會否影響人工智能的游戲規則?”依圖科技CEO朱瓏當時回應:“(關系)是現狀,但產品真的能打動人。”或許可以這么理解,“關系”在某種程度上也代表著,你比別人更了解行業。

對于AI創業者,B2B意味著賺錢的難度和門檻更高了。不過,收費的價值也因此體現。在陳洪亮看來,一旦客戶為此買單,其在組織機構內部能夠被更高效地推行,避免淪為乏人問津的免費試用。王詠剛也相信,移動互聯網的免費打法在人工智能時代將難以延續。

盡管業內少有公司公布自己的營收情況,但投資人大都表示,人工智能正在加速變現,“有些2B的項目,盈利已經很好了。”對于投資人和創業者而言,變現不僅僅代表了財務模型的轉正,也意味著終于贏得了市場與用戶的認可。

四家獨角獸

擁有大數據支持的金融、安防和醫療,被視為是人工智能的下一個機會,也成為過去一年資本聚集的行業。國內計算C視覺賽道的創業公司接近30 家,人臉識別領域更是出現4 個獨角獸――曠視(Face++)、商湯、依圖、云從科技,紛紛完成融資。2017年,在工信部的“獨角獸”企業榜單中,曠視的市場估值突破20億美元。

曠視市場部副總裁謝憶楠告訴《21CBR》記者,2013年,曠視開始專注于人臉視覺的產品通用化。“當時主攻三方面的算法――人臉檢測、關鍵點標注和人臉識別,團隊基于行業做了很多技術上的研究。”2013-2014年,曠視拿下3項世界計算機視覺競賽的第一名。2015年,在德國漢諾威IT博覽會上,馬云向德國總理默克爾演示Smile to Pay掃臉技術,就是由曠視提供核心算法,將刷臉支付模塊內置到支付寶客戶端中。

目前,曠視的Face++人工智能開放平臺面向中小銀行、地產園區、IT企業及獨立開發者開放人臉、圖像、文字等識別能力。其中,人臉識別API的日均調用量超過2400萬次,是目前世界最大的人臉技術平臺。曠視方面聲稱,其人臉識別技術在國內互聯網金融領域擁有80%以上的份額。

曠視的快速崛起得益于技術和市場的多重利好。一方面,深度學習算法在過去10年間取得重要突破,給計算機視覺的大規模應用奠定了基礎。另一方面,2014年,國家實名制工作相繼在網絡、電信和金融領域全面鋪開。2015年,互聯網金融雨后春筍般涌現,通過人臉識別技術完成遠程開戶和身份驗證,成為各方普遍采用的技術手段。計算機視覺創業公司步入商業化時期。

謝憶楠表示,公司在商業化前期關鍵性地走通了“數據―算法―產品―技術”這一循環,面向行業的通用服務乃至更為深度的定制化方案得以落地。

而另一家獨角獸公司――依圖科技則啃下了安防這塊骨頭,其“蜻蜓眼”人像大平臺服務于全國上百個地市的公安系統,是全國唯一擁有十億級人像庫比對能力的公司。

利用技g優勢,快速切入一兩個行業,從而形成深度合作,是上述獨角獸公司早期脫穎而出的共同原因。在現有技術已然成熟、各家準確率紛紛達標的情況下,如何基于真實痛點挖掘場景,提供定制化且可復制的解決方案,成為打破傳統行業壁壘、快速拿下市場的關鍵。

而在語音賽道,技術成熟也意味著消費級機器人市場的打開。Rokid并非頭一個玩家,卻自帶網紅體質。其迄今為止的兩款產品,在未設獨立展位的情況下,連續兩年獲得CES(國際消費電子展)創新類獎項。創始人Misa(祝銘明)在江湖上見首不見尾,研究團隊的陣容卻堪稱強大:位于北京和舊金山的兩個實驗室由數十名全職博士科學家組成,來自中科院、哈佛、斯坦福、伯克利等一批海內外頂尖院校。

Rokid北京實驗室負責人高鵬告訴《21CBR》記者,智能音箱Pebble的核心功能體驗分為三類:音樂、兒童讀物等內容服務,天氣、鬧鐘等工具類服務,以及智能家居控制服務。憑借600萬首320K碼率高品質曲庫和喜馬拉雅FM等對接資源,Pebble向用戶提供的內容涵蓋音樂、新聞、電臺、相聲、戲曲和脫口秀等。一切體驗從用戶對其說出激活詞“若琪”的一刻開啟。

激活詞“若琪”的設計和打磨用了將近一年時間。高鵬介紹,激活詞的識別錯誤率隨著音節的加長而降低。目前國內外同類產品的激活詞大多設置在3-4個音節,而雙音節的高激活率很難成功。在經歷“若小琪”、“Hi,若琪”的反反復復后,研究團隊還是通過算法驗證實現了雙音節。在公開的試用報告中,Pebble多個維度的人機交互體驗超過了谷歌推出的業內首款產品Google Home。

而在聲音定位上,祝銘明早年從威爾?史密斯主演的科幻電影《我,機器人》中的機器人女聲獲得靈感。高鵬坦言:“當時根本沒有那樣的現成聲音。”團隊開始在市場上尋覓適合的音色,同時自主研發TTS(Textto-Speech)語音合成技術,并由專門團隊對聲音處理和內容反饋進行設計,“若琪”最終被定位為一個溫柔、幽默、聰明且不失個性的女聲。

通過開放基于網絡協議的API標準,Rokid還將飛利浦、小米、lifesmart等品牌納入到其智能家居生態鏈中。在幾乎未做投放、線下推廣的情況下,開售三個星期的Pebble在天貓官網的銷量逼近千臺。祝銘明對媒體表示:“產品日活躍用戶數量超過50%,用戶使用時長平均超過1小時。”6月8日,Rokid宣布開通全渠道銷售,Pebble登陸全國500多家經銷商門店。

在Rokid的品牌文案中,“自然”是多次出現的一個詞。產品負責人向文杰對此表示,語言、視覺和觸摸是人類最自然的交流方式,“未來的產品方向就是向用戶提供最自然的交互體驗,希望讓用戶感受到,我們的產品是有溫度的家庭成員,而不是一臺冷冰冰的機器。”

智能的未來

人工智能的商業春天才剛剛開始。

埃森哲的研究結果顯示,到2035年,人工智能將有望令包括美國、日本在內的12個發達國家的經濟增長率翻番,勞動生產率增長40%。在謝憶楠看來,目前國內人工智能市場仍處在存量消化階段,保守估計仍有七成左右的垂直行業尚待開發,在教育、交通、社保等領域潛力巨大。朱瓏則表示,過去一年間,性能成倍提升的人工智能技術不斷解鎖應用場景,人類的想象力已經跟不上人工智能的發展速度。

機器的迷人之處在于智能未來。業內普遍認為,無人駕駛將是未來人工智能的重要落點。在創新工場的投資策略里,未來5-10年的投資項目中有相當一部分投給了無人駕駛。“機會太大了,將是萬億級的市場,且很難被個別巨頭壟斷。”王詠剛表示,無人駕駛是一個完整的產業鏈,從感知、決策、控制等多個模塊的算法,再到各類傳感器,乃至汽車共享和交通改造,有著巨大的想象空間,遠未到技術收斂的階段。

另一個充滿未來感的方向則是沉浮數年的消費級智能硬件。亞馬遜在6月初宣布,旗下智能音箱Echo的年出貨量預期突破1000萬臺;蘋果則被傳即將在年度開發者大會中一款由語音助手Siri控制的智能音箱。國內方面則早有叮咚、小智者激起的浪花,“千箱之年”的說法因此在業內盛行開來。

Rokid將自身定位為一家科技公司而非硬件廠商,著眼于更宏大的語音技能生態建設。高鵬表示,Rokid將在近期推出開放平臺,有望接入外賣、快遞、叫車等來自第三方開發者的擴展功能,為用戶提供更為豐富的語言技能應用。

人工智能從來就不是一場輕巧肆意的游戲,參與者面臨的仍將是重重阻礙。

首先是巨大的人才缺口。陳洪亮稱,未來很長一段時間,人工智能的馬太效應將體現在人才方面。李開復提過一組數字,全球當下的人工智能專家不超過7000人,在中國這個數字可能是700個,且大多被BAT收入囊中。這也是創新工場成立人工智能工程院的一大使命:通過人才招聘和高校共建,同時加強與政府部門、國內外高科技公司的合作,培育和孵化高水準的人工智能技術團隊。

數據壁壘則是人工智能創業打破大公司壟斷、完成行業深度融合的另一項難題,一大原因在于數據安全泄露和用戶隱私破壞。王詠剛認為,人工智能的發展與數據安全不是相互撕裂的關系,而是博弈均衡。

而最大的困難還是來源于技術本身。深度學習理論沿革每隔10年左右就會經歷巨大變化,每一次的技術遞進也推動著人工智能的工業化進程,新商業模式因此而生。“前沿技術當然對一線業務開展有著指導意義。”王詠剛說。

人工智能始終是強技術驅動的領域。謝憶楠稱:“從算法、軟件、硬件到解決方案,每一步都要靠硬實力說話。純商業模式的東西,天花板很明顯。”計算機視覺領域的四個獨角獸之一云從科技CEO周曦也公開宣稱:“人工智能是有門檻的,短期之內只要自己保持足夠快的進步速度,別人很難對你構成威脅。”

篇10

工信部下屬中國電子技術標準化研究院的《2016年虛擬現實產業發展白皮書》中指出,中國虛擬現實產業潛力巨大,以用戶體驗佳為代表的創新性產品推動了供給側改革,成為提升用戶滿意度的重要手段。在今時代背景下,新媒體作為一個不斷變化的媒體,其應用引起了廣泛的關注。文章首先剖析虛擬現實技術的原理,然后總結新媒體的特點,最后對新媒體的應用進行研究與分析,具有一定的實用價值。

【關鍵詞】虛擬現實技術 新媒體 應用

虛擬現實技術開始于20世紀60年代,指的是通過計算機軟件、硬件以及相關配套設施,生成一種三維環境,從而創造出全新的交互方式。其通過用戶的視覺、觸覺、嗅覺等來增強用戶體驗,使得用戶產生身臨其境的感覺。而新媒體的產生是相對于傳統媒體來說的,指的是報刊、廣播等傳統媒體以后出現的新的數字媒體,其通過移動互聯網以及其它數字渠道進行傳播,在手機、電腦等終端進行展示,從而向用戶提供服務的媒體形態。在虛擬現實技術發展如火如荼的今天,如何利用虛擬現實技術來促進新媒體應用的發展,成為人們關注的焦點。

1 虛擬現實技術原理

虛擬現實技術是一門生成虛擬現實場景的技術,而生成虛擬現實場景的關鍵是如何創造虛擬世界,即建模虛擬場景。虛擬現實場景對模型的要求很高,而如今解決建模問題的方法主要有兩種:一種是基于計算機圖形學的方法,一種是基于圖像建模的方法。

基于圖形學的方法指的是首先利用計算機建立三維模型,然后對模型進行貼膜等紋理的操作,最后對場景中的光照、陰影等進行處理。該方法的優點是模型制作精良,往往會產生逼真的效果。但是,其缺點是需要大量的計算,對計算機硬件的要求較高,而且一般要求制作人員具有編程的能力。

基于圖像建模的方法指的是在圖像處理算法的基礎上,由若干張圖像來構造三維場景,往往利用計算機視覺原理進行的。其優點是對計算機硬件要求不高,場景的精良程度只與圖像的分辨率有關,從而避免了大量的運算,該方法逐漸成為了研究的主流。

2 新媒體的特點

新媒體的第一個特點是整合了視頻、音頻和文字信息。通過技術的發展,用戶不僅僅局限于文字的閱讀,而且能夠獲得視覺、聽覺、甚至嗅覺的體驗。

新媒體的第二個特點是加強了交互性。如今,人與人之間的交互不再局限于口耳相傳,而是手機與手機、手機與電腦、甚至電視與電腦等方式,這種交互方式不再只是一個簡單的技術概念,而是一種理念的提升和發展。

可以說,新媒體的特點符合當今社會的發展趨勢。由于生活與工作節奏的加快,人們對時間碎片化的管理也日趨看重,而新媒體的多方位體驗正好符合了人們的這一要求。此外,新媒體利用互聯網技術,可以隨時隨地進行互動交流,滿足人們對世界信息的需求,人們對新媒體的目的性和選擇的主動性也就越強。

3 新媒體的應用研究

3.1 數字教育方面

在全國高校思想政治會議上明確提出,要運用新媒體新技術使工作活起來,推動思想政治工作傳統優勢同信息技術高度融合,增強時代感和吸引力。其中,虛擬現實技術作為當前最新的技術,與新媒體相結合,共同為教育工作提供服務成為一種可能。

借助虛擬現實技術,數字教育可以對一些過往的歷史事件或者無法實際操作進行模擬、仿真,通過對視覺、聽覺等感官的刺激來達到身臨其境的感覺。例如,化學課中爆炸效果,在實際的操作中,出于教師和學生安全的考慮,不可能真的產生爆炸,而僅僅是講解爆炸的相關理論,難免會無法引起學生的學習興趣。而通過虛擬現實技術,教師可以構造一個虛擬環境,在虛擬環境中進行爆炸演示,再利用對學生視覺、聽覺甚至嗅覺的沖擊,無疑會給學生留下深刻的印象。

3.2 數字電影方面

數字電影是指在電影的拍攝、后期加工以及發行放映等環節,部分或者全部以數字處理技術代替傳統光學化學或者物理處理技術,用數字話介質代替膠片的電影,其優點是永遠保持影片像素的準確和精美。然而,隨著人們欣賞水平的提升,已經不再滿足于對影片分辨率的要求,而是追求身臨其境的感覺。

將虛擬現實技術融入到數字電影中去,通過頭盔以及交互設備,不僅可以滿足人們對觀賞的需求,而且能夠在最大程度上刺激人們的視覺、聽覺等感官,同時周圍伴有立體聲環音,使觀眾置身其中,現場感十足。

3.3 數字游戲方面

一方面,將數字游戲與虛擬現實技術相結合是有必要的,因為二者在游戲主題和游戲風格的不同,所表現出來的互動模式和感官體驗也會不同,從而提高游戲的可玩性和操作性。此外,游戲制作者通過尋找數字游戲和虛擬現實技術之間的聯系,將擴展的想象力和情感融入到游戲世界中,已經成為他們最為關注的事情,與此同時,也會大大提高玩家的游戲滿足感。

另一方面,部分玩家沉溺于游戲世界,逐漸脫離現實世界,傷害身體事件屢有發生。游戲制作者如果能夠在開發游戲的同時,融入進虛擬現實技術,就可以充分利用虛擬與現實之間的關聯性,使得玩家在游戲的過程中,不僅體驗到虛擬世界的樂趣,更能夠聯系到現實世界,這樣,也能夠防止玩家脫離現實。

參考文獻

[1]常雪佳.虛擬現實在數字娛樂游戲中的應用[J].信息與電腦,2015,3(06):15-17.

[2]付力婭.基于虛擬現實技術運用的數字媒體交互方式嬗變研究[J].新媒體研究,2016,2(13):28-29.

[3]廖祥忠.何為新媒體[J].現代傳播,2008,25(05):121-125.