傳感器是一條紐帶,它將數(shù)字世界和物理世界迷人地連接在一起。但是,要獲得有價值的可用數(shù)據(jù)并非易事。實際上,許多剛剛進(jìn)入物聯(lián)網(wǎng)領(lǐng)域的設(shè)計人員都對傳感器數(shù)據(jù)的混亂沒有足夠的心理預(yù)期。
引導(dǎo)客戶相信,他們看到的大量“錯誤”數(shù)據(jù)并不是因為傳感器本身出了故障,成為物聯(lián)網(wǎng)運動傳感器公司MbientLab的日常工作。之所以數(shù)據(jù)錯誤,是因為集成了這些傳感器的系統(tǒng)設(shè)計中缺少一些進(jìn)行數(shù)據(jù)清理的關(guān)鍵步驟。
必須正確理解通過機(jī)器學(xué)習(xí)訓(xùn)練物聯(lián)網(wǎng)的難度?!岸嗄陙?,工具和硬件都取得了長足進(jìn)步,但是,對于數(shù)據(jù)處理的基本理解仍然沒有多少改進(jìn)。
要搞清楚干凈數(shù)據(jù)和臟數(shù)據(jù)之間的區(qū)別,很重要的一點是,看看數(shù)據(jù)是如何從A點到達(dá)B點的。
概括來說,傳感器的原始數(shù)據(jù)需要進(jìn)行后端處理。基礎(chǔ)傳感器將原始信號從一種形式的能量轉(zhuǎn)換成模擬信號或者數(shù)字信號,可能需要施加外部電源,也可能不需要。最初的原始轉(zhuǎn)換來源于現(xiàn)實世界的模擬信號:力、熱、光、磁、聲音。經(jīng)過傳感器轉(zhuǎn)換后,沿著傳感器內(nèi)部或者印刷電路板上的信號路徑繼續(xù)前行,如果有需要,模擬信號可以經(jīng)過調(diào)節(jié)、放大環(huán)節(jié)轉(zhuǎn)換成數(shù)字信號。然后,將數(shù)據(jù)發(fā)送到微處理器或者其它類型的計算單元中,通過算法進(jìn)一步過濾噪聲,并以應(yīng)用所需要的方式提取相關(guān)信息。
計算體系架構(gòu)剛剛開始著手研究怎么有效地進(jìn)行這種數(shù)據(jù)處理,有些數(shù)據(jù)需要在邊緣設(shè)備上進(jìn)行預(yù)處理,其它數(shù)據(jù)則發(fā)送到更強(qiáng)大的服務(wù)器中進(jìn)行清理。
“邊緣計算將發(fā)揮巨大作用,”“基礎(chǔ)構(gòu)建模塊都有了,我們現(xiàn)在需要弄清楚,怎么有效地移動任意格式的傳感器數(shù)據(jù),數(shù)據(jù)移動過程中涉及的內(nèi)存層次結(jié)構(gòu)如何設(shè)計,以使得可以實現(xiàn)最佳計算性能。一句話,就是如何提高傳感器數(shù)據(jù)的計算效率。
一個傳感器的例子
有些操作需要基于那些用來鑒別一段時間內(nèi)趨勢的數(shù)據(jù)立即進(jìn)行動作,這類數(shù)據(jù)的提取非常關(guān)鍵,此外,清除已經(jīng)喪失了價值的數(shù)據(jù)也很重要。考慮到存在多種類型的這種數(shù)據(jù),而且有些情況下,需要多種數(shù)據(jù)類型來建模物理世界或判斷某人是否應(yīng)該立即進(jìn)行醫(yī)療急救,這種數(shù)據(jù)提取和清除工作更加艱難了。
數(shù)據(jù)也可能一開始是干凈的,但是經(jīng)過更新或者病毒入侵后變臟了。
“在全球范圍內(nèi),所有組件都需要盡可能安全,因此您希望從硬件中建立信任。組件安全啟動后,通信數(shù)據(jù)本身就已經(jīng)具備了某種程度的可信度。但是,有的系統(tǒng)也可能存在不安全的未知組件,這就需要對數(shù)據(jù)進(jìn)行入侵檢測和軟件分析,以查看數(shù)據(jù)和組件是否存在任何損壞。在汽車中,我們希望檢測出那些給出異常或奇怪?jǐn)?shù)據(jù)的部件,這不僅是組件安全問題,還涉及到人身安全?!?/span>
臟數(shù)據(jù)肯定要清理掉,但是它在哪里變臟的以及是如何變臟的,決定了下一步采取的行動。是不是傳感器本身產(chǎn)生了臟數(shù)據(jù),設(shè)計人員需要一開始就考慮到這一點。“解決傳感器問題需要大量的專業(yè)知識,” “它需要設(shè)計人員在硬件層面了解傳感器,理解從傳感器中提取的數(shù)據(jù),具備軟件(算法)開發(fā)的經(jīng)驗?!?/span>