物聯(lián)網(wǎng)大數(shù)據(jù)平臺(tái)是通過(guò)無(wú)線網(wǎng)絡(luò),以視頻為核心,將各種傳感器采集到的數(shù)據(jù)匯聚到大數(shù)據(jù)平臺(tái),進(jìn)行數(shù)據(jù)分析統(tǒng)計(jì),以一張圖的形式,對(duì)當(dāng)前狀態(tài)和未來(lái)趨勢(shì)進(jìn)行概況展示,讓決策者可以實(shí)時(shí)全局掌控系統(tǒng)內(nèi)的各項(xiàng)關(guān)鍵數(shù)據(jù),并根據(jù)對(duì)歷史數(shù)據(jù)的統(tǒng)計(jì)分析,預(yù)測(cè)未來(lái)趨勢(shì),輔助決策者及時(shí)做出準(zhǔn)確的判斷和決策。
一個(gè)物聯(lián)網(wǎng)大數(shù)據(jù)平臺(tái)需要具備哪些功能?與通用的大數(shù)據(jù)平臺(tái)相比,它需要具備什么樣的特征呢?我們來(lái)仔細(xì)分析一下。
1.必須是高效的分布式系統(tǒng)。物聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)量巨大,僅中國(guó)而言,就有5億多臺(tái)智能電表,每臺(tái)電表每隔15分鐘采集一次數(shù)據(jù),一天全國(guó)智能電表就會(huì)產(chǎn)生500多億條記錄。這么大的數(shù)據(jù)量,任何一臺(tái)服務(wù)器都無(wú)能力處理,因此處理系統(tǒng)必須是分布式的,水平擴(kuò)展的。為降低成本,一個(gè)節(jié)點(diǎn)的處理性能必須是高效的,需要支持?jǐn)?shù)據(jù)的快速寫(xiě)入和快速查詢(xún)。
2.必須是實(shí)時(shí)處理的系統(tǒng)?;ヂ?lián)網(wǎng)大數(shù)據(jù)處理,大家所熟悉的場(chǎng)景是用戶(hù)畫(huà)像、推薦系統(tǒng)、輿情分析等等,這些場(chǎng)景并不需要什么實(shí)時(shí)性,批處理即可。但是對(duì)于物聯(lián)網(wǎng)場(chǎng)景,需要基于采集的數(shù)據(jù)做實(shí)時(shí)預(yù)警、決策,延時(shí)要控制在秒級(jí)以?xún)?nèi)。如果計(jì)算沒(méi)有實(shí)時(shí)性,物聯(lián)網(wǎng)的商業(yè)價(jià)值就大打折扣。
3.需要運(yùn)營(yíng)商級(jí)別的高可靠服務(wù)。物聯(lián)網(wǎng)系統(tǒng)對(duì)接的往往是生產(chǎn)、經(jīng)營(yíng)系統(tǒng),如果數(shù)據(jù)處理系統(tǒng)宕機(jī),直接導(dǎo)致停產(chǎn),產(chǎn)生經(jīng)濟(jì)有損失、導(dǎo)致對(duì)終端消費(fèi)者的服務(wù)無(wú)法正常提供。比如智能電表,如果系統(tǒng)出問(wèn)題,直接導(dǎo)致的是千家萬(wàn)戶(hù)無(wú)法正常用電。因此物聯(lián)網(wǎng)大數(shù)據(jù)系統(tǒng)必須是高可靠的,必須支持?jǐn)?shù)據(jù)實(shí)時(shí)備份,必須支持異地容災(zāi),必須支持軟件、硬件在線升級(jí),必須支持在線IDC機(jī)房遷移,否則服務(wù)一定有被中斷的可能。
4.需要高效的緩存功能。絕大部分場(chǎng)景,都需要能快速獲取設(shè)備當(dāng)前狀態(tài)或其他信息,用以報(bào)警、大屏展示或其他。系統(tǒng)需要提供一高效機(jī)制,讓用戶(hù)可以獲取全部、或符合過(guò)濾條件的部分設(shè)備的新?tīng)顟B(tài)。
5.需要實(shí)時(shí)流式計(jì)算。各種實(shí)時(shí)預(yù)警或預(yù)測(cè)已經(jīng)不是簡(jiǎn)單的基于某一個(gè)閾值進(jìn)行,而是需要通過(guò)將一個(gè)或多個(gè)設(shè)備產(chǎn)生的數(shù)據(jù)流進(jìn)行實(shí)時(shí)聚合計(jì)算,不只是基于一個(gè)時(shí)間點(diǎn)、而是基于一個(gè)時(shí)間窗口進(jìn)行計(jì)算。不僅如此,計(jì)算的需求也相當(dāng)復(fù)雜,因場(chǎng)景而異,應(yīng)容許用戶(hù)自定義函數(shù)進(jìn)行計(jì)算。
6.需要支持?jǐn)?shù)據(jù)訂閱。與通用大數(shù)據(jù)平臺(tái)比較一致,同一組數(shù)據(jù)往往有很多應(yīng)用都需要,因此系統(tǒng)應(yīng)該提供訂閱功能,只要有新的數(shù)據(jù)更新,就應(yīng)該實(shí)時(shí)提醒應(yīng)用。而且這個(gè)訂閱也應(yīng)該是個(gè)性化的,容許應(yīng)用設(shè)置過(guò)濾條件,比如只訂閱某個(gè)物理量五分鐘的平均值。
7.實(shí)時(shí)數(shù)據(jù)和歷史數(shù)據(jù)的處理要合二為一。實(shí)時(shí)數(shù)據(jù)在緩存里,歷史數(shù)據(jù)在持久化存儲(chǔ)介質(zhì)里,而且可能依據(jù)時(shí)長(zhǎng),保留在不同存儲(chǔ)介質(zhì)里。系統(tǒng)應(yīng)該隱藏背后的存儲(chǔ),給用戶(hù)和應(yīng)用呈現(xiàn)的是同一個(gè)接口和界面。無(wú)論是訪問(wèn)新采集的數(shù)據(jù)還是十年前的老數(shù)據(jù),除輸入的時(shí)間參數(shù)不同之外,其余應(yīng)該是一樣的。