大數據,百科的解釋是:大數據(big data),指無法在一定時間範圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。具有Volume、Velocity、Variety、Value、veracity五大特點。
看完上面對大數據的名詞解釋,可能有些人會雲裡霧裡還沒真正明白所表達的意思,那麼接下來就來通過一個故事來詳細了解一下,當然任何東西都會有兩面性,有人借助技術做好事,也就會有人用來騙人,見仁見智。
那麼就拿看病來說,尤其是某些不靠譜的醫院,比如一個人得了病,姑且就叫小A,小A不幸得了某種疾病,他用某搜索引擎上網搜索跟這個疾病有關的資料(也就是關鍵詞),此刻,第一步的資料收集就開始,通過小A的關鍵詞搜索,搜索引擎不斷給小A呈現與此病有關的醫院廣告,當小A打開其中某些不靠譜醫院的網站查看網頁時,與此同時網站的後台也就開始收集小A的數據,比如IP地址、手機IMEI碼(注:IMEI碼就像是個人的身份證號碼一樣,是設備唯一的識別碼,無論你換什麼號碼這個碼都不會變。在手機撥號界面輸入*#06#即可顯示你手機的IMEI碼)、還有可能收集到手機號碼。
看到廣告後,小A決定去某家不靠譜但他不知道不靠譜的醫院就診看病,在掛號後等待就診的時候,小A發現醫院有提供免費的WiFi,於是根據操作輸入手機號碼獲取上網驗證碼連上WiFi,醫院WiFi熱點後台檢測到小A的手機IMEI碼,再對比之前訪問過醫院網站的設備IMEI碼相同,那麼即可斷定是同一設備,那麼通過查看小A之前的網頁訪問記錄即可知道小A得的大概是什麼病了。
實際上即使小A沒有主動連上該醫院的WiFi,只要他的手機WiFi開關是開啟的,並在醫院WiFi信號覆蓋範圍內,醫院一樣可以獲取小A已經在醫院附近。因為手機WiFi在打開的情況下會一直搜索周圍WiFi熱點信號,並發出連接請求或驗證是否可以連接,這樣手機WiFi與周邊WiFi熱點就有了一次握手過程,WiFi熱點核對手機WiFi MAC地址是否被授權連接,如果授權了即連接成功,未授權即拒絕連接。醫院也可通過這個知道小A在醫院附近。
當醫生叫號到小A時,其實就已經掌握了小A的大部分情況,而小A對此毫不知情,與醫生交流過程當中,他只會覺得這個醫生很厲害,藝術肯定了得,光看看問幾句就能把自己所有症狀病情都了解清楚,還給出了治療方案。此刻小A肯定會對這家醫院深信不疑,在小A準備進一步的治療的同時,這家不靠譜的醫院可能會根據小A留的手機號碼去進一步非法收集小A的其他詳細資料,比如在網上的購物記錄、訂餐記錄、各種賬單流水記錄等等,大致就可能確定小A的收入水平、消費水平等等,接著就可以根據小A的實際情況更加精準的忽悠,最後,本來可能在正規醫院花費少量金錢即可看好的病在這家不靠譜的醫院裡付出巨額費用,也可能傾家蕩產。
回頭再來看,從小A上網查找資料的第一步就已經入套了,所以選擇一個靠譜的搜索引擎是非常必要的,這關乎到獲取信息的準確性,當你獲取的第一條信息就是騙子的局,那麼後面的每一步都將是圈套,你只會越陷越深,直到傾家蕩產,某些不靠譜的搜索引擎公司會將某些“關鍵詞”明碼標價出售,出錢多的在搜索結果排位靠前顯示,出錢少排後,以此類推,你要獲取的信息內容可能會排列在這些虛假信息的後面,這就不是道德問題了,這已經觸犯法律了,每次被曝光之後短暫整改,爾後依然我行我素,其中緣由不在今天的話題範圍,就不再解釋了。
故事說完了,不知道你現在是不是對大數據有一個系統的、深刻的理解了呢?
领取专属 10元无门槛券
私享最新 技术干货