- 好友
- 0
- 帖子
- 4740
- 積分
- 9468
- 最後登錄
- 2018-7-31
- 在線時間
- 0 小時
 
- 好友
- 0
- 帖子
- 4740
- 積分
- 9468
- 最後登錄
- 2018-7-31
- 在線時間
- 0 小時
|
如果你問人們,大數據是什麼?比較樣板化的答案通常是三個V:數量(volume),效率(velocity)和廣闊性(variety)。接下來他們會開始討論,他們的數據到底有多大才能被定義為「大數據」。
當你開始看到實際技術的時候,事情開始變得比較複雜。這些主要的挑戰使事情發展到,今天已經沒有單一的一種科技可以一次性處理有關於大數據的三個V的所有問題——數量。效率和廣闊性。
如果我不得不對大型集團公司介紹大數據科技,我寧願讓他們使用以下各種打包的技術來引進大數據功能。
- Hadoop 和 Map Reduce:為了在商業計算機上分發數據敏感型應用而準備的框架。
- NoSQL :一種新品種的數據庫,並不像傳統的相關數據庫一樣提供同樣的一致性模型。
- 內存數據庫支持:數據庫主要依賴他們數據存儲中的主內存。
- 柱狀數據存儲:數據以列而不是行來存儲,這提供了分析應用的更快途徑。
- 流式處理:這是快速分解和過濾大量數據和事件的實時估算系統。
關於這些技術你會得到更多的信息,但是在目前為止,如果我們希望用3V維度來衡量,我們會得到下面這張表格。
這些技術對流量有持續的要求,其中某些事實上是多種不同解決方案的一個混合體。所以沒有必要來挑剔這張表格的精確度,只是給我們一些指示來看一看哪種可能最適合,
有趣的事情是看一下Hadoop生態系統如何轉化來解決速率較低的短板。每一個該系統的分銷商都有他自己的方法,來為這一數據庫系統提速。按照其中一家公司Hortonwork的宣傳,他們會把這種Hadoop SQL數據庫速度提升百分之百。
如果關於大數據有兩件事情需要牢記的話,那就是:
- 大數據始終是一個正在移動的目標:數據處理的市場現在正在包圍我們。試着跟最新的動態和變化保持更新。
- 你不能一勞永逸:就像其他所有的事情一樣,沒有任何一種解決方案適合所有場合。實際上,很多企業最終都沒有辦法,只能用多種大數據技術的整合來解決他們的問題。
如果你正在尋找針對大數據問題的解決方案,首先請通過三個V的大數據定義來看一看是什麼問題導致你頭疼,而根據這些問題產生的原因,選擇解決起來比較擅長的方案。如果我必須要猜測的話,我會猜你最終會採用不止一種方法的組合。(編譯:書航)
原文:The 3 V’s of Big Data and their Technologies
作者:Tzachi Lunet-Levi, Amdocs負責人 |
|