在這里我們就來回顧一下過去一年中,幾大重點廠商所發布的大數據戰略,看看他們之間到底有何區別,誰又能引. . .
大數據的價值已經逐漸被用戶認可。作為新概念,大數據在給一些初創公司帶來機遇的同時,也為大型的傳統IT廠商提出了新課題,在遠未飽和的市場中如何將自身的利益最大化?因此我們看到包括甲骨文、IBM以及微軟在內的主流數據庫廠商都紛紛發布了明確的大數據戰略,甚至連英特爾這樣和數據不太沾邊的公司也都參與進來。大數據中蘊含的大商機是每個廠商都要抓住的機遇。
在這里我們就來回顧一下過去一年中,幾大重點廠商所發布的大數據戰略,看看他們之間到底有何區別,誰又能引領新的大數據時代?
甲骨文大數據平臺浮出水面
甲骨文在2011年的OpenWorld上宣布將推出Oracle大數據機(Big Data Appliance)和Exalytics商務智能服務器,筆者曾認為這是甲骨文強勢進入“大數據”市場的標志。隨著BDA和Exalytics在今年年初的正式供貨,甲骨文的大數據平臺解決方案也逐漸浮出了水面。
甲骨文的大數據平臺解決方案可以簡單地理解為Exadata+大數據機+Exalytics的組合,利用這“三駕馬車”來分別應對數據捕獲、組織、分析和決策四個部分:利用大數據機來捕獲所有可用數據,通過Hadoop來將不同類型的數據組織為易分析的數據;然后再利用Exadata進行分析,其中Exalytics將起到加速BI分析過程的作用。因此通過這三個“大家伙”的組合,甲骨文將為用戶提供一個高集成度的大數據平臺。
EMC布局大數據中國市場
從市場宣傳和推廣的角度來看,EMC應該算是最早一批將大數據提上議事日程的廠商,去年5月在美國召開的EMC World大會就是以“Big Data”作為主題。當然只有口號是遠遠不夠的,EMC在這一年中針對大數據采取了一系列的舉措,包括發布了業內第一款大數據社交協作平臺Greenplum Chorus,EMC在用行動表達著對大數據市場的信心。
EMC在中國的業務發力點將包括以下幾個方面:1、依賴目前核心的市場銷售和咨詢顧問團隊,加強行業的覆蓋;2、重點培養如神州數碼、怡德、易通等在內的渠道合作伙伴,以推動大數據市場戰略;3、建立一個立足于中國本土的研發團隊。
作為EMC大數據戰略的重要一環,收購而來的Greenplum將承擔非結構化數據處理的重任。目前Greenplum的數據庫產品包括傳統的Greenplum Database和Greenplum HD(Hadoop),前者用來應對企業結構化數據,后者可以將非結構化數據導入Greenplum中進行存儲和分析。在今年年初,EMC又將Greenplum HD同EMC Isilon進行了整合,使Isilon可以原生支持Hadoop,成為業界第一個原生支持Hadoop的橫向擴展NAS平臺。
IBM積極推動大數據落地
大數據剛剛進入人們視野的時候,IBM就率先推出了業界首個大數據分析產品BigInsights和Steams,通過Hadoop和內存分析等技術實現了對大數據的存儲和分析。經歷了一年多的發展,除不斷完善產品功能之外,IBM又提出了一套全面的戰略理論3A5步,實現信息生命周期的管理。
今年IBM在大數據方面的主要方向是推動應用的落地,大數據在中國的應用集中在以技術為主導的互聯網公司當中,而針對傳統行業,這樣的經驗無法推而廣之。包括金融、電信以及制造等傳統行業在大數據方面的需求已經逐漸凸顯出來,而IBM的優勢就在于豐富的實踐經驗能夠幫助國內用戶讓大數據“落地生根”。
針對幾個行業,IBM給出了具體的大數據應用場景和解決方案,包括制造業、金融和電信等大型傳統行業。IBM的大數據戰略非常清晰,一步一個腳印走的很堅實,其前景將被看好。
英特爾憑Hadoop向大數據靠攏
雖然Hadoop并不是大數據代名詞,但當提到大數據生態系統的時候,人們還是會首先想到Apache Hadoop。同大數據類似,Hadoop是一整套技術與產品的組合,來源于Apache軟件基金會的開源項目,可以為企業提供一個可靠的、可擴展的分布式計算環境。它包括了MapReduce計算框架、HDFS存儲系統、HBase數據庫以及Hive等工具,能夠對非結構化數據進行有效的操作與處理。這也是Hadoop在大數據時代獨領風騷的重要原因,因此許多廠商都希望通過Hadoop來抓住大數據所帶來的機遇。
在今年的七月份,英特爾公司對外發布了自己的Hadoop商業發行版(Apache Hadoop Distribution),也是這幾家大型廠商中唯一擁有自身發行版Hadoop的一家。靠硬件芯片起家的英特爾為何要走這條路?
英特爾實際上已經看到企業用戶對于大數據的需求在不斷增長,特別是在中國。目前國內的Hadoop應用大多數集中在互聯網行業,傳統行業沒有專門的技術團隊可以擔負起維護開源Hadoop集群的重任。除Oracle、IBM這樣的廠商會提供一些異常昂貴的Hadoop服務之外,像Cloudera、Hortonworks這樣的頂級Hadoop提供商在國內的投入力度卻非常小。這雖然讓人有些意外,但國內用戶的確是需要一個“靠譜的”Hadoop解決方案,來切實解決大數據問題。英特爾的Hadoop發行版恰好能解決這一問題。
英特爾Hadoop發行版包含了所有的分析、集成以及開發組件,并對不同組合之間進行了更加深入的優化。此外,還添加了英特爾Hadoop管理器(Hadoop Manager),從安裝、部署到配置與監控,可以提供對平臺的全方位管理。目前英特爾已經開放了免費下載,隨著推廣力度的不斷加大,相信英特爾的Hadoop還是能很輕松地在國內大數據市場分一杯羹。
微軟大數據戰略依然延續“端到端”
對于微軟企業級部門來說,今年是非常重要的一年。大面積的產品更新以及在云計算業務方面的進展,讓微軟在2012年吸引了大量關注的目光,當然大數據就是其中之一。微軟在今年上半年正式發布了SQL Server 2012數據庫平臺,并添加了Hadoop的相關服務,逐漸將數據業務延伸到非結構化數據領域。而伴隨Windows Azure Marketplace和SharePoint等工具的推出,微軟已經具備了打造端到端的大數據平臺的能力。
微軟的大數據解決方案涵蓋了管理、擴展和洞察三個層面,從各個角度來把握大數據生命周期。其中數據管理層將對所有類型的數據進行搜集和管理,包括結構化、半結構化、非結構化和流數據;數據擴展層主要實現數據發現的功能,通過多種類型、多種數據源的互連實現對數據集的豐富;洞察力層主要面向應用,通過數據挖掘以及多種數據展現工具,實現任何用戶對任何位置的任何數據洞察。
微軟對大數據生命周期的三個層面都投入了大量的研發力度:SQL Server 2012數據庫和并行數據倉庫(Parallel Data Warehouse)將作為結構化數據的處理平臺。針對非結構化數據,微軟也將推出全新的Hadoop服務HDInsight,該產品包括公有云(Windows Azure)和私有云(Windows Server)兩個版本,提供企業級的Hadoop服務。
另外,最新發布的Windows Azure Marketplace將實現大數據的共享,通過開放數據協議(OData)展現數百種來自微軟和第三方的應用程序和數據挖掘算法。用戶還可以使用最熟悉的工具從結構化和非結構化數據中獲得可執行的洞察力,包括SQL Server分析服務(SSAS)的PowerPivot和Power View,通過連接器就可以對Hadoop分布式文件系統中的非結構化數據進行分析與展現。