深度洞察用戶數據

高效挖掘數據價值

以云計算為基礎,能夠對持續性海量增加的多結構類型數據,進行快速計算和分析,對行業大數據進行多維度重新整合和深度挖掘,建立橫向、縱向、交叉以及立體分析模型和對標體系,實現包含IAAS,PAAS及SAAS等數據的綜合應用,幫助客戶提高大數據的處理能力,挖掘大數據的價值,利用大數據進行分析、決策,提高經營管理能力和客戶服務水平。

技術架構

Technology Architecture

平臺特色

Platform features

安全性加固,使用LDAP作為賬戶管理系統,提供單點登錄能力;文件系統層針對表、字段的存儲關鍵信息動態加密,集群內部用戶信息禁止明文存儲。

統一工作臺提供豐富的可視化組,包括批量采集、實時采集、實時消息批量計算任務、機器學習等任務類型。

大數據基礎平臺在統一存儲上建立資源管理層,為企業提供統一的計算資源管理、動態資源分配、多租戶之間資源配置和動態共享,靈活支持多租戶、多服務在統一平臺上的平滑運行。

統一運維管理和友好的圖形化管理界面,為客戶提供了系統安裝集群配置、資源級別安全控制、監控及預警等多方面支持,在管理便捷性方面優勢顯著。

全鏈路大數據管理,提供個性化的數據建模、數據查詢、收藏、管理功能。

海量批處理和高速流處理,集成了Hadoop、Spark、Storm等計算框架和HDFS、Hbase等數據存儲服務,能夠真正做到海量批處理和高速流處理的能力。

海量數據搜索,Hadoop大數據基礎平臺分布式實時搜索與分析引擎,可實時對數據進行深度搜索,支持多維度的數據展現形態。

大數據云計算平臺

Big Data Cloud Computing Platform

大數據基礎平臺

Big Data Base Platform

大數據運維管理,提供可靠安全、容錯、易用的集群管理能力,支持大規模集群的安裝部署、統一監控告警、統一用戶權限管理、日志查詢、服務管理等服務。

Hadoop集成開放工具,提供了web圖形化方式操作,包括流程控制、作業調度、數據管理、數據搜索、元數據管理、文件管理等功能。

分布式文件系統HDFS,實現高吞吐量的數據訪問,適合大規模數據集方面的應用,為海量數據提供存儲服務。

分布式處理引擎MapReduce起到了將大事務分散到不同設備處理的能力,這樣原本必須用單臺較強服務器才能運行的任務,在分布式環境下也能完成了。

分布式數據庫HBase適合于存儲大表數據(表的規??梢源锏絞諦幸約笆僂蛄校┓夢士梢源锏絞凳奔侗?。

分布式內存計算框架,能夠幫助用戶簡單地快速開發統一的大數據應用,對數據進行協處理、流式處理、交互式分析等。

分布式搜索ElasticSearch提供實時分布式搜索和分析引擎。

分布式緩存層(Tachyon、Redis),當兩個Spark作業需要共享數據時,通過Tachyon無需再通過寫磁盤,而是借助Tachyon進行內存讀寫,從而提高計算效率。

數據倉庫 Hive提供類似SQL的Hive Query Language語言操作結構化數據。

流處理Storm、Spark Streaming,由集群中的主控節點(master node)分發代碼,將任務分配給工作節點(worker node)執行。

統一安全管理平臺對系統安全進行保障,通過網絡安全、身份認證、權限控制、數據?;ど蠹?、監控等能力,保障系統的安全、數據的安全、信息的安全。

身份認證,實現租戶通過政務外網、公有云、互聯網等對政務云內部資源的可控訪問。

訪問控制和授權,提供安全策略,保證政務云內部租戶、主機、VM之間的默認安全隔離。

數據?;?,數據備份是最基礎的數據?;な侄?,是防止數據丟失的最后一道防線。 審計和監控,記錄所有云平臺的相關活動的日志和審計,監視各種應用程序和服務器。