論之語是國(guó)内技(jì)術(shù)領先的行業(yè)大數據應用解決方案提供商,基于開(kāi)放(fàng)的POISE大數據應用平台,可以為(wèi)行業(yè)客戶提供定制化的大數據應用解決方案。
Pioneer/先驅
2006年(nián),Hadoop正式誕生(shēng),而早在2001年(nián),我們的技(jì)術(shù)團隊已經在幫助我們的行業(yè)客戶處理每天超過10億條的海量數據,基于定制化的分布式數據庫和搜索技(jì)術(shù),我們可以輕松處理、存儲和分析這些規模龐大的異構數據。到(dào)2008年(nián),我們幫助客戶搭建的最大的一(yī)個(gè)大數據集群節點數量已經達到(dào)1000個(gè),同時期,Yahoo!構建的全球最大的Hadoop集群節點數量為(wèi)2000個(gè)。
早期對大數據技(jì)術(shù)的深度應用研究為(wèi)我們擁抱Hadoop生(shēng)态圈打下(xià)了良好的基礎,時至今日,我們已經成為(wèi)了行業(yè)内Hadoop生(shēng)态圈應用的先行者,在POISE大數據應用平台上(shàng),您将可以看(kàn)到(dào)Hadoop生(shēng)态圈最新技(jì)術(shù)在行業(yè)中的實際落地應用。
Open/開(kāi)放(fàng)
不同于其它商業(yè)大數據基礎平台廠商,論之語POISE大數據應用平台以應用為(wèi)導向,采取完全開(kāi)放(fàng)的态度,底層基于開(kāi)源Hadoop/Spark架構,可以無縫兼容Cloudera、Hortonworks等國(guó)際主流商業(yè)Hadoop發行版,快速低(dī)成本遷移到(dào)華為(wèi)FusionInsight、阿裡(lǐ)飛(fēi)天平台等國(guó)内主流大數據基礎平台之上(shàng)。
基于采用Kafka的數據總線技(jì)術(shù),POISE大數據應用平台可以為(wèi)上(shàng)層第三方應用提供簡單查詢、批量導出和複制分發等數據支撐。
基于采用WebService的服務總線技(jì)術(shù),POISE大數據應用平台可以為(wèi)應用平台内部之間以及應用平台外部應用提供服務交互能(néng)力支撐。
Intelligent/智能(néng)
從(cóng)IBM深藍到(dào)Google AlphaGo,借助大數據+深度學習技(jì)術(shù),Google人工(gōng)智能(néng)震驚了世界。論之語POISE大數據應用平台全面引入機(jī)器(qì)學習技(jì)術(shù),讓您的大數據應用更智能(néng)。
以内容分析為(wèi)例,POISE結合Deep Learning和NLP技(jì)術(shù),可以通(tōng)過大數據訓練實現自(zì)動語種識别、要素信息提取等内容深度分析功能(néng)。
以關系分析為(wèi)例,POISE結合Deep Learning和Monte Carlo Tree Search算(suàn)法,利用預測和反饋機(jī)制,可以大大提高(gāo)概率計算(suàn)的準确性。
Safety/安全
我們深刻理解數據安全對客戶的重要性,在POISE大數據應用平台上(shàng),通(tōng)過管理總線我們提供貫穿整個(gè)大數據應用平台的數據安全保護機(jī)制。
數據加密:為(wèi)所有進入POISE大數據應用平台的數據提供高(gāo)效、透明的數據加密保護。
數據備份:根據數據存儲形式的不同,提供節點間備份、離線增量備份等完善的數據備份機(jī)制。
訪問控制:提供基于數據類型表級和要素數據字段級細粒度訪問控制和基于角色的授權控制。
安全治理:提供全面審計、多(duō)級審批、數據沿襲和生(shēng)命周期管理。
Efficient/高(gāo)效
POISE大數據應用平台秉承“即查即得”的設計原則,通(tōng)過在分布式計算(suàn)框架(MapReduce/Spark Streaming/Spark SQL/Storm)中結合大量的算(suàn)法優化、高(gāo)性能(néng)計算(suàn)(HPC)和預計算(suàn)(Pre-computing)技(jì)術(shù)應用,可以實現PB數據量級下(xià)的實時/準實時交互響應。
針對超大規模數據的處理與應用場景,集成并深度優化了”Bigtable+Lucence“框架,可以完美支撐萬億級異構數據的高(gāo)效查詢與存儲需求。以某地工(gōng)業(yè)大數據項目為(wèi)例,其數據種類200餘種,涉及運行監測、生(shēng)産制造、設備運營等業(yè)務,平均單條數據大小(xiǎo)為(wèi)300字節。基于我司的混合處理框架,單節點普通(tōng)PC服務器(qì)每天可高(gāo)效處理50億條以上(shàng)數據,單節點最大存儲記錄數高(gāo)達5000億,且可同時保證數據的随機(jī)檢索延遲不超過3秒(miǎo)。
大數據,大未來,論之語,您的大數據處理專家!