IBM大力推进Spark项目,称其为未来十年最为重要的开源项目
  • 发表于2015-8-2 02:26
  • 765 次阅读
  • 2 条评论
[摘要] IBM加入Spark社区,计划培养100多万数据科学家【2015年6月17日,北京】今日,IBM(NYSE:IBM)今天宣布承诺大力推进Apache Spark项目,并称该项目为:在以数据...
IBM加入Spark社区,计划培养100多万数据科学家

2015617日,北京今日,IBM(NYSE:IBM)今天宣布承诺大力推进Apache Spark项目,并称该项目为:在以数据为主导的,未来十年最为重要的新的开源项目。这一承诺的核心是将Spark嵌入IBM业内领先的分析和商务平台,并将Spark作为一项服务,在IBM Bluemix平台上提供给客户。IBM还将投入超过3500名研究和开发人员在全球十余个实验室开展与Spark相关的项目,并将为Spark开源生态系统无偿提供突破性的机器学习技术——IBM SystemML,同时,IBM还将培养超过100万名Spark数据科学家和数据工程师。

从流行的应用程序到物联网,数据与分析已经深深的嵌入到商业和社会的组织机构之中,Spark无疑为大规模数据处理带来了革命性的突破。首先,它极大的提升了数据依赖型应用程序的性能;其次,它从根本上简化了由数据驱动的智能应用程序的开发流程。

六大举措,加速Spark生态系统创新

为了加速Spark生态系统的开源创新进程,IBM将采取如下具体措施:

l  IBM将把Spark构建在自有的分析与商务平台的核心中。

l  IBM将把Spark作为沃森健康云洞察平台的核心基础之一,以便医疗服务人员和研究人员在围绕新的人口健康数据进行分析时,更快地将数据转化为价值。

l  IBM将对IBM突破性的IBM SystemML机器学习技术开源,并与Databricks协作提高Spark的机器学习能力。

l  IBM将把Spark作为一项服务在Bluemix平台上提供给客户,任何开发人员都可以快速加载数据、建模,并导出预测性工具用于他们的应用程序。

l  IBM将投入超过3500名IBM研究和开发人员在全球十余个实验室开展与Spark相关的项目,并在旧金山设立Spark技术中心,帮助数据科学与开发者社区在开发智能应用时,实现以设计为先导的创新。

l  IBM将通过与AMPLab、DataCamp、MetiStream、Galvanize 和MOOC,等多种合作方式,培养至少100万名Spark数据科学家和数据工程师。

IBM大中华区大数据与分析事业部总经理钟泽敏先生表示:“在开源创新领域IBM已经引领行业十年之久。我们深信开源的力量是为客户创造价值的源泉,我们将全力支持Spark,将其作为推动分析的基础性技术平台,从根本上推动所有业务领域加速创新。我们将帮助客户部署和利用Spark推动数据战略,以实现业务转型和差异化竞争,并从中获益。”

Spark推动IBM客户的业务转型

Spark已受到开发者与数据科学家们的热烈追捧。作为一个可以帮助企业便捷整合大数据至应用程序中的重要平台,Spark势头强劲,充分为IBM的客户提供业务转型的决策:

ü  Optibus的实时交通规划软件正在改变公共交通的组织方式。Optibus首席技术官兼共同创始人Amos Haggiag表示“Spark与IBM的合作,能够为Optibus提供高度扩展的平台,使我们的软件即服务产品进入新市场变得更容易,并简化我们在全球交通运输公司的部署、维护与应用开发过程。”

ü  全球咨询与上下文数据技术解决方案公司Findability Sciences正在使用IBM Analytics与Spark平台帮助客户挖掘大数据的价值。Findability Sciences首席执行官Anand Mahurkar表示“IBM BigInsights与Apache Spark的结合赋予了我们应对中小型企业需求的巨大能力,这种能力是MapReduce无法提供的。借助Spark平台,公司业绩大大提升了。现在,我们能够处理来自物联网的流数据,并提供诸如交通、乘客、停车等动态数据的分析。”

ü  美国费城地区最大的健康保险公司Independence Blue Cross (IBC),在该区域的服务对象超过200万人,在全美的服务对象超过700万人。IBC利用Spark平台助其推动产品的创新和新型服务的开发。IBC信息部总监Darwin Leung表示,“Apache Spark正在迅速成为开发机器学习分析应用程序的有力工具。它能够让IBC的研究人员与学术合作伙伴们更紧密地协作,帮助我们更快地实现客户的理赔。”

ü  IBMNASASETI Institute正在利用Spark的机器学习能力,分析兆兆级字节的复杂外太空无线信号,以新的模式寻找外星智慧生命的存在。SETI研究中心资深天文学家兼总监Seth Shostak博士表示,“借助Bluemix平台上的Spark服务,我们将能够与IBM共同合作,开发出分析信号数据的新方式,帮助我们在宇宙中寻找智慧生物。这也是在科学服务领域中,一次关于协同的成功尝试。”

IBM是UC Berkeley AMPLab的4家创始成员之一,Spark正是于2009年初创于此,经过夜以继日的研究实验、提供建议、结合务实的洞察,并与研究人员就共同感兴趣的话题密切互动,Spark应运而生。UC Berkeley AMPLab的总监Michael Franklin教授表示,“作为AMPLab的赞助者,IBM致力于发展Spark社区,并为Berkeley Data Analytics Stack的持续发展与改进提供指导,对于该开源平台,Spark是不可或缺的关键组成部分。”

Spark具有敏捷快速,便于应用的特征。良好的开源属性使其可以在全球范围内持续改进。在接下来的几个月里,IBM的科学家和工程师将与Apache Spark开放社区合作,迅速推动先进机器学习技术的普及,并加快智能业务应用开发的创新速度。通过无偿提供SystemML,IBM将帮助数据科学家提高迭代速度以应对不断变化的业务需求,并为不断发展壮大的应用程序开发人员生态系统提供支持,使智能技术在所有领域得到深度应用。

关于IBM

如需了解更多关于 IBM 分析与Spark合作的信息,请访问:www.ibm.com/spark
如需了解更多关于 IBM 公司的信息,请访问公司网址:http://www.ibm.com




已有2条评论
还可以输入40字
欢迎您,
admin 2015-8-3 09:30

asdfasdfsdf

fans 2015-9-9 19:52

哈哈

admin 2015-8-3 09:31

哈哈哈

fans 2015-9-9 19:52

可以的。

在线培训
更多 >>

2016-9-27 20:00 - 2016-9-27 22:00

线上

已结束
Docker on PowerLinux【在线培训】

2016-4-20 20:00 - 2016-4-20 22:00

线上

已结束
HBASE性能测试与调优初探【在线培训】

2016-3-30 20:00 - 2016-3-30 22:00

线上

已结束
OpenStack初步【在线培训】

2015-9-8 20:00 - 2015-9-8 21:30

线上

已结束
开源大数据技术架构设计【在线培训】
热门话题
更多 >>
power linux下部署jdk1.6和tomcat5.5+,下载地址求助。
power linux下部署jdk1.6和tomcat5.5+,下载地址求助。
学习Linux的未来前景到底如何?
网上百度了下,说:在root用户下 vi /etc/sysconfig/network 里面修改。但是我的 /e ...
hadoop运行日志的问题
我是在linux上面用命令运行jar包。 输出的日志很多,用管道命令 more less都不好使。 ...
为什么Linux下读取不到文件呢?
Linux下读取当前目录文件为空的原因? 在前面已经打印出来pathName是“./data.txt”, ...
我要提问