2016 年人工智能最重要的发展:面向所有人的深度学习

   日期:2016-09-29     来源:信息化协同创新专委会    评论:0    
核心提示:过去一年人工智能和深度学习最重要的发展不在技术,而是商业模式的转变。过去6个月,所有巨头都将自己的深度学习IP开源。Data Science Central网站主编、有多年数据科学和商业分析模型从业经验的Bill Vorhies分析了开源浪潮的形成原因:云服务后来者谷歌为了吸引用户、扩大市场,率先大举开源;随后,各巨头为了吸引人才、加速创新,也纷纷开源;OpenAI的出现也为开源起到了一定推进作用。开源会使技术发展更快,但主宰市场的仍将是巨头。

过去一年人工智能和深度学习最重要的发展不在技术,而是商业模式的转变。过去6个月,所有巨头都将自己的深度学习IP开源。Data Science Central网站主编、有多年数据科学和商业分析模型从业经验的Bill Vorhies分析了开源浪潮的形成原因:云服务后来者谷歌为了吸引用户、扩大市场,率先大举开源;随后,各巨头为了吸引人才、加速创新,也纷纷开源;OpenAI的出现也为开源起到了一定推进作用。开源会使技术发展更快,但主宰市场的仍将是巨头。

过去一年,深度学习领域发生了很多事情。有很多令人拍案叫绝的案例,比如微软用多达152层的神经网络(通常只有六七层),漂亮地赢得Image Net比赛冠军。但过去6个月里,对深度学习影响最为深远的,还是商业模式的大转变。

突然之间——真的可以说是突然之间,亚马逊、IBM、谷歌、Facebook、Twitter、百度和微软这些巨头都将代码开源。其中,谷歌还像商业顾客免费使用这家公司的旗舰AI产品——Tensor Flow。

从2015年底到这个月,下面列出的这些项目都开源了。

如果你是谷歌的商业客户,或者是愿意花时间做开源代码的开发员,所有这些优质IP都任你挑选。那么,是什么促成了这股开源浪潮?为什么会发生如此大的转变?人类最先进、最神奇的技术,就像超市里的促销品。

情况确实如此,但只说对了一半。推动开源的原因有几点。

主导深度学习及应用

上图所提到的8家公司中,有一些是云服务平台,他们想要扩大用户基础,而另一些,包括提供云服务的在内,是以深度学习为发展引擎的数字技术公司。

深度学习处在图像识别、自动标记、文本语音转换、自动翻译以及语义分析的核心。此外,以亚马逊为代表,深度学习也开始被用于推荐系统和异常检测(比如欺诈交易)。因此,不难理解为什么巨头都要将深度学习视为攸关生死存亡的技术和能力。

对这些公司而言,文字和图像识别与分类的应用,还有购物推荐对亚马逊的意义显而易见。不过,这个道理就没那么明显了:开发出用户数量最多、普及程度最广的AI平台的人,将成为新兴市场的主宰,包括那些你现在还想不到的市场。

学界已经为分析算法打好了基础。现在至少有50套不同的深度学习工具,大部分都是开源的。过去五六年,很多创业公司都想利用这些开源资源打造完美的AI平台。然而,市场的主导权仍然掌握在少数巨头手里面。这个事实很可能表明,开发独立大平台的机会已经过去了,顶多也就是能开发小平台,之后也会被收购。

例如说位于加州的初创公司ErsatzLabs,投入了很多资源开发商用深度学习AI平台。去年,公司融资未果,CEODaveSullivan讲述了如今销售让人使用深度学习的产品或服务的难处。这些产品或服务的目标用户,有很多都在大公司工作,而他们更愿意使用自己的工具,或者在内部招人。

“现在人人都在等着下一个杀手级深度学习应用,还没有人知道是什么,”Sullivan说:“但不会是平台。”

成为云服务市场的主宰

对亚马逊、微软和谷歌而言,这事关云服务用户的竞争。这三家公司都想在云市场赢得巨大的份额,但谷歌却远远落后一大截。

Forrester Research前不久发表数据,今年,亚马逊的云利润大约108亿美元,微软101亿美元左右,而谷歌只有39亿美元。这促成了史上最大的深度学习大放送。

根据《华尔街日报》今年7月20日的报道,谷歌宣布将Tensor Flow的语义分析和语音转换文本的两大库开源。语音转文字、翻译和解释(语义分析)都是技术老大难,大型B2C公司都会遇得到。谷歌举例说,假设一家公司分析了超过20亿分钟的客服通话录音,一种情况是系统理解了顾客的需求,为顾客提供了满意的服务,另一种是系统没有理解,当然也就提供不了服务,这两种情形对比,所花费的成本和得到的收益,差距是巨大的。

因此,谷歌云服务的竞争力是人工智能,强调人工智能也将是谷歌推广云服务时市场营销的重点。

免费可能是头一遭,但在云服务里竞争人工智能却是由来已久。亚马逊、IBM和微软都提供类似的AI服务。谷歌的机器学习产品“很不错,也终于以一种开发商真正想要的方式被包装起来,”Forrester Research的首席分析师John Rymer说:“但他们并不是独一家……而且亚马逊和微软遥遥领先。”

谷歌(还有他的竞争对手)云服务的收费标准是按次数计算,顾客每请求使用一次就会征收多少钱。几个月前发布的谷歌图像识别功能(不是免费的),哪怕只有一两个客户,但这些客户都是大客户,使用量都是上万亿次的,最终收入也是相当可观的。

吸引人才、提高声望、加速创新

数据科学家的数量算少,而深度学习的专家更是少得可怜。对于大公司而言,开源能够帮助他们招聘更多的顶级AI人才。就跟收购IP一样,人才资源稀缺也是深度学习领域融资并购的一大推力,收购初创公司,就意味着增加了有经验的员工。(有意思的是苹果,在几乎巨头都纷纷开源的浪潮中,仍然坚守代码的所有权。目前还不清楚苹果能撑多久。)

开源不仅能吸引学界和产业界的优秀研究人员和开发人员,也能吸引产生创新的个体。许多世界顶级的人工智能专家都来自学术界,研究人员也是开源软件的活跃用户。BrandonBallinger以前是谷歌的工程师,现在他与加州大学旧金山分校合作研究心脏病学。BrandonBallinger说:“如果你守着不开,像苹果那样,你根本不会吸引最优秀的人才。”

除此之外,还有实际的问题,不管你规模有多大,你的研发预算也是有限度的。IBM研发副总裁RobThomas说:“关键是速度和创新。现在,我的[研发]受研发预算的控制,除非我们是在开源做的项目。”

如果你的平台被APAChe Institute作为新的开源项目收归旗下,你就能获得很高的信誉和很多的用户,由此创新的速度也更快。

能建立最强大硬件的公司,跑在最前面

不是有意贬低要在分布式系统上面运行100多层神经网络的能力,但深度学习剩下的问题还是在硬件方面。而说到硬件,又有谁比亚马逊、微软、谷歌和IBM在他们的云服务数据中心上面投资更多的呢?

有多大?IBM的Watson使用了90台IBMPower750服务器,每台服务器含有一个3.5GHz的POWER7八核处理器,每个核有4个线程。加一来,系统一共拥有2880个POWER7处理器线程,内存为16TB。

IBM的研究员John RenNIe介绍,Watson每秒可以处理数据500GB,相当于一万本图书。如果你认为这很厉害,那么Watson的性能实际上,还不到Top500超级计算机的一半。

为当今的云服务数据中心优化AI,需要注重在处理器中不常见的芯片类型,特别是GPU和FPGA。当前的数据中心没有那么多GPU或FPGA,但需要处理的数据量又这么大。怎么办呢?英特尔就发现了机会。去年夏天,英特尔用167亿美元收购了FPGA制造商Altera,很明显是标识出市场的新方向。

深度学习初创公司Skymind首席研究员AdamGibson说,深度学习已经成了“硬件问题”。是的,我们仍然需要顶尖的研究人员来指导神经网络的建立,但越来越多的时候,寻求更强大的硬件成了一种粗暴简单的解决方式。Gibson说,深度神经网络工作非常出色,但我们并不理解原理,因此,诀窍在于找到最好的算法组合。而更多更好的硬件能缩短寻找的时间。

最终的结果是,能够建立最强大的硬件网络的公司跑在最前面。几乎可以肯定,领跑的将是谷歌、亚马逊、微软和其他极少数公司。

没有OpenAI,就没有OpenAI

这一点挺有意思。如果没有特斯拉的创始人ElonMusk和其他一大串鼎鼎有名的科技明星,这股开源运动或许还真流行不起来。

2015年底,上面那批人宣布成立初创公司OpenAI,而且是一家非营利性人工智能公司。

OpenAI迅速从巨头、初创企业和学术界笼络了一批顶尖AI开发人员和研究人才,在很短时间内树立起了地位。Greg Brockman以前是初创公司Stripe的首席技术官,现在是OpenAI的一位负责人。他在最近的博客文章里写道,“我们的目标是推动数字智能,造福整个人类,不受财务回报约束”。

除了Musk和Thiel,OpenAI的其他支持者包括“PC之父”AlanKay、深度学习先驱YoshuaBengio。OpenAI表示这些支持者已经承诺,要投资10亿美元到项目中。

就个人而言,我打赌这些非常聪明的技术人员肯定知道好好利用这些投资。如果没有OpenAI,巨头还会急不可耐地开源吗?

接下来……

除了上面提出的问题,还有一些值得思考。其中,最主要的一个或许是为什么深度学习平台能够脱颖而出?是技术好、容易使用,还是跟硬件有关呢?这得留到下次再说了。

总之,2016年感觉越来越像2007年,那时候Hadoop第一次开源,商业应用如何火箭升空,一发而不可收拾。

 
  
  
  
  
 
更多>同类资讯
0相关评论
 
全年征稿 / 资讯合作
 
 
 
推荐资讯
可能喜欢