了不起的创变者 | 讯飞上云的幕后「规划师」

10月23日,科大讯飞一年一度的全球1024开发者节,在安徽合肥召开(www.9zzz.cn)。科大讯飞集团副总裁于继栋走上舞台,发布了讯飞开放平台新品——讯飞AI云,并回顾了“讯飞开放平台”十年来的发展历程。

十年前,于继栋深思熟虑,坚持推动业务“上云”。而十年来,他将讯飞的众多AI能力逐步迁移至云端,并让这些能力得到变现。

作为掌舵整个讯飞开放平台业务的掌门人,于继栋常常自谦:“我只是一名程序员”。而十年来,这位“程序员”与讯飞开放平台一起,迎接并战胜了一个又一个挑战。

站在十年后的今天,于继栋说,如果能回到十年前,他仍然会做出相同的选择:“人工智能是一项深远的技术,过去的十年,可能是历史的必然。”

讯飞上云

时间倒回到2010年。

那一年,苹果发布了一代机皇iPhone 4,三星发布了旗下首款安卓手机Galaxy S,移动互联网的黄金十年自此拉开序幕。

而在国内,PC互联网时代的格局初现,BAT的概念刚刚被提出。但在整个IT产业,似乎很少有人注意到科大讯飞,这家安徽合肥的本土科技企业。

那时,科大讯飞的定位,是一家“语音技术提供商”。在语音技术上,讯飞拥有着深厚的技术积累与不错的业内口碑。但在公众眼中,这家企业的存在感却几乎为0。

这背后的原因非常简单。讯飞是一家技术提供商,只输出核心技术。这些技术需要集成商整合成解决方案,再包装成产品,最后服务到客户。从讯飞到客户,产业链条冗长。这让讯飞往往只能为他人作嫁衣,很难获得客户的直接反馈,其自身的商业价值也受到了拖累。

当时,云计算概念方兴未艾,谷歌推出了语音搜索的新玩法,而中国互联网行业的风起云涌也让于继栋心动不已。他意识到,讯飞也应该跳出单纯技术输出的圈子,开始做商品与服务。

这一设想,在讯飞内部迅速引起了大量讨论,反对之声也不少见——“本来可以卖钱的技术,为什么让别人拿去免费用?”但最终,讯飞决策层还是决定,面对未来的互联网时代,讯飞有必要推出新的模式。他们要将讯飞的AI能力,复制到云上。

于是,在2010年10月28日,讯飞发布了两款至今影响深远的产品。一款是C端用户熟知的讯飞输入法,另一款则是讯飞输入法的底层平台、讯飞开放平台的前身——讯飞语音云。

十年时间过去,这两款产品也没有辜负人们的期望。如今,它们已经成为了科大讯飞最具影响力的两大品牌。

等待春天

讯飞语音云一经发布,便迅速获得业界好评。

于继栋回忆,当时科大讯飞的股票连续十几天涨停,短时间内股价出现三倍增长。而他的团队、资源也在急剧扩充。早期,语音云只有几台服务器,而不到两年时间,他们就扩充了近千台服务器。

当时,语音服务正处于高速增长期。2011年,苹果发布了一代经典iPhone 4s,其搭载的语音助理服务Siri迅速成为行业与用户的新宠。一夜之间,几乎所有手机厂商都将语音助理功能提上议程。但这一功能并非手机厂商强项。而刚刚开放语音云平台的科大讯飞,则成为了手机厂商们的首选。

“2011之后那两年,我们发展得还不错。”于继栋回忆。但挑战,也在这时到来。

与B端行业用户不同,手机用户的高峰使用时间是晚间9点。海量的语音接入,常常会引发系统故障,甚至服务崩溃。而于继栋的团队也习惯了在深夜加班应对挑战。

直到2013年,语音云服务才进入稳定状态。也正是在这两年的磨练期,讯飞的语音识别能力获得了突飞猛进的进步,其语音识别准确率从60%+增长至90%+。

2013年,为了进一步提升对开发者创业的支持,讯飞语音云正式对外更名为“讯飞开放平台”。开放平台让讯飞积累了不错的用户及行业口碑,但于继栋却遇到了新的难题——变现。

当时,讯飞开放平台的服务量一直都在增长,但收益却没有太大的变化。在公司,于继栋也感受到了巨大的压力,每天上班,他总是悄悄地来,悄悄地走:“不敢面对其他部门的同事,我觉得我们给公司带来了不小的负担,很愧疚。”

他必须为讯飞开放平台找到新的变现增长点。在互联网行业,大多数产品的变现途径都离不开电商、游戏、广告。其中,电商、游戏与讯飞相距甚远,而广告,则成为了为数不多的选择。

由此,讯飞开放平台开始尝试基于AI的精准广告服务。此外,开放平台还凭借着与客户之间的良好关系,推出了整合众多App的流量服务平台,做起了广告平台的生意。依靠这些新业务,讯飞开放平台终于度过了最艰难的岁月,并在2016年成功实现盈亏平衡。

而正是在这一年,AI产业的新一轮春天到来了。

产业爆发

对AI产业而言,2016年是一个非同寻常的年份。

2016年1月,Google旗下的DeepMind团队在《Science》上发表封面文章,宣布旗下AI AlphaGo以5:0的战绩完胜欧洲围棋冠军樊麾。两个月后,AlphaGo战胜世界围棋冠军李世石。AI在围棋领域击败人类,直接颠覆了公众对于AI产业的认知。新一轮AI热潮由此到来。

AlphaGo战胜人类,也标志着AI产业的新一轮升级。与1997年“深蓝”战胜卡斯帕罗夫不同的是,AlphaGo这一次击败人类,离不开硬件算力升级,以及神经网络、深度学习技术带来的新一轮革命。在新技术的助力下,AI已今非昔比。

语音识别,图像识别,自然语义理解,语音生成,这些AI新技术开始广泛在各个应用场景落地。"当时各行各业都在思考,我们的业务要不要结合下人工智能?"于继栋回忆。

而讯飞开放平台也开始不断强化、丰富自己的能力。2012年,平台开放了自然语音理解能力,让AI不仅可以将语音转化为文字,还能理解文字本身的含义。

在这一过程中,客户也提出了更多AI领域的需求,其中一些也不再局限于语音领域,如视觉领域的人脸识别等。在2016年之前,讯飞开放平台上的能力数量只有20余个,而如今,这一数字已经超过300。

仅在2016年一年,讯飞开放平台就增加了50万名开发者。与此同时,AI也在开始向产业渗透。“现在我们发现,大部分开发者已经不仅仅是将AI嵌入产品,而是开始通过AI让企业管理更高效、更智能。”于继栋说。

如今,讯飞开放平台已经成为整个科大讯飞内部的重要板块,讯飞2019年财报数据显示,讯飞开放平台实现营收11.54亿,同比增长68.71%,在全部业务中的占比则为11.45%。

“从2017年到现在,年复合增长率应该都超过了100%。”于继栋说,“虽然营收占比还没能做到业内第一,但未来的发展速度一定会越来越快。”

延展边界

“程序员最喜欢的一句话是‘Hello world’,他们喜欢技术掌控世界的感觉。但等到自己做业务后才发现,真正可控的部分可能只有5%。”于继栋说,“剩下的部分,需要靠运气,靠行业大势,更要靠客户的认可,以及我们自身的长期努力。”

成立十年来,讯飞开放平台也曾面临许多竞争对手的挑战。一些竞争对手已经出局离场,与此同时,又会不断有新的玩家加入这一战场。而讯飞开放平台与竞争对手之间的关系,也在变化。

如今,在讯飞开放平台的官网上,讯飞也引入了商汤、京东云等AI、云计算企业的相关服务,供开发者调用。“我们也在延展AI的边界,为开发者提供更多的AI能力。”于继栋说。

为了服务这些开发者,讯飞也在探索更多服务模式。面对开发者们提出的新需求,讯飞会将可批量量化的新需求提供给研究院,并将其整合为新的服务能力。

例如,在教育领域,有些客户需要AI语音评测的能力,应用在App中根据用户跟读的语音、语调、准确度打分。讯飞开放平台在得到市场反馈后,第一时间给出了解决方案。此外,在新农业建设方面,平台通过语音识别和大数据分析,深耕行业数字化升级,打造AI时代新型农庄。

这些针对细分行业、细分场景的投入,也给讯飞开放平台带来了回报。如今,教育已经成为了讯飞开放平台客户最集中的一大行业。

现在,除了讯飞开放平台的“规划师”,于继栋的另一个身份,是两个孩子的父亲。“用AI让教育更轻松”也成为了他的一大理想。

“AI解放了人类,给人类带来了很多便利,让人类有时间去做更多有意义的事情。”于继栋如此评价AI对人类社会的推动力,“但是,人类最好不要因此变得懒惰。”

而对他而言,继续建设讯飞开放平台,可能就是最有意义的事情。“讯飞开放平台已经干了10年了,我可能还要做好再干10年、20年、或更长时间的思想准备。

主营产品:DC散热风扇,直流风扇,直流鼓风机,散热风扇,旭弘翔产品