大数据文摘出品
作者:刘俊寰
沸沸扬扬的Daniel Povey入华大事终于尘埃落定!
在2019小米开发者大会前一天,小米创始人雷军在微博上宣布,国际语音识别和AI领域专家,语音识别开源工具Kaldi之父Daniel Povey正式入职小米,出任小米语音首席科学家,并将出席2019小米开发者大会。
拒绝Facebook的加盟邀约、被大学解聘之后,这个语音识别大牛曾在Twitter上宣布以兼职顾问的身份加入北京初创公司爱数智慧,并表示全职工作会选择一家中国企业。
此前,Daniel Povey发Twitter表示,即将与小米签订合约,预计将在年底前正式入职。
如今,他说到做到,正式加盟小米!据了解,Daniel Povey将在北京组建独立研究团队,开发新一代的“PyTorch-y"Kaldi。
昨天,2019小米开发者大会上,小米相关负责人公布了小米智能生活系统MIUI在未来2-3年的战略安排。其中,小米蓝牙音箱”小爱同学“作为MIUI的场景入口之一自然是关注重点,而Daniel Povey的加盟无疑会大大增强小米在自然语言处理上的能力。
Daniel Povey立下军令状:6个月后将有新一代Kaldi
下午五点,作为压轴嘉宾,Daniel Povey首次以小米员工的身份,针对“Kaldi”的未来研究计划,以及自然语言处理的最近发展,进行了主题演讲。这也是被开除事件后,Daniel Povey首次公开演讲。
Daniel首先表达了加盟小米的巨大热情。他介绍道,Kaldi现在还存在诸多缺点,包括没有Python接口、难以与TensorFlow和PyTorch结合、不支持整数化等。
Daniel说道,此前他对TensorFlow和PyTorch表示出极大的排斥,因为他认为Kaldi系统本身足够优秀,但现在他改变了看法,“TensorFlow和PyTorch十分优美,实用性也很强”。他举例说道,利用TensorFlow和PyTorch能够成功搭载移动端,这是Kaldi无法做到的。
对于这个方向的研究,Daniel表示他已经思考得足够成熟,但一直缺少机会和资金支持,现在加盟小米,或许就是最好的时机。
随后,Daniel向大家介绍了Kaldi在技术上取得的新进展:
Kaldi新版本将更注重信号电平增强数据增强(混响、噪声、速记扰动)将会动态进行节省磁盘空间计划更自然地支持多渠道方案希望使训练使得信号直接运行的网络变得更加容易
同时,Daniel也公布了下一代kaldi的研究计划:在DNN方面使用PyTorch使用Kaldi进行图形/FST相关方面的解码增加Python接口通过使用pybind11将Python接口添加到Kaldi(此项工作已开始)在PyTorch中执行LF-MMI
新官上任三把火,Daniel这次也放出了狠话,立下军令状:6个月之后会看到新版Kaldi成品。而要实现这个目标,还需要写大量代码,这是他一个人无法完成的,而小米能够提供充足的人力和物力支持,帮助他在预计时间内完成新一代Kaldi开发。这也是他加盟小米的诸多原因之一。
小米AI能力“添翼”,“小爱同学”未来可期
小米集团副总裁崔宝秋表示,过去近三年小米重点发力了两大AI领域,其中一个就是“小爱同学”,可以说,“小爱同学就是小米的AI”。
小米AI实验室主任王斌介绍道,在自然语言处理方面,小米已经成功搭载了基础算法、人机对话、机器翻译等功能,在Lite分析结果对比中,处理速度提升了224%,模型减少了65%,F1降低了1%。
目前,小爱同学已经为诸多领域赋能,包括智能投影、蓝牙音频、蓝牙芯片等。
崔宝秋表示,小米这两年发展势头猛烈,这就吸引到很多人才加入,包括Daniel Povey。可以想见,Daniel Povey的加盟对于“小爱同学”的开发研究将会起到重大的促进作用。
小米挖宝全过程:被学校开除,拒绝Facebook,最终加盟小米
Daniel加入小米的过程颇为曲折,让我们也再来回顾一下小米是如何挖到这枚语音识别界的“宝藏男孩”。
今年5月份,由于约翰霍普金斯大学(JHU)所在地区Baltimore的犯罪率居高不下,为了保证学生的安全,JHU要设立自己的警察力量。然而有的学生觉得,Baltimore已经有严重的种族问题,JHU如果有自己的警察,则会不可避免的加剧种族矛盾。
抗议的学生将学校行政楼大门锁上了,而Daniel Povey所隶属的语言和语音处理中心(Center for Language and Speech Processing, CLSP)的机房就在Garland的地下室里。
为了维护过热的服务器,保证系统正常运行,Daniel Povey在5月8日组织了一场“反抗议”的抗议活动。然而事情愈演愈烈,他的行为被这帮抗议学生描述成“一个白人至上主义的JHU教授带领着一帮人去攻击抗议的学生”。
最终,Daniel Povey被学校带薪停职,从8月31日起生效。
随后,Daniel在自己的主页上发表了一篇长文,叙述了事情的始末,发表了自己的看法,并透露了自己的下一步动向。“我将从8月19日开始去西雅图找一份私营部门的工作,但我仍然会远程与我的学生和同事一起工作。”
这个私营企业是Facebook,Daniel本来准备从19号开始在西雅图办公室为Facebook开发语音识别系统。然而Facebook在15号告诉他,允许他作为全职承包商为工作6周的时间,同时在此期间他们将对学校的事件进行的调查,他的FTE offer将取决于Facebook的调查结果。
于是,Daniel果断拒绝了这个offer,他表示:“整件事让我有(和学校)似曾相识的感觉。”
发生了这一连串的事情之后,Daniel表示:“如果有人好奇的话,我的计划是在一家中国公司工作,也许在一所中国大学找一份兼职工作。”
就是在这个时候,小米集团人工智能部总经理叶航军透露道,当时这个帖子被小米人工智能部门语音组的负责人看到了,因为语音组一直在用Kaldi,所以对他非常关注。
于是小米开始联系Daniel,Daniel也回信表达了一下自己的看法。在后续沟通中,小米通过邮件回答了Daniel的一些疑问,包括小米招他负责什么,小米的战略,以及怎么看待开源等。
之后Daniel来到了小米“面试”,小米工作人员向他介绍了公司在做的一些项目,分享小米对开源的看法等,Daniel当场表现出极大的兴趣。
Daniel Povey也解释了选择来小米工作的原因,在他看来,以小米为代表的中国互联网公司有着纯粹、极致的开源文化,以及开放、共享的理念。
本文首发于微信公众号:大数据文摘。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。
最新评论