“以机器学习领域的论文数量为例,两个月前谷歌的 Jeff Dean 曾展示了一个数字:arXiv 上每天关于机器学习的论文数量超过 100 篇。”吴恩达表示。“今天,我们也有了很多机器学习工具,包括神经网络框架 TensorFlow、PyTorch、MXNet 和百度飞桨,这些工具正在让人们使用机器学习的门槛变得越来越低。”
通过足够的数据和算力、灵活的工具以及创新的想法,我们可以建立起属于自己的 AI 项目。很多公司的 CEO 都在担心如何把 AI 技术加入企业工作流程中。这个转型过程有时是 1-2 年,或是更长。他们担心选择了错误的项目、设定了不切实际的目标,如果转型失败,公司会蒙受巨大损失。
“看看今天的世界,有关 AI 的应用越来越多了。但企业的 AI 转型并不是开发一个 APP 这么简单。”吴恩达表示。
去年底,吴恩达发布了《AI 转型指南》,希望以教育者的身份将“All in AI”的经验传授给众多公司管理者。作为 AI 领域的先驱者,吴恩达从谷歌大脑和百度 AI 团队的发展中收集洞见,它们对谷歌、百度的 AI 转型扮演着重要角色。参照此指南,任何企业都有可能成为强大的 AI 公司。
为了找到正确的方向,我们需要从简单的地方起步,自动化任务而非工作,并把人工智能和人类的专业知识进行结合,这样才能更好地帮助公司选择正确的 AI 项目。“我们发现,很多公司第一个落地的 AI 项目通常并不是最有潜力的项目。我给很多公司的建议是做一次头脑风暴,至少看六个不同的项目,”吴恩达表示。“然后花费几个星期进行调研工作,确保这个项目是有价值的。”
吴恩达为企业 AI 转型给出了如下建议,在《AI 转型指南》中也有详尽解释:
1. 实行试点项目获得动力
2. 建立一支内部 AI 团队
3. 提供广泛的 AI 培训
4. 策划合适的 AI 战略
5. 建立内部和外部沟通
在期待 AI 为企业带来的红利之前,我们还需要避免几个陷阱:不要期待 AI 立刻产生作用,而是要多次尝试,对 AI 发展的回报曲线进行合理预算;不要使用传统的流程评估人工智能项目,应该为 AI 项目团队设立合适的 KPI 和目标;在团队建设时,我们不能仅依靠明星工程师,而是要建立一个完善的团队。
“看到 AI 崛起,我们需要有正确的概念,首先 AI 是一个系统的工程。我们需要集中很多人的团队才能完成一项具体任务。”吴恩达表示。
对于未来的人工智能发展,吴恩达认为,我们应该期待能够利用小数据的新算法:“我们现在只能用人眼检测手机屏幕的划痕——如果有大量图片,AI 也可以做得很好,但没有任何工厂会有几百万不同划痕的手机。这个时候我们就需要 few shot learning、无监督学习等新方法,能从很少的例子中学习出正确的概念。”
强化学习和自我学习可以在虚拟环境中进行训练,从而避免在真实世界的应用中遇险。而且这些模拟可以并行化,同时进行大量的试验,很快学习出解决方案。
AI 正在走向端侧,区域计算中心也要承担部分计算,吴恩达对于 5G 有着很高的期待:“5G 是非常重要的技术,这项技术在中国的发展已经超过了美国。它能让网络延迟从 4G 的 20 毫秒降低到仅仅 1 毫秒,并支持更多设备的连接。5G 可以支持更多种类的应用,帮助 AI 发展出更多新的形势。”
“现在的计算机在识别面部方面比人类做得更好。所有这些使得我们相信:我们似乎拿到了人工智能魔法的配方,它就是深度学习。”牛津大学计算机系主任 Michael Wooldridge 在大会上说道。“看起来是这样的,但进一步的探索之后。我们就会看到目前机器学习技术的尽头。人们都在问边界是什么,我们现在已经看到了一些界限。”
Michael Wooldridge 向我们介绍了人工智能目前的优势与限制。
计算机在 1940 年被发明出来的时候,被用来处理一些数学问题——它比人类做得好,可以 24 小时不停地工作,人类是做不到的。
但一些人类每天都在使用的简单能力,机器学习却是做不到的——计算机无法进行长期推理,无法做问题的定义,难以对周遭环境形成认知,也难以完成可靠的判断。
机器学习的工程化视角
在下午的“数据思维与工程实践”板块,华为 IT 标准专利部主任工程师黄之鹏另辟蹊径地分享了 AI 的工程化视角。
“我们提到机器学习,经常会想到大数据应用,但这次我希望介绍一下工程化视角(GAIA 原则)的机器学习,”黄之鹏表示。“华为希望以通用性技术来解决问题。在抽象的过程中,则希望有统一的接口。我们希望所有的工作都能有很好的操作性、可解释性:写好一次代码,在其他任务中都可以应用。另外,机器学习最终的目的是自动化。”
在开源领域里,华为一直在推动全栈视角,真正的 AI 需要打通全栈,实现端到端的人工智能工作流程,开发者不仅应该知道怎么用框架完成任务,还要知道模型跑在不同的环境里,需要如何简单地进行转换。
黄之鹏着重介绍了近年来华为在开源社区 ONNX 中的贡献。在此前推理侧的模型转换基础上,机器学习社区正在密集讨论模型训练的新方向。华为在这方面的贡献包括边缘设备的通用方法,以及对于 Model Zoo 的算法贡献与方法提升。
他说,“过去五年中,以深度学习为代表的 AI 技术在 CV 领域取得巨大成功,但对于很多大的互联网公司来说,占公司内部 80% 以上算力的应用还是搜索、推荐、广告,它们是沉默的大多数应用。”
用户在淘宝上的行为是非常复杂的,包括浏览、收藏、购买等,电商广告面临的挑战是如何洞察用户的兴趣习惯,推荐个性化的产品。而随着深度学习的引入,网络变得越来越复杂,新的挑战是,广告推荐场景以特征为主,一方面高维稀疏特征导致模型非常大,往往达数百 G 甚至上 T 规模;另一方面,相比 CV 场景,广告推荐场景在参数规模、样本规模上都要大一两个数量级,参数通常达千亿规模,样本通常达千亿到万亿规模,所以必须要做一个全局设计保证计算芯片高效率运行。
暗物智能深耕的场景是 AI+教育。其研发总监梁小丹称,暗物智能从技术上搭建了五层的 AI 认知架构,第一层是执行交互层,第二层是感知和行为层,第三层是任务与调度层,第四层是思维与动机层,第五层是价值和规范层。
它具备语音交互、计算机视觉、逻辑处理等多模态能力,并研发了一款桌面陪伴机器人。
暗物智能还通过学习教育机构的视频,自动生成背后的教学逻辑,训练 AI 老师。在智慧课堂场景中,它通过分析老师与学生的对话交互,判断老师有没有把某个知识点教会学生,以及学生对哪个知识点掌握得较为薄弱,进而进行个性化 AI 辅导。
最后,黄之鹏、俞凯、Matt Scott、梁晓丹和 Wonder Technologies 首席数据科学家 Christopher Dossman 共同围绕 AI 应用创新与挑战进行了一场圆桌对话。
“在未来十年可解释的 AI 是最重要的方式,只有可信的 AI 才能够推广到各类领域中。”俞凯表示。
Matt Scott 则认为目前我们仍然处在 AI 技术发展的开始阶段:“当今的人工智能研究还有一些基础的问题未被攻克。机器学习无法学会人类学习经验的方法,我认为结合多种感官输入的多模态算法将会是未来 AI 的重要发展方向。”