杨强用联邦学习打破数据孤岛，吴恩达谈企业转型

zj66 · 发表于 2020-10-17 09:16:45

马上注册！

您需要登录才可以下载或查看，没有账号？注册

×

来源：北国网

　　7月20日，“市北·GMIS”第二天更加精彩，杨强、吴恩达、俞凯等重磅嘉宾继续带来了 12 场主题演讲，内容涵盖联邦学习、认知智能、图表征神经网络等前沿技术，同时 AI 应用侧的探索也异彩纷呈。

　　在前沿技术方面，杨强教授分享了如何用联邦学习打破数据割裂，吴恩达谈到小数据、无监督学习对未来人工智能发展的重要性，俞凯也抛出认知智能的技术演进路线。

　　在 AI 应用方面，华为带来从工程视角审视人工智能的新思路，阿里巴巴、美团展示了 AI 在大规模场景数据中的应用，周涛教授则呈现 AI 社会治理与监管方面的新研究。

　　杨强：用联邦学习打破“数据孤岛”

　　作为今天大会的第一位开场嘉宾，微众银行首席人工智能官、国际人工智能学会理事长、香港科技大学教授杨强带来联邦学习的最新发展与应用。

　　AI 发展到今天面临很大挑战，尤其是数据挑战。数据孤岛、小数据、用户隐私的保护等导致数据的割裂，让 AI 技术很难发挥出价值。为了解决这一问题，杨强教授提出“联邦学习”的研究方向。

　　所谓联邦学习，是多个数据方之间组成一个联盟，共同参与到全局建模的建设中，各方之间在保护数据隐私和模型参数基础上，仅共享模型加密后的参数，让共享模型达到更优的效果。

　　杨强介绍道，联邦学习可分为横向联邦和纵向联邦，横向联邦是指企业各方数据维度相同、ID 维度不同，更多存在于消费者应用中；纵向联邦是指企业各方数据的 ID 维度相同(样本重叠)、数据维度不同，更多存在于 B 端应用。

　　在具体的使用场景中，杨强重点介绍了联邦学习在金融行业中的应用。比如针对保险行业的个性化保险定价问题，一家互联网企业和一家保险企业进行数据合作，这种合作数据的 ID 重合度相当大，数据特征维度大大增加，使模型的个性化定价效果显著提升，为保险企业带来 8 倍覆盖率提升和 1.5 倍利润率提升。

　　在另外一个小微企业信贷管理案例中，使用联邦学习后，企业将风控区分度提升 12%，使贷款不良率小于千分之五。

　　即使在双方既没有共同的 ID，数据特征也不同的情况下，也可以使用迁移学习结合联邦学习进行共同建模。

　　杨强强调，联邦学习一定是多方共同协作组成一个联盟，生态的建设十分重要。它最大的优势是，保证数据不出户，通过生态在不同行业选取合作伙伴，用群体智能不断提升模型效果。

　　未来，安全合规、防御攻击、算法效率、联盟机制等都需要进一步研究。比如联邦学习中各方合作的一个基础就是加密技术，加密算法的效率显得尤为重要，算法的改善还有很长的路要走。

　　吴恩达：利用 AI 带来的动能

　　深度学习先驱吴恩达(Andrew Ng)是大家耳熟能详的名字，他的演讲也获得了最多的掌声。今天，吴恩达在 GMIS 大会上与人们探讨了企业的人工智能转型。

　　“四年前我提出了一个概念：AI 是新的电力。现在我得说，AI 带来的动能正在展现效果。”吴恩达说道。“看看近年来有关 AI 的工作需求数量，每年都有 35% 的增长，深度学习的发展正在让人工智能领域变得繁荣。麦肯锡最近的预测认为到 2030 年，全球的经济增长量中将有 13 万亿美元来自人工智能技术的贡献。”

　　“以机器学习领域的论文数量为例，两个月前谷歌的 Jeff Dean 曾展示了一个数字：arXiv 上每天关于机器学习的论文数量超过 100 篇。”吴恩达表示。“今天，我们也有了很多机器学习工具，包括神经网络框架 TensorFlow、PyTorch、MXNet 和百度飞桨，这些工具正在让人们使用机器学习的门槛变得越来越低。”

　　吴恩达表示，几个月前他曾在加州参加了一个创业挑战：一支来自印度的团队展示了机器人应用方法，其可以自动拍摄农田的照片。有趣的是，开发这一应用的人只有 12 岁——他使用开源的工具和算法完成了这一任务。现在的人工智能业务已经可以由任何人来做了。

　　通过足够的数据和算力、灵活的工具以及创新的想法，我们可以建立起属于自己的 AI 项目。很多公司的 CEO 都在担心如何把 AI 技术加入企业工作流程中。这个转型过程有时是 1-2 年，或是更长。他们担心选择了错误的项目、设定了不切实际的目标，如果转型失败，公司会蒙受巨大损失。

　　“看看今天的世界，有关 AI 的应用越来越多了。但企业的 AI 转型并不是开发一个 APP 这么简单。”吴恩达表示。

　　去年底，吴恩达发布了《AI 转型指南》，希望以教育者的身份将“All in AI”的经验传授给众多公司管理者。作为 AI 领域的先驱者，吴恩达从谷歌大脑和百度 AI 团队的发展中收集洞见，它们对谷歌、百度的 AI 转型扮演着重要角色。参照此指南，任何企业都有可能成为强大的 AI 公司。

　　为了找到正确的方向，我们需要从简单的地方起步，自动化任务而非工作，并把人工智能和人类的专业知识进行结合，这样才能更好地帮助公司选择正确的 AI 项目。“我们发现，很多公司第一个落地的 AI 项目通常并不是最有潜力的项目。我给很多公司的建议是做一次头脑风暴，至少看六个不同的项目，”吴恩达表示。“然后花费几个星期进行调研工作，确保这个项目是有价值的。”

　　吴恩达为企业 AI 转型给出了如下建议，在《AI 转型指南》中也有详尽解释：

　　1. 实行试点项目获得动力

　　2. 建立一支内部 AI 团队

　　3. 提供广泛的 AI 培训

　　4. 策划合适的 AI 战略

　　5. 建立内部和外部沟通

　　在期待 AI 为企业带来的红利之前，我们还需要避免几个陷阱：不要期待 AI 立刻产生作用，而是要多次尝试，对 AI 发展的回报曲线进行合理预算；不要使用传统的流程评估人工智能项目，应该为 AI 项目团队设立合适的 KPI 和目标；在团队建设时，我们不能仅依靠明星工程师，而是要建立一个完善的团队。

　　“看到 AI 崛起，我们需要有正确的概念，首先 AI 是一个系统的工程。我们需要集中很多人的团队才能完成一项具体任务。”吴恩达表示。

　　对于未来的人工智能发展，吴恩达认为，我们应该期待能够利用小数据的新算法：“我们现在只能用人眼检测手机屏幕的划痕——如果有大量图片，AI 也可以做得很好，但没有任何工厂会有几百万不同划痕的手机。这个时候我们就需要 few shot learning、无监督学习等新方法，能从很少的例子中学习出正确的概念。”

　　强化学习和自我学习可以在虚拟环境中进行训练，从而避免在真实世界的应用中遇险。而且这些模拟可以并行化，同时进行大量的试验，很快学习出解决方案。

　　AI 正在走向端侧，区域计算中心也要承担部分计算，吴恩达对于 5G 有着很高的期待：“5G 是非常重要的技术，这项技术在中国的发展已经超过了美国。它能让网络延迟从 4G 的 20 毫秒降低到仅仅 1 毫秒，并支持更多设备的连接。5G 可以支持更多种类的应用，帮助 AI 发展出更多新的形势。”

　　认清人工智能的极限

　　在过去十年里，我们看到了人工智能的一些真正突破，机器翻译这样 20 年前仅存在于科幻小说里的东西，现在已经成为全球数百万人每天都在使用的技术了。同时我们还看到了很多令人兴奋的进展，如人脸识别技术。在 2012 年时，吴恩达等人在谷歌的研究引领了图像识别领域的重大突破。

　　“现在的计算机在识别面部方面比人类做得更好。所有这些使得我们相信：我们似乎拿到了人工智能魔法的配方，它就是深度学习。”牛津大学计算机系主任 Michael Wooldridge 在大会上说道。“看起来是这样的，但进一步的探索之后。我们就会看到目前机器学习技术的尽头。人们都在问边界是什么，我们现在已经看到了一些界限。”

　　Michael Wooldridge 向我们介绍了人工智能目前的优势与限制。

　　计算机在 1940 年被发明出来的时候，被用来处理一些数学问题——它比人类做得好，可以 24 小时不停地工作，人类是做不到的。

　　但一些人类每天都在使用的简单能力，机器学习却是做不到的——计算机无法进行长期推理，无法做问题的定义，难以对周遭环境形成认知，也难以完成可靠的判断。

　　“你抽烟吗？如果你每天抽 20 支烟，得肺癌的几率会有很大提升。这是一个简单的推论，但对于计算机来说是难以理解的。”Wooldridge 表示。

　　今天，AI 最重要的问题在于认知能力——理解周围的情况。“这个技术关乎无人驾驶的可行性，我们可能会在未来的 5、10 或是 30 年后实现它，”Wooldridge 说道。“自动驾驶归根结底就是让汽车知晓周遭情况。深度学习在这方面已经形成了很大的突破，但并未完全解决有关认知的问题。”

　　历史上，想要让 AI 进行推理，并展现认知能力，人们找到了两种思路：

　　· 自上而下的方法：基于专家知识的 AI——比如由人类教 AI 认识规则，从而让它学会如何开车。但在规则太多的情况下，我们仍然无法实现可靠的认知，深度学习这种方法效果反而很好。

　　· 自下而上的方法就是机器学习，通过数据的输入和判断的输出，通过大量已标注样本进行学习，不断更新模型权重，最终让计算机学会概念，进而拥有判断的能力。神经网络和深度学习是目前流行的方法。

　　由于算力限制等客观原因，深度学习方法在很长一段时间内并不实用，而今天，深度学习已经可以学会很多能力了。Wooldridge 举了 DeepMind 让 AI 打 Atari 游戏的例子：在 600 次迭代之后，强化学习算法在没有人类教学的情况下，通过自我训练学会了效率最高的得分方法。

　　但基于数据驱动的方法也有其极限，以法文诗歌的翻译为例，人类专家的翻译结果能够保持优美，但谷歌翻译的机械结果显然不尽完美。机器不能理解语言背后的意义，不懂法国文化。如果需要好翻译，计算机需要看懂文字背后的深层内容。截至目前，我们不管把多少英文-法文文本输入到神经网络中，也无法获得像人类这样的理解。

　　Wooldridge 举了个更有趣的例子，机器学习也不能理解这样的文字：

　　-Bob:“I'm leaving you。”

　　-Ann:“Who is she?”

　　如果把这六个单词输入谷歌翻译中，翻译成任何语言，我们都能获得不错的直译结果，但机器是无法理解自己在干什么的。“人类的学习方法和机器是不同的过程。机器如果要对语言有所理解，就要理解世界的一些常识知识。深度学习是一个很大的突破，但这不是真正的 AI。要想实现真正的智慧，我们还需要更多。”Wooldridge 说道。

　　周涛：一张街景照片引发的城市安全感分析

　　作为国内大数据行业启蒙导师之一，电子科技大学教授周涛呈现了在商业之外，AI、大数据在社会治理和监管中的真实应用。他抛出一个独到观点：“未来社会治理和监管会有四方面的变化，自动化+规模化+定量化+客观化，AI、大数据将会发挥越来越大的作用。”

　　围绕这一观点，他介绍了 AI、大数据在城市治理、金融监管、环境治理等方面的真实应用。