返回列表 发布新帖
查看: 801|回复: 0

杨强用联邦学习打破数据孤岛,吴恩达谈企业转型

发表于 2020-10-17 09:16:45 | 查看全部 |阅读模式

马上注册!

您需要 登录 才可以下载或查看,没有账号?注册

×
       来源:北国网

  7月20日,“市北·GMIS”第二天更加精彩,杨强、吴恩达、俞凯等重磅嘉宾继续带来了 12 场主题演讲,内容涵盖联邦学习、认知智能、图表征神经网络等前沿技术,同时 AI 应用侧的探索也异彩纷呈。

  在前沿技术方面,杨强教授分享了如何用联邦学习打破数据割裂,吴恩达谈到小数据、无监督学习对未来人工智能发展的重要性,俞凯也抛出认知智能的技术演进路线。

  在 AI 应用方面,华为带来从工程视角审视人工智能的新思路,阿里巴巴、美团展示了 AI 在大规模场景数据中的应用,周涛教授则呈现 AI 社会治理与监管方面的新研究。

  杨强:用联邦学习打破“数据孤岛”

  作为今天大会的第一位开场嘉宾,微众银行首席人工智能官、国际人工智能学会理事长、香港科技大学教授杨强带来联邦学习的最新发展与应用。

  AI 发展到今天面临很大挑战,尤其是数据挑战。数据孤岛、小数据、用户隐私的保护等导致数据的割裂,让 AI 技术很难发挥出价值。为了解决这一问题,杨强教授提出“联邦学习”的研究方向。

  所谓联邦学习,是多个数据方之间组成一个联盟,共同参与到全局建模的建设中,各方之间在保护数据隐私和模型参数基础上,仅共享模型加密后的参数,让共享模型达到更优的效果。

  杨强介绍道,联邦学习可分为横向联邦和纵向联邦,横向联邦是指企业各方数据维度相同、ID 维度不同,更多存在于消费者应用中;纵向联邦是指企业各方数据的 ID 维度相同(样本重叠)、数据维度不同,更多存在于 B 端应用。

  在具体的使用场景中,杨强重点介绍了联邦学习在金融行业中的应用。比如针对保险行业的个性化保险定价问题,一家互联网企业和一家保险企业进行数据合作,这种合作数据的 ID 重合度相当大,数据特征维度大大增加,使模型的个性化定价效果显著提升,为保险企业带来 8 倍覆盖率提升和 1.5 倍利润率提升。

  在另外一个小微企业信贷管理案例中,使用联邦学习后,企业将风控区分度提升 12%,使贷款不良率小于千分之五。

  即使在双方既没有共同的 ID,数据特征也不同的情况下,也可以使用迁移学习结合联邦学习进行共同建模。

  杨强强调,联邦学习一定是多方共同协作组成一个联盟,生态的建设十分重要。它最大的优势是,保证数据不出户,通过生态在不同行业选取合作伙伴,用群体智能不断提升模型效果。

  未来,安全合规、防御攻击、算法效率、联盟机制等都需要进一步研究。比如联邦学习中各方合作的一个基础就是加密技术,加密算法的效率显得尤为重要,算法的改善还有很长的路要走。

  吴恩达:利用 AI 带来的动能

  深度学习先驱吴恩达(Andrew Ng)是大家耳熟能详的名字,他的演讲也获得了最多的掌声。今天,吴恩达在 GMIS 大会上与人们探讨了企业的人工智能转型。

  “四年前我提出了一个概念:AI 是新的电力。现在我得说,AI 带来的动能正在展现效果。”吴恩达说道。“看看近年来有关 AI 的工作需求数量,每年都有 35% 的增长,深度学习的发展正在让人工智能领域变得繁荣。麦肯锡最近的预测认为到 2030 年,全球的经济增长量中将有 13 万亿美元来自人工智能技术的贡献。”

  “以机器学习领域的论文数量为例,两个月前谷歌的 Jeff Dean 曾展示了一个数字:arXiv 上每天关于机器学习的论文数量超过 100 篇。”吴恩达表示。“今天,我们也有了很多机器学习工具,包括神经网络框架 TensorFlow、PyTorch、MXNet 和百度飞桨,这些工具正在让人们使用机器学习的门槛变得越来越低。”

  吴恩达表示,几个月前他曾在加州参加了一个创业挑战:一支来自印度的团队展示了机器人应用方法,其可以自动拍摄农田的照片。有趣的是,开发这一应用的人只有 12 岁——他使用开源的工具和算法完成了这一任务。现在的人工智能业务已经可以由任何人来做了。

  通过足够的数据和算力、灵活的工具以及创新的想法,我们可以建立起属于自己的 AI 项目。很多公司的 CEO 都在担心如何把 AI 技术加入企业工作流程中。这个转型过程有时是 1-2 年,或是更长。他们担心选择了错误的项目、设定了不切实际的目标,如果转型失败,公司会蒙受巨大损失。

  “看看今天的世界,有关 AI 的应用越来越多了。但企业的 AI 转型并不是开发一个 APP 这么简单。”吴恩达表示。

  去年底,吴恩达发布了《AI 转型指南》,希望以教育者的身份将“All in AI”的经验传授给众多公司管理者。作为 AI 领域的先驱者,吴恩达从谷歌大脑和百度 AI 团队的发展中收集洞见,它们对谷歌、百度的 AI 转型扮演着重要角色。参照此指南,任何企业都有可能成为强大的 AI 公司。

  为了找到正确的方向,我们需要从简单的地方起步,自动化任务而非工作,并把人工智能和人类的专业知识进行结合,这样才能更好地帮助公司选择正确的 AI 项目。“我们发现,很多公司第一个落地的 AI 项目通常并不是最有潜力的项目。我给很多公司的建议是做一次头脑风暴,至少看六个不同的项目,”吴恩达表示。“然后花费几个星期进行调研工作,确保这个项目是有价值的。”

  吴恩达为企业 AI 转型给出了如下建议,在《AI 转型指南》中也有详尽解释:

  1. 实行试点项目获得动力

  2. 建立一支内部 AI 团队

  3. 提供广泛的 AI 培训

  4. 策划合适的 AI 战略

  5. 建立内部和外部沟通

  在期待 AI 为企业带来的红利之前,我们还需要避免几个陷阱:不要期待 AI 立刻产生作用,而是要多次尝试,对 AI 发展的回报曲线进行合理预算;不要使用传统的流程评估人工智能项目,应该为 AI 项目团队设立合适的 KPI 和目标;在团队建设时,我们不能仅依靠明星工程师,而是要建立一个完善的团队。

  “看到 AI 崛起,我们需要有正确的概念,首先 AI 是一个系统的工程。我们需要集中很多人的团队才能完成一项具体任务。”吴恩达表示。

  对于未来的人工智能发展,吴恩达认为,我们应该期待能够利用小数据的新算法:“我们现在只能用人眼检测手机屏幕的划痕——如果有大量图片,AI 也可以做得很好,但没有任何工厂会有几百万不同划痕的手机。这个时候我们就需要 few shot learning、无监督学习等新方法,能从很少的例子中学习出正确的概念。”

  强化学习和自我学习可以在虚拟环境中进行训练,从而避免在真实世界的应用中遇险。而且这些模拟可以并行化,同时进行大量的试验,很快学习出解决方案。

  AI 正在走向端侧,区域计算中心也要承担部分计算,吴恩达对于 5G 有着很高的期待:“5G 是非常重要的技术,这项技术在中国的发展已经超过了美国。它能让网络延迟从 4G 的 20 毫秒降低到仅仅 1 毫秒,并支持更多设备的连接。5G 可以支持更多种类的应用,帮助 AI 发展出更多新的形势。”

  认清人工智能的极限

  在过去十年里,我们看到了人工智能的一些真正突破,机器翻译这样 20 年前仅存在于科幻小说里的东西,现在已经成为全球数百万人每天都在使用的技术了。同时我们还看到了很多令人兴奋的进展,如人脸识别技术。在 2012 年时,吴恩达等人在谷歌的研究引领了图像识别领域的重大突破。

  “现在的计算机在识别面部方面比人类做得更好。所有这些使得我们相信:我们似乎拿到了人工智能魔法的配方,它就是深度学习。”牛津大学计算机系主任 Michael Wooldridge 在大会上说道。“看起来是这样的,但进一步的探索之后。我们就会看到目前机器学习技术的尽头。人们都在问边界是什么,我们现在已经看到了一些界限。”

  Michael Wooldridge 向我们介绍了人工智能目前的优势与限制。

  计算机在 1940 年被发明出来的时候,被用来处理一些数学问题——它比人类做得好,可以 24 小时不停地工作,人类是做不到的。

  但一些人类每天都在使用的简单能力,机器学习却是做不到的——计算机无法进行长期推理,无法做问题的定义,难以对周遭环境形成认知,也难以完成可靠的判断。

  “你抽烟吗?如果你每天抽 20 支烟,得肺癌的几率会有很大提升。这是一个简单的推论,但对于计算机来说是难以理解的。”Wooldridge 表示。

  今天,AI 最重要的问题在于认知能力——理解周围的情况。“这个技术关乎无人驾驶的可行性,我们可能会在未来的 5、10 或是 30 年后实现它,”Wooldridge 说道。“自动驾驶归根结底就是让汽车知晓周遭情况。深度学习在这方面已经形成了很大的突破,但并未完全解决有关认知的问题。”

  历史上,想要让 AI 进行推理,并展现认知能力,人们找到了两种思路:

  · 自上而下的方法:基于专家知识的 AI——比如由人类教 AI 认识规则,从而让它学会如何开车。但在规则太多的情况下,我们仍然无法实现可靠的认知,深度学习这种方法效果反而很好。

  · 自下而上的方法就是机器学习,通过数据的输入和判断的输出,通过大量已标注样本进行学习,不断更新模型权重,最终让计算机学会概念,进而拥有判断的能力。神经网络和深度学习是目前流行的方法。

  由于算力限制等客观原因,深度学习方法在很长一段时间内并不实用,而今天,深度学习已经可以学会很多能力了。Wooldridge 举了 DeepMind 让 AI 打 Atari 游戏的例子:在 600 次迭代之后,强化学习算法在没有人类教学的情况下,通过自我训练学会了效率最高的得分方法。

  但基于数据驱动的方法也有其极限,以法文诗歌的翻译为例,人类专家的翻译结果能够保持优美,但谷歌翻译的机械结果显然不尽完美。机器不能理解语言背后的意义,不懂法国文化。如果需要好翻译,计算机需要看懂文字背后的深层内容。截至目前,我们不管把多少英文-法文文本输入到神经网络中,也无法获得像人类这样的理解。

  Wooldridge 举了个更有趣的例子,机器学习也不能理解这样的文字:

  -Bob:“I'm leaving you。”

  -Ann:“Who is she?”

  如果把这六个单词输入谷歌翻译中,翻译成任何语言,我们都能获得不错的直译结果,但机器是无法理解自己在干什么的。“人类的学习方法和机器是不同的过程。机器如果要对语言有所理解,就要理解世界的一些常识知识。深度学习是一个很大的突破,但这不是真正的 AI。要想实现真正的智慧,我们还需要更多。”Wooldridge 说道。

  周涛:一张街景照片引发的城市安全感分析

  作为国内大数据行业启蒙导师之一,电子科技大学教授周涛呈现了在商业之外,AI、大数据在社会治理和监管中的真实应用。他抛出一个独到观点:“未来社会治理和监管会有四方面的变化,自动化+规模化+定量化+客观化,AI、大数据将会发挥越来越大的作用。”

  围绕这一观点,他介绍了 AI、大数据在城市治理、金融监管、环境治理等方面的真实应用。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

关注公众号
QQ会员群

Copyright © 2021-2025 中企互动平台 版权所有 All Rights Reserved.

相关侵权、举报、投诉及建议等,请发 E-mail:bztdxxl@vip.sina.com

Powered by Discuz! X3.5|京ICP备10020731号-1|京公网安备 11010102001080号

关灯 在本版发帖
扫一扫添加管理员微信
返回顶部
快速回复 返回顶部 返回列表