600字范文 > “羊吃草”论数据隐私保护难题破解之道？世界第一本联邦学习专著问世

“羊吃草”论数据隐私保护难题破解之道？世界第一本联邦学习专著问世

时间：2021-11-16 04:50:05

看到这本书的封面插画，你是否以为即将面对一本童话故事书？

实际上，这本书“意义重大”，绝非童话，是用“羊吃草”的比喻给我们解释：大数据时代，人工智能在隐私安全前提下实现数据合作的最优解决方案。这就是世界上第一本“联邦学习”专著——《Federated Learning》（英文版）/《联邦学习》（中文版），由微众银行首席人工智能官杨强教授及人工智能部刘洋、程勇、康焱、陈天健、于涵等多位人工智能领域顶级专家历时两年，共同编撰而成。

12月，《Federated Learning》由美国Morgan & Claypool出版社出版了英文电子版，1月印刷版问世，属于世界著名的AI丛书系列。5月，中文版正式由电子工业出版社博文视点出版。该书对联邦学习这一人工智能新兴技术进行了系统性阐释，并且全面分享了微众银行在联邦学习领域的深厚积累。

图：中英文书籍封面

先了解一下，“联邦学习”是什么？

“联邦学习(Federated Learning）”作为一种加密的分布式机器学习范式，可以使得各方在不披露原始数据的情况下达到共建模型的目的。即在不违反数据隐私保护法规的前提下，连接数据孤岛，建立性能卓越的共有模型。

还不懂？让我们先搞明白“联邦学习解决的问题是什么？”

假如你养了一只小羊，想给它吃各种不同营养成分的草料，你需要去各地收集草料再运送回来喂它。但是有一天，各地不再允许将草料向外运输了，你该怎么办？

在机器学习领域，模型效果的提升依赖于数据训练，所以机器学习模型就像这只小羊，而数据是草。收集草运到羊所在的地方喂它，就像从各处收集数据，用以训练模型。但现实是：隐私和数据安全保护的要求使得获取数据成为障碍，小草不能直接运出本地，这也就是我们常见的“数据孤岛”困境。

图：将草从各地集中到一起喂羊，但并不合规

怎么解决机器学习模型这只小羊吃草的问题？

在此情况下，联邦学习提供了新的思路：让羊群在各地移动，而草不出本地。

也就是机器学习模型以分布式的方式构建，而不需要数据在本地区域之外移动，这种“数据不动，模型动”的优势在于，对于每只羊的所有者而言，并不知道羊吃到肚子里的草到底是什么样，也就实现了在隐私保护和数据安全的前提下，机器学习模型不断完善。

图：羊到各地吃草，主人无法知道它吃了哪些草

回归现实，举例来说说这是怎么回事？

理论听不懂，那来讲点实际的应用，例如大家比较熟悉的智慧零售，联邦学习能发挥怎样的作用呢？在智慧零售领域中常常会有多方企业的参与，他们都各自拥有海量的用户数据，如：银行拥有用户购买能力的数据，社交平台拥有用户个人偏好数据，电商平台则拥有产品特点的数据。出于国内外的数据隐私保护法律法规，这些企业是不能直接把各方数据加以合并的，因为数据的原始提供者，即他们各自的用户可能不同意这样做。但他们各自的数据量和种类都不足以单独建立高质量模型来得到最优结果。联邦学习就是要解决这个问题：建立一个共有模型。这个共有模型类似于把数据聚合在一起建立的最优模型，但是在建立共有模型的时候，数据本身不移动，因此不泄露隐私，符合数据合规要求，建好的模型也仅在各自的区域为本地的目标服务。

这样的机器模型能为用户提供更精准的产品推荐等服务，从而打破数据壁垒，构建跨领域合作，大大提升了信息和资源匹配的效率。当然，不仅仅是零售领域，在其他领域联邦学习也同样发挥出色，比如对“安全”十分看重的金融领域：多家机构联合建模的风控模型能更准确地识别信贷风险，联合反欺诈；多家银行建立的联邦反洗钱模型，能解决该领域样本少，数据质量低问题。从以上两个领域的案例可以看出，在这样一个联邦机制下，参与方越多，模型效果越好，各个参与者的身份和地位相同，实现“共同富裕”。

图：联邦学习系统架构示意

这么厉害的研究，谁是这群讲故事的人？

本书由微众银行首席人工智能官（CAIO）杨强教授带领微众银行人工智能部高级研究员刘洋、程勇、康焱，微众银行人工智能部副总经理陈天健，新加坡南洋理工大学（NTU）计算机科学与工程学院助理教授、微众银行特聘顾问于涵撰写。

杨强教授是国际人工智能界的领军人物，是 “迁移学习”（transfer learning）的开创者，并且带领团队首次提出“联邦迁移学习”（Federated Transfer Learning）的研究新方向。他于7月当选为国际人工智能协会（AAAI）院士，是第一位获此殊荣的华人，之后又于5月当选为AAAI执行委员会委员，是首位也是至今为止唯一的AAAI华人执委。8月他当选为国际人工智能联合会(IJCAI，国际人工智能领域创立最早的顶级国际会议)理事会主席，是第一位担任主席的华人科学家。他获得第九届吴文俊人工智能杰出贡献奖，是国内人工智能领域最高奖项。近期，他又被选为AAAI 大会主席，将成为AAAI 大会历史上第二位大会主席，也是担任此职位的首位华人。

数据要合作，研究也需要团队，这群牧羊人都有哪些满点技能？

杨强教授现带领的微众银行AI团队是微众银行顶级人工智能研发团队。立足微众银行ABCD（人工智能AI、区块链Blockchain、云计算Cloud Computing、大数据Big Data）科技发展战略，致力于用自主可控、安全可信的AI技术探索金融科技新路，引领AI行业新方向。目前已在FedAI合作生态、新一代人机交互、精准营销、智能资管四大领域推出一系列领先创新成果。

在联邦学习生态建设中，微众AI团队领衔联邦学习国际标准（联邦学习IEEE国际标准）、国内标准的制定。并在初发布自主研发的全球首个工业级联邦学习开源框架FATE（FederatedAI Technology Enabler：/FederatedAI/FATE）。近两年，微众AI团队不断进行联邦学习商业化探索，将理论用于解决问题，将应用落地于市场，携手各行各业共建联邦学习生态，目前，腾讯、华为、京东、平安等巨头都已加入联邦学习生态共建。

好高端的样子，那这本书江湖地位如何？

凭借理论专业性及立足实践的实用性，该书获得国内外顶级专家认可与推荐。中国科学院院士、清华大学人工智能研究院院长张钹在书的序言中写道，“《联邦学习》一书主要从技术维度出发，重点研究了联邦学习对AI的隐私保护和数据安全问题。从广度上看，此书除了讨论了四种联邦学习的基本类型，还讨论了相关的联邦学习激励机制和分布式机器学习。而从深度上而言，从深度上看，书中包括原理、算法、平台和应用实例。本书作者杨强等均来自微众银行，他们都参与了联邦智能使能器（Federated AI Technology Enabler，FATE）的联邦学习平台的开发。本书的许多思想来源于这个实践，因此具有实用性。”中国工程院院士、北京大学教授、鹏城实验室主任高文，创新工场董事长兼CEO李开复，欧洲科学院外籍院士、IEEE Fellow，中国人民解放军军事科学院副院长梅宏，第十三届全国政协经济委员会委员肖钢，南京大学人工智能学院院长、欧洲科学院外籍院士、ACM/AAAI/IEEE Fellow周志华等为书撰写推荐语。

作为一个数据工作者，为何要看这本书？

本书详细描述了联邦学习如何将分布式机器学习、密码学、基于金融规则的激励机制和博弈论结合起来，以解决分散数据的使用问题。介绍不同种类的面向隐私保护的机器学习解决方案以及技术背景，并描述一些典型的实际问题解决案例。

图：本书知识体系（点击查看大图）

这是一个海量的却又是碎片化的数据时代，数据的“社会属性”日益凸显——既需要独立又需要合作，只有互帮互助却又保持着个体的隐私安全才能发挥最大的智慧与价值。联邦学习(Federated Learning) 的出现，是来自于人工智能落地的商业化实践探索，也将回归实践，为数据隐私保护难题提供了领先的解决方案。相信这本书也会让更多的学者和工程师了解联邦学习，参与共建联邦学习生态。

想对联邦学习了解更多？欢迎前往我们官网（）查看最新动态，后续我们也将在官网上线书籍习题内容，敬请关注。

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

“羊吃草”论数据隐私保护难题破解之道？ 世界第一本联邦学习专著问世

“羊吃草”论数据隐私保护难题破解之道？世界第一本联邦学习专著问世