联邦学习商业化落地基础:安全还是价值?

更新时间: 2022-07-08 17:23:39 点击数:

当下数据成为比肩石油的基础性关键战略资源。在日益增长的数据共享需求和日渐严格的数据合规要求下,如何兼顾数据开放和数据安全,推动安全、可信的数据共享及价值流转,是企业面临的重要课题。而隐私计算作为全新的技术提供了破局思路,在保证数据安全的前提下尽可能使数据价值最大化。

一、什么是隐私计算

隐私计算(Privacy compute 或Privacy computing)是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合,达到对数据“可用、不可见”的目的;在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放。简单来说,即让数据在一个密闭空间里被安全地交换、共享、流通进而实现数据“价值”。

隐私计算之所以安全的原因在于,数据所有者和数据使用者分离,数据拥有方在数据不出库、不可见的基础上实现数据整合与数据模型计算,而后将产出模型结果同步回中心节点分发至不同参与者,以实现数据价值共享。

目前主流的隐私计算技术主要分为三大方向:

第一类是以多方安全计算为代表的基于密码学的隐私计算技术;

第二类是以联邦学习为代表的人工智能与隐私保护技术融合衍生的技术;

第三类是以可信执行环境为代表的基于可信硬件的隐私计算技术。

其中,联邦学习是兼顾数据合作与隐私保护的去中心化协作机器学习技术。传统的数据价值流转是把所有数据汇聚到云或者数据中心,基于处理后的数据进行大量的计算,产出预测,从而运用到具体的应用场景中。联邦学习则相反,AI本身在参与方自己的设备、数据中心,或边缘上去产出计算结果,利用本地数据训练模型,将需要更新的参数同步回到一个中心节点,在平均其模型结果后,再将新的训练模型分发到各个不同的参与者。在联邦学习的机制下,参与者不需要牺牲底层数据隐私,就可以同时实现比较大规模的AI、机器学习的应用场景。

二、联邦学习商业化落地的两大基础

随着行业关注度与需求性的不断提升,隐私计算及联邦学习发展前景无限。据国际调研机构 Gartner 预测,2025 年将有一半的大型企业机构,在不受信任的环境和多方数据分析用例中使用隐私计算处理数据,大数据生态的普惠性协作将达到前所未有的水平。

但当下隐私计算及联邦学习仍处于探索阶段,在商业化落地的过程中面临着两大阻碍,公平性校验、场景化AI洞察。即在校验参与者身份及数据质量打造一个公平协作的环境下,基于业务目标与场景践以坚实的AI能力,真正以数据驱动业务增长,实现不同参与方下数据的互联互通。这将是实现联邦学习有意义、有价值、能规模化商业落地的基础条件。

01、区块链驱动更为公平安全的数据协作环境

联邦学习基于“可用、不可见”的底层逻辑,保障了不同所有权的数据源在AI模型训练、预测过程中的安全问题。但这仅是数据互联互通的一环,仅靠单一技术难以构建高效、高流动性的数据共享生态。仍需考虑数据真实性、数据质量,以及数据参与方激励机制、贡献评估和利益分配流程等多种因素。

因此为避免由于行业竞争造成的故意混淆错误结果到联邦学习的体系中,以及一系列其他机制层面的系统性风险所造成的训练模型结果错误等,就需要透明、有效的安全机制进行干预,建立体系各方的相互信任。

区块链具有数据可溯源、难以篡改、公开透明、智能合约自动执行等技术特点,则成为解决上述问题的最佳技术。其可以帮助企业各方创造去中心化、自动化透明管理,信任以及治理机制,来消除参与者之间信任程度的风险要素。针对数据质量及安全性问题,区块链支持采取投票机制,由联盟各方共同确认每个共享结果的质量,可以有效地减少学习体系中不被信任的第三方以伪造的、有疑问的数据破坏整体洞察结果的情况发生。

区块链专注参与方可信执行与数据权属凭证流通,联邦学习技术则负责大规模的运算和数据价值流通。两者的协同,实现全程闭环的数据安全和隐私服务,使得操作和处理记录可上链保存、不可被篡改,大大减少了数据确权难、数据集质量低、数据资源有限等数据流转问题,为企业及组织构建了一个更为公平安全的数据协作生态。

02、成熟化的AI能力赋能数据价值落地

当下随着需求不断扩张与成熟,隐私计算应用落地多向开花,在互联网、金融、电信、医疗等行业渗透率加速攀升。而联邦学习作为应用面、需求性更广的隐私计算技术,在企业更为关注的客户数据、营销领域作用斐然。

在B2C行业,例如旅游、零售、汽车、教育、消费金融等中大型企业,存在一定量级的交叉客户,但由于数据体系割裂,缺乏数据共享、数据洞察机会。联邦学习可以在不需要共享数据的情况下,基于深度的AI机器学习建立用户分层模型、预测性模型等围绕拉新与客户生命周期管理场景下的数据洞察,提升转化率、降低打扰率,驱动精准营销与数据资产沉淀。

但若使联邦学习真正能落地于应用场景,发挥业务驱动价值,在规模化且多样化的高质量数据基础下,AI技术也同样成为核心能力。这要求着联邦学习需深耕于全域营销场景,具备海量数据磨炼下,成熟性、精准性可快速落地输出洞察的AI模型,将数据场景化,并转化成深入洞察,驱动数据各方创造可衡量的经济效益。

区块链协同具备AI基因的联邦学习将激发未来数据蓝海。目前数据安全流通量不足数据总量的十万分之一,伴随着区块链技术与具备强AI能力的联邦学习融合与发展,未来将有广阔的数据蓝海价值被激发。

而创略科技作为专注于数据技术与AI的企业,整合了区块链、密码学以及机器学习等技术,在AI能力与区块链技术的双重加持下推出了APEX联邦学习,具有以下优势:

1、基于密码学技术,不泄露原始数据,甚至原始数据的分布,上下界都不会泄露;

2、性能出色,相比于原始数据上合并直接建模,性能上无损;

3、支持多种AI算法,加密算法并没有限制机器学习的自由度;

4、借鉴区块链layer2层思想,链上记录必要log信息,防止企业作恶,相比于直接建模对企业更有约束力;

5、以区块链为中枢,整个建模完全去中心化,任何主体无法获取或破解其他主体持有的数据。完全去除第三方中心服务,降低数据的获取成本。

APEX联邦学习服务流程

目前联邦学习在营销领域的拓展还处于初级阶段,需要客户之间以及对提供通道的供应商具有高度的信任。而创略科技基于自身在AI应用场景下建立的联邦学习通道,希望可以一步步推动行业往平台化、联盟化发展,驱动联邦学习商业化落地,最终激发广阔的数据蓝海价值。