什么是 zkML?解释和用例

摘要: zkML在人工智能系统中建立了可加密执行的信任,并在 DeFi 和医疗保健领域得到了早期应用,但仍受到扩展到 GPT-4 级模型的计算压力的阻碍。

投资者正将资金投入硬件加速器和利基用例,押注 zkML 将成为人工智能不透明行业的关键基础设施,因为这些行业存在系统性崩溃的风险。

什么是零知识机器学习(zkML)?

零知识机器学习(zkML)融合了零知识证明(ZKPs)和机器学习(ML),前者是一种在不泄露底层数据的情况下证明语句的加密方法,后者则可实现保护隐私且可验证的计算。

zkML 目前使用加密证明来验证较小的人工智能项目,如交易机器人或图像生成器,以确认规则的合规性。扩展到大型模型(如 GPT-4o、o1、DALL-E 2、Claude 3.5、Grok-1)仍然受到极高计算成本的限制。

其他应用可能包括欺诈检测和私人生物认证。通过使用零知识证明,zkML 确保了隐私和计算的完整性,使其成为金融(传统/去中心化)和医疗保健等敏感领域所需的先进技术。

什么是零知识机器学习(zkML)

zkML 如何工作?

zkML使验证者能够确认人工智能模型推理或训练过程的正确性,而不会泄露敏感细节,如输入数据、模型权重或其他私人信息。

zkML 验证过程包括以下关键步骤:

  • 密码转换:ML 运算(推理、训练)被转化为算术电路或约束系统,将神经网络层转化为数学关系。
  • 证明生成:防 ZK 系统(zk-SNARKs、zk-STARKs)可生成简洁的加密证明,证明 ML 计算、散列非线性激活、矩阵乘法和数据流转化为代数语句的正确性。
  • 验证:第三方根据公共参数(如模型哈希值、输入承诺)验证证明,而无需访问原始数据,确保输出源于商定的逻辑。
  • 隐私性输入、权重和梯度保持加密或屏蔽,依靠同态加密或安全多方计算等加密原语来隔离敏感数据。
  • 权衡利弊:更大的网络或更深的层会增加计算开销,而证明规模和验证速度取决于底层证明系统的效率。

简单地说,zkML 可以让别人证明人工智能模型的预测或训练结果是正确的,而无需透露底层数据或模型细节。这是通过确保隐私和准确性的加密证明来实现的,使整个过程既安全又可验证。

zkml 如何工作

zkML 用例

zkML 已经证明了它在加密货币中的实用性,有几个项目成功实施了它,或在主网部署前的最后测试阶段取得了进展。

  • 链上人工智能完整性:证明交易机器人或收益率策略(Modulus Labs 的 RockyBotGiza x Yearn执行与宣称的一致,防止对 DeFi 市场的暗中操纵。
  • API 问责制:迫使提供商附上证明,说明是哪些模型为其输出提供了动力,从而揭露 "黑箱 "ML 服务。
  • 漏洞防范:让 DAO 使用 ZK 异常证明(阿兹特克协议的研究成果),并根据历史漏洞利用模式进行训练,以编程方式冻结被黑客攻击的合约。
  • 生物识别升级:用户通过证明新的生物识别模板来自有效扫描,自行更新凭证(世界虹膜代码),无需集中重新注册。
  • 医疗保密:诊断加密核磁共振成像(vCNN),同时保持扫描的私密性,用加密审计取代合规性文书工作。
对 ZKML 感兴趣的加密和 Defi 项目

DeFi 的潜在影响

zkML 技术成熟后,有可能被整合到分散式金融所有领域中更广泛的使用案例中:

  • DeFi 风险模型:证明人工智能优化的贷款抵押或衍生品定价(Aave、Synthetix、Hyperliquid 等)的正确性,而不会暴露专有算法或用户头寸。
  • DAO 治理:验证基于 ML 的投票权重计算或提案影响预测,同时保持参与者数据(如代币持有量)的私密性。
  • 隐私币:使用 ML 对交易匿名集(Zcash、Monero)进行审计,在不泄露用户身份或网络元数据的情况下检测仿冒攻击。
  • NFT 估值:以加密方式验证稀有度得分或动态定价算法(Pudgy Penguins、Azuki NFT),不会泄露专有估值逻辑。
  • 跨链通告:通过在不泄露节点输入的情况下证明跨链数据聚合的完整性,确保由 ML 驱动的数据源(Chainlink、Band Protocol)的安全。
  • ZK-Rollups:启用 ML 优化的交易批处理(ZKsync、StarkNet),并提供证明,确保公平的订单/费用计算,而不会暴露用户活动模式。
将zkml的实现转化为defi

zkML 的现状

zkML是2024年对硅谷信任赤字的回应,Polychain和a16z等加密货币巨头向Modulus Labs、World(原Worldcoin)和Ingonyama等初创公司注入了数百万美元,以推动链上人工智能隐私和可验证性的发展。

虽然 zkML 技术仍在与 ChatGPT 规模的模型作斗争,但 2025 年可能标志着一个转折点。由特朗普总统牵头的美国政府 5000 亿美元的星际之门数据中心计划,以及中国DeepSeek的开源人工智能模型等新加入者,都将推动更快的创新。

风险与担忧

zkML 的加密保证具有非同小可的风险,可能会阻碍企业采用或暴露系统漏洞。

  • 指数成本:证明复杂模型(GPT-4o 等)的成本仍然过高,硬件限制(见Ingonyama 的 ZKPU)限制了投资回报率的小众应用案例。
  • 集中化风险:对 GPU/ASIC 的依赖可能会巩固少数芯片制造商(如 Nvidia)的权力,从而与分散化的理想背道而驰。
  • 安全剧院:执行不力的电路,如未经测试的EZKL编译,可能会产生掩盖数据泄漏或模型缺陷的 "验证 "输出。
  • 监管模糊:早期授权(目前主要是欧盟的《人工智能法案》)可能会迫使不合格的 zkML 集成,造成合规负担,却没有真正的安全优势。
  • 采用摩擦:尽管Modulus Labs证实了 zkML 在供应链中的价值,但沃尔玛等公司在 zkML 的运营方面仍面临人才短缺的问题。

最后的想法

zkML 是人工智能问责制的重要一步,但仍受到可扩展性的限制,因为目前的 GPU 加速证明难以处理万亿参数模型。

以基础设施选项为目标的投资者认为,zkML 是 DeFi 和药物发现等行业的关键审计层,在这些行业中,人工智能的透明度可保障数十亿美元的安全。

监管机构面临着一个微妙的平衡问题:过度监督有可能扼杀创新,而不作为则可能让未经验证的人工智能破坏人们对重要系统的信任。