Qu'est-ce que zkML ? Explication et cas d'utilisation

Résumé : zkML a permis d'instaurer une confiance cryptographique dans les systèmes d'intelligence artificielle, avec une adoption précoce dans les domaines de la défense et des soins de santé, mais il reste entravé par la contrainte de calcul liée à la mise à l'échelle des modèles de niveau GPT-4.

Les investisseurs injectent des capitaux dans des accélérateurs de matériel et des cas d'utilisation de niche, en pariant que le zkML deviendra une infrastructure essentielle pour les secteurs où l'opacité de l'IA risque de provoquer un effondrement systémique.

Qu'est-ce que le Zero-Knowledge Machine Learning (zkML) ?

Le Zero-Knowledge Machine Learning (zkML) fusionne les preuves à connaissance nulle (ZKP), une méthode cryptographique permettant de prouver des déclarations sans révéler les données sous-jacentes, avec l'apprentissage automatique (ML) pour permettre des calculs vérifiables et préservant la vie privée.

zkML vérifie actuellement les petits projets d'IA, tels que les robots d'échange ou les générateurs d'images, à l'aide de preuves cryptographiques qui confirment le respect des règles. La mise à l'échelle de grands modèles (par exemple, GPT-4o, o1, DALL-E 2, Claude 3.5, Grok-1) reste limitée par des coûts de calcul extrêmes.

D'autres applications peuvent aller de la détection des fraudes à l'authentification biométrique privée. En utilisant des preuves à zéro connaissance, zkML garantit la confidentialité et l'intégrité des calculs, ce qui en fait une avancée nécessaire dans des domaines sensibles tels que la finance (traditionnelle/décentralisée) et les soins de santé.

Qu'est-ce que le Zero-Knowledge Machine Learning (zkML) ?

Comment fonctionne zkML ?

zkML permet à un vérificateur de confirmer l'exactitude du processus d'inférence ou d'apprentissage d'un modèle d'IA sans révéler de détails sensibles tels que les données d'entrée, les poids du modèle ou d'autres informations privées.

Le processus de vérification du zkML comprend les étapes suivantes :

  • Conversion cryptographique: Les opérations de ML (inférence, formation) sont traduites en circuits arithmétiques ou en systèmes de contraintes, transformant les couches du réseau neuronal en relations mathématiques.
  • Génération de preuves: Les systèmes à preuve ZK(zk-SNARKs, zk-STARKs) génèrent des preuves cryptographiques succinctes attestant de l'exactitude des calculs ML, des activations non linéaires de hachage, des multiplications de matrices et des flux de données dans des énoncés algébriques.
  • Vérification: Des tiers valident les preuves par rapport à des paramètres publics (par exemple, des hachages de modèles, des engagements d'entrée) sans accéder aux données brutes, ce qui garantit que les résultats découlent de la logique convenue.
  • Confidentialité: Les entrées, les poids et les gradients restent cryptés ou masqués, en s'appuyant sur des primitives cryptographiques telles que le cryptage homomorphique ou le calcul multipartite sécurisé pour isoler les données sensibles.
  • Compromis: Des réseaux plus grands ou des couches plus profondes augmentent la charge de calcul, tandis que la taille de la preuve et la vitesse de vérification dépendent de l'efficacité du système de preuve sous-jacent.

En termes simples, zkML permet de prouver que les prédictions ou les résultats d'entraînement d'un modèle d'IA sont corrects sans révéler les données sous-jacentes ou les détails du modèle. Pour ce faire, des preuves cryptographiques garantissent la confidentialité et l'exactitude, ce qui rend le processus à la fois sûr et vérifiable.

Comment fonctionne le zkml

Cas d'utilisation de zkML

Le zkML a déjà fait la preuve de son utilité dans le domaine de la cryptographie, plusieurs projets l'ayant mis en œuvre avec succès ou ayant franchi les dernières étapes de test avant le déploiement sur le réseau principal.

  • Intégrité de l'IA en chaîne: Prouver que les robots de trading ou les stratégies de rendement(RockyBot de Modulus Labs, Giza x Yearn) s'exécutent comme prévu, afin d'empêcher toute manipulation cachée des marchés de la finance de marché.
  • Responsabilité de l'API: Exposer les services de ML "boîte noire" en obligeant les fournisseurs à joindre des preuves montrant quels modèles alimentent leurs résultats.
  • Prévention des exploits: Permettre aux DAO de geler de manière programmatique les contrats piratés en utilisant des preuves d'anomalie ZK(recherche d'Aztec Protocol), formées sur des modèles d'exploitation historiques.
  • Mises à jour biométriques: Les utilisateurs mettent à jour eux-mêmes leurs données d'identification(codes d'iris du monde) en prouvant que les nouveaux modèles biométriques proviennent de scans valides, ce qui élimine la nécessité d'un réenregistrement centralisé.
  • Confidentialité médicale: Diagnostiquer les IRM cryptées(vCNN) tout en préservant la confidentialité des scanners, en remplaçant les documents de conformité par des audits cryptographiques.
projets crypto et defi intéressés par le zkml

Implications potentielles du DeFi

Lorsque la technologie zkML arrivera à maturité, il est possible qu'elle soit intégrée dans des cas d'utilisation encore plus larges dans tous les domaines de la finance décentralisée :

  • Modèles de risque DeFi: prouve l'exactitude de la garantie des prêts optimisée par l'IA ou de la tarification des produits dérivés (Aave, Synthetix, Hyperliquid, etc.) sans exposer les algorithmes propriétaires ou les positions de l'utilisateur.
  • Gouvernance de la DAO: Valide les calculs de poids de vote basés sur le ML ou les prévisions d'impact des propositions tout en gardant les données des participants (par exemple, les avoirs en jetons) privées.
  • Privacy Coins: Audite les ensembles de transactions anonymes (Zcash, Monero) en utilisant la ML pour détecter les attaques Sybil sans compromettre les identités des utilisateurs ou les métadonnées du réseau.
  • Évaluation NFT: Vérifie cryptographiquement les scores de rareté ou les algorithmes de tarification dynamique(Pudgy Penguins, Azuki NFT) sans divulguer la logique d'évaluation propriétaire.
  • Oracles inter-chaînes: Sécurise les flux de données alimentés par le ML (Chainlink, Band Protocol) en prouvant l'intégrité de l'agrégation des données entre les chaînes sans révéler les entrées des nœuds.
  • ZK-Rollups: Permet la mise en lots de transactions optimisées par ML(ZKsync, StarkNet) avec des preuves garantissant des calculs équitables des commandes/frais sans exposer les schémas d'activité des utilisateurs.
zkml dans le cadre de l'initiative defi

État actuel de zkML

zkML est la réponse de 2024 au déficit de confiance de la Silicon Valley, propulsé par des géants de la cryptographie comme Polychain et a16z qui injectent des millions dans des startups telles que Modulus Labs, World (anciennement Worldcoin) et Ingonyama pour faire progresser la confidentialité et la vérifiabilité de l'IA sur la chaîne.

Alors que la technologie zkML a encore du mal avec les modèles à l'échelle du ChatGPT, 2025 pourrait marquer un tournant. L'initiative Stargate de 500 milliards de dollars du gouvernement américain pour les centres de données, lancée par le président Trump, et les nouveaux venus tels que les modèles d'IA à source ouverte de DeepSeek, en Chine, devraient accélérer les innovations.

Risques et préoccupations

Les garanties cryptographiques du zkML s'accompagnent de risques non négligeables qui pourraient freiner l'adoption par les entreprises ou exposer des vulnérabilités systémiques.

  • Coûts exponentiels: La démonstration de modèles complexes (GPT-4o, etc.) reste d'un coût prohibitif, les contraintes matérielles (voir ZKPU d'Ingonyama) limitant les cas d'utilisation de niche du ROI.
  • Risques de centralisation: La dépendance à l'égard des GPU/ASIC peut consolider le pouvoir de quelques fabricants de puces (par exemple, Nvidia), ce qui va à l'encontre des idéaux de décentralisation.
  • Théâtre de la sécurité: Les circuits mal implémentés, comme les compilations EZKL non testées, risquent de produire des résultats "vérifiés" qui masquent des fuites de données ou des failles dans le modèle.
  • Ambiguïté réglementaire: Les premiers mandats (principalement la loi européenne sur l'IA pour l'instant) pourraient imposer des intégrations zkML imparfaites, créant des charges de conformité sans réels avantages en termes de sécurité.
  • Friction d'adoption: Des entreprises comme Walmart sont confrontées à une pénurie de talents pour rendre le zkML opérationnel, bien que Modulus Labs ait prouvé sa valeur pour la chaîne d'approvisionnement.

Réflexions finales

Le zkML est une étape fondamentale dans la responsabilisation de l'IA, mais il reste limité par l'évolutivité, car les preuves actuelles accélérées par le GPU ont du mal à gérer des modèles à des billions de paramètres.

Les investisseurs qui ciblent les options d'infrastructure considèrent zkML comme la couche d'audit critique pour des secteurs tels que DeFi et la découverte de médicaments, où la transparence de l'IA permet de sauvegarder des milliards.

Les régulateurs sont confrontés à un délicat exercice d'équilibre : une surveillance excessive risque d'étouffer l'innovation, tandis que l'inaction pourrait permettre à l'IA non vérifiée de saper la confiance dans les systèmes vitaux.