¿Qué es la disponibilidad de datos?
Resumen: La disponibilidad de datos (DA) desempeña un papel vital en las redes de cadenas de bloques al garantizar que los datos de las transacciones permanezcan accesibles para su validación sin necesidad de almacenamiento permanente.
Las capas de disponibilidad de datos son blockchains que gestionan DA proporcionando una forma de hacer que los datos estén disponibles cuando sea necesario, a menudo utilizando metodologías como el muestreo de disponibilidad de datos (DAS).
Sin embargo, siguen existiendo retos relacionados con la retención de datos, la escalabilidad y la complejidad de la verificación de grandes datos, por lo que proyectos como NEAR y Celestia están a la vanguardia para abordarlos.
¿Qué es la disponibilidad de datos en criptografía?
La disponibilidad de datos (DA) garantiza que los datos de una red criptográfica sean accesibles para su validación sin necesidad de almacenamiento permanente. En lugar de almacenar los datos indefinidamente, la DA implica demostrar que los datos están disponibles y pueden ser recuperados por cualquiera que los necesite.
Este enfoque reduce los costes de almacenamiento, ya que los datos sólo necesitan estar accesibles durante un tiempo limitado. Por ejemplo, la actualización 4844 de Ethereum introdujo los "blobs" y utiliza una técnica llamada Data Availability Sampling (DAS), que mejora notablemente la escalabilidad.
Esto permite a Ethereum y a otras capas 1 disponer de una cantidad considerablemente mayor de datos, manteniendo al mismo tiempo una alta garantía de que se podrá acceder a ellos cuando sea necesario. En última instancia, DA ayuda a maximizar el manejo de datos de Ethereum reduciendo los costes de almacenamiento y mejorando la capacidad para futuras transacciones.
Otra parte clave de DA es la modularidad, que separa las funciones de consenso, ejecución y disponibilidad de datos, lo que permite a los sistemas de capa 2 gestionar la ejecución fuera de la cadena sin dejar de utilizar la infraestructura de Ethereum para verificar los datos sin necesidad de almacenarlos todos directamente en la cadena principal.
¿Cómo funciona la disponibilidad de datos?
Los mecanismos de disponibilidad de datos garantizan que los datos de las transacciones se propaguen y sean verificables en toda la red de blockchain, lo que resuelve los problemas de escalabilidad y fiabilidad.
- Replicación y redundancia: Los datos se replican en varios nodos, almacenando registros completos o parciales. Técnicas como 2D Reed-Solomon garantizan la recuperación de los datos aunque falten partes.
- Consenso y disponibilidad de datos: Los mecanismos de consenso garantizan que todos los nodos se pongan de acuerdo sobre la disponibilidad de los datos, impidiendo los ataques de retención de datos y manteniendo su coherencia.
- Incentivos criptoeconómicos: Los nodos son recompensados con tarifas de transacción o recompensas inflacionarias para mantener la disponibilidad de los datos, apoyando la descentralización y la seguridad de la red.
- Propagación de nodos: Los nodos completos distribuyen los datos por la red, garantizando su disponibilidad para la validación. Esto permite a cualquier participante acceder a los datos y verificarlos cuando sea necesario.
- Capas DA especializadas: Las capas DA como Celestia gestionan la disponibilidad de los datos al tiempo que aplican técnicas como las pruebas merkle y el muestreo de nodos ligeros para mejorar la verificación de los datos.
¿Qué es una capa de disponibilidad de datos (DAL)?
La Capa de Disponibilidad de Datos (DAL) es una blockchain especializada que proporciona esta funcionalidad DA, permitiendo la verificación descentralizada a través de métodos como el muestreo de disponibilidad de datos (DAS), asegurando que cualquiera pueda verificar los datos de manera eficiente sin depender de terceros de confianza.
Hay dos tipos principales de DAL: Muestreo de Disponibilidad de Datos (DAS) y Comités de Disponibilidad de Datos (DAC). Los DAS utilizan métodos estadísticos descentralizados para validar la disponibilidad de los datos, mientras que los DAC se basan en un grupo de entidades de confianza para garantizar la integridad de los datos.
Muestreo de disponibilidad de datos (DAS)
DAS adopta el muestreo estadístico para validar la disponibilidad de datos sin necesidad de que los nodos descarguen y almacenen conjuntos de datos completos. Este enfoque es especialmente adecuado para redes descentralizadas con exigencias de escalabilidad.
- Muestreo aleatorio: Los nodos ligeros solicitan aleatoriamente pequeñas porciones de los datos, garantizando la integridad y disponibilidad de todo el conjunto de datos. Al muestrear solo un subconjunto, los nodos logran una alta probabilidad de detectar datos ausentes o retenidos.
- Escalabilidad: DAS minimiza las cargas de transmisión y almacenamiento de datos en nodos individuales, lo que permite escalar la red manteniendo la descentralización.
- Descentralización: Al eliminar la dependencia de intermediarios de confianza, DAS garantiza un funcionamiento sin confianza y se alinea con los principios básicos de blockchain.
- Mecanismos avanzados: Técnicas como la codificación de borrado 2D Reed-Solomon potencian la DAS al permitir a los nodos ligeros recuperar conjuntos de datos completos a partir de fragmentos muestreados.
- Limitaciones: DAS puede ser vulnerable a ataques de retención de datos si los adversarios predicen y manipulan los patrones de muestreo. Además, la eficacia de DAS depende de la presencia de un número suficiente de nodos honestos que realicen el muestreo.
Comités de Disponibilidad de Datos (CAD)
Los DAC implican a un grupo designado de entidades de confianza responsables de validar y garantizar la disponibilidad de los datos de las transacciones. Este enfoque centralizado compensa cierta descentralización por la eficiencia.
- Eficacia: Los DAC reducen las demandas computacionales y de ancho de banda de la red, lo que permite una verificación y un procesamiento más rápidos de los datos.
- Modelo de confianza: Los participantes deben confiar en que el comité actuará con honestidad y mantendrá la integridad de los datos. Esto introduce un nivel de centralización que puede no alinearse con todos los principios de blockchain.
- Riesgos de centralización: Concentrar la responsabilidad en un pequeño grupo aumenta el riesgo de colusión o de puntos únicos de fallo. Si el DAC se ve comprometido, la seguridad y la integridad de la red corren peligro.
- Casos de uso: Los DAC se emplean a menudo en redes con permisos o semicentralizadas, donde los supuestos de confianza son aceptables, como las aplicaciones empresariales o los proyectos de blockchain en fase inicial.
- Enfoques híbridos: Algunos proyectos combinan DAC con garantías criptográficas para mitigar los riesgos y mejorar la confianza sin descentralizar completamente.
Disponibilidad de datos en ZK Rollups
La disponibilidad de los datos es un componente crítico en los Rollups Zero Knowledge (ZK), ya que garantiza que las transacciones fuera de la cadena puedan validarse de forma efectiva. Los ZK Rollups comprimen los datos de las transacciones y los publican en la blockchain de nivel 1 junto con pruebas criptográficas para garantizar la integridad y validez de los datos.
A pesar del uso de pruebas de conocimiento cero (ZKP), DA es esencial para confirmar que los datos de la transacción subyacente siguen siendo accesibles para su verificación. Esto garantiza que todos los participantes puedan validar de forma independiente las transiciones de estado del rollup.
Los Rollups ZK difieren de los Rollups Optimistas en sus requisitos de DA, ya que se basan en garantías criptográficas en lugar de pruebas de fraude. Las estrategias de DA en los Rollups ZK incluyen mecanismos de almacenamiento fuera de la cadena y compromisos en la cadena.
Los mejores proyectos de la DA
La versatilidad de la disponibilidad de datos es evidente en los diversos enfoques que adoptan los mejores proyectos de DA para abordar los retos de blockchain:
- Celestia: Una red modular de DA que desacopla el consenso y la disponibilidad de datos, permitiendo una verificación de datos escalable y eficiente.
- Protocolo NEAR: Emplea la fragmentación para distribuir los datos entre varios nodos, mejorando el rendimiento y garantizando la disponibilidad de los datos.
- EigenDA: Un servicio descentralizado de disponibilidad de datos construido sobre Ethereum, que utiliza ETH restaurado para proporcionar posibilidades DA para rollups.
- Disponibilidad: Una capa de disponibilidad de datos que utiliza el muestreo de disponibilidad de datos para permitir que los nodos ligeros verifiquen los datos sin descargar conjuntos de datos completos.
- Lumia: Proporciona una disponibilidad de datos personalizada para la tokenización de activos en el mundo real, garantizando la integridad y accesibilidad de los datos de las transacciones.
Diferencia entre disponibilidad de datos y almacenamiento de datos
Es importante no confundir la disponibilidad de datos con el almacenamiento de datos, ya que tienen finalidades distintas. Mientras que la DA garantiza la disponibilidad inmediata de los datos para su validación, el almacenamiento de datos se ocupa de mantener y recuperar datos antiguos para su uso futuro.
En los protocolos no AD, los incentivos para almacenar datos suelen proceder de entidades externas que necesitan registros históricos, como exploradores de bloques, indexadores, aplicaciones, rollups o usuarios que quieren garantizar el acceso a su historial de transacciones.
Retos para garantizar la disponibilidad de los datos
A pesar de su importancia crítica, garantizar la disponibilidad de los datos en los sistemas blockchain se enfrenta a varios retos que afectan al rendimiento, la seguridad y la descentralización:
- Retención de datos: Los actores maliciosos pueden retener datos intencionadamente, impidiendo que los validadores o los nodos accedan a información esencial.
- Compromiso entre escalabilidad y seguridad: lograr una gran escalabilidad a menudo compromete la seguridad, ya que los conjuntos de datos más grandes son más difíciles de verificar y almacenar.
- Limitaciones técnicas: Las limitaciones de recursos dificultan a los nodos la gestión y transmisión eficiente de grandes volúmenes de datos.
- Expansión del almacenamiento: El crecimiento exponencial de los datos de las transacciones aumenta la carga de almacenamiento de los participantes en la red.
- Problemas de interoperabilidad: Mantener una disponibilidad uniforme de los datos en diferentes redes de cadenas de bloques sigue siendo un reto complejo.
- Sobrecarga de verificación: La validación de grandes conjuntos de datos requiere importantes recursos informáticos, lo que provoca retrasos e ineficiencias.
- Complejidad de la descentralización: Mantener una red descentralizada al tiempo que se amplían los sistemas de disponibilidad de datos es un delicado equilibrio plagado de obstáculos técnicos.
Conclusión
Comprender la disponibilidad de los datos puede resultar complejo al principio, pero en esencia se trata de garantizar que los datos de las transacciones estén accesibles cuando se necesiten para su validación, sin almacenarlos de forma permanente.
Permite que las redes blockchain verifiquen las transacciones de forma eficiente garantizando que los datos estén disponibles durante un breve periodo de tiempo, lo que minimiza los costes de almacenamiento.
Aunque la DA sigue afrontando retos, confiamos en que los principales protocolos del sector logren importantes avances en 2025.