1. परिचय
Permissionless blockchains, exemplified by Bitcoin and Ethereum, have revolutionized decentralized systems but face significant scalability challenges. While the energy consumption of Proof-of-Work (PoW) consensus has been widely debated, the substantial and growing संग्रहण ओवरहेड पूर्ण नोड्स द्वारा आवश्यक संग्रहण ओवरहेड व्यापक भागीदारी और नेटवर्क स्वास्थ्य के लिए एक महत्वपूर्ण, किंतु अपर्याप्त रूप से संबोधित, बाधा बना हुआ है। यह शोधपत्र पहला व्यापक प्रायोगिक अध्ययन प्रस्तुत करता है जो विश्लेषण करता है कि पूर्ण नोड सत्यापन के लिए ब्लॉकचेन डेटा का उपयोग कैसे करते हैं, जिससे अंतर्निहित प्रोटोकॉल को बदले बिना स्थानीय संग्रहण आवश्यकताओं को नाटकीय रूप से कम करने के लिए व्यावहारिक रणनीतियाँ प्राप्त होती हैं।
2. Background & Problem Statement
ब्लॉकचेन की अखंडता लेन-देन के एक पूर्ण, सत्यापन योग्य इतिहास पर निर्भर करती है। बिटकॉइन के लिए, यह खाता बही 370 GB से अधिक है, जो स्वतंत्र रूप से लेन-देन को मान्य करने के लिए पूर्ण नोड चलाने वाले प्रतिभागियों से महत्वपूर्ण संसाधनों की मांग करती है।
2.1 अनुमतिहीन ब्लॉकचेन का भंडारण बोझ
भंडारण आवश्यकता सीधे तौर पर अपनाने और लेन-देन की मात्रा के समानुपाती है। पूरी खाता बही को संग्रहीत करना सुरक्षा (डबल-स्पेंडिंग को रोकने) के लिए आवश्यक है लेकिन एक उच्च प्रवेश बाधा पैदा करता है, जिससे केंद्रीकरण के जोखिम उत्पन्न होते हैं क्योंकि कम उपयोगकर्ता पूर्ण नोड चलाने का खर्च उठा सकते हैं।
मुख्य आँकड़ा
Bitcoin Full Node Storage: >370 GB (as of the study's timeframe). This creates a significant hardware cost and disincentive for widespread node operation.
2.2 मौजूदा समाधान और उनकी सीमाएँ
पिछले दृष्टिकोणों में शामिल हैं:
- Checkpointing/Snapshots: प्रोटोकॉल संशोधन या हार्ड फोर्क की आवश्यकता होती है, जिससे समन्वय संबंधी चुनौतियाँ उत्पन्न होती हैं।
- Bitcoin's Pruning: उपयोगकर्ताओं को एक मनमाना भंडारण सीमा (GB या ब्लॉक ऊंचाई) निर्धारित करने की अनुमति देता है। यह उपयुक्त नहीं है क्योंकि इसमें मार्गदर्शन का अभाव है, जिससे संभावित रूप से अभी भी प्रासंगिक डेटा हटाया जा सकता है या अनावश्यक डेटा बरकरार रखा जा सकता है, जो नोड्स को नेटवर्क से डेटा फिर से प्राप्त करने के लिए मजबूर करता है और विलंबता बढ़ाता है।
3. Methodology & Empirical Analysis
इस कार्य का मुख्य योगदान अनुकूलन को सूचित करने के लिए वास्तविक नोड व्यवहार का एक डेटा-संचालित विश्लेषण है।
3.1 डेटा संग्रह और नोड व्यवहार प्रोफाइलिंग
लेखकों ने Bitcoin full nodes को साधनबद्ध किया ताकि मानक संचालन—विशेष रूप से नए लेन-देन और ब्लॉकों के सत्यापन के दौरान—स्थानीय संग्रहण से प्रत्येक डेटा पहुंच (रीड) की निगरानी और लॉगिंग की जा सके। इससे यह प्रोफाइल बनती है कि निरंतर सत्यापन के लिए ब्लॉकचेन के कौन से हिस्से वास्तव में आवश्यक हैं।
3.2 डेटा एक्सेस पैटर्न का विश्लेषण
विश्लेषण से एक महत्वपूर्ण अंतर्दृष्टि प्राप्त हुई: ऐतिहासिक ब्लॉकचेन डेटा का एक महत्वपूर्ण हिस्सा शायद ही कभी या कभी भी एक्सेस नहीं किया जाता है एक निश्चित अवधि के बाद। वर्तमान स्थिति (अनस्पेंट ट्रांजैक्शन आउटपुट - UTXOs) और हाल के इतिहास को सत्यापित करने के लिए आवश्यक डेटा, पूर्ण लेजर की तुलना में बहुत छोटा उपसमुच्चय बनाता है।
Core Insight
पूर्ण नोड्स को नए ब्लॉक और लेनदेन को वास्तविक समय में मान्य करने के लिए संपूर्ण बहु-सौ-गीगाबाइट इतिहास की आवश्यकता नहीं होती है। सक्रिय रूप से आवश्यक डेटासेट का आकार कई गुना छोटा होता है।
4. प्रस्तावित भंडारण कमी रणनीतियाँ
अनुभवजन्य निष्कर्षों के आधार पर, पेपर क्लाइंट-साइड रणनीतियाँ प्रस्तावित करता है।
4.1 प्रोटोकॉल परिवर्तन के बिना स्थानीय भंडारण छँटाई
प्राथमिक रणनीति एक बुद्धिमान, डेटा-जागरूक प्रूनिंग एल्गोरिदम है। साधारण आयु या आकार के आधार पर प्रूनिंग करने के बजाय, नोड ब्लॉकचेन डेटा (जैसे पुराने खर्च किए गए लेनदेन आउटपुट) को सुरक्षित रूप से हटा सकता है जिसे प्रोफाइलिंग ने भविष्य के सत्यापन के लिए अनावश्यक दिखाया है। इसे शुद्ध रूप से क्लाइंट साइड पर लागू किया गया है।
4.2 क्लाइंट-साइड अनुकूलन तकनीकें
अतिरिक्त अनुकूलन में शायद ही कभी एक्सेस किए जाने वाले लेकिन आवश्यक ऐतिहासिक डेटा के संपीड़न, और कैशिंग रणनीतियाँ शामिल हैं जो "वर्किंग सेट" (अक्सर एक्सेस किए जाने वाले UTXO और हाल के ब्लॉक) को तेज़ स्टोरेज में रखने को प्राथमिकता देती हैं।
5. Results & Evaluation
5.1 प्राप्त करने योग्य स्टोरेज फुटप्रिंट में कमी
अध्ययन का सबसे चौंकाने वाला परिणाम: उनकी बुद्धिमान प्रूनिंग रणनीति को लागू करके, एक पूर्ण Bitcoin नोड अपने स्थानीय संग्रहण फुटप्रिंट को लगभग 15 GB तक कम कर सकता है जबकि पूर्ण सत्यापन क्षमताओं को बनाए रखते हुए। यह पूर्ण 370+ GB लेजर से 95% से अधिक की कमी का प्रतिनिधित्व करता है।
चार्ट: संग्रहण फुटप्रिंट तुलना
(काल्पनिक चार्ट विवरण) "फुल लेजर (370 GB)" और "प्रून्ड वर्किंग सेट (15 GB)" की तुलना करने वाला एक बार चार्ट। प्रून्ड सेट मूल का एक छोटा सा हिस्सा है, जो दृष्टिगत रूप से प्राप्त भारी कमी पर जोर देता है।
5.2 प्रदर्शन और उपरि लागत के बीच समझौता
प्रोफाइलिंग और इंटेलिजेंट प्रूनिंग की कम्प्यूटेशनल ओवरहेड नगण्य बताई गई है। समझौता यह है कि यदि किसी नोड को बहुत पुराने, प्रून किए गए डेटा का संदर्भ देने वाले लेनदेन को मान्य करने की आवश्यकता होती है, तो उसे नेटवर्क से एक क्रिप्टोग्राफिक प्रूफ (जैसे मर्कल प्रूफ) प्राप्त करना होगा, जिससे थोड़ी सी संचार विलंबता होती है। हालाँकि, विश्लेषण से पता चलता है कि यह एक दुर्लभ घटना है।
6. Technical Details & Mathematical Framework
प्रूनिंग लॉजिक लेनदेन जीवनचक्र की समझ पर निर्भर करती है। एक लेनदेन आउटपुट (UTXO) जो खर्च किया जा चुका है, भविष्य के खर्चों को मान्य करने के लिए अब आवश्यक नहीं है। मूल लॉजिक को मॉडल किया जा सकता है। मान लीजिए $L$ पूर्ण लेजर है। मान लीजिए $A(t)$ समय विंडो $t$ तक एक नोड द्वारा $L$ से सभी डेटा एक्सेस (रीड) का सेट है। आवश्यक कार्य सेट $W$ को इस प्रकार परिभाषित किया गया है:
$W = \{ d \in L \mid P(\text{access } d \text{ in future validation}) > \tau \}$
जहाँ $\tau$ एक छोटी संभाव्यता सीमा है जो अनुभवजन्य रूप से प्राप्त की गई है। $W$ में नहीं आने वाले डेटा को छाँटा जा सकता है। सुरक्षा छाँटे गए डेटा के लिए Merkle प्रमाण प्राप्त करने की क्षमता पर निर्भर करती है, जहाँ प्रमाण का आकार ब्लॉकचेन के आकार में लघुगणकीय है: $O(\log n)$।
7. Analysis Framework: A Case Study
परिदृश्य: एक नया व्यवसाय विश्वसनीय, स्वतंत्र लेन-देन सत्यापन के लिए एक Bitcoin full node चलाना चाहता है, लेकिन उसके पास भंडारण बुनियादी ढांचे के लिए सीमित बजट है।
फ्रेमवर्क का अनुप्रयोग:
- प्रोफ़ाइल: एक मानक फुल नोड को प्रोफ़ाइलिंग सक्षम करके 2 सप्ताह के लिए डिप्लॉय करें ताकि इसके विशिष्ट एक्सेस पैटर्न सीखे जा सकें।
- गणना करें: प्रोफ़ाइल के आधार पर, एल्गोरिदमिक रूप से इष्टतम डेटासेट $W$ निर्धारित करें। अध्ययन से पता चलता है कि यह Bitcoin के लिए लगभग 15 GB पर स्थिर हो जाएगा।
- Prune: $W$ में नहीं होने वाले सभी ब्लॉकचेन डेटा को हटाएं।
- Operate: प्रून किए गए नोड को चलाएं। दुर्लभ मामलों में जब प्रून किए गए डेटा की आवश्यकता हो, तो पीयर-टू-पीयर नेटवर्क से एक मर्कल प्रूफ अनुरोध करें।
परिणाम: व्यवसाय 370+ GB के बजाय ~15 GB संग्रहण के साथ पूर्ण सत्यापन सुरक्षा प्राप्त करता है, जिससे लागत और जटिलता में भारी कमी आती है।
8. Future Applications & Research Directions
- अन्य ब्लॉकचेन के लिए अनुकूलन: इस अनुभवजन्य पद्धति को Ethereum, विशेष रूप से मर्ज के बाद, और अन्य PoW/PoS चेनों पर लागू करके चेन-विशिष्ट प्रूनिंग पैरामीटर प्राप्त करना।
- मानकीकरण: प्रोफाइलिंग डेटा प्रारूप और प्रूफ अनुरोधों को मानकीकृत करने के लिए एक बीआईपी (बिटकॉइन सुधार प्रस्ताव) प्रस्तावित करना, ताकि प्रून किए गए नोड्स अधिक कुशल बन सकें।
- लाइट क्लाइंट संवर्धन: फुल नोड्स और एसपीवी (सरलीकृत भुगतान सत्यापन) क्लाइंट्स के बीच की खाई को पाटना। 15 जीबी संग्रहण वाले "लगभग-पूर्ण" नोड्स एसपीवी क्लाइंट्स की तुलना में कहीं अधिक मजबूत सुरक्षा प्रदान करते हैं, जबकि पारंपरिक फुल नोड्स की तुलना में कहीं अधिक तैनाती योग्य होते हैं।
- विकेंद्रीकरण अभियान: यह प्रौद्योगिकी वैश्विक स्तर पर पूर्ण नोड्स की संख्या बढ़ाने के अभियानों के लिए एक प्रमुख सक्षमकर्ता हो सकती है, जिससे नेटवर्क की लचीलापन और सेंसरशिप प्रतिरोध में सुधार होता है।
9. References
- Sforzin, A., Maso, M., Soriente, C., & Karame, G. (Year). On the Storage Overhead of Proof-of-Work Blockchains. Conference/Journal Name.
- Nakamoto, S. (2008). Bitcoin: A Peer-to-Peer Electronic Cash System.
- Bitcoin Core Documentation. (n.d.). Blockchain Pruning. Retrieved from https://bitcoincore.org/en/doc/
- Buterin, V. (2014). Ethereum: A Next-Generation Smart Contract and Decentralized Application Platform.
- Bonneau, J., et al. (2015). SoK: Research Perspectives and Challenges for Bitcoin and Cryptocurrencies. IEEE S&P.
- Gervais, A., et al. (2016). On the Security and Performance of Proof of Work Blockchains. ACM CCS.
विश्लेषक का दृष्टिकोण: पुरानी श्रृंखलाओं के लिए एक स्केलेबिलिटी लाइफलाइन
मुख्य अंतर्दृष्टि: यह शोधपत्र ब्लॉकचेन की सबसे गुप्त स्केलिंग बाधा: स्टेट ब्लोट पर एक सटीक प्रहार करता है। जबकि दुनिया टीपीएस (प्रति सेकंड लेनदेन) और ऊर्जा खपत पर ध्यान केंद्रित कर रही है, एसफोर्ज़िन एट अल. सही ढंग से पहचानते हैं कि स्थायी, असीमित स्टोरेज वृद्धि विकेंद्रीकरण का एक मूक हत्यारा है। उनका कार्य सिद्ध करता है कि पूर्ण नोड्स को संपूर्ण इतिहास संग्रहीत करने की आवश्यकता वाला सिद्धांत एक स्व-लगाया गया प्रतिबंध है, न कि क्रिप्टोग्राफिक आवश्यकता। वास्तविक आवश्यकता वर्तमान सत्यापन के लिए आवश्यक डेटा के प्रूफ-कैरींग सबसेट को संग्रहीत करना है—एक ऐसा अंतर जिसके विशाल व्यावहारिक निहितार्थ हैं। proof-carrying subset of data necessary for current validation—a distinction with monumental practical implications.
Logical Flow: The argument is elegantly empirical. Instead of proposing a top-down protocol overhaul, they first instrument nodes to observe what data is actually usedयह डेटा-केंद्रित दृष्टिकोण सिस्टम प्रदर्शन अनुकूलन में सर्वोत्तम प्रथाओं को दर्शाता है, जो अनुकूलन से पहले किसी एप्लिकेशन का प्रोफाइलिंग करने के समान है। यह निष्कर्ष कि "वर्किंग सेट" लगभग 15 जीबी है, मुख्य आधार है। यह समस्या को "हम Bitcoin को कैसे बदलें?" से बदलकर "हम अप्रयुक्त 95% को सुरक्षित रूप से कैसे हटाएं?" कर देता है। समाधान—बुद्धिमान प्रूनिंग + नेटवर्क-प्राप्त Merkle प्रमाण पर वापसी—व्यावहारिक इंजीनियरिंग में एक उत्कृष्ट उदाहरण है, जो इसके पीछे के सिद्धांतों की याद दिलाता है। कैश निष्कासन नीतियाँ कंप्यूटर आर्किटेक्चर में या आधुनिक ऑपरेटिंग सिस्टम द्वारा मेमोरी पेज प्रबंधित करने के तरीके में।
Strengths & Flaws: इसकी ताकत इसकी परिनियोजन क्षमता है। एक क्लाइंट-साइड परिवर्तन के रूप में, इसे किसी विवादास्पद हार्ड फोर्क की आवश्यकता नहीं है, जिससे निकट भविष्य में इसके अपनाना संभव हो जाता है। यह सीधे तौर पर एक फुल नोड चलाने की बाधा को कम करता है, संभावित रूप से नोड केंद्रीकरण की प्रवृत्ति को उलट सकता है। हालाँकि, विश्लेषण में कमियाँ हैं। पहला, यह एक नई, सूक्ष्म निर्भरता पैदा करता है: प्रून किए गए नोड्स को पुराने डेटा के लिए प्रमाण उपलब्ध कराने के लिए नेटवर्क (विशेष रूप से, गैर-प्रून किए गए "आर्काइव" नोड्स) पर निर्भर रहना होगा। इससे एक दो-स्तरीय नोड प्रणाली बनती है और सैद्धांतिक रूप से इसका दुरुपयोग किया जा सकता है यदि आर्काइव नोड्स दुर्लभ या दुर्भावनापूर्ण हो जाते हैं। दूसरा, जैसा कि Bonneau et al. जैसे शोधकर्ताओं ने Bitcoin सुरक्षा पर अपने "SoK" में उल्लेख किया है, लाइट क्लाइंट्स (जिससे यह दृष्टिकोण मिलता-जुलता है) का सुरक्षा मॉडल एक पूर्ण आर्काइवल नोड की तुलना में सख्ती से कमजोर है, क्योंकि यह डेटा उपलब्धता के बारे में एक ट्रस्ट धारणा पेश करता है। यह पेपर इस बदलाव के दीर्घकालिक सुरक्षा प्रभावों पर कुछ हद तक सतही तरीके से विचार करता है।
Actionable Insights: ब्लॉकचेन परियोजनाओं, विशेष रूप से स्थापित PoW चेन के लिए, यह शोध एक "लेगेसी चेन स्केलेबिलिटी" पैकेज के लिए एक खाका है। तत्काल कार्रवाई इस प्रोफाइलिंग और इंटेलिजेंट प्रूनिंग को Bitcoin Core जैसे मुख्यधारा क्लाइंट्स में एक डिफ़ॉल्ट, अनुकूलित विकल्प के रूप में एकीकृत करना है। नियामकों और उद्यमों के लिए, यह प्रौद्योगिकी अनुपालनकारी, स्व-सत्यापन नोड्स चलाना काफी अधिक व्यवहार्य बनाती है, जिससे तृतीय-पक्ष API प्रदाताओं पर निर्भरता कम हो जाती है। भविष्य की ओर देखते हुए, इस पद्धति को Ethereum के स्टेट ट्री पर लागू किया जाना चाहिए, जो एक अलग लेकिन समान रूप से महत्वपूर्ण भंडारण चुनौती प्रस्तुत करता है। अंतिम अंतर्दृष्टि यह है कि ब्लॉकचेन स्केलेबिलिटी सिर्फ अधिक तेजी से करने के बारे में नहीं है; यह हमारे पास पहले से मौजूद चीजों के साथ अधिक चतुराई से काम करने के बारे में है। यह कार्य उस दिशा में एक महत्वपूर्ण कदम है, जो ब्लॉकचेन को मूल्यवान बनाने वाली सुरक्षा गारंटी का त्याग किए बिना विकेंद्रीकरण को बनाए रखने का मार्ग प्रदान करता है।