2.1 無許可區塊鏈的儲存負擔
截至本研究進行時,比特幣區塊鏈需要超過370 GB的儲存空間。此增長與採用率和時間呈線性關係,構成了長期的可擴展性挑戰。高儲存需求阻礙了使用者運行完整節點,可能導致資源充裕的少數實體走向中心化,這與去中心化的基本原則相悖。
以比特幣和以太坊為代表的無許可區塊鏈,雖然革新了去中心化系統,但其資源密集性也備受批評。工作量證明共識機制的能源消耗已被廣泛討論,而完整節點所需龐大且持續增長的儲存開銷,相對而言較少受到關注。本文旨在填補此一缺口,首次透過實證研究探討區塊鏈節點如何利用帳本資料進行交易與區塊驗證。核心目標是探索並量化能夠將PoW區塊鏈的儲存佔用空間從數百GB大幅縮減至更易管理的規模之策略,且無需更改底層網路協議。
如比特幣等區塊鏈的去中心化安全模型,要求完整節點儲存並驗證完整的交易歷史。這造成了顯著的進入門檻,限制了網路的去中心化程度。
截至本研究進行時,比特幣區塊鏈需要超過370 GB的儲存空間。此增長與採用率和時間呈線性關係,構成了長期的可擴展性挑戰。高儲存需求阻礙了使用者運行完整節點,可能導致資源充裕的少數實體走向中心化,這與去中心化的基本原則相悖。
過往的方法包括檢查點和快照協議,這些都需要硬分叉或共識層級的修改。Bitcoin Core 提供了一個修剪選項,但缺乏智慧指引——使用者必須任意選擇一個保留閾值(以GB或區塊高度為單位),這可能導致刪除仍具相關性的未花費交易輸出,或儲存不必要的資料。
本研究基於對真實比特幣節點運作的資料驅動分析。
作者對 Bitcoin Core 客戶端進行了監測,記錄了在長時間標準節點運作期間的所有磁碟讀取操作。這建立了一個詳細的剖析檔案,顯示在驗證新區塊和交易時,具體存取哪些資料(舊區塊、交易)。
關鍵發現是:絕大多數的歷史區塊鏈資料很少被存取。驗證主要依賴於:
此模式揭示了在本機儲存完整鏈存在顯著的冗餘。
基於實證分析,本文提出了客戶端策略。
最直接的策略是智慧修剪演算法。節點可以動態保留以下內容,而非簡單的區塊高度截斷:
此方法與現有的比特幣節點完全相容。
為了進一步縮減,節點可以採用「延遲擷取」模式。如果所需的歷史交易未在本機儲存,節點可以從點對點網路按需請求。這是以邊際增加的驗證延遲(擷取時間)換取顯著的儲存節省。像梅克爾證明這樣的密碼學證明,可以確保擷取資料的完整性,而無需信任提供資料的節點。
研究證明,透過實施智慧修剪策略,一個完整的比特幣節點可以將其本機儲存需求縮減至約15 GB,同時保持完整的驗證能力。這包括UTXO集合(約4-5 GB)、所有區塊標頭(約50 MB)以及一個近期完整區塊的視窗。
「延遲擷取」策略在生成或驗證梅克爾證明時,產生的計算開銷可忽略不計。主要的權衡在於,當需要從網路擷取資料時,區塊驗證時間可能會增加,在正常網路條件下估計約為數百毫秒——對於在資源受限的裝置上啟用節點而言,這是一個微小的代價。
修剪資料和按需擷取交易的完整性由梅克爾樹保障。一個從區塊高度 $h$ 請求交易 $tx$ 的節點,可以向對等節點請求該交易連同一個梅克爾路徑證明 $\pi_{tx}$。儲存了包含梅克爾根 $root_h$ 的區塊標頭的節點,可以透過重新計算來驗證證明:
$\text{Verify}(tx, \pi_{tx}, root_h) = \text{true}$ 若 $\text{MerkleHash}(tx, \pi_{tx}) = root_h$
這確保了該交易確實是規範鏈的一部分,而無需整個區塊。需要深度歷史交易的概率被建模為UTXO集合年齡分佈的函數,研究發現該分佈高度偏向於近期輸出。
情境:一家新創公司希望為其支付服務運行一個完全驗證的比特幣節點,但雲端儲存預算有限。
框架應用:
此框架使他們能夠在將儲存成本降低超過95%的同時,維持安全性和自主權。
核心洞見:本文最有價值的貢獻不僅僅是一個新的修剪演算法——而是對「完整節點」教條的實證解構。它證明了370 GB的區塊鏈在很大程度上是一個冷存檔;活躍的、對安全至關重要的工作集要小一個數量級。這從根本上挑戰了極端儲存是自主權不可避免的代價這一觀念,就像CycleGAN論文透過展示你不需要配對資料來重新定義圖像到圖像轉換一樣。兩者都是識別並利用隱藏的、現實世界資料不對稱性的例子。
邏輯脈絡:論證過程極具說服力且簡單:1) 測量節點實際使用(而非儲存)哪些資料。2) 發現使用高度集中。3) 因此,安全地丟棄未使用的大部分。4) 提供可靠擷取罕見所需資料片段的機制。這是一個經典的工程優化循環,應用於一個先前被認為不可變的系統。
優點與缺陷:其優勢在於實用性和可立即部署性。它不需要共識變更,使其成為在經常充滿爭議的區塊鏈領域中罕見的「雙贏」提案。然而,該分析有一個關鍵的、未言明的缺陷:它針對的是穩定狀態進行優化。它低估了在鏈重組期間的資源需求。深度重組雖然罕見,但可能需要快速驗證許多舊區塊。一個已修剪的節點將需要即時擷取數GB的資料,可能導致其落後並無法及時驗證競爭鏈——這是一個安全風險。因此,本文的權衡不僅僅是延遲換取儲存,也是極端網路事件下的韌性換取日常效率。
可行洞見:對於開發者而言,關鍵在於立即在錢包和節點軟體中實作可配置的智慧修剪。對於研究人員,下一步是量化重組風險,並設計能承受網路壓力的擷取協議。對於投資者和專案,這項工作降低了運行安全節點的營運成本,使真正的去中心化商業模式更具可行性。這是將區塊鏈基礎設施從業餘愛好轉變為可擴展實用工具的一小步但至關重要的一步,與更廣泛的產業趨勢(如Gartner等組織所追蹤的)朝向高效、永續的分散式系統發展方向一致。