Vitalik o możliwej przyszłości Ethereum (część szósta): The Splurge

Bitget App

Trade smarter

Bitget

Wiadomości

Vitalik Buterin2025/10/29 17:26

Pokaż oryginał

Przez:Vitalik Buterin

W projektowaniu protokołu Ethereum około połowa treści dotyczy różnych typów ulepszeń EVM, a pozostała część składa się z różnorodnych niszowych tematów – to właśnie oznacza „prosperitet”.

W projektowaniu protokołu Ethereum około połowa treści dotyczy różnych typów ulepszeń EVM, a pozostała część obejmuje różne niszowe tematy – to właśnie oznacza „Splurge” (rozkwit).

Oryginalny tytuł: „Possible futures of the Ethereum protocol, part 6: The Splurge”

Autor: Vitalik Buterin

Tłumaczenie: zhouzhou, BlockBeats

Poniżej znajduje się oryginalna treść (dla lepszej czytelności została częściowo zredagowana):

Niektóre rzeczy trudno zaklasyfikować do jednej kategorii, a w projektowaniu protokołu Ethereum istnieje wiele „detali”, które są bardzo istotne dla sukcesu Ethereum. W rzeczywistości około połowa treści dotyczy różnych typów ulepszeń EVM, a pozostała część obejmuje różne niszowe tematy – to właśnie oznacza „Splurge” (rozkwit).

Mapa drogowa 2023: Splurge

Splurge: kluczowe cele

Przekształcenie EVM w wydajny i stabilny „stan końcowy”
Wprowadzenie abstrakcji kont do protokołu, umożliwiając wszystkim użytkownikom korzystanie z bezpieczniejszych i wygodniejszych kont
Optymalizacja ekonomii opłat transakcyjnych, zwiększenie skalowalności przy jednoczesnym obniżeniu ryzyka
Eksploracja zaawansowanej kryptografii, aby znacząco poprawić Ethereum w długim okresie

Ulepszenia EVM

Jaki problem rozwiązują?

Obecnie EVM trudno poddać analizie statycznej, co utrudnia tworzenie wydajnych implementacji, formalną weryfikację kodu oraz dalszą rozbudowę. Ponadto, efektywność EVM jest niska i trudno wdrożyć wiele zaawansowanych form kryptografii, chyba że zostaną one wyraźnie obsłużone przez prekompilacje.

Co to jest i jak działa?

Pierwszym krokiem w aktualnej mapie drogowej ulepszeń EVM jest EVM Object Format (EOF), który planuje się włączyć do następnego hard forka. EOF to seria EIP, które określają nową wersję kodu EVM z wieloma unikalnymi cechami, z których najbardziej widoczne to:

Oddzielenie kodu (wykonywalnego, ale nieczytelnego z EVM) od danych (czytelnych, ale niewykonywalnych)
Zakaz dynamicznych skoków, dozwolone są tylko skoki statyczne
Kod EVM nie może już obserwować informacji związanych z gazem
Dodano nowy, jawny mechanizm podprogramów

Struktura kodu EOF

Splurge: ulepszenia EVM (kontynuacja)

Stare kontrakty będą nadal istnieć i mogą być tworzone, choć ostatecznie mogą zostać stopniowo wycofane (a nawet przymusowo przekonwertowane na kod EOF). Nowe kontrakty skorzystają z wydajności EOF – najpierw poprzez nieco mniejszy bajtkod dzięki podprogramom, a następnie dzięki nowym funkcjom specyficznym dla EOF lub niższym kosztom gazu.

Po wprowadzeniu EOF dalsze aktualizacje stają się łatwiejsze, a obecnie najbardziej rozwiniętym pomysłem jest EVM Modular Arithmetic Extension (EVM-MAX). EVM-MAX tworzy zestaw nowych operacji specjalnie dla obliczeń modularnych i umieszcza je w nowej przestrzeni pamięci, do której nie można uzyskać dostępu przez inne opkody, co umożliwia optymalizacje, takie jak mnożenie Montgomery’ego.

Nowszym pomysłem jest połączenie EVM-MAX z funkcją SIMD (Single Instruction Multiple Data), która jako koncepcja istnieje w Ethereum od dawna, po raz pierwszy zaproponowana przez Grega Colvina w EIP-616. SIMD może przyspieszyć wiele form kryptografii, w tym funkcje skrótu, 32-bitowe STARKs i kryptografię opartą na kratkach, a połączenie EVM-MAX i SIMD sprawia, że te dwa wydajne rozszerzenia naturalnie się uzupełniają.

Ogólny projekt połączonego EIP zaczyna się od EIP-6690, a następnie:

Pozwala na (i) dowolną liczbę nieparzystą lub (ii) dowolną potęgę dwójki do 2768 jako moduł
Dla każdego opkodu EVM-MAX (dodawanie, odejmowanie, mnożenie) dodaje wersję, która zamiast 3 natychmiastowych liczb x, y, z używa 7: x_start, x_skip, y_start, y_skip, z_start, z_skip, count. W kodzie Python te opkody działają następująco:

for i in range(count):

mem[z_start + z_skip * count] = op(

mem[x_start + x_skip * count],

mem[y_start + y_skip * count]

)

W rzeczywistej implementacji będzie to przetwarzane równolegle.

Możliwe jest dodanie XOR, AND, OR, NOT i SHIFT (w tym cyklicznych i niecyklicznych), przynajmniej dla potęg dwójki jako modułu. Dodano również ISZERO (który wypycha wynik na główny stos EVM), co wystarczy do realizacji kryptografii krzywych eliptycznych, kryptografii na małych polach (np. Poseidon, Circle STARKs), tradycyjnych funkcji skrótu (np. SHA256, KECCAK, BLAKE) i kryptografii opartej na kratkach. Inne ulepszenia EVM mogą być wdrożone, ale jak dotąd cieszą się mniejszym zainteresowaniem.

Linki do istniejących badań

EOF:
EVM-MAX:
SIMD:

Pozostała praca i kompromisy

Obecnie EOF planowany jest do włączenia w następnym hard forku. Zawsze istnieje możliwość jego usunięcia w ostatniej chwili – w poprzednich hard forkach funkcje były tymczasowo usuwane, ale takie działanie wiąże się z dużym wyzwaniem. Usunięcie EOF oznacza, że wszelkie przyszłe ulepszenia EVM musiałyby być wdrażane bez EOF, co jest możliwe, ale prawdopodobnie trudniejsze.

Główny kompromis EVM polega na złożoności L1 w stosunku do złożoności infrastruktury – EOF to dużo kodu do dodania do implementacji EVM, a statyczna kontrola kodu jest stosunkowo złożona. W zamian jednak można uprościć języki wyższego poziomu, uprościć implementację EVM i uzyskać inne korzyści. Można powiedzieć, że mapa drogowa, która priorytetowo traktuje ciągłe ulepszenia L1 Ethereum, powinna obejmować i opierać się na EOF.

Ważną pracą do wykonania jest wdrożenie funkcji podobnych do EVM-MAX + SIMD oraz przeprowadzenie benchmarków zużycia gazu dla różnych operacji kryptograficznych.

Jak to współdziała z innymi częściami mapy drogowej?

L1 dostosowując swój EVM sprawia, że L2 również łatwiej się dostosowuje; brak synchronizacji może prowadzić do niekompatybilności i negatywnych skutków. Ponadto EVM-MAX i SIMD mogą obniżyć koszty gazu dla wielu systemów dowodzenia, czyniąc L2 bardziej wydajnymi. Umożliwia to także zastąpienie większej liczby prekompilacji kodem EVM wykonującym te same zadania, bez dużego wpływu na wydajność.

Abstrakcja kont

Jaki problem rozwiązują?

Obecnie transakcje mogą być weryfikowane tylko w jeden sposób: podpisem ECDSA. Początkowo abstrakcja kont miała wyjść poza to, pozwalając na dowolną logikę weryfikacji konta jako kod EVM. Umożliwia to szereg zastosowań:

Przejście na kryptografię odporną na kwanty
Rotacja starych kluczy (powszechnie uznawana za zalecaną praktykę bezpieczeństwa)
Portfele multisig i portfele z odzyskiwaniem społecznym
Używanie jednego klucza do operacji o niskiej wartości, a innego (lub zestawu kluczy) do operacji o wysokiej wartości

Pozwala to protokołom prywatności działać bez relayerów, znacznie upraszczając ich złożoność i eliminując kluczowy scentralizowany punkt zależności

Od 2015 roku, kiedy zaproponowano abstrakcję kont, jej cele rozszerzyły się o wiele „celów wygody”, np. umożliwienie kontu bez ETH, ale z ERC20, płacenia za gaz w ERC20. Poniżej znajduje się podsumowujący wykres tych celów:

MPC (obliczenia wielostronne) to technika mająca już 40 lat, pozwalająca podzielić klucz na kilka części i przechowywać je na różnych urządzeniach, generując podpisy kryptograficznie bez bezpośredniego łączenia tych części.

EIP-7702 to propozycja planowana do wprowadzenia w następnym hard forku, będąca wynikiem rosnącej świadomości potrzeby zapewnienia wygody abstrakcji kont wszystkim użytkownikom (w tym EOA), mająca na celu krótkoterminową poprawę doświadczenia użytkowników i uniknięcie podziału ekosystemu.

Prace rozpoczęły się od EIP-3074 i ostatecznie doprowadziły do EIP-7702. EIP-7702 udostępnia „funkcje wygody” abstrakcji kont wszystkim użytkownikom, w tym dzisiejszym EOA (kontom zarządzanym przez podpisy ECDSA).

Jak widać na wykresie, choć niektóre wyzwania (zwłaszcza te dotyczące „wygody”) można rozwiązać stopniowo, np. przez MPC lub EIP-7702, główne cele bezpieczeństwa pierwotnej propozycji abstrakcji kont można osiągnąć tylko poprzez powrót do pierwotnego problemu: umożliwienie kodowi smart kontraktu kontrolowania weryfikacji transakcji. Do tej pory nie zostało to wdrożone ze względu na wyzwania związane z bezpieczną implementacją.

Co to jest i jak działa?

Sednem abstrakcji kont jest prostota: umożliwienie smart kontraktom inicjowania transakcji, a nie tylko EOA. Cała złożoność polega na wdrożeniu tego w sposób przyjazny dla zdecentralizowanej sieci i odporny na ataki typu denial-of-service.

Typowym kluczowym wyzwaniem jest problem wielokrotnej nieważności:

Jeśli 1000 kont ma funkcje weryfikacji zależne od jednej wartości S, a obecna wartość S sprawia, że transakcje w mempoolu są ważne, to pojedyncza transakcja zmieniająca S może unieważnić wszystkie pozostałe transakcje w mempoolu. Umożliwia to atakującemu wysyłanie śmieciowych transakcji do mempoolu przy minimalnym koszcie, blokując zasoby węzłów sieci.

Po latach pracy, mającej na celu rozszerzenie funkcjonalności przy jednoczesnym ograniczeniu ryzyka DoS, ostatecznie powstało rozwiązanie „idealnej abstrakcji kont”: ERC-4337.

ERC-4337 działa, dzieląc przetwarzanie operacji użytkownika na dwa etapy: weryfikację i wykonanie. Najpierw przetwarzane są wszystkie weryfikacje, a następnie wszystkie wykonania. W mempoolu operacje użytkownika są akceptowane tylko wtedy, gdy etap weryfikacji dotyczy wyłącznie ich własnego konta i nie odczytuje zmiennych środowiskowych. Zapobiega to atakom wielokrotnej nieważności. Ponadto na etap weryfikacji nakładane są ścisłe limity gazu.

ERC-4337 został zaprojektowany jako dodatkowy standard protokołu (ERC), ponieważ w tamtym czasie deweloperzy klientów Ethereum skupiali się na Merge i nie mieli zasobów na inne funkcje. Dlatego ERC-4337 używa obiektów zwanych operacjami użytkownika, a nie zwykłych transakcji. Ostatnio jednak zdano sobie sprawę, że przynajmniej część tych funkcji powinna być zapisana w protokole.

Dwa kluczowe powody to:

Wrodzona nieefektywność EntryPoint jako kontraktu: każda paczka ma stały narzut ok. 100 000 gazu oraz dodatkowe tysiące gazu na każdą operację użytkownika.
Konieczność zapewnienia właściwości Ethereum: np. gwarancje włączenia stworzone przez inclusion list muszą być przeniesione na użytkowników abstrakcji kont.

Ponadto ERC-4337 rozszerza dwa funkcje:

Paymasters: umożliwiają jednemu kontu płacenie opłat za inne, co narusza zasadę, że etap weryfikacji może dotyczyć tylko konta nadawcy, dlatego wprowadzono specjalne mechanizmy zapewniające bezpieczeństwo paymasterów.
Aggregators: obsługa agregacji podpisów, np. BLS lub opartej na SNARK. Jest to niezbędne do osiągnięcia maksymalnej efektywności danych na Rollupach.