以太坊作为全球领先的智能合约平台,其核心在于账户模型的设计与管理,理解以太坊账户的源码实现,对于深入把握以太坊的工作原理、安全机制以及开发安全可靠的DApp至关重要,本文将基于以太坊客户端(以Go客户端geth为例)的源码,对以太坊账户的核心实现与机制进行深入分析。
以太坊账户模型概览
在深入源码之前,我们先简要回顾以太坊的账户模型,以太坊主要有两种账户类型:
- 外部账户 (Externally Owned Accounts, EOAs):由用户通过私钥控制,没有关联的代码,发起交易、部署合约等操作通常由EOAs驱动,其标识是地址(Address)。
- 合约账户 (Contract Accounts):由智能合约代码控制,拥有状态(State),可以通过接收交易或调用其他合约来改变自身状态,其标识也是地址(由创建者地址和nonce等生成)。
这两种账户共同构成了以太坊的状态基础,所有账户信息都存储在以太坊的MPT(Merkle Patricia Trie)状态数据库中。
账户数据结构:Account 与 StateObject
在以太坊Go客户端(如geth)的core/state包中,账户的核心数据结构是Account和StateObject。
core/types.Account 结构体
这个结构体定义了账户在状态 trie 中存储的基本数据格式,它是一个序列化的结构:
// Account represents an account in the state database.
type Account struct {
Nonce uint64
Balance *big.Int
Root common.Hash // Merkle root of the storage trie
CodeHash common.Hash
}
- Nonce:一个递增的计数器,用于防止重放攻击,对于EOA,它代表该账户发起的交易数量;对于合约账户,它代表该账户创建的合约数量。
- Balance:账户持有的以太币数量,以wei为单位。
- Root:存储合约账户数据的Merkle Patricia Trie的根哈希,对于EOA,此值为空。
- CodeHash:账户代码的哈希值,对于EOA,此值为空字符串的哈希;对于合约账户,此值为合约代码的哈希。
这个Account结构体是状态数据库中存储的“信息。
core/state.StateObject 结构体
StateObject则是内存中账户对象的表示,它包含了Account结构体的信息,并提供了更多的方法和功能,用于修改和查询账户状态。
// StateObject represents an Ethereum account object in the state trie.
type StateObject struct {
address common.Address
data Account
db Database
dbErr error
dirty bool // 是否已被修改
deleted bool // 是否已被删除
onDirty func(addr common.Address) // 当状态改变时的回调函数
// 以下字段用于合约账户
code Code
storage map[common.Hash]common.Hash // 合约的存储槽
storageDirty map[common.Hash]struct{} // 标记哪些存储槽被修改
}
- address:账户地址。
- data:嵌入的
Account结构体,包含账户的基本信息。 - db:指向底层数据库(通常是MPT状态数据库)的接口,用于持久化状态变更。
- dirty/deleted:标记账户状态是否被修改或删除,用于后续的状态提交。
- onDirty:回调函数,在账户状态改变时触发。
- code:合约账户的代码(
Code类型,包含字节码和哈希)。 - storage/storageDirty:合约账户的存储槽及其修改标记。
StateObject是账户状态在内存中的“活性”代表,所有对账户状态的修改(如转账、合约调

StateObject进行。
账户的创建与管理
账户的创建
- EOA创建:EOA由用户通过导入私钥或创建新钱包生成,其
Nonce从0开始,Balance初始为0(或转入一定数量),Root和CodeHash为空。 - 合约账户创建:当EOA发送一个创建合约的交易时,以太坊节点会执行以下步骤:
- 创建一个新的合约账户地址(基于创建者地址和创建者的Nonce)。
- 初始化该合约账户的
StateObject,设置Nonce为1(因为创建了一个合约),Balance通常为0(除非在构造函数中转入),Root初始化为空(对应一个空的存储trie),CodeHash为空字符串的哈希。 - 将合约的字节码部署到该账户,并更新
CodeHash为字节码的哈希。 - 执行合约的构造函数(init code),修改合约账户的存储状态。
- 将修改后的
StateObject标记为dirty,等待写入状态数据库。
账户的加载与更新
在以太坊节点处理交易或查询状态时,需要从数据库中加载账户信息:
- 加载:通过账户地址从MPT状态数据库中读取
Account结构体数据,然后将其封装成StateObject对象加载到内存中。 - 更新:对
StateObject的字段(如Balance、Nonce、合约的storage)进行修改,每次修改后,StateObject会被标记为dirty。 - 提交:当需要持久化状态时(如区块打包完成),所有被标记为
dirty的StateObject会被重新序列化为Account结构体,并更新到MPT状态数据库中,对于合约账户,其storage的修改也会被组织成一个单独的存储MPT,并更新其Root哈希。
账户状态的核心操作
余额转移
当一笔转账交易被处理时:
- 从发送方EOA的
StateObject中扣除相应数量的Balance,并增加其Nonce。 - 从接收方账户(可能是EOA或合约账户)的
StateObject中增加相应数量的Balance。 - 双方的
StateObject都会被标记为dirty。
合约存储读写
当调用合约并读写其存储时:
- 加载合约账户的
StateObject。 - 读取:根据指定的
key(存储槽索引),从storagemap中获取对应的value。 - 写入:根据指定的
key和value,更新storagemap,并将该key标记为dirty(存储在storageDirty中)。 - 合约账户的
StateObject本身也会被标记为dirty。
账户代码的管理
合约账户的代码是其核心。StateObject中的Code字段通常是一个Code结构体,包含:
codeHash:代码的哈希,用于快速验证。code:实际的字节码(可能为nil,如果未加载或通过codehash可以获取)。
当部署合约或执行合约时,字节码会被设置到StateObject的Code字段中,并更新data.CodeHash,以太坊会利用CodeHash来缓存和验证代码,避免重复存储和加载。
源码中的关键包与函数
分析以太坊账户源码,主要关注以下几个关键包和函数:
core/state:定义了Account、StateObject等核心结构体,以及账户状态的加载、更新、提交逻辑。(*StateDB).GetStateObject(addr common.Address) *StateObject:根据地址获取账户对象。(*StateDB).CreateAccount(addr common.Address):创建新账户(通常用于合约创建)。(*StateObject).AddBalance(amount *big.Int)/(*StateObject).SubBalance(amount *big.Int):修改余额。(*StateObject).SetState(key, value common.Hash)/(*StateObject).GetState(key common.Hash) common.Hash:读写合约存储。(*StateDB).Commit():将所有状态变更提交到数据库。
core/types:定义了交易(Transaction)、区块(Block)等类型,其中交易中包含了发送方地址、接收方地址、Nonce、金额等信息,这些信息直接关联到账户操作。ethdb:定义了数据库接口,如Database,StateDB通过它与底层存储(如LevelDB)交互。
总结与展望
通过对以太坊账户源码的剖析,我们可以看到:
1