首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >rbpf虚拟机-码

rbpf虚拟机-码

作者头像
盹猫
发布2025-07-22 18:46:19
发布2025-07-22 18:46:19
8900
代码可运行
举报
运行总次数:0
代码可运行

一、概述

该篇文章是rbpf不同码之间关系和作用的整理。

(学习该虚拟机的目的是为了搞懂solana合约的执行方式,solana使用的rbpf是在该虚拟机上进行扩展。)

二、码的定义

2.1 汇编码

汇编码​(Assembly Code)是 ​汇编语言 的代码形式,它是低级语言的一种,介于高级语言(如 C、C++)和机器码之间。汇编码使用助记符和符号来表示机器指令,比直接使用二进制的机器码更易于人类阅读和编写,但仍然与特定的硬件架构密切相关。

2.2 字节码

字节码​(Bytecode)是一种中间表示形式(Intermediate Representation, IR),它是介于高级语言(如 Java、Python)和机器码之间的一种指令集。字节码通常由虚拟机(如 JVM、Python 解释器)解释执行,或者通过 ​JIT 编译器 动态编译为目标机器的机器码。

2.3 机器码

机器码​(Machine Code)是 ​CPU 直接执行的二进制指令,它是计算机硬件能够理解和执行的最低级语言形式。机器码是编译器或汇编器将高级语言(如 C、C++)或汇编语言翻译为的最终形式,直接在 CPU 上运行。

汇编码是语言,字节码是过渡,机器码是最终执行。

三、码样式

3.1 汇编码

常用的x86 是一种变长指令集架构,汇编码通常以助记符表示,指令长度从 1 字节到 15 字节不等 示例 1:将立即数 42 加载到寄存器 eax

代码语言:javascript
代码运行次数:0
运行
复制
mov eax, 42

​解释:

  • mov 是操作码,表示“移动”。
  • eax 是目标寄存器。
  • 42 是立即数。

3.2 字节码

​eBPF 字节码 是 eBPF 程序的中间表示形式,例如下述样式:

代码语言:javascript
代码运行次数:0
运行
复制
let prog = &[
     0xb7, 0x10, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00,
     0x95, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00
];

不同语言的字节码不同,如java虚拟机(JVM),使用自己独有字节码格式:

代码语言:javascript
代码运行次数:0
运行
复制
Compiled from "Example.java"
public class Example {
  public Example();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]);
    Code:
       0: bipush        10                 // 将常量 10 压入栈
       2: istore_1                         // 存储到局部变量表索引 1(a)
       3: bipush        20                 // 将常量 20 压入栈
       5: istore_2                         // 存储到局部变量表索引 2(b)
       6: iload_1                          // 加载局部变量表索引 1(a)
       7: iload_2                          // 加载局部变量表索引 2(b)
       8: iadd                             // 整数加法
       9: istore_3                         // 存储结果到局部变量表索引 3(c)
      10: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
      13: iload_3                          // 加载局部变量表索引 3(c)
      14: invokevirtual #3                  // Method java/io/PrintStream.println:(I)V
      17: return
}

3.3 机器码

eBPF 机器码是特定于硬件架构的二进制指令,可以直接在 CPU 上运行。 不同架构的机器码完全不同。例如:

  • x86_64 架构的机器码:B8 2A 00 00 00
  • ARM 架构的机器码:E3 A0 00 2A

四、转换代码

4.1 汇编码-字节码(汇编器)

代码语言:javascript
代码运行次数:0
运行
复制
pub fn assemble(src: &str) -> Result<Vec<u8>, String> {
    let parsed = (parse(src))?;
    //Ok([Instruction { name: "mov", operands: [Register(0), Integer(0)] }, Instruction { name: "add", operands: [Register(1), Integer(2)] }])
    let insns = (assemble_internal(&parsed))?;

    let mut result: Vec<u8> = vec![];
    for insn in insns {
        result.extend_from_slice(&insn.to_array());
    }
    Ok(result)
}

汇编器就要是通过assemble方法,先对指令进行割形成列表,然后通过对不同的op码进行分类后形成对应的字节码数据。

4.2 字节码->汇编码(反汇编器)

代码语言:javascript
代码运行次数:0
运行
复制
pub fn disassemble(prog: &[u8]) {
    #[cfg(feature = "std")]
    {
        for insn in to_insn_vec(prog) {
            println!("{}", insn.desc);
        }
    }

反汇编则通过循环的方式切割字节码指令信息,同样通过op码进行分类转换为对应的字符串信息.

详情请查看文章:rbpf虚拟机-编译与反编译器

4.3 字节码->机器码(JIT即时编译)

  • 设置函数入口,保存寄存器状态,初始化内存指针。
  • 根据 use_mbuff 和 update_data_ptr 的值,处理内存缓冲区(mbuff)和- 数据指针。
  • 分配栈空间,用于存储局部变量和临时数据。
  • 逐条翻译 eBPF 指令为目标机器码,支持多种指令类型(加载、存储、算术运算、跳转等)。
  • -修正跳转指令的目标地址,确保控制流的正确性。
  • -Epilogue(函数出口)​

五、总结

通过上述对不同码之间的区分,对各种格式码之间的关系认识更加清晰,同时对不同码之间的转换有了一定了解。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2025-07-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、概述
  • 二、码的定义
    • 2.1 汇编码
    • 2.2 字节码
    • 2.3 机器码
  • 三、码样式
    • 3.1 汇编码
    • 3.2 字节码
    • 3.3 机器码
  • 四、转换代码
    • 4.1 汇编码-字节码(汇编器)
    • 4.2 字节码->汇编码(反汇编器)
    • 4.3 字节码->机器码(JIT即时编译)
  • 五、总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档