最近基于puerts做了个nodejs addon,能让nodejs方便的调用c++的库。拿一个比较知名的同类方案v8pp做对比:
相同点
先列几个不同点
puerts不仅仅想做更好的v8/C++绑定方案,还通过“跨语言交互”抽象出来的一套api,定义了一个语言无关的原生addon标准。该标准的addon无需重新编译可以在实现了该标准的游戏引擎(UE /Unity),nodejs、lua等环境加载使用。可以下载这个工程体验一下:puerts_addon_demos,也期待该标准的更多语言支持。
反观nodejs原生addon,要在同出一源的electron加载也要用electron的工具重新构建:using-native-node-modules
class HelloWorld
{
public:
HelloWorld(int p) {
Field = p;
}
void Foo(std::function<bool(int, int)> cmp) {
bool ret = cmp(Field, StaticField);
std::cout << "Foo, Field: " << Field << ", StaticField: " << StaticField << ", compare result:" << ret << std::endl;
}
static int Bar(std::string str) {
std::cout << "Bar, str:" << str << std::endl;
return StaticField + 1;
}
int Field;
static int StaticField;
};
int HelloWorld::StaticField = 0;
UsingCppType(HelloWorld);
void Init() {
puerts::DefineClass<HelloWorld>()
.Constructor<int>()
.Method("Foo", MakeFunction(&HelloWorld::Foo))
.Function("Bar", MakeFunction(&HelloWorld::Bar))
.Property("Field", MakeProperty(&HelloWorld::Field))
.Variable("StaticField", MakeVariable(&HelloWorld::StaticField))
.Register();
}
//hello_world is module name, will use in js later.
PESAPI_MODULE(hello_world, Init)
const puerts = require("puerts");
let hello_world = puerts.load('path/to/hello_world');
const HelloWorld = hello_world.HelloWorld;
const obj = new HelloWorld(101);
obj.Foo((x, y) => x > y);
HelloWorld.Bar("hello");
HelloWorld.StaticField = 999;
obj.Field = 888;
obj.Foo((x, y) => x > y);
local puerts = require "puerts"
local hello_world = puerts.load('path/to/hello_world')
local HelloWorld = hello_world.HelloWorld
local obj = HelloWorld(101)
obj:Foo(function(x, y)
return x > y
end)
HelloWorld.Bar("hello")
HelloWorld.StaticField = 999
obj.Field = 888
obj:Foo(function(x, y)
return x > y
end)
编译好addon后,可以用puerts提供的工具生成声明文件。
先安装puerts工具
npm install -g puerts
将声明文件生成到typing目录
puerts gen_dts path\to\your\addon -t typing
打开声明文件typing\module_name\index.d.ts,可以看到针对声明的C++类的ts声明:
declare module "hello_world" {
import {$Ref, $Nullable, cstring} from "puerts"
class HelloWorld {
constructor(p0: number);
Field: number;
static StaticField: number;
static Bar(p0: string) :number;
Foo(p0: (p0:number, p1:number) => boolean) :void;
}
}
把typing目录加到ts工程的tsconfig.json的compilerOptions/typeRoots即可享受代码提示、检查之乐。
上面js调用代码的ts版本如下:
import {load} from "puerts";
import * as HelloWorldModlue from 'hello_world'
let hello_world = load<typeof HelloWorldModlue>('path/to/hello_world');
const HelloWorld = hello_world.HelloWorld;
const obj = new HelloWorld(101);
obj.Foo((x, y) => x > y);
HelloWorld.Bar("hello");
HelloWorld.StaticField = 999;
obj.Field = 888;
obj.Foo((x, y) => x > y);
通过HelloWorld例子我们初步了解了puerts for node的初步使用,想进一步使用请看文档和例子。
接下来我们讲下设计、实现相关的东东。篇幅的关系只讲两个主题:
笔者从xLua到puerts,使用过脚本引擎/虚拟机有:lua、v8、jscore、quickjs、wasm3等等,感觉脚本引擎/虚拟机和宿主交互来来去去就那么回事,于是萌生了一个“做一套跨虚拟机的FFI抽象”的想法。
这些引擎有的提供的是C接口,有的提供的是C++接口,这抽象接口用哪个语言好?
很显然应该用C,它兼容性更好,有可能有些环境只能用C,而且一个动态库和可执行程序之间的接口如果用到了C++的类型(std::string, std::shared_ptr等),两边使用的C++版本不一样很容易导致崩溃,如果这些不能用,为何不直接用C?
虚拟机调用宿主的一个函数,其实是调用宿主注册的一个特定接口的回调,回调中读取参数调用实际函数后,把结果返回给虚拟机。每个虚拟机对这回调的定义基本都不一样,也很难评个高下。最终定了如下回调签名。
typedef struct pesapi_callback_info__* pesapi_callback_info; typedef void (*pesapi_callback)(pesapi_callback_info info);
主要是基于两点考虑:
typedef JSValue JSCFunctionData(JSContext *ctx, JSValueConst this_val, int argc, JSValueConst *argv, int magic, JSValue *func_data);
虽然差别很大:有很多参数,而且有返回值。我们可以这么适配一下
struct pesapi_callback_info__ {
JSContext *ctx;
JSValueConst this_val;
int argc;
JSValueConst *argv;
int magic;
JSValue *func_data;
JSValue result;
};
[](JSContext *ctx, JSValueConst this_val, int argc, JSValueConst *argv, int magic, JSValue *func_data) {
pesapi_callback_info__ callbackInfo;
callbackInfo.ctx = ctx;
callbackInfo.this_val = this_val;
callbackInfo.argc = argc;
callbackInfo.argv = argv;
callbackInfo.magic = magic;
callbackInfo.func_data = func_data;
pesapi_callback callback = (pesapi_callback)(JS_VALUE_GET_PTR(func_data[0]));
callback(callbackInfo);
return callbackInfo.result;
}
翻到前面的HelloWorld例子,有这么一行:
PESAPI_MODULE(hello_world, Init)
PESAPI_MODULE是一个宏,这将会在addon动态库中定义几个入口,其中最重要是一个addon初始化函数,实现了“跨虚拟机的抽象接口”的程序加载addon后会主动调用,传入前面说的那一系列接口实现函数的指针。
前面说的“跨虚拟机的抽象接口”叫pesapi,是Portable Embedded Scripting API的缩写,整套API的描述只有一个200多行的简单纯c头文件。
纯用这套api去编写addon也是可以的,这种方式仅仅依赖一个头文件和一个c文件,不依赖任何库。这是一个例子:tiny_c
可以看到比较繁琐,前面的HelloWorld使用的声明式绑定方式简单很多,也仅仅多依赖些头文件和C++14,不需要依赖node或者v8。
我们对一个C++类进行声明式绑定,默认编译后生成的是对pesapi的调用,好处是这种addon不依赖于任何的脚本引擎/虚拟机,以二进制形式发布,可以在任意支持pesapi的环境使用,但它也有缺点:脚本引擎/虚拟机的API先封装成pesapi再被addon调用,性能会有一些损失。
具体可以看这个对比测试工程:puerts_node_performance,主页有多个平台的测试结果,其中puerts_perf即为模板绑定+pesapi的测试,作为对比的v8api_perf则是手工调用v8 api的测试,还是有不小的性能损失的。
napi_perf是手工调用nodejs的napi实现的addon,napi和pesapi类似,都是封装成c接口给addon调用(ps:pesapi的设计也有参考napi),它的测试数据和puerts模板绑定+pesapi是差不多的,可见性能损失更多的源于c接口的封装。
代码不需要修改,只需编译时加入PES_EXTENSION_WITH_V8_API宏即可获得相当大的性能提升,顾名思义加了这个宏,模板将改为调用v8 api而不是pesapi,puerts_v8_perf即是这种方式编译的addon,性能比较接近v8api_perf,远比同样是模板+v8 api的v8pp性能要好(v8pp_pref)。
当然,也有代价的,这导致v8 api的依赖,addon编译需要加入v8,而且这种addon也不能在其它虚拟机上跑。
v8有一个甚少人知道和使用的特性:fast api call。
前面也说过原生调用是通过特定形式的回调来实现,每一个参数处理都至少有一次函数调用,而fast api call是根据函数签名信息,用TurboFan编译器运行时jit生成代码完成虚拟机内部Calling Convention到原生Calling Convention的转换,可能一个参数只需要简单的一个指令。
这特性也有一些坑:
const Add = Calc.Add
Add(1, 2) // fast
Calc.Add(1, 2) // very slow
网络甚少fast api call的资料,只能结合源码去摸索去解决这些问题,所幸都搞定了。
之前puerts_v8_perf不需要修改代码,只需:
即可享用这巨大的性能提升。实测puerts_fastcall_perf比v8api_perf还要快1~2倍。