前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python操作AST解JS混淆

Python操作AST解JS混淆

作者头像
李玺
发布2022-11-02 18:21:34
1.9K0
发布2022-11-02 18:21:34
举报
文章被收录于专栏:爬虫逆向案例

通过生成语法树(AST),可快速修改代码中的一些混淆处理,从而简化代码,便于后续分析。

本文通过Python来把JS转为AST并进行简单的操作,内容很简单。

比如我们下图中的JS代码,有sum和minus两个函数,一个变量a,两个换行\n,以及一次sum函数的调用,参数为1和2。

通过pyjsparser库将script代码转换成为json-ast格式。

pyjsparser是目前用于 python 的相对便捷和易理解的 JavaScript 解析器。可将JavaScript翻译成Python,即在Python中运行JavaScript代码。

代码语言:javascript
复制
import pyjsparser
js_ast = pyjsparser.parse(script)

转换后用Json格式化工具打开。

在body下的元素有这几种类型:

代码语言:javascript
复制
    函数声明:FunctionDeclaration

      空语句(\n):EmptyStatement

      变量声明:VariableDeclaration

      表达式语句:ExpressionStatement

根据Json可看到FunctionDeclaration中有基本的函数名、参数名、参数类型、块语句和返回语句等。

此外,表达式语句中还有调用表达式(CallExpression)、二元表达式(BinaryExpression)、赋值表达式(AssignmentExpression)等等。

那么我们就可以通过这些Type,以修改Json对象的方式去操作这棵语法树。比如根据是否被调用去删除一些无用的对象,删除未调用的函数,或根据规则去替换一些结构,修改一些节点。

接下来看这段代码

假如这是一段时间长并且难以阅读的代码,我们需要先将其转为AST,然后遍历所有函数,来查找未被调用的方法,然后进行删除,再根据AST转回正常的JS代码。

代码语言:javascript
复制
# 完整代码如下,大家自己试试删除无用变量a吧!
# js2py依赖于pyjsparser,所以安装js2py即可安装pyjsparser
# pip install js2py
script = '''
    function sum(a,b){  
        c = minus(2,3)
        return a+c;
    };

    function minus(a2,b2){  
        return a2-b2;
    };

    function dddd(a2,b2){  
        return a2-b2;
    };

    var a = 123;
    sum(1,2)
'''

import pyjsparser
js_ast = pyjsparser.parse(script)
# 获取所有方法
funcList = []
for i in js_ast['body']:
    if i['type'] =='FunctionDeclaration':
        name = i['id']['name']
        funcList.append(name)

# 查找未被调用的方法
noCallList = []
for func in funcList:
    searchStatement = "{'type': 'CallExpression', 'callee': {'type': 'Identifier', 'name': '%s'}"%func
    if searchStatement not in str(js_ast):
        noCallList.append(func)

# 删除未调用的方法
for i in js_ast['body']:
    if i['type'] =='FunctionDeclaration':
        if i['id']['name'] in noCallList:
            js_ast['body'].remove(i)

#js_ast['body'][0]['id']['name'] = 'pythonlx'  # 修改一个函数名

# 用AST重新生成js代码
import js2py.py_node_modules.escodegen as escodegen
escodegen = escodegen.var.get('escodegen')
res = escodegen.get('generate')(js_ast)
print(res.to_python()

执行后,可以发现未被调用的dddd方法已经被删除。

代码很简单,大家试试如何删除无关变量a吧!

本文牛刀小试,更多内容我们后续再见!

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-10-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档