Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >python pyc文件解析_pyc文件

python pyc文件解析_pyc文件

作者头像
全栈程序员站长
发布于 2022-09-07 02:47:34
发布于 2022-09-07 02:47:34
1.5K0
举报

大家好,又见面了,我是你们的朋友全栈君。

code object¶

在我们导入 python 脚本时在目录下会生成个一个相应的 pyc 文件,是pythoncodeobj的持久化储存形式,加速下一次的装载。

文件结构¶

pyc文件由三大部分组成

最开始4个字节是一个Maigc int, 标识此pyc的版本信息

接下来四个字节还是个int,是pyc产生的时间

序列化的 PyCodeObject,结构参照include/code.h,序列化方法python/marshal

pyc完整的文件解析可以参照

关于co_code

python3.6 以上参数永远占1字节,如果指令不带参数的话则以0x00代替,在运行过程中被解释器忽略,也是Stegosaurus技术原理;而低于python3.5的版本中指令不带参数的话却没有0x00填充

例题¶

首先尝试pycdc反编译失败

# Source Generated with Decompyle++

# File: imgenc.pyc (Python 2.7)

import sys

import numpy as np

from scipy.misc import imread, imsave

def doit(input_file, output_file, f):

Unsupported opcode: STOP_CODE

img = imread(input_file, flatten = True)

img /= 255

size = img.shape[0]

# WARNING: Decompyle incomplete

注意到是python2.7,也就是说指令序列共占1字节或3字节(有参数无参数)

使用pcads得到

imgenc.pyc (Python 2.7)

67 STOP_CODE

68 STOP_CODE

69 BINARY_DIVIDE

70 JUMP_IF_TRUE_OR_POP 5

73 LOAD_CONST 3: 0

76 LOAD_CONST 3: 0

79 BINARY_DIVIDE

定位到出错的地方,观察发现 LOAD_CONST LOAD_CONST BINARY_DIVIDE STORE_FAST opcodes (64 03 00 64 03 00 15 7d 05 00)被破坏了,根据上下文线索修复后

00000120 64 04 00 6b 00 00 72 ce 00 64 03 00 64 03 00 15 |d..k..r..d..d…|

00000130 7d 05 00 64 03 00 64 03 00 15 7d 05 00 64 03 00 |}..d..d…}..d..|

00000140 64 03 00 15 7d 05 00 64 03 00 64 03 00 15 7d 05 |d…}..d..d…}.|

00000150 00 64 03 00 64 03 00 15 7d 05 00 64 03 00 64 03 |.d..d…}..d..d.|

00000160 00 15 7d 05 00 64 03 00 64 03 00 15 7d 05 00 64 |..}..d..d…}..d|

00000170 03 00 64 03 00 15 7d 05 00 64 03 00 64 03 00 15 |..d…}..d..d…|

00000180 7d 05 00 64 03 00 64 03 00 15 7d 05 00 64 03 00 |}..d..d…}..d..|

00000190 64 03 00 15 7d 05 00 64 03 00 64 03 00 15 7d 05 |d…}..d..d…}.|

000001a0 00 64 03 00 64 03 00 15 7d 05 00 64 03 00 64 03 |.d..d…}..d..d.|

000001b0 00 15 7d 05 00 64 03 00 64 03 00 15 7d 05 00 6e |..}..d..d…}..n|

接下来根据修复好的python源代码得到flag即可

延伸:

Tools¶

将python字节码转换为可读的python 源代码,包含了反汇编(pycads)和反编译(pycdc)两种工具

允许我们在Python字节码文件(pyc或pyo)中嵌入任意Payload。由于编码密度较低,因此我们嵌入Payload的过程既不会改变源代码的运行行为,也不会改变源文件的文件大小

原理是在python的字节码文件中,利用冗余空间,将完整的payload代码分散隐藏到这些零零碎碎的空间中.

评论

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/147972.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
如何破解一个Python虚拟机壳并拿走12300元ETH
之前在群里看到有人发了一个挑战,号称将 5 ETH 的私钥放在了加密的代码中,只要有人能解密就可以取走,所以我又管不住自己这双手了。
evilpan
2023/02/12
5710
如何破解一个Python虚拟机壳并拿走12300元ETH
Python写的Python解释器(四)
真正的Python字节码 现在让进入真正的Python字节码中,从一个简单的函数开始:
哒呵呵
2018/08/06
6400
一文让你完全弄懂Stegosaurus
国内关于 Stegosaurus 的介绍少之又少,一般只是单纯的工具使用的讲解之类的,并且本人在学习过程中也是遇到了很多的问题,基于此种情况下写下此文,也是为我逝去的青春时光留个念想吧~
Angel_Kitty
2018/12/19
1.2K0
简单入门python字节码混淆
我就是小菜鸡本鸡了,不是很会写东西,请各位大佬多多见谅。本文基于python2.7,因为python3并不是很懂。
ChaMd5安全团队
2019/05/07
2.4K1
你了解 Python 字节码的原理吗?
如果你曾经写过或者用过 Python,你可能已经习惯了看到 Python 源代码文件;它们的名称以.Py 结尾。你可能还见过另一种类型的文件是 .pyc 结尾的,它们就是 Python “字节码”文件。这里转载一篇文章,专门讲解 Python 字节码的相关内容,给大家看看。
崔庆才
2019/06/14
2.6K0
你了解 Python 字节码的原理吗?
【PY】Python3 字节码详解
在逆向的时候遇到过反编译 py 字节码,之前也就没咋在意,啥不会查就完事儿了,好家伙,省赛让我给遇到了,直接嘤嘤嘤😭,但还好解出来了;
sidiot
2023/08/31
3450
【PY】Python3 字节码详解
[oeasy]python0135_python_语义分析_ast_抽象语法树_abstract_syntax_tree
print("1982------Guido in cwi") print("1995------Guido in cnri") print("2000------Guido in beopen") print("2005------Guido in google") print("2012------Guido in dropbox") print("2020------Guido in microsoft")
oeasy
2023/04/16
4200
[oeasy]python0135_python_语义分析_ast_抽象语法树_abstract_syntax_tree
Python 高级教程之探索 Python code object
Code objects 是 CPython 实现的低级细节。 代码对象是 CPython 对一段可运行 Python 代码的内部表示,例如函数、模块、类体或生成器表达式。当你运行一段代码时,它会被解析并编译成一个代码对象,然后由 CPython 虚拟机 (VM) 运行。代码对象包含直接操作 VM 内部状态的指令列表,例如“将堆栈顶部的两个对象加在一起,将它们弹出,然后将结果放入堆栈”。这类似于像 C 这样的语言的工作方式:您将代码编写为人类可读的文本,该代码由编译器转换为二进制格式,然后运行二进制代码(C 的机器代码和 Python 的所谓字节码)直接由 CPU(对于 C)或由 CPython VM 的虚拟 CPU 执行。
海拥
2022/05/07
7500
Python 之父亲自优化解释器性能
2020 年 11 月 Python 之父(Guido)加入微软,按他个人的说法是自己的退休生活太无聊了。站在现在的这个时间点,一年半的时间过去了。Guido 的工作中对开发者来说感知最强的应该数 Cpython 解释器的性能优化了。
初代庄主
2022/09/22
3150
Python 之父亲自优化解释器性能
[oeasy]python0010 - python虚拟机解释执行py文件的原理
​解释运行程序 🥊回忆上次内容我们这次设置了断点设置断点的目的是更快地调试调试的目的是去除​​bug​​别害怕​​bug​​一步步地总能找到​​bug​​这就是程序员基本功调试​​debug​​我心中还是有疑问​​python3​​ 是怎么解释​​hello.py​​ 的?🤔纯文本我们的py文件是一个纯文本文件​编辑​打开我们的guido.py​如果没有就新做一个这里面是一个个的字符print("1982------Guido in cwi")print("1995------Guido in cnri
oeasy
2022/10/21
4940
[oeasy]python0010 - python虚拟机解释执行py文件的原理
python数据分析源码_python 统计分析
第一步克隆 Cpython 仓库到本地, 切换到我当前的版本, 我当前的版本号是 3.8.0a0
全栈程序员站长
2022/09/24
5870
python数据分析源码_python 统计分析
通过内置对象理解 Python(二)
在上一节的基础上,下面从一些最有趣的内容开始,这些内容构建了 Python 作为一种语言的基础,逐一对内置函数进行探讨。
老齐
2021/11/04
4050
一个关于 += 的谜题
当时看到这个问题,第一反应就是选 2。因为 tuple 是不可变对象,不支持对它的元素赋值,会报错。
AlwaysBeta
2022/02/28
3190
Python的Sequence切片下标问题
在python中, 切片是一个经常会使用到的语法, 不管是元组, 列表还是字符串, 一般语法就是:
Lin_R
2018/10/22
9870
Python dis 模块初步使用
Python 代码先被编译为字节码后,再由Python虚拟机来执行字节码, Python的字节码是一种类似汇编指令的中间语言, 一个Python语句会对应若干字节码指令,虚拟机一条一条执行字节码指令, 从而完成程序执行。 Python dis 模块支持对Python代码进行反汇编, 生成字节码指令。 先来一小段代码:
py3study
2020/01/07
1.1K0
详解Python的is操作符
is 操作符是Python语言的一个内建的操作符。它的作用在于比较两个变量是否指向了同一个对象。 与 == 的区别 class A(): def __init__(self, v): self.value = v def __eq__(self, t): return self.value == t.value a = A(3) b = A(3) print a == b print a is b 这个结果是True,False。因为我们重写了__
海纳
2018/03/02
8110
python 基准测试(cProfile \ kcachegrind \ line_profiler \ memory_profiler)
该包可以了解代码是如何转换为字节码的, dis 表示 disassemble 反汇编
Michael阿明
2022/09/21
1.4K0
python 基准测试(cProfile \ kcachegrind \ line_profiler \ memory_profiler)
【PY】Python3 字节码混淆
emmm,关于字节码混淆,最早碰到还是在校赛的时候,当时一脸懵逼,什么情况,怎么 uncompyle6 不能反编译 pyc 了,不过之后也就不了了之了,今天特地写此博文纪念 DASCTF Oct X 吉林工师魔法赛 中的一道 RE 题 —— 魔法叠加,出题人是真的阴间💩  
sidiot
2023/08/31
5260
【PY】Python3 字节码混淆
初识Python(一)
默认执行上述的hello.py文件,需要明确的指出hello.py脚本由python解释器来执行,即python hello.py。
py3study
2020/01/11
4320
笨办法学 Python3 第五版(预览)(二)
现在你将把函数与你从之前练习中了解到的变量结合起来。如你所知,变量给数据片段一个名称,这样你就可以在程序中使用它。如果你有这段代码:
ApacheCN_飞龙
2024/03/03
2540
笨办法学 Python3 第五版(预览)(二)
相关推荐
如何破解一个Python虚拟机壳并拿走12300元ETH
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档