社区编辑申请
注册/登录
如何解包 Python 恶意可执行文件
安全 数据安全
使用 Python 编写的程序通常以源码的形式发布,也可以将所有依赖都打包到一个可执行文件中。那么如何解包 Python 恶意可执行文件呢?

使用 Python 编写的程序通常以源码的形式发布,也可以将所有依赖都打包到一个可执行文件中。那么如何解包 Python 恶意可执行文件呢?

打包

打包与加壳不同,打包 Python 程序的目的是创建一个可以在操作系统上独立运行的可执行文件。使用例如 PyInstaller 这类打包工具时,会执行以下操作:

  • 将所有.py 源文件编译为 python 字节码文件(.pyc文件)
  • 整合所有 python 编译的源代码和 python 依赖,包括依赖于操作系统的 python 解释器(Linux 上的 libpython3.9.so.1.0 或 Windows 上的 python37.dll)
  • 将所有资源都打包在一起,执行时将这些资源都解压到内存中,然后使用解释器解释执行原始 python 代码

以 Windows 平台为例,将示例代码使用 PyInstaller 进行打包:

示例代码

直接运行脚本文件是很容易的:

运行情况

打包如下所示:

打包情况

打包得到的 evil_program.exe可以直接运行,可得到与脚本相同的运行结果。此时,程序可以移动到另一个完全没有 Python 环境的机器上一样可以执行。

运行情况

在 Windows 上解包 Python<3.9

如果样本中可以看到很多以 py 开头的字符串,基本可以断定是一个打包的 Python 程序。

字符串

对于 PyInstaller 来说,还有独特字符串 MEIPASS。

监控运行程序时在临时文件夹中创建了哪些文件,就能够知道使用的 Python 版本。例如 python38.dll 意味着使用的是 Python 3.8 版本。

监控文件系统

想要恢复源代码,必须要保证:

  • 解压得到所有文件,特别是编译后的字节码文件(.pyc)
  • 反编译感兴趣的 .pyc 文件

解压可以使用 pyinstxtractor,使用相同版本的 Python 即可解压得到文件:

解压文件

pyinstxtractor 还额外提供了哪些是 Python 程序文件的信息,尽管存在误报但是也有很大的帮助。可以看到主文件是 evil_program.pyc:

提取文件

接着使用 uncompyle6进行反编译,值得注意的是 uncompyle6 只支持到 Python 3.8。

反编译

在 Linux 上解包 Python>=3.9

再次使用 pyinstxtractor 解压样本文件。由于样本是 64 位 ELF 文件,不能直接使用 pyinstxtractor 需要将文件的 pydata 转存到一个单独的文件再执行 pyinstxtractor。

转存文件

解包成功如下所示,也需要配合相应的 Python 版本:

解压文件

解压后的数据中有一个 RansomWare.pyc,就是需要关注的内容。由于使用 Python 3.9,需要 Decompyle++进行反编译。该工具美中不足的就是没有文档讲解如何进行构建,如下所示:

构建反编译工具

如果想要从任何地方调用 pycdc 命令,也可以运行 sudo make install。

pycdc 是反编译命令,使用它来恢复 RansomWare.pyc 的源代码:

反编译

当然,某些情况下也会遇到反编译失败的问题。但大部分代码还是可以正常进行反编译的:

反编译失败

反编译失败时,可以使用 pycdas 命令来恢复“反汇编”的字节码。

write_key() 函数的字节码反汇编

结论

本文介绍了如何解压和反编译使用 PyInstaller 打包的 Python 程序,在应对使用 Python 编写的恶意软件时可以在源码级进行分析,可以大大提高效率。

责任编辑:未丽燕 来源: FreeBuf.com
相关推荐

2022-04-11 11:38:44

Python代码游戏

2022-05-20 08:55:02

py文件exepython

2022-05-03 22:25:57

Python浏览器语言

2022-05-07 07:26:05

PyScriptHTMLPython 代码

2022-05-03 23:44:21

Python动态链接库Ctypes

2022-05-02 16:27:01

JavaScriptHTMLPython

2022-05-25 07:11:13

2022-04-13 18:40:59

Python开发

2022-05-17 09:14:50

聚类算法python

2022-05-10 16:04:40

编程语言PythonC语言

2022-04-19 08:29:12

Python机器学习

2022-05-10 07:24:19

2022-04-15 11:30:59

代码,Python保存视频

2022-03-18 21:27:36

Python无代码

2022-03-16 19:36:16

Python工具代码

2022-04-12 08:43:21

Python内置模块

2022-04-24 10:12:25

Python软件包代码

2022-05-16 09:34:17

Python可视化图表

2022-04-11 13:37:54

编程语言PythonMATLAB

2022-05-16 13:37:12

Sysrv僵尸网络微软

同话题下的热门内容

Veeam公布2022年勒索软件趋势:受害者只能恢复69%的受损数据POWERSUPPLaY:电源变扬声器,泄漏你的隐私信息构建数据成熟度模型和数据成熟度的四个阶段数据访问管理基础和实施策略

编辑推荐

网络管理员的利器之9款值得关注的Ping监控工具2020年漏洞扫描工具Top10细说七大邮件安全协议的实现原理安全趣闻 | “ji32k7au4a83”竟然是一个典型弱密码用于渗透测试的10种漏洞扫描工具
我收藏的内容
点赞
收藏

51CTO技术栈公众号