如何解包 Python 恶意可执行文件

安全 数据安全
使用 Python 编写的程序通常以源码的形式发布,也可以将所有依赖都打包到一个可执行文件中。那么如何解包 Python 恶意可执行文件呢?

使用 Python 编写的程序通常以源码的形式发布,也可以将所有依赖都打包到一个可执行文件中。那么如何解包 Python 恶意可执行文件呢?

打包

打包与加壳不同,打包 Python 程序的目的是创建一个可以在操作系统上独立运行的可执行文件。使用例如 PyInstaller 这类打包工具时,会执行以下操作:

  • 将所有.py 源文件编译为 python 字节码文件(.pyc文件)
  • 整合所有 python 编译的源代码和 python 依赖,包括依赖于操作系统的 python 解释器(Linux 上的 libpython3.9.so.1.0 或 Windows 上的 python37.dll)
  • 将所有资源都打包在一起,执行时将这些资源都解压到内存中,然后使用解释器解释执行原始 python 代码

以 Windows 平台为例,将示例代码使用 PyInstaller 进行打包:

示例代码

直接运行脚本文件是很容易的:

运行情况

打包如下所示:

打包情况

打包得到的 evil_program.exe可以直接运行,可得到与脚本相同的运行结果。此时,程序可以移动到另一个完全没有 Python 环境的机器上一样可以执行。

运行情况

在 Windows 上解包 Python<3.9

如果样本中可以看到很多以 py 开头的字符串,基本可以断定是一个打包的 Python 程序。

字符串

对于 PyInstaller 来说,还有独特字符串 MEIPASS。

监控运行程序时在临时文件夹中创建了哪些文件,就能够知道使用的 Python 版本。例如 python38.dll 意味着使用的是 Python 3.8 版本。

监控文件系统

想要恢复源代码,必须要保证:

  • 解压得到所有文件,特别是编译后的字节码文件(.pyc)
  • 反编译感兴趣的 .pyc 文件

解压可以使用 pyinstxtractor,使用相同版本的 Python 即可解压得到文件:

解压文件

pyinstxtractor 还额外提供了哪些是 Python 程序文件的信息,尽管存在误报但是也有很大的帮助。可以看到主文件是 evil_program.pyc:

提取文件

接着使用 uncompyle6进行反编译,值得注意的是 uncompyle6 只支持到 Python 3.8。

反编译

在 Linux 上解包 Python>=3.9

再次使用 pyinstxtractor 解压样本文件。由于样本是 64 位 ELF 文件,不能直接使用 pyinstxtractor 需要将文件的 pydata 转存到一个单独的文件再执行 pyinstxtractor。

转存文件

解包成功如下所示,也需要配合相应的 Python 版本:

解压文件

解压后的数据中有一个 RansomWare.pyc,就是需要关注的内容。由于使用 Python 3.9,需要 Decompyle++进行反编译。该工具美中不足的就是没有文档讲解如何进行构建,如下所示:

构建反编译工具

如果想要从任何地方调用 pycdc 命令,也可以运行 sudo make install。

pycdc 是反编译命令,使用它来恢复 RansomWare.pyc 的源代码:

反编译

当然,某些情况下也会遇到反编译失败的问题。但大部分代码还是可以正常进行反编译的:

反编译失败

反编译失败时,可以使用 pycdas 命令来恢复“反汇编”的字节码。

write_key() 函数的字节码反汇编

结论

本文介绍了如何解压和反编译使用 PyInstaller 打包的 Python 程序,在应对使用 Python 编写的恶意软件时可以在源码级进行分析,可以大大提高效率。

责任编辑:未丽燕 来源: FreeBuf.com
相关推荐

2021-01-08 08:06:19

脚本Shell文件

2021-01-12 10:10:41

shell脚本Linux命令

2015-02-02 11:03:12

2023-09-04 07:14:36

2010-02-22 18:04:27

CentOS mpla

2012-01-05 10:37:40

Java

2011-08-09 10:24:19

可执行文件病毒病毒

2021-01-14 22:17:09

PythonLinux工具

2017-02-07 10:22:53

2009-06-20 09:21:37

UNIXLINUX

2023-03-31 23:31:06

.go文本文件

2021-01-06 05:29:57

虚拟内存文件

2009-04-16 10:37:17

Javaexejar

2022-05-20 08:55:02

py文件exepython

2023-12-18 09:21:22

开发静态编译Linux

2009-10-28 13:03:54

2021-07-02 05:23:10

微软Edge浏览器

2020-06-08 08:38:24

可执行文件文件字符

2023-12-25 16:10:34

Linuxdconfig命令

2018-08-06 14:18:09

Linux应用程序技术
点赞
收藏

51CTO技术栈公众号