当前位置: 首页 > news >正文

HagiCode Skill 系统技术解析:如何打造可扩展的 AI 技能管理平台铀

环境安装

pip install keystone-engine capstone unicorn

这3个工具用法极其简单,下面通过示例来演示其用法。

Keystone

示例

from keystone import *

CODE = b"INC ECX; ADD EDX, ECX"

try:

ks = Ks(KS_ARCH_X86, KS_MODE_64)

encoding, count = ks.asm(CODE)

print(f"汇编指令数量: {count}")

print(f"机器码 (十进制): {encoding}")

print(f"机器码 (Hex): {''.join(f'{x:02x}' for x in encoding)}")

except KsError as e:

print(f"ERROR: {e}")

代码解释

代码流程十分简单:

初始化keystone->编译代码->输出结果

初始化keystone

ks = Ks(KS_ARCH_X86, KS_MODE_64)

初始化keystone引擎:

第一个参数:选择指令架构例如:x86,arm......

第二个参数:选择模式,例如:64位,32位,小端序......

编译代码

将汇编转换为16进制的shellcode

encoding, count = ks.asm(CODE)

第一个返回值:机器码指令的数组

第二个返回值:汇编指令数量

Capstone

capstone的用法和keystone差不多。

示例

from capstone import *

CODE = b"\xff\xc1\x01\xca"

md = Cs(CS_ARCH_X86, CS_MODE_64)

print("地址\t\t指令\t\t操作数")

print("-" * 30)

for i in md.disasm(CODE, 0x1000):

print(f"0x{i.address:x}:\t{i.mnemonic}\t{i.op_str}")

代码解释

代码流程跟keystone差不多:

初始化capstone->反编译代码->输出结果

初始化capstone

md = Cs(CS_ARCH_X86, CS_MODE_64)

初始化capstone引擎:

第一个参数:选择指令架构例如:x86,arm......

第二个参数:选择模式,例如:64位,32位,小端序......

反编译代码

for i in md.disasm(CODE, 0x1000):

print(f"0x{i.address:x}:\t{i.mnemonic}\t{i.op_str}")

使用方法disasm反汇编:

第一个参数:机器码

第二个参数:第一条指令的基地址

返回:一个包含指令对象的数组

unicorn

unicorn提供的方法使用也不复杂,但需要一定的内存基础知识。

下面用一个案例解释。

示例

情景模拟: 我逆向过程中发现一个xor加密代码,我需要通过模拟执行,对密文进行解密。

根据汇编代码可以得知:

0x20000存放密文

0x30000存放结果

0x10000中读取密钥key

from unicorn import *

from unicorn.x86_const import *

import struct

from keystone import *

ASM_CODE = """

MOV ECX, 5

MOV ESI, 0x20000

MOV EDI, 0x30000

MOV BL, byte ptr [0x10000]

loop_start:

LODSB

XOR AL, BL

STOSB

LOOP loop_start

"""

def get_code():

ks = Ks(KS_ARCH_X86, KS_MODE_32)

encoding, count = ks.asm(ASM_CODE)

return bytes(encoding)

CODE = get_code()

ADDRESS_CODE = 0x400000

ADDRESS_KEY = 0x10000

ADDRESS_IN = 0x20000

ADDRESS_OUT = 0x30000

REAL_KEY = 0x77

CIPHER_TEXT = b"\x3F\x12\x1B\x1B\x18"

def hook_code(uc, access, address, size, value, user_data):

if address == ADDRESS_KEY:

key_value = uc.mem_read(address, size)

print(f"key: {hex(key_value[0])}")

def start_emulation():

try:

print("初始化环境...")

mu = Uc(UC_ARCH_X86, UC_MODE_32)

mu.mem_map(0x0, 1 * 1024 * 1024)

mu.mem_map(ADDRESS_CODE, 2 * 1024 * 1024)

mu.mem_write(ADDRESS_CODE, CODE)

mu.mem_write(ADDRESS_IN, CIPHER_TEXT)

mu.mem_write(ADDRESS_KEY, struct.pack("B", REAL_KEY))

mu.hook_add(UC_HOOK_MEM_READ, hook_code)

mu.emu_start(ADDRESS_CODE, ADDRESS_CODE + len(CODE))

decrypted_text = mu.mem_read(ADDRESS_OUT, 5)

print(f"解密后的文本: {decrypted_text.decode()}")

except UcError as e:

print(f"模拟错误: {e}")

if __name__ == "__main__":

start_emulation()

代码解释

代码流程:

初始化环境->分配虚拟内存->写入数据->添加捕获操作->模拟执行指令->读取内存结果

初始化环境

这个跟上面的keystone和capstone一样,就不解释了

mu = Uc(UC_ARCH_X86, UC_MODE_32)

分配虚拟内存

第一行是用于存放堆内存数据,第二行是用于存放执行的代码

mu.mem_map(0x0, 1 * 1024 * 1024)

mu.mem_map(ADDRESS_CODE, 2 * 1024 * 1024)

mem_map用于初始化虚拟内存

第一个参数:内存的虚拟地址基址

第二个参数:内存的大小

内写入数据

第一行写入代码,第二行写入密文,第三行写入解密key

mu.mem_write(ADDRESS_CODE, CODE)

mu.mem_write(ADDRESS_IN, CIPHER_TEXT)

mu.mem_write(ADDRESS_KEY, struct.pack("B", REAL_KEY))

mem_write用于写入虚拟内存

第一个参数:写入内存的地址

第二个参数:写入内存的数据

添加捕获操作

hook用于捕获数据,这里用于捕获key

def hook_code(uc, access, address, size, value, user_data):

if address == ADDRESS_KEY:

key_value = uc.mem_read(address, size)

print(f"key: {hex(key_value[0])}")

mu.hook_add(UC_HOOK_MEM_READ, hook_code)

hook_add添加hook

第一个参数:捕获模式,规定什么时候触发hook,例如:读取内存,中断捕获......

第二个参数:触发的回调函数,回调函数各个参数如下:

def hook_code(uc, access, address, size, value, user_data):

uc:模拟器对象

access:当前访问类型:UC_MEM_READ,UC_MEM_WRITE......

address:当前访问的虚拟地址

size:当前访问数据大小

value:access为UC_MEM_WRITE,则这里为要写入的值

user_data:用户在add_hook时传进去的自定义数据

模拟执行指令

mu.emu_start(ADDRESS_CODE, ADDRESS_CODE + len(CODE))

第一个参数:模拟执行的起始地址

第二个参数:模拟执行的代码大小

读取内存结果

decrypted_text = mu.mem_read(ADDRESS_OUT, 5)

第一个参数:读取内存的地址

第二个参数:读取内存的大小琶任盘褪

http://www.jsqmd.com/news/626015/

相关文章:

  • Qwen3-4B Instruct-2507开源镜像实操:Streamlit极速文本对话一键部署
  • RAG 还是 Lucene:私有化部署客服系统的 AI 知识库架构选型闹
  • Python重装失败?可能是这些残留文件在作怪(含详细操作截图)
  • 【SOTA缓存架构白皮书】:基于Llama-3/DeepSeek实测的6维缓存评估矩阵与选型决策树
  • 2026奇点大会AIoT安全红线清单(含3类被忽略的侧信道攻击面+国密SM9动态证书签发流程图)
  • VMware macOS解锁神器:Unlocker 3.0完整使用指南
  • AI开发-python-langchain框架(--并行流程 )慕
  • mbed OS 6+ 嵌入式TFTP服务器设计与实现
  • 终极免费剧本写作工具:Trelby让你5分钟成为专业编剧
  • 龙芯k - 走马观碑组MPU驱动移植苍
  • PhotoTool Compress/Remove EXIF
  • 终极B站视频解析工具:5分钟掌握bilibili-parse完整使用指南
  • PyTorch 2.8镜像基础教程:torchvision.transforms与Albumentations对比选型
  • 万字拆解 LLM 运行机制:Token、上下文与采样参数鼓
  • PlugY实战指南:突破暗黑2限制的3个关键策略
  • HagiCode Desktop 混合分发架构解析:如何用 PP 加速大文件下载籽
  • 别再只画轨迹图了!用MATLAB的geobasemap给你的GPS数据加上真实地图背景
  • Qwen3-14B游戏本地化效果:英文游戏文本→中文语境化重写(含俚语)
  • 【OpenClaw】通过 Nanobot 源码学习架构---()总体颇
  • 迪普防火墙 DPtech FW1000系列生产环境配置指南
  • STM32启动之旅:从上电到main函数的奇妙历程
  • python-flask的食品公司采购管理系统的设计与实现_django pycharm vue
  • 大模型推理卡顿救星来了:SITS2026公布的3层KV Cache压缩算法实测指南
  • 终极iOS设备降级工具:如何安全恢复旧版系统并解决白屏问题
  • AI头像生成器惊艳效果:生成带‘琉璃发饰+月光投影+微风扬发’细节文案
  • GLM-. 全面支持与 Gemini CLI 集成:HagiCode 的多模型进化之路傻
  • Maomi.In | .NET 全能多语言解决方案撞
  • 网络安全人员必考的几本证书!包含CISE(工程师)、CISO(管理)、CISA(外审)三个不同的方向。
  • 大模型上线前必做的A/B测试:为什么92%的LLM产品因忽略这4个统计陷阱导致决策失误?
  • 告别臃肿代码!用状态机+查表法重构你的STM32 OLED菜单(代码更清晰易维护)