当前位置: 首页 > news >正文

-:RAG 入门-向量存储与企业级向量数据库 milvus

环境安装

pip install keystone-engine capstone unicorn

这3个工具用法极其简单,下面通过示例来演示其用法。

Keystone

示例

from keystone import *

CODE = b"INC ECX; ADD EDX, ECX"

try:

ks = Ks(KS_ARCH_X86, KS_MODE_64)

encoding, count = ks.asm(CODE)

print(f"汇编指令数量: {count}")

print(f"机器码 (十进制): {encoding}")

print(f"机器码 (Hex): {''.join(f'{x:02x}' for x in encoding)}")

except KsError as e:

print(f"ERROR: {e}")

代码解释

代码流程十分简单:

初始化keystone->编译代码->输出结果

初始化keystone

ks = Ks(KS_ARCH_X86, KS_MODE_64)

初始化keystone引擎:

第一个参数:选择指令架构例如:x86,arm......

第二个参数:选择模式,例如:64位,32位,小端序......

编译代码

将汇编转换为16进制的shellcode

encoding, count = ks.asm(CODE)

第一个返回值:机器码指令的数组

第二个返回值:汇编指令数量

Capstone

capstone的用法和keystone差不多。

示例

from capstone import *

CODE = b"\xff\xc1\x01\xca"

md = Cs(CS_ARCH_X86, CS_MODE_64)

print("地址\t\t指令\t\t操作数")

print("-" * 30)

for i in md.disasm(CODE, 0x1000):

print(f"0x{i.address:x}:\t{i.mnemonic}\t{i.op_str}")

代码解释

代码流程跟keystone差不多:

初始化capstone->反编译代码->输出结果

初始化capstone

md = Cs(CS_ARCH_X86, CS_MODE_64)

初始化capstone引擎:

第一个参数:选择指令架构例如:x86,arm......

第二个参数:选择模式,例如:64位,32位,小端序......

反编译代码

for i in md.disasm(CODE, 0x1000):

print(f"0x{i.address:x}:\t{i.mnemonic}\t{i.op_str}")

使用方法disasm反汇编:

第一个参数:机器码

第二个参数:第一条指令的基地址

返回:一个包含指令对象的数组

unicorn

unicorn提供的方法使用也不复杂,但需要一定的内存基础知识。

下面用一个案例解释。

示例

情景模拟: 我逆向过程中发现一个xor加密代码,我需要通过模拟执行,对密文进行解密。

根据汇编代码可以得知:

0x20000存放密文

0x30000存放结果

0x10000中读取密钥key

from unicorn import *

from unicorn.x86_const import *

import struct

from keystone import *

ASM_CODE = """

MOV ECX, 5

MOV ESI, 0x20000

MOV EDI, 0x30000

MOV BL, byte ptr [0x10000]

loop_start:

LODSB

XOR AL, BL

STOSB

LOOP loop_start

"""

def get_code():

ks = Ks(KS_ARCH_X86, KS_MODE_32)

encoding, count = ks.asm(ASM_CODE)

return bytes(encoding)

CODE = get_code()

ADDRESS_CODE = 0x400000

ADDRESS_KEY = 0x10000

ADDRESS_IN = 0x20000

ADDRESS_OUT = 0x30000

REAL_KEY = 0x77

CIPHER_TEXT = b"\x3F\x12\x1B\x1B\x18"

def hook_code(uc, access, address, size, value, user_data):

if address == ADDRESS_KEY:

key_value = uc.mem_read(address, size)

print(f"key: {hex(key_value[0])}")

def start_emulation():

try:

print("初始化环境...")

mu = Uc(UC_ARCH_X86, UC_MODE_32)

mu.mem_map(0x0, 1 * 1024 * 1024)

mu.mem_map(ADDRESS_CODE, 2 * 1024 * 1024)

mu.mem_write(ADDRESS_CODE, CODE)

mu.mem_write(ADDRESS_IN, CIPHER_TEXT)

mu.mem_write(ADDRESS_KEY, struct.pack("B", REAL_KEY))

mu.hook_add(UC_HOOK_MEM_READ, hook_code)

mu.emu_start(ADDRESS_CODE, ADDRESS_CODE + len(CODE))

decrypted_text = mu.mem_read(ADDRESS_OUT, 5)

print(f"解密后的文本: {decrypted_text.decode()}")

except UcError as e:

print(f"模拟错误: {e}")

if __name__ == "__main__":

start_emulation()

代码解释

代码流程:

初始化环境->分配虚拟内存->写入数据->添加捕获操作->模拟执行指令->读取内存结果

初始化环境

这个跟上面的keystone和capstone一样,就不解释了

mu = Uc(UC_ARCH_X86, UC_MODE_32)

分配虚拟内存

第一行是用于存放堆内存数据,第二行是用于存放执行的代码

mu.mem_map(0x0, 1 * 1024 * 1024)

mu.mem_map(ADDRESS_CODE, 2 * 1024 * 1024)

mem_map用于初始化虚拟内存

第一个参数:内存的虚拟地址基址

第二个参数:内存的大小

内写入数据

第一行写入代码,第二行写入密文,第三行写入解密key

mu.mem_write(ADDRESS_CODE, CODE)

mu.mem_write(ADDRESS_IN, CIPHER_TEXT)

mu.mem_write(ADDRESS_KEY, struct.pack("B", REAL_KEY))

mem_write用于写入虚拟内存

第一个参数:写入内存的地址

第二个参数:写入内存的数据

添加捕获操作

hook用于捕获数据,这里用于捕获key

def hook_code(uc, access, address, size, value, user_data):

if address == ADDRESS_KEY:

key_value = uc.mem_read(address, size)

print(f"key: {hex(key_value[0])}")

mu.hook_add(UC_HOOK_MEM_READ, hook_code)

hook_add添加hook

第一个参数:捕获模式,规定什么时候触发hook,例如:读取内存,中断捕获......

第二个参数:触发的回调函数,回调函数各个参数如下:

def hook_code(uc, access, address, size, value, user_data):

uc:模拟器对象

access:当前访问类型:UC_MEM_READ,UC_MEM_WRITE......

address:当前访问的虚拟地址

size:当前访问数据大小

value:access为UC_MEM_WRITE,则这里为要写入的值

user_data:用户在add_hook时传进去的自定义数据

模拟执行指令

mu.emu_start(ADDRESS_CODE, ADDRESS_CODE + len(CODE))

第一个参数:模拟执行的起始地址

第二个参数:模拟执行的代码大小

读取内存结果

decrypted_text = mu.mem_read(ADDRESS_OUT, 5)

第一个参数:读取内存的地址

第二个参数:读取内存的大小兜桶字趟

http://www.jsqmd.com/news/655671/

相关文章:

  • 西门子840D后处理实战:用TCL脚本自动生成刀具清单,告别手动编号
  • 终极指南:如何使用TlbbGmTool轻松管理单机游戏数据
  • TCP可靠传输的基石:从停止等待到滑动窗口,ARQ协议如何守护你的数据?
  • Obsidian Smart Connections 技术深度解析:如何构建零配置的AI笔记关联引擎
  • 2026届毕业生推荐的六大降重复率助手推荐
  • 实战指南:从COCO标注(.json)到YOLO训练(.txt)的无损格式转换
  • 3个场景告诉你:为什么这个工具能让Windows体验提升300%?
  • Sign Language Interpreter:用深度学习打破沟通壁垒的实时手语翻译工具
  • 2026南宁建筑行业AI获客落地指南:AI获客服务商参考、成本与时效全详解
  • Windhawk终极指南:Windows系统定制与界面增强完整手册
  • 7-Zip完整指南:如何用这款免费开源压缩工具提升工作效率 [特殊字符]
  • 2026贵阳南明区正宗铁签烤肉与烤鱼美食体验地标(含官方联系方式) - 精选优质企业推荐官
  • CSAPP-MallocLab:从隐式空闲链表到显式分离链表的性能跃迁
  • 世贸通美国EB5投资移民:赴美生子将遭重创,美宝家庭身份危机 - 速递信息
  • 告别NAS卡顿!用PC版tinyMediaManager 4.x给群晖电影库刮削海报和信息(附Java环境配置)
  • 南京离婚律师哪家技术强 - 资讯焦点
  • 如何选择直剪仪专业制造商,台式直剪仪价格与品牌分析 - 工业设备
  • 2026年全国工业降温设备十大品牌口碑推荐:负压风机/工业冷风机/降温湿帘厂家排名 - 安互工业信息
  • NavMeshPlus:Unity 2D游戏智能寻路的终极解决方案
  • 手把手教你用FastAPI给DeepSeek-OCR模型做个Web界面,还能兼容OpenAI的API格式
  • RISC-V分支预测入门:从BTFN到两级预测器,手把手理解CPU如何‘猜’对指令
  • 深圳会议酒店推荐|从福田CBD到前海,酒店哥哥一篇搞定你的办会选址难题
  • OpenHarmony 5.0.2 USB摄像头适配:从配置修改到图像显示的完整调试指南
  • Go语言中的图形界面开发实战解析:从GUI到WebAssembly
  • 开源DICOM查看器Weasis:零成本构建专业医学影像分析平台
  • 2026贵阳南明区铁签烤肉、正宗炭火烤肉夜宵美食品牌选择(含官方联系方式) - 精选优质企业推荐官
  • 关投强企业级媒体发稿服务合作流程解析:覆盖需求对接至售后全链路核心决策信息 - 发稿平台推荐
  • 上海新闻综合频道专题报道!老年活动假牙选对才安心,上海夕阳红口腔凭专业实力守护长辈 “齿” 间幸福
  • 向新而生拓局全球|2026上海API情趣生活展五周年盛典重磅揭幕 - 资讯焦点
  • 网盘直链下载助手终极指南:一键获取8大网盘真实下载地址