当前位置：首页 > news >正文

分布式系统的排障利器 —— ionet 全链路调用日志跟踪

news 2026/7/29 16:15:38

分布式系统排障有多难？

在单机应用中，出了问题看一下日志就行。但在分布式系统中，一个用户请求可能经过多个逻辑服——登录服 → 匹配服 → 房间服 → 数据统计服。当某个环节出问题时，你面对的是散落在多台机器上的日志。

更棘手的是：大量用户同时在线时，不同用户的日志交错在一起，想筛选出"用户 100001 的登录请求经过了哪些服务"几乎是大海捞针。

传统做法是用 userId 来过滤日志。但这在高并发下不靠谱——同一用户可能在短时间内发起多次请求，你无法区分哪条日志属于哪次请求。

ionet 的解决方案：全链路 traceId

ionet 内置了全链路调用日志跟踪特性。核心思路很简单：

为每个请求分配一个唯一的 traceId，这个 traceId 会随着请求在所有逻辑服之间传递，并记录在每一条日志中。

无论请求经过了多少个逻辑服、跨了多少台机器，你只需要用 traceId 搜索日志，就能还原完整的调用链路。

如何启用

1. 配置 logback.xml

在日志模板中加入 ionetTraceId：

<?xml version="1.0" encoding="UTF-8"?>
<configuration><property name="log.pattern"value="%d{HH:mm:ss.SSS} %green([%thread]) [%X{ionetTraceId}] %highlight(%-5level) %cyan(%logger{5}).%M\(%F:%L\) %m%n"/><appender name="STDOUT" class="ch.qos.logback.core.ConsoleAppender"><encoder class="ch.qos.logback.classic.encoder.PatternLayoutEncoder"><pattern>${log.pattern}</pattern><charset>utf8</charset></encoder></appender><root level="INFO"><appender-ref ref="STDOUT"/></root>
</configuration>

关键是 %X{ionetTraceId} —— 它会从 MDC（Mapped Diagnostic Context）中读取当前请求的 traceId 并打印。

2. 日志输出效果

10:23:45.123 [UserThread-3] [abc123def456] INFO  HallAction.login(HallAction.java:15) 用户登录成功
10:23:45.125 [UserThread-3] [abc123def456] INFO  MailService.send(MailService.java:42) 发送欢迎邮件
10:23:45.126 [UserThread-5] [abc123def456] INFO  RewardService.calc(RewardService.java:28) 计算离线奖励
10:23:45.130 [UserThread-1] [xyz789ghi012] INFO  HallAction.login(HallAction.java:15) 用户登录成功

看到了吗？traceId 为 abc123def456 的三条日志属于同一次请求，即使它们在不同的线程中执行。而 xyz789ghi012 是另一次请求。

跨机器、跨进程追踪

ionet 全链路跟踪最强大的地方在于：traceId 会随着请求跨进程、跨机器传递。

当请求从用户逻辑服调用匹配逻辑服，再调用房间逻辑服时，三个逻辑服即使运行在不同的机器上，它们打印的日志都会包含同一个 traceId。

# 机器 A - 用户逻辑服
10:23:45.123 [abc123] 用户 100001 发起匹配请求# 机器 B - 匹配逻辑服
10:23:45.128 [abc123] 为用户 100001 匹配到对手 200002# 机器 C - 房间逻辑服
10:23:45.135 [abc123] 创建房间，玩家: 100001, 200002

通过搜索 abc123，你可以在所有机器的日志中还原这次请求的完整链路。

自定义 traceId 生成策略

框架提供了默认的 traceId 生成实现（适合单个对外服场景）。如果你启动了多个对外服，建议自定义生成策略：

// 使用 MongoDB ObjectId 作为 traceId
public void config() {TraceKit.setDefaultTraceIdSupplier(() -> new ObjectId().toString());
}

注意：自定义的 traceId 长度不能超过 24 个字符。

与中间件方案的对比

特性	ionet 全链路追踪	Zipkin / SkyWalking
安装依赖	无	需要独立部署追踪服务
侵入性	零侵入（框架自动注入）	需要添加 agent 或 SDK
跨进程支持	✅	✅
跨机器支持	✅	✅
配置复杂度	一个 logback 配置	配置采集器、存储、UI
适用场景	ionet 分布式系统	通用微服务