当前位置：首页 > news >正文

Circos图颜色配置完全手册：从RGB值到ribbon着色技巧

news 2026/3/26 22:56:19

Circos图颜色配置完全手册：从RGB值到ribbon着色技巧

如果你在生物信息学领域工作过一段时间，肯定见过Circos图——那些色彩斑斓、环环相扣的圆形可视化图表。它们能将复杂的关联数据以惊人的美学效果呈现出来。但你是否曾经盯着自己生成的Circos图，总觉得颜色搭配哪里不对劲？或者想为特定的数据关系定制渐变效果，却不知从何下手？

我刚开始用Circos时，也经历过这个阶段。官方文档虽然详尽，但关于颜色系统的部分却分散在各个配置文件中，缺乏一个完整的视觉设计视角。更让人头疼的是，当你需要调整ribbon（连接带）的渐变、修改染色体区块的颜色、或者统一整个图表的配色方案时，往往需要在五六个不同的文件之间来回切换，每个文件都有自己的语法和逻辑。

这篇文章就是为你解决这些问题而写的。我们不讨论如何准备数据或处理超大矩阵——那是另一个话题。今天，我们聚焦在Circos可视化中最容易被忽视，却又最能提升图表专业度和美观度的部分：颜色系统。我会带你深入解析colors.conj、karyotype.txt、color_percentile.conf这些关键文件，分享我踩过坑后总结出的配色技巧，让你能真正掌控Circos图的视觉表现。

1. 理解Circos颜色系统的三层架构

Circos的颜色配置不是单一的系统，而是由三个相互关联但又各自独立的层次构成。理解这个架构，是进行任何高级配色调整的前提。

1.1 基础颜色定义层：colors.conj

colors.conj文件是Circos颜色系统的基石。你可以把它想象成一个调色板定义文件，所有在图表中使用的颜色都必须在这里先声明。

这个文件的结构其实很简单，就是一系列的颜色变量名和对应的RGB值：

colorxy1 = 255,0,0 colorxy2 = 0,255,0 colorxy3 = 0,0,255 otu_color1 = 128,128,128 otu_color2 = 255,255,0

几个关键点需要注意：

颜色变量名可以任意定义，但要有意义。我习惯用colorxy前缀表示列（通常是X轴）相关的颜色，用otu_color前缀表示行（通常是OTU或样本）相关的颜色
RGB值的范围是0-255，用逗号分隔，不要加括号
这个文件只定义颜色，不决定哪个元素使用哪个颜色

提示：虽然RGB是最常用的格式，但Circos也支持HSV、HSL等颜色空间。不过对于大多数应用场景，RGB已经足够，而且更直观。

1.2 染色体/区块着色层：karyotype.txt

这是Circos中最容易让人困惑的文件之一。karyotype.txt不仅定义了每个染色体（或数据区块）的宽度和位置，还指定了它们的基础颜色。

文件格式如下：

chr - XY1 0 10000 colorxy1 chr - XY2 0 8000 colorxy2 chr - OTU1 0 5000 otu_color1

每一行定义一个区块，包含：

类型标识（通常是chr -）
区块名称（如XY1、OTU1）
起始位置（通常是0）
结束位置（区块长度）
使用的颜色变量名（必须已在colors.conj中定义）

这里有个重要的视觉细节：karyotype.txt中定义的颜色，实际上只用于染色体环的背景填充。也就是说，如果你在最终的Circos图中看到染色体环有不同的颜色，那是由这个文件控制的。

但问题来了：我们经常在Circos图中看到的那些彩色小方块（贡献圈）和连接带（ribbon），它们的颜色并不由karyotype.txt直接控制。这就是为什么新手调整颜色时，改了karyotype.txt却发现只有背景色变了，其他元素还是原来的颜色。

1.3 连接与贡献圈着色层：row.txt、col.txt与cells.txt

这是颜色系统中最复杂的部分，也是实现精细控制的关键。Circos用三个文件分别控制不同视觉元素的颜色：

row.txt和col.txt：控制贡献圈（contribution ring）的颜色分段

贡献圈是Circos图中那些围绕在染色体环外侧的彩色弧段，表示行或列对整体关联的贡献度。row.txt控制行贡献圈，col.txt控制列贡献圈。

它们的格式是这样的：

OTU_8 25411 35891 fill_color=colorxy1831 OTU_9 12005 18942 fill_color=colorxy956

每一行定义了一个贡献圈中的一段：

第一列：行名或列名
第二、三列：该段在贡献圈中的起始和结束位置
fill_color=：指定使用的颜色变量

cells.txt：控制ribbon（连接带）的颜色

这是实现渐变效果和关系强弱可视化的核心文件。cells.txt定义了哪些行和列之间有连接，以及这些连接的颜色属性。

典型的一行数据：

OTU_5 XY_127 color=ribbon_color_5 z=0.8 OTU_5 XY_128 color=ribbon_color_5 z=0.6

这里：

color=指定颜色变量（通常来自color_percentile.conf）
z=值控制颜色深度或透明度，用于表示连接强度

2. 实战：从零配置一套完整的配色方案

理论讲完了，现在让我们动手实际操作。假设我们有一个微生物组数据集，包含15个样本（OTU）和120个环境因子（XY），我们要为这个数据集创建一套美观且信息量大的配色方案。

2.1 第一步：规划整体配色策略

在开始写任何配置文件之前，先花10分钟规划一下整体配色策略。这是很多新手会跳过的一步，但却是做出专业图表的关键。

我通常考虑以下几个维度：

数据类型的颜色区分：样本（OTU）和环境因子（XY）应该使用不同的色系，让读者一眼就能区分
类群的颜色编码：如果OTU属于不同的门（如厚壁菌门、拟杆菌门），可以用同一色系的不同深浅来表示
关联强度的视觉编码：强关联和弱关联应该在颜色上有明显区别
整体美观度：颜色搭配要和谐，避免过于刺眼或难以区分的颜色

基于这些考虑，我决定：

OTU使用蓝色系（从浅蓝到深蓝）
XY使用绿色系（从浅绿到深绿）
强关联用暖色（红-橙），弱关联用冷色（蓝-紫）

2.2 第二步：创建colors.conj调色板

现在开始创建colors.conj文件。我会创建两套颜色：一套用于染色体背景，一套用于ribbon渐变。

染色体背景颜色（在karyotype.txt中使用）：

# OTU颜色 - 蓝色系 otu_blue1 = 173,216,230 # 浅蓝 otu_blue2 = 135,206,235 # 天蓝 otu_blue3 = 100,149,237 # 矢车菊蓝 otu_blue4 = 70,130,180 # 钢蓝 otu_blue5 = 30,144,255 # 道奇蓝 # XY颜色 - 绿色系 xy_green1 = 144,238,144 # 浅绿 xy_green2 = 102,205,170 # 中海绿 xy_green3 = 60,179,113 # 中海春绿 xy_green4 = 46,139,87 # 海绿 xy_green5 = 34,139,34 # 森林绿

ribbon渐变颜色（在color_percentile.conf中使用）：

# 强关联到弱关联的渐变 ribbon_red = 255,99,71 # 番茄红 - 强关联 ribbon_orange = 255,165,0 # 橙色 - 中等关联 ribbon_yellow = 255,215,0 # 金色 - 弱关联 ribbon_blue = 100,149,237 # 矢车菊蓝 - 很弱关联

注意：颜色名称要有意义且一致。我使用otu_和xy_前缀来区分类型，用数字表示深浅程度。这样在后续配置中不容易混淆。

2.3 第三步：配置karyotype.txt的染色体颜色

在karyotype.txt中，我们需要为每个OTU和XY分配背景颜色。这里的关键是：如何有逻辑地分配颜色，而不是随机分配。

我通常根据数据的自然分组来分配颜色。比如，如果OTU属于不同的门：

# OTU区块 - 按门分类着色 chr - OTU_1 0 5000 otu_blue1 # 厚壁菌门 - 浅蓝 chr - OTU_2 0 4500 otu_blue1 chr - OTU_3 0 4800 otu_blue2 # 拟杆菌门 - 天蓝 chr - OTU_4 0 5200 otu_blue2 chr - OTU_5 0 4700 otu_blue3 # 放线菌门 - 矢车菊蓝 # XY区块 - 按环境因子类型着色 chr - XY_1 0 10000 xy_green1 # 温度相关因子 chr - XY_2 0 9500 xy_green1 chr - XY_3 0 11000 xy_green2 # pH相关因子 chr - XY_4 0 10500 xy_green2 chr - XY_5 0 9800 xy_green3 # 养分相关因子

这种有逻辑的颜色分配，能让读者在看到图表时，不仅看到关联关系，还能直观地理解数据的结构。

2.4 第四步：实现ribbon的智能渐变着色

这是Circos颜色配置中最精彩的部分。通过color_percentile.conf和cells.txt的配合，我们可以根据关联强度自动为ribbon分配渐变颜色。

首先，在color_percentile.conf中定义颜色百分位：

# 根据关联强度（z值）分配颜色 <colors> ribbon_color_1 = ribbon_red # z > 0.8，最强关联 ribbon_color_2 = ribbon_orange # 0.6 < z <= 0.8 ribbon_color_3 = ribbon_yellow # 0.4 < z <= 0.6 ribbon_color_4 = ribbon_blue # z <= 0.4，最弱关联 </colors> <rules> <rule> condition = var(z) > 0.8 color = ribbon_color_1 </rule> <rule> condition = var(z) > 0.6 color = ribbon_color_2 </rule> <rule> condition = var(z) > 0.4 color = ribbon_color_3 </rule> <rule> condition = 1 color = ribbon_color_4 </rule> </rules>

这个配置的意思是：

关联强度z值大于0.8的ribbon用红色（最强）
z值在0.6-0.8之间的用橙色
z值在0.4-0.6之间的用黄色
z值小于等于0.4的用蓝色（最弱）

然后在cells.txt中，我们只需要指定z值，颜色会自动根据上面的规则分配：

OTU_1 XY_15 z=0.92 OTU_1 XY_27 z=0.75 OTU_1 XY_42 z=0.55 OTU_1 XY_68 z=0.32 OTU_2 XY_15 z=0.88

这样做的巨大优势：当数据更新时，你不需要手动调整每个ribbon的颜色。只要z值计算正确，颜色会自动根据强度重新分配，大大提高了工作流的可重复性。

3. 高级技巧：解决实际工作中的颜色难题

掌握了基础配置后，让我们看看一些更高级的场景。这些是我在实际项目中遇到的真实问题，以及我的解决方案。

3.1 问题一：如何突出显示特定的关键关联？

有时候，我们不仅想根据强度着色，还想特别突出某些生物学意义重大的关联，即使它们的统计强度不是最高的。

我的解决方案是：创建一套“重点颜色”，在cells.txt中手动覆盖自动着色。

首先，在colors.conj中添加重点颜色：

# 重点关联颜色 highlight_red = 220,20,60 # 深红 highlight_purple = 147,112,219 # 中紫罗兰

然后，在cells.txt中，对于需要特别强调的关联，直接指定颜色而不是使用z值：

# 常规关联 - 使用z值自动着色 OTU_1 XY_15 z=0.92 OTU_1 XY_27 z=0.75 # 重点关联 - 手动指定颜色 OTU_3 XY_42 color=highlight_red # 已知的重要代谢通路 OTU_5 XY_68 color=highlight_purple # 新发现的有趣关联

这样，在最终的图表中，这些重点关联会以醒目的颜色突出显示，即使它们的z值可能不是最高的。

3.2 问题二：如何处理超过100种颜色的情况？

Circos官方文档建议颜色变量不要超过100个，但在实际微生物组分析中，我们经常有数百个OTU和XY。如果每个都分配不同颜色，不仅colors.conj文件会变得巨大，而且人眼也很难区分那么多相似颜色。

我的策略是：使用颜色循环和分组着色。

颜色循环法：

# 只定义10种基础颜色 color_set1 = 31,119,180 color_set2 = 255,127,14 color_set3 = 44,160,44 color_set4 = 214,39,40 color_set5 = 148,103,189 color_set6 = 140,86,75 color_set7 = 227,119,194 color_set8 = 127,127,127 color_set9 = 188,189,34 color_set10 = 23,190,207 # 在karyotype.txt中循环使用 chr - OTU_1 0 5000 color_set1 chr - OTU_2 0 4500 color_set2 chr - OTU_3 0 4800 color_set3 ... chr - OTU_11 0 5100 color_set1 # 回到第一种颜色 chr - OTU_12 0 4900 color_set2

分组着色法（更推荐）：

如果OTU有分类信息（如门、纲、目），可以为每个高级分类单元分配一种颜色，同一分类单元内的OTU使用该颜色的不同深浅：

分类单元	基础颜色	浅色变体	深色变体
厚壁菌门	蓝色系	otu_firmicutes_light	otu_firmicutes_dark
拟杆菌门	绿色系	otu_bacteroidetes_light	otu_bacteroidetes_dark
放线菌门	红色系	otu_actinobacteria_light	otu_actinobacteria_dark

然后在karyotype.txt中：

# 厚壁菌门的OTU - 都用蓝色系，但深浅不同 chr - OTU_1 0 5000 otu_firmicutes_light chr - OTU_2 0 4500 otu_firmicutes_dark chr - OTU_3 0 4800 otu_firmicutes_light # 拟杆菌门的OTU - 都用绿色系 chr - OTU_4 0 5200 otu_bacteroidetes_light chr - OTU_5 0 4700 otu_bacteroidetes_dark

这种方法既保持了颜色的可区分性，又避免了颜色数量爆炸的问题。

3.3 问题三：如何创建平滑的颜色渐变效果？

Circos默认的ribbon着色是离散的——根据z值落入哪个区间，就使用对应的颜色。但有时候我们想要更平滑的渐变效果，让颜色随z值连续变化。

虽然Circos本身不支持真正的连续渐变，但我们可以通过增加颜色区间数量来模拟平滑渐变。

假设我们想要从蓝色（弱关联）到红色（强关联）的连续渐变，可以在color_percentile.conf中定义10个甚至20个中间颜色：

# 定义渐变颜色序列 gradient_1 = 30,144,255 # 道奇蓝 gradient_2 = 65,105,225 # 皇家蓝 gradient_3 = 100,149,237 # 矢车菊蓝 gradient_4 = 135,206,235 # 天蓝 gradient_5 = 176,224,230 # 淡蓝 gradient_6 = 240,128,128 # 浅珊瑚红 gradient_7 = 255,99,71 # 番茄红 gradient_8 = 255,69,0 # 红橙色 gradient_9 = 255,0,0 # 纯红 gradient_10 = 178,34,34 # 砖红

然后在规则中设置更精细的区间：

<rules> <rule> condition = var(z) > 0.9 color = gradient_10 </rule> <rule> condition = var(z) > 0.8 color = gradient_9 </rule> <rule> condition = var(z) > 0.7 color = gradient_8 </rule> ... # 更多区间 </rules>

虽然配置起来更繁琐，但视觉效果会好很多，特别是当ribbon数量很多时，整体看起来会有真正的渐变感。

4. 配色心理学与可访问性考虑

作为生物信息学可视化专家，我们不仅要考虑图表的美观，还要考虑信息的有效传达和可访问性。颜色选择不是随意的，它会影响读者对数据的理解和记忆。

4.1 颜色与认知负荷

人脑处理颜色信息的能力是有限的。研究表明，大多数人能快速区分的颜色数量在7-10种之间。超过这个数量，识别准确率和速度都会下降。

我的实践经验法则：

主要类别不超过7种颜色：如果你的数据有20个类别，考虑使用颜色循环或分组策略
使用色盲友好配色：约8%的男性和0.5%的女性有色觉缺陷，避免红-绿对比
保持一致性：在整个图表中，相同的颜色应该表示相同的含义

4.2 色盲友好配色方案

对于需要公开发表或展示的图表，色盲友好性不是可选项，而是必须考虑的因素。以下是一些经过验证的色盲友好配色：

颜色名称	RGB值	适用场景
蓝色	0,114,178	主要类别，正常和色盲都能很好区分
橙色	230,159,0	与蓝色对比，适合次要类别
蓝绿色	0,158,115	第三类别，与蓝、橙都易区分
洋红色	204,121,167	第四类别
黄色	240,228,66	高亮或强调，但避免大量使用

你可以在colors.conj中直接使用这些颜色值：

# 色盲友好配色 cb_blue = 0,114,178 cb_orange = 230,159,0 cb_cyan = 0,158,115 cb_magenta = 204,121,167 cb_yellow = 240,228,66

4.3 打印友好与屏幕显示的平衡

另一个常被忽视的考虑是：你的Circos图会在哪里被查看？

学术论文打印：通常黑白或灰度，需要确保颜色在灰度转换后仍有区分度
海报展示：大尺寸打印，颜色可以更鲜艳，但要注意打印机的色域限制
屏幕演示：RGB色域，可以使用更丰富的颜色，但要注意不同显示器的校准差异

针对打印优化的技巧：

使用颜色亮度差异：在灰度转换中，亮度差异比色相差异更重要
添加纹理或图案：对于关键区分，可以在颜色基础上添加不同的填充图案（虽然Circos原生不支持，但可以在后期用插画软件添加）
提供图例：无论如何，清晰详细的图例都是必不可少的

我通常的做法是：先创建屏幕显示的彩色版本，然后生成一个灰度版本检查可读性。如果某些颜色在灰度下难以区分，就调整它们的亮度值。

5. 自动化与可重复工作流

手动配置Circos颜色文件是繁琐且容易出错的。在实际项目中，我几乎总是使用脚本来自动生成这些配置文件。这不仅提高了效率，也确保了结果的可重复性。

5.1 使用Python生成colors.conj

下面是一个简单的Python脚本，可以根据输入参数自动生成colors.conj文件：

def generate_colors_conj(otu_count, xy_count, output_file="colors.conj"): """生成Circos colors.conj文件""" colors = [] # 为OTU生成蓝色系颜色 blue_base = [30, 144, 255] # 道奇蓝 for i in range(otu_count): # 创建渐变的蓝色 factor = i / max(otu_count - 1, 1) # 0到1之间 r = int(blue_base[0] * (1 - factor) + 255 * factor) g = int(blue_base[1] * (1 - factor) + 255 * factor) b = int(blue_base[2] * (1 - factor) + 255 * factor) colors.append(f"otu_color_{i+1} = {r},{g},{b}") # 为XY生成绿色系颜色 green_base = [34, 139, 34] # 森林绿 for i in range(xy_count): factor = i / max(xy_count - 1, 1) r = int(green_base[0] * (1 - factor) + 255 * factor) g = int(green_base[1] * (1 - factor) + 255 * factor) b = int(green_base[2] * (1 - factor) + 255 * factor) colors.append(f"xy_color_{i+1} = {r},{g},{b}") # 写入文件 with open(output_file, 'w') as f: f.write("\n".join(colors)) print(f"已生成{len(colors)}种颜色到{output_file}") # 使用示例 generate_colors_conj(otu_count=50, xy_count=120)

这个脚本会为50个OTU生成从蓝色到白色的渐变，为120个XY生成从绿色到白色的渐变。你可以根据需要调整基色和渐变逻辑。

5.2 自动分配karyotype.txt颜色

基于OTU的分类信息自动分配颜色：

import pandas as pd def assign_karyotype_colors(taxonomy_file, output_file="karyotype_colors.txt"): """根据分类信息分配karyotype颜色""" # 读取分类信息 df = pd.read_csv(taxonomy_file, sep='\t') # 定义门级别的颜色映射 phylum_colors = { "Firmicutes": "otu_firmicutes", "Bacteroidetes": "otu_bacteroidetes", "Actinobacteria": "otu_actinobacteria", "Proteobacteria": "otu_proteobacteria", # 添加更多... } karyotype_entries = [] for idx, row in df.iterrows(): otu_id = row['OTU_ID'] length = row['Length'] # 假设有长度信息 phylum = row['Phylum'] # 获取颜色 color_prefix = phylum_colors.get(phylum, "otu_default") # 创建karyotype条目 entry = f"chr - {otu_id} 0 {length} {color_prefix}" karyotype_entries.append(entry) # 写入文件 with open(output_file, 'w') as f: f.write("\n".join(karyotype_entries)) return len(karyotype_entries)

5.3 批量处理与质量控制脚本

最后，我通常会创建一个主控脚本，把所有的颜色配置步骤串联起来：

#!/bin/bash # circos_color_pipeline.sh # 1. 生成基础颜色定义 python generate_colors_conj.py --otu 50 --xy 120 # 2. 根据分类信息分配karyotype颜色 python assign_karyotype_colors.py --taxonomy otu_taxonomy.tsv # 3. 生成color_percentile.conf python generate_color_percentile.py --min-z 0.1 --max-z 0.95 # 4. 验证颜色配置 python validate_colors.py --check-all # 5. 运行Circos测试 circos -conf circos.conf -outputfile test.png echo "颜色配置管道执行完成"

这种自动化工作流不仅节省时间，更重要的是确保了每次分析的一致性。当需要调整配色方案时，只需要修改生成脚本的参数，然后重新运行整个管道即可。

经验告诉我，在生物信息学可视化中，颜色不是装饰，而是信息传递的重要组成部分。一个好的配色方案能让复杂的数据关系一目了然，而一个糟糕的配色则可能隐藏或误导关键发现。通过深入理解Circos的颜色系统，并运用本文介绍的技巧，你应该能够创建出既美观又富有信息量的Circos可视化图表。

在实际项目中，我建议先从简单的配色开始，逐步增加复杂度。每次调整后，都要问自己：这个颜色选择是否有助于读者理解数据？是否突出了最重要的发现？是否考虑了色盲用户的可访问性？记住，最好的可视化是那些让数据自己说话的可视化，而颜色就是你给数据的嗓音——要清晰、准确、有表现力。

查看全文

http://www.jsqmd.com/news/451465/