当前位置：首页 > news >正文

基于深度强化学习的LC-RIS毫米波通信优化方案

news 2026/6/23 12:42:54

1. 项目概述

在6G通信技术快速发展的背景下，毫米波通信因其高带宽特性成为研究热点，但同时也面临着严重的传播损耗和遮挡问题。可重构智能表面(RIS)技术通过动态调控电磁环境为解决这些问题提供了新思路。传统基于半导体(PIN二极管、变容二极管等)的RIS虽然响应速度快，但在毫米波频段和大规模阵列部署时面临严峻的功耗挑战。相比之下，液晶基RIS(LC-RIS)以其极低的功耗特性(750单元阵列仅需约150mW)展现出巨大潜力，但其毫秒级的重配置时间(典型值9-29ms)严重制约了在动态场景中的应用。

本文针对LC-RIS在动态毫米波网络中的相位优化问题，提出了一种基于深度强化学习(Deep Deterministic Policy Gradient, DDPG)的智能调控方案。该方案突破了传统优化方法需要完美信道状态信息(CSI)的限制，通过实时学习环境动态特性，在信噪比(SNR)与配置时间之间实现智能权衡。研究团队通过实际LC-RIS原型测量数据(工作频率60GHz，30×25单元阵列)和高保真射线追踪仿真，验证了算法在室内移动场景(用户速度1.5-3m/s)中的有效性。

关键创新点：首次将DDPG算法应用于LC-RIS动态优化，解决了传统方法因CSI获取延迟导致的性能下降问题，通过加权奖励函数设计实现了SNR与服务时间的灵活权衡。

2. 系统模型与问题建模

2.1 LC-RIS硬件特性

LC-RIS的核心工作原理是通过外加电压改变液晶分子的排列方向，从而调控电磁波的反射相位。与半导体RIS相比，液晶材料具有两大显著特性：

低功耗机制：液晶单元仅需改变分子取向而非激发载流子，单个单元功耗低至0.2μW。实验中使用的30×25阵列总功耗仅约150mW，比同等规模PIN二极管阵列(约25W)降低两个数量级。
响应时间限制：液晶分子的旋转速度受黏滞系数和电场强度制约，实测显示：
- 正向电压下的响应时间常数τ⁺ₐ=9ms
- 反向松弛时间常数τ⁻ₐ=29ms
这使得LC-RIS的相位调整存在物理上限。例如，从初始相位ω₀调整到目标相位ω_d所需时间可通过公式计算：
```
t_cn = { τ⁺ₐ·ln((ω_m-ω₀)/(ω_m-ω_d)) if ω_d > ω₀ τ⁻ₐ·ln(ω₀/ω_d) if ω_d < ω_0 }
```

2.2 通信系统建模

考虑室内毫米波网络场景(办公室/会议室等)，系统包含：

单天线AP：发射功率30dBW(1W)，工作频率60GHz
LC-RIS面板：750单元(30列×25行)，每列相位同步调控
移动用户：速度1.5-3m/s，接收灵敏度-130dBW

信道模型采用Rician衰落，其中：

AP-RIS和RIS-用户链路：K因子=20(强视距成分)
AP-用户链路：K因子=0(完全非视距)

关键物理量计算：

有效信道：ℎ_eff = η·h_{R-U}·Ω·h_{A-R}
- η=√(4πd_y d_z/λ)为RIS孔径修正因子
- Ω为包含反射系数γ_n=ρe^{jω_n}的对角矩阵
接收功率：P_r = P_t·|h_{A-U} + h_eff|²
信噪比：SNR = P_r/σ²