- 潘伟;肖政;任忠芳;王海鹏;
本研究提出了一种专门针对X波段电磁超表面雷达和机器学习技术的动态手势识别技术,其主要目标是通过结合单通道调频连续波(Frequency Modulated Continuous Wave, FMCW)体制收发机和可编程电磁超表面的波束扫描来实现手势识别和分类。在传统的雷达手势识别方法中,通常需要依赖于多输入多输出(Multiple-Input Multiple-Output, MIMO)雷达架构才能有效获取目标的角度信息。然而,MIMO雷达架构由于需要具备多链路,不仅会增加硬件成本,还会增加控制复杂度。而电磁超表面天线可以依据加载天线阵列的电压不同实现灵活的波束调控,利用这一特性获取到目标的角度信息。本研究基于自行搭建的X波段电磁超表面雷达,采用二维独立扫描,即包含一次水平扫描和一次垂直扫描,同时提出相应的雷达信号处理方法,从雷达回波数据中分别处理获得与传统FMCW MIMO雷达相似的角度-时间图(Angle-Time Map, ATM)以及距离-时间图(Range-Time Map, RTM),将特征图像输入机器学习进行分类识别。通过实验验证和定性定量分析,该方法可以较好的区分六种不同的动态手势动作,为电磁超表面雷达在手势动作识别的低成本应用拓展提供了新的思路。
2025年05期 v.20;No.153 455-464页 [查看摘要][在线阅读][下载 1488K] [下载次数:7 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:9 ] - 凌翔宇;江结林;鲍家坤;
在边缘计算环境中,通过微调预训练模型以适配实际场景数据,可以使用户获得个性化模型的能力,而无需上传数据,从而有效保护隐私。然而,微调过程中高昂的内存开销对资源有限的边缘设备构成了重大挑战,同时,量化部署中因量化误差导致的模型精度下降问题也亟待解决。为此,文中提出了一种面向边缘环境的量化感知训练优化方法,该方法结合了层优先度指标引导的稀疏更新方法与分块量化策略。首先,为了减少迁移学习中的内存占用,文中设计了一种基于层优先度指标的稀疏更新方法,该指标综合考虑模型各层的参数量、MAC值和Fisher信息熵,用以选择性地更新模型部分层,从而在显著降低微调内存开销的同时保持模型精度;其次,针对量化部署过程中精度损失的问题,提出了一种分块量化策略,该策略通过将输入数据分割为多个子块并独立执行量化操作,显著减小了因离群值引发的量化误差,从而提升模型在量化后的精度。实验结果表明,文中方法在多个模型中的表现均优于传统方法。与传统微调方法相比,本方法在微调过程中最高可减少61%的内存占用,同时在量化部署后,精度损失最低可控制在0.2%。这充分验证了文中方法在资源受限的边缘设备上应用的有效性与实用性。
2025年05期 v.20;No.153 465-474页 [查看摘要][在线阅读][下载 1154K] [下载次数:5 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ] - 袁程胜;梁羽冲;胡晓宇;张剑;
在商场、机场等监控摄像头中,行人很容易被一些障碍物、或者因部分身体区域超出拍摄范围而遮挡。与识别行人的整体信息情况相比,遮挡行人重识别更具挑战性。为了解决这些问题,本文提出一种全新的遮挡感知Transformer(Occlusion Aware Transformer, OATrans)特征表示模型,显著提升遮挡情况下行人重识别的鲁棒性和特征对齐能力。首先,设计关键点掩膜注意力修饰模块(Keypoint-Mask Attention Modification, KMAM),引导模型关注人体的关键部件信息,减少障碍物和背景干扰的影响;其次,遮挡感知分组模块的提出能够(Occlusion-Aware Grouping, OAG)将判别性特征与非判别性特征动态分离,提高模型对不同遮挡程度的适应性;然后,特征聚合与融合机制(Feature Aggregation and Fusion, FAF)通过与人体关键点热图对齐,改善人体部件的对齐能力;最后,结合正交损失和多样性损失进一步增强特征提取的独立性和判别力。在多个标准数据集上进行了测试,在Occluded-DukeMTMC数据集上,OATrans的Rank-1准确率和平均精度均值分别达到70.3%和61.8%;在Partial-REID数据集上,Rank-1和Rank-3准确率分别为85.8%和92.2%;此外,在全身数据集Market-1501和DukeMTMC-reID上,Rank-1准确率分别达到了95.5%和90.9%。实验结果表明,文中所提的OATrans特征学习模型在遮挡条件下比现有方法表现出更强的泛化性。
2025年05期 v.20;No.153 475-489页 [查看摘要][在线阅读][下载 1351K] [下载次数:8 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:2 ] - 黄大丰;李翔晨;张凤奎;
针对战略预警探测系统在全局态势统一、全域资源调度、体系融合发展方面的实际需求,本文中运用云边端协同技术和思想,提出了基于云边端协同的战略预警探测系统体系总体架构。通过构建资源池化、服务云化、业务协同的分层体系结构,优化了资源层、服务层与应用层的逻辑关系;并根据战略预警探测系统的核心功能,设计了基于云边端协同的全局态势一张图和多级分布式协同资源调度的实现机制。研究成果为战略预警探测系统的体系构建提供了思路。
2025年05期 v.20;No.153 490-497页 [查看摘要][在线阅读][下载 1469K] [下载次数:15 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:3 ] - 张云;任勇;栾添;
量子计算凭借量子叠加与纠缠特性,在理论层面展现出对特定问题的指数级加速潜力,如大整数分解、量子化学模拟等。超导量子计算机是量子计算机众多路线中极有可能实现通用量子计算的途径之一。然而,当前超导量子计算机极易受环境扰动,造成计算误差。文中系统梳理了超导量子计算中噪声的主要来源、类型及其影响,并提出应对措施与发展路线,旨在提升量子门保真度与相干时间,推动超导量子计算从理论走向实用化。
2025年05期 v.20;No.153 498-505+557页 [查看摘要][在线阅读][下载 1844K] [下载次数:3 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:2 ] - 刘昊;
文中提出了一种融合超像素分割和聚合的合成孔径雷达(Synthetic Aperture Radar, SAR)图像舰船目标检测方法。首先,定义了新的聚类中心变换准则和自适应相似性度量准则,基于这两种准则生成SAR图像超像素;然后,利用多向灰度共生矩阵计算超像素间的纹理相似度,实现纹理相似的超像素聚合;最后,基于超像素聚合结果,利用基于规则的目标检测方法,实现舰船目标快速检测。基于多种不同类型场景的SAR图像的实验结果表明,本方法具有稳健的舰船目标检测性能。
2025年05期 v.20;No.153 506-511页 [查看摘要][在线阅读][下载 1358K] [下载次数:125 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ] - 詹可汉;朱建良;
在现代航空领域,随着机载设备智能化与自动化需求的不断提升,语音识别技术已成为该领域的重要研究方向。然而,传统深度学习方法存在训练过程复杂、识别准确率易受噪声干扰等问题。为解决机载噪声环境下操作员语音识别准确度低的问题,文中提出了一种基于Whisper模型的鲁棒语音识别方法。首先,对Whisper模型的特征选取、词元表示及网络框架进行了系统性分析;其次,探讨了基于Transformers框架的Whisper模型微调实现方案,通过引入LoRA模块有效降低了微调成本,同时解决了模型语义失真问题;最后,通过仿真实验对比了不同参数规模的Whisper模型及其他深度学习模型在多级信噪比增强数据集上的性能表现。实验结果表明,Whisper模型在含噪语音识别任务中展现出显著优势,其鲁棒性不仅具有泛化能力,还与噪声的频谱特性密切相关。本研究为机载噪声环境下的语音识别提供了新的解决方案,具有重要的理论价值与应用前景。
2025年05期 v.20;No.153 512-519页 [查看摘要][在线阅读][下载 1451K] [下载次数:637 ] |[网刊下载次数:0 ] |[引用频次:1 ] |[阅读次数:2 ] - 张一鸣;朱子杰;张霜;吴红兵;吴聪;
语义匹配在问答系统和信息检索等应用中至关重要,主流预训练模型针对句子匹配任务存在难以有效捕捉关键信息和句向量“坍缩”问题。为此,文中设计了一种基于动态词遮掩和知识增强的语义匹配模型,通过构建特定领域迁移数据集和融合动态词遮掩策略,增强对关键信息的建模能力;同时,引入知识增强策略,优化句向量表征,提升语义匹配的准确性和可解释性。实验结果显示,在同质文本匹配任务中,文中所提出的模型在相似度评估上平均值为0.839,较主流模型高出0.130以上;在异质文本匹配任务中,该模型的平均准确率达到了66.8%,显著超越主流模型19%以上,同时平均召回率也优于主流模型11%以上,表明文中模型在深入理解文本间语义关系方面的优越性,尤其在经过迁移训练后其性能优势更为显著。
2025年05期 v.20;No.153 520-528页 [查看摘要][在线阅读][下载 1582K] [下载次数:6 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:3 ] - 舒予;金昊;江昊;
文中对社交媒体中用户转发行为的预测进行了研究,提出一种多维度特征增强的用户转发行为预测方法,旨在从海量社交数据中挖掘有价值的信息并构建精准的预测框架,以促进转发行为的精准预测。该研究首先对社交网络中的用户行为特征进行分类与影响分析,将用户社交状态字段划分为连续型和离散型两类,并采用差异化统计分析方法研究其对转发行为的影响,设计量化指标对字段重要性进行排序,筛选出有效的用户社交状态特征组合。其次,构建基于大语言模型的特征提取体模型,通过提示学习设计结合外部知识的主题分类模型,提升少样本条件下的主题识别能力;同时通过参数微调构建本地情感特征提取模型,有效提高情感分类准确率和模型的泛化性能。最后,设计融合图与序列的转发预测框架,利用账号间空间关系图并引入改进的序列模型,实现对用户转发行为的高精度预测。实验结果表明,该方法在多个数据集上表现优于现有基准方法,验证了多维度特征融合对用户转发行为预测的有效性。
2025年05期 v.20;No.153 529-538页 [查看摘要][在线阅读][下载 1611K] [下载次数:3 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ] - 蒲逊;夏明赟;
现有的低密度奇偶校验码(Low Density Parity Check, LDPC)闭集识别方法中,通过直接采用后验概率构建模型计算结果累加的方式会导致在较小码字数量时识别性能较差,通过中心极限定理分布拟合的参数分析方法在部分条件下偏离实际分布,从而无法获得更高的识别性能。基于这些问题,文中提出了一种基于分布参数的LDPC闭集识别方法,该方法通过对软判决序列在LD模型中理论分布进行期望分析,得出了对不同行重校验向量的理论分布参数,通过对参数的数值分析,给出了实际分布参数与理论分布参数差异性的量化模型,并基于该模型识别出对应校验矩阵。实验结果表明,当码字数量较少时,该方法在多行重校验矩阵中的识别性能优于现有的后验概率识别算法。
2025年05期 v.20;No.153 539-545页 [查看摘要][在线阅读][下载 1606K] [下载次数:38 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:2 ] - 张钏钰;李成华;
当前多模态大语言模型在多模态长上下文任务上表现不佳,原因在于现有的几种多模态大语言模型自身结构中,直接投影会导致视觉序列过长、使用Q-former压缩视觉数据使得信息丢失、Flamingo等修改语言模型主干的设计使得性能表现不佳。针对这些问题,文中提出了多模态大语言模型的位置感知记忆增强方法,实现了对多模态大语言模型对于图文交叉的多模态长上下文任务表现的提升,该方法主要包含锚点偏移检索器、自适应占位符、记忆库三部分。其中,锚点偏移检索器基于RoBERTa、Transformer层和前馈神经网络构建,利用CLIP的跨模态能力,能够在多模态对话过程中实现更加丰富、有效的记忆库检索;自适应占位符基于指令微调的思想,将上下文结构信息融入检索结果,使其信息更加完整,以实现更准确、流畅的对话生成;记忆库针对多模态图文交叉长上下文构建,具有针对多模态记忆设计的分块结构和检索返回策略,贴合多模态对话任务的需求。本文方法在图文交叉长上下文测试基准MMDU-benchmark和MM-NIAH上对两个不同的语言模型都展现了有效增强,MMDU-benchmark上的平均得分相对于基线方法分别提高了5.3和11.6,MM-NIAH的图文推理任务的准确度相对于基线方法提高了4.3%和7.2%,证明了本文提出的位置感知记忆增强方法能够有效增强多模态大语言模型,更好处理图文交叉长上下文任务。
2025年05期 v.20;No.153 546-557页 [查看摘要][在线阅读][下载 1600K] [下载次数:239 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:3 ] - 张鸿云;吕昭;胡博洋;
基于无线体域网(Wireless Body Area Network, WBAN)的实时健康监测系统在医疗保健领域发挥重要作用。这种监测系统主要问题是传输能效,即如何在微型传感器的能量限制的情况下,提高测量数据传输的稳定性和有效性。针对类传输能效问题,文中提出一种基于信道自相关和历史信道增益范数相结合的传输功率控制(A&N-TPC)方法,以最大限度地提高系统的传输能效,实现长时间健康监测的任务。在A&N-TPC中,来自多个传感器节点的数据包以时分多址(Time Division Multiple Access, TDMA)方式调度,基于时间自相关模型对下一帧的信道增益进行预测和历史信道增益的范数进行联合优化。将实际WBAN日常场景中收集的信道数据集导入仿真模型以评估A&N-TPC的性能,结果表明,A&N-TPC提高了信道传输稳定性,明显降低传感器节点的能耗。
2025年05期 v.20;No.153 558-564页 [查看摘要][在线阅读][下载 1565K] [下载次数:5 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]