本刊信息

主管:中国科学技术协会

主办:中国电子学会 南京航空航天大学

国际刊号:ISSN 1004-9037

国内刊号:CN 32-1367/TN

地址:南京市御道街29号 南京航空航天大学(明故宫校区)

电话:025-84892742

传真:025-84892742

E-mail:sjcj@nuaa.edu.cn

邮编:210016

期刊简介
  • 中文核心期刊(电子技术、通信技术类)
           中国科学引文数据库(CSCD)来源期刊
           中国科技论文统计源期刊
           荷兰Scopus数据库收录
           俄罗斯《文摘杂志》收录
           日本科学技术社数据库收录
           美国《剑桥科学文摘》(CSA)收录
           英国INSPEC数据库收录

显示方式:
  • “计算成像”专栏序言

    2024(2):247-247, DOI: 10.16337/j.1004-9037.2024.02.001

    Abstract:

  • 计算增强光学相干层析成像技术研究进展

    乔正钰,黄勇,郝群

    2024(2):248-270, DOI: 10.16337/j.1004-9037.2024.02.002

    Abstract:

    光学相干层析成像(Optical coherence tomography, OCT)作为一种重要的无损断层三维成像技术,应用场景广泛。不断发展的场景需求对OCT技术的性能提出了新的要求,包括分辨率提升、焦深解耦、像差校正及分辨率各向异性改善等。在过去的十几年内,一系列基于计算成像的方法被证明能有效实现上述性能提升。本文围绕上述OCT成像4个性能提升需求,总结综述了代表性的计算成像方法。分析对比了相应计算成像方法之间的优劣,并对未来发展趋势进行展望,旨在为计算成像方法在 OCT 领域的进一步研究与应用提供参考。

  • 计算成像技术中的点扩散函数工程

    乔敏达,白林阁,王书恒,王天宇,董雪,相萌,刘飞,刘金鹏,邵晓鹏

    2024(2):271-296, DOI: 10.16337/j.1004-9037.2024.02.003

    Abstract:

    围绕光学成像中点扩散函数(Point spread function, PSF)在计算成像中的新内涵与应用,介绍了传统光学成像中PSF的概念以及PSF在光学系统设计中关键作用,并简要说明了几种利用PSF恢复图像算法以及图像评价指标。在此基础上以计算成像框架下信息传递的视角重新审视了PSF的内涵,从狭义、广义光学系统两个方面对计算成像领域中的相关研究进行了归纳总结,最后展望了PSF工程技术的应用前景及发展趋势。

  • 计算成像在全息存储相位恢复中的应用研究进展

    郝建颖,林雍坤,刘宏杰,陈瑞娴,宋海洋,林达奎,林枭,谭小地

    2024(2):297-311, DOI: 10.16337/j.1004-9037.2024.02.004

    Abstract:

    全息存储技术作为一种三维体存储、二维面数据传输的数据存储技术,具有存储密度高、数据传输快等特点,是解决海量数据长期存储的有力方案之一。传统全息存储方法受到光电探测器只对强度响应的限制,通常采用纯振幅编码进行调制,但仅利用振幅信息无法完全发挥全息技术本身优势,如何简单快速、稳定精确地解码相位信息是全息存储技术面临的现实问题。计算成像因其算法多变、高感知维度等特点为全息存储技术的相位恢复问题提供了新的思路。本文主要从迭代计算相位恢复和深度学习相位重建角度回顾近年来利用计算成像技术解决全息存储相位恢复问题的一些工作,从存储密度提升、数据读取速度提升以及数据读取稳定性等角度对工作进行了分析,并对该方向未来发展做出展望。

  • 基于快速分解后向投影算法的小天体快速三维成像

    胡超然,韦明川

    2024(2):312-323, DOI: 10.16337/j.1004-9037.2024.02.005

    Abstract:

    雷达成像技术凭借其快速、无损伤以及高分辨率的特点,在深空探测领域得到了日益广泛的关注。针对合成孔径雷达(Synthetic aperture radar, SAR)三维成像过程中运算效率低的问题,基于小天体弱引力和快速自旋的特点,提出了一种适用于慢飞越观测模式的快速分解后向投影(Fast factorized back-projection, FFBP)三维成像算法。首先,分析了慢飞越模式下的等效运动模型,基于运动模型将二维极坐标系成像域扩展至三维球坐标系成像域,对三维FFBP算法中的孔径划分以及图像融合问题进行了深入分析,推导了子孔径二维划分规则和图像递归融合方法,并给出了具体实现流程。最后通过数值仿真和实测数据验证了算法的有效性。实验结果表明,所提成像算法可大幅提升运算效率,根据不同的孔径划分方式,相较于后向投影(Back-projection, BP)算法,可实现30~50倍的加速比,并获得与经典BP算法近似的成像性能。

  • 基于频谱特征自适应采样的傅里叶单像素成像方法

    肖振坤,张永峰,魏文卿,邓琥

    2024(2):324-336, DOI: 10.16337/j.1004-9037.2024.02.006

    Abstract:

    傅里叶单像素成像(Fourier single-pixel imaging, FSI)中成像效率的提升主要借助优化重构算法和采样方法来实现,但在采样次数有限的情况下,FSI无法准确采样关键频率,导致成像质量差。为解决这一问题,提出一种频谱特征自适应采样策略。首先,研究傅里叶域中能量的集中程度,以此确定低频等距预采样的最优半径。进一步,通过预采样低频分量估计关键频谱位置的方式,测量相应的傅里叶系数,最终实现图像重构。与基于高频方向能量连续性的自适应采样方法相比,该方法可以针对不同频谱特征目标,自适应选择较优采样路径,获取关键傅里叶系数,进而改善成像质量,其峰值信噪比提高2.28 dB,结构相似度提高15.83%。因此,该方法在应对FSI对未知特征目标进行成像时,具有高效空间信息采集的优点,有望在单像素快速实时成像中得到应用。

  • 基于事件信息与深度学习的高动态范围三维重建

    王杰,魏振东,王启江,张启灿,王亚军

    2024(2):337-347, DOI: 10.16337/j.1004-9037.2024.02.007

    Abstract:

    采用光学三维成像技术测量金属零件、黑色物体以及半透明物体等高动态范围(High dynamic range,HDR)表面的三维轮廓是一个极具挑战性的问题。目前,传统方法对存在较低反射以及半透明区域的场景进行重建还有一定的局限性,半透明物体的内部反射噪声很难消除。现有基于深度学习的方法通常使用相对较强的激光强度,这可能会损坏样品,同时会出现采集图像过曝现象,需要对激光强度进行繁琐的调整。针对这些问题,本文提出基于事件信息和深度学习算法的高动态场景三维测量方法。事件相机通过异步记录单个像素的亮度变化,无需等待全局曝光时间,具有高动态响应范围,能够充分采集到HDR场景的激光条纹反射信息。引入深度卷积神经网络(Deep convolutional neural network,DCNN)来消除半透明物体的内部噪声以及金属物体高反光的过曝影响,同时增强弱激光条纹图像质量。实验结果表明,本文方法能够应用低功率线激光扫描成功实现HDR场景的高质量三维重建。

  • 基于语义分割和融合残差U-Net的单视光学遥感影像三维重建方法

    黄桦,朱宇昕,章历,陈志达,张乙志,王博

    2024(2):348-360, DOI: 10.16337/j.1004-9037.2024.02.008

    Abstract:

    从单视遥感图像进行三维重建本身是一个解不唯一的非适定问题,往往需要大量的人工经验来补充缺失信息以构建完整三维模型。为了解决这一问题,提出了一种基于语义分割和融合残差U-Net的单视遥感影像三维重建方法。该方法包括语义分割和单视遥感影像高度估计两个阶段。语义分割阶段使用U-Net确定地物属性,在此基础上改进U-Net对遥感影像进行高度估计,并联合语义特征进行锚定高度回归以提高重建精度。针对改进U-Net,通过嵌入不同数量与通道的残差块,强化编码器的特征提取能力,并修改解码器输出层使其适应于高度回归任务,从而实现逐像素预测遥感影像的数字表面模型(Digital surface model, DSM)高度值。在公开的US3D数据集上得到了均方根误差(Root mean square error,RMSE)为2.751 m、平均绝对误差(Mean absolute error,MAE)为1.446 m的结果,重建结果均优于其余网络,证实该方法实现了基于单视遥感影像的三维估计,能够重建地物的分布结构。

  • 多粒度三支决策研究进展

    钱进,郑明晨,周川鹏,刘财辉,岳晓冬

    2024(2):361-375, DOI: 10.16337/j.1004-9037.2024.02.009

    Abstract:

    多粒度三支决策利用三支决策理论,从多视角、多层次对复杂问题进行数据分析与处理,逐渐成为一种高效、可靠的智能决策方法。本文对多粒度三支决策的研究工作进行综述,主要介绍了多粒度融合策略、多视角三支决策和多层次三支决策,以及从定性和定量两个角度探讨了多粒度三支决策,讨论了不同多粒度三支决策模型之间的关系,并指出了多粒度三支决策研究中存在的若干问题,为该领域的深入研究提供参考。

  • 分布式稀疏软大间隔聚类

    谢云轩,陈松灿

    2024(2):376-384, DOI: 10.16337/j.1004-9037.2024.02.010

    Abstract:

    虽然软大间隔聚类(Soft large margin clustering,SLMC)相比其他诸如K-Means等算法具有更优的聚类性能与某种程度的可解释性,然而当面对大规模分布存储数据时,均遭遇了同样的可扩展瓶颈,其涉及的核矩阵计算需要高昂的时间代价。消减此代价的有效策略之一是采用随机Fourier特征变换逼近核函数,而逼近精度所依赖的特征维度常常过高,隐含着可能过拟合的风险。本文将稀疏性嵌入核SLMC,结合交替方向乘子法(Alternating direction method of multipliers, ADMM),给出了一个分布式稀疏软大间隔聚类算法(Distributed sparse SLMC, DS-SLMC)来克服可扩展问题,同时通过稀疏化获得更好的可解释性。

  • 一种半监督金融事件多标签分类方法

    杨卓峰,李旸,李德玉

    2024(2):385-394, DOI: 10.16337/j.1004-9037.2024.02.011

    Abstract:

    随着数字金融服务业的不断发展,互联网和金融服务系统积累了海量文本数据,对金融文本中描述的金融事件自动分类是金融科技的现实需求,也是自然语言处理和机器学习领域广泛关注的方向。目前,深度学习方法已在文本分类中广泛应用,针对文本数据中的金融事件多标签分类中存在的已标注数据缺少、已有深度学习方法消耗资源大以及现有方法未利用金融事件文本的具体特点等问题,通过采用ALBERT和TextCNN等表示工具,引入主体词注意力机制,提出了一种半监督金融事件多标签分类方法。首先,通过无监督数据增强(Unsupervised data augmentation,UDA)方法缓解标注数据量不足的问题;其次,引入了主体词注意力机制,使用ALBERT动态词向量表征方法对文本中的词进行表示;然后,利用TextCNN对文本进行综合语义表示;最后,分别采用交叉熵和KL散度度量标记数据和无标记数据的损失来训练模型。在金融文本数据集上验证了本文所提方法的有效性。

  • 结合图像纹理的自适应透射率修正去雾算法

    孙景荣,陈哲哲,王健凯,宋诗斌,赵静

    2024(2):395-405, DOI: 10.16337/j.1004-9037.2024.02.012

    Abstract:

    图像去雾算法在户外智能监控及交通导航等领域普遍应用,通过去雾后提高图像的清晰度以提高目标的识别效果。暗通道及其改进算法在天空等景深灰色较亮区域的透射率估计存在偏差,易导致图像失真、细节模糊等问题,对智能交通领域图像识别有严重影响。本文提出了自适应透射率去雾方法对透射率进行补偿,采用对数变换获得对数补偿算子调节景深区域透射率,根据图像信息丰富程度计算出暗通道的置信度,结合图像纹理信息构造出纹理补偿算子,通过自适应透射率补偿参数调整灰色亮部区域的初始透射率,可有效改善图像去雾后失真等问题。本算法的平均梯度、信噪比、信息熵等客观指标较其他去雾算法均有所提高,图像中灰色亮部区域透射率补偿效果良好,复原图像细节清晰自然、亮度适中,有效提升了图像质量。

  • 一种融合激励和颤音建模的端到端歌唱合成方法

    周骁,胡亚军,潘嘉,胡国平,凌震华

    2024(2):406-415, DOI: 10.16337/j.1004-9037.2024.02.001

    Abstract:

    近年来,歌唱合成技术快速发展,基于变分推理和流模型的端到端歌唱合成(VISinger)成为主流,但其在效果上和真人仍有一定差距,主要体现在合成歌声中的音高听感不连续、颤音合成不佳及发音不稳定等。为此,本文针对性地提出了一系列改进方法:针对基频稳定性问题,提出在解码器中增加激励模块,将基频信息以激励信号的形式显式提供给解码器;针对颤音合成不自然问题,增加颤音预测模块,通过流式模型和变分数据增强,显式对歌声中的颤音进行建模;进一步在先验网络中增加ReZero策略。实验结果显示,增加激励信号能提升合成基频的稳定性,颤音建模对颤音的恢复有显著提升作用,ReZero策略对训练速度和发音稳定性有一定提升。主观测听中,本文提出的模型在歌唱合成自然度上相比VISinger有显著优势,平均意见分(Mean opinion score, MOS)达到3.95,对比两阶段建模方法DiffSinger+HiFiGAN也有明显优势,证明了本文所提方法的有效性。

  • 基于自注意力机制的音频对抗样本生成方法

    李珠海,郭武

    2024(2):416-423, DOI: 10.16337/j.1004-9037.2024.02.014

    Abstract:

    随着个人语音数据在网络上的传播以及自动说话人识别算法的发展,个人的声纹特征面对着泄露的风险。音频对抗样本可以在人耳主观听觉不变的前提下,使得自动说话人识别算法失效,从而保护个人的声纹特征。本文在典型的音频对抗样本生成算法FoolHD模型的基础上引入了自注意力机制来改进对抗样本生成,该方法称为FoolHD-MHSA。首先,使用卷积神经网络作为编码器来提取输入音频频谱的对抗扰动谱图;然后利用自注意力机制从全局角度提取扰动谱不同部分特征的关联特征,同时将网络聚焦到扰动谱中的关键信息、抑制无用信息;最后,使用解码器将处理后的扰动谱隐写到输入频谱中得到对抗样本频谱。实验结果表明,FoolHD-MHSA方法生成的对抗样本相比FoolHD方法有着更高的攻击成功率和平均客观语音质量评估(Perceptual evaluation of speech quality,PESQ)得分。

  • 基于多任务学习的语音情感识别

    李云峰,闫祖龙,高天,方昕,邹亮

    2024(2):424-432, DOI: 10.16337/j.1004-9037.2024.02.001

    Abstract:

    在近期的语音情感识别研究中,研究人员尝试利用深度学习模型从语音信号中识别情感。然而,传统基于单任务学习的模型对语音的声学情感信息关注度不足,导致情感识别的准确率较低。鉴于此,本文提出了一种基于多任务学习、端到端的语音情感识别网络,以挖掘语音中的声学情感,提升情感识别的准确率。为避免采用频域特征造成的信息损失,本文利用基于时域信号的Wav2vec2.0自监督网络作为模型的主干网络,提取语音的声学特征和语义特征,并利用注意力机制将两类特征进行融合作为自监督特征。为了充分利用语音中的声学情感信息,使用与情感有关的音素识别作为辅助任务,通过多任务学习挖掘自监督特征中的声学情感。在公开数据集IEMOCAP上的实验结果表明,本文提出的多任务学习模型实现了76.0%的加权准确率和76.9%的非加权准确率,相比传统单任务学习模型性能得到了明显提升。同时,消融实验验证了辅助任务和自监督网络微调策略的有效性。

  • IRS辅助大规模MIMO系统中抑制残余硬件损伤的AQBFO无源波束赋形方案

    彭坤,梁彦,李飞

    2024(2):433-444, DOI: 10.16337/j.1004-9037.2024.02.016

    Abstract:

    由通信收发机硬件非理想特性导致的残余硬件损伤在智能反射面(Intelligent reflecting surface, IRS)辅助的大规模多输入多输出(Multiple-input multiple-output, MIMO)系统中难以避免,并且会严重降低上行用户的可达和速率。针对这一问题,本文提出了一种基于自适应量子菌群觅食优化(Adaptive quantum bacterial foraging optimization, AQBFO)算法的无源波束赋形方案,用于抑制残余硬件损伤对系统性能的影响。首先,基于统计信道状态信息(Channel state information, CSI)推导出系统上行可达和速率的近似解析表达式。然后,以最大化和速率为目标,基于AQBFO算法对无源波束赋形进行优化。仿真结果验证了在IRS辅助大规模MIMO系统中,基于AQBFO算法的无源波束赋形方案能够有效抑制残余硬件损伤的影响,并显著提升系统的上行遍历和速率。

  • 一种跳转向量的隐性加权分数傅里叶变换通信方法

    刘芳,黄珂婷,侯宇,冯永新

    2024(2):445-455, DOI: 10.16337/j.1004-9037.2024.02.017

    Abstract:

    加权分数傅里叶变换(Weighted fractional Fourier transform,WFRFT)技术可以极大地改变信号的特性,使信号的统计特性多样化,从而有效地保障通信信息安全。为解决单参数WFRFT通信抗扫描能力不足的问题,以单参数WFRFT为切入点,深入研究单参数分数域的形成机理,分析其潜在的微观特征和暗特征,从而提出了一种基于跳转向量的隐性WFRFT通信方法(Implicit WFRFT communication method of jump vector,IWVJ)。利用调制阶数与星座图的关系,建立了跳变矩阵和跳变向量,并以此制定了控制规则。此外,通过跳变向量控制获得动态调制阶数,从而达到安全通信的目的。仿真结果表明,IWVJ方法对授权接收机具有较高的反变换解调相似度和较低的误码率,相比于具有普适扫描能力的非授权接收机性能更优。同时对解调阶数误差、基础调制阶数和跳转频率等参数的设置给出了适用的建议,使IWVJ方法能够更好地应用于通信系统,为具有抗干扰、抗截获和抗欺骗能力的保密通信提供技术依据。

  • 基于密文KNN检索的室内定位隐私保护算法

    欧锦添,乐燕芬,施伟斌

    2024(2):456-470, DOI: 10.16337/j.1004-9037.2024.02.018

    Abstract:

    在定位请求服务中,如何保护用户的位置隐私和位置服务提供商(Localization service provider, LSP)的数据隐私是关系到WiFi指纹定位应用的一个具有挑战性的问题。基于密文域的K-近邻(K-nearest neighbors,KNN)检索,本文提出了一种适用于三方的定位隐私保护算法, 能有效提升对LSP指纹信息隐私的保护强度并降低计算开销。服务器和用户分别完成对指纹信息和定位请求的加密,而第三方则基于加密指纹库和加密定位请求,在隐私状态下完成对用户的位置估计。所提算法把各参考点的位置信息随机嵌入指纹,可避免恶意用户获取各参考点的具体位置;进一步利用布隆滤波器在隐藏接入点信息的情况下,第三方可完成参考点的在线匹配,实现对用户隐私状态下的粗定位,可与定位算法结合降低计算开销。在公共数据集和实验室数据集中,对两种算法的安全、开销和定位性能进行了全面的评估。与同类加密算法比较,在不降低定位精度的情况下,进一步增强了对数据隐私的保护。

  • 用于正弦波频率估计的修正I-Rife算法

    王哲文,许晖,易辉跃,黄浩,杨柳,邓鹤鸣,张武雄,顾豪爽,胡永明

    2024(2):471-480, DOI: 10.16337/j.1004-9037.2024.02.019

    Abstract:

    对正弦波信号的频率估计是雷达领域常见的问题。当真实频率接近量化频点时,I-Rife算法的频移因子的计算会产生较大误差,为提高频率估计的精度,本文通过分析Rife及I-Rife算法的性能及误差产生的原因,利用频谱细化的方法,提出了一种修正I-Rife算法,即用峰值频点左右各0.5点处的频谱幅值来替代频谱峰值点的幅值和次大值频点处的幅值进行插值计算,对频率偏移值进行更为准确的估计,在计算量与I-Rife算法几乎相同的情况下,有效地提高了频率的估计精度。仿真结果表明,改进后的I-Rife算法整体性能优于I-Rife算法,且估计的均方根误差更接近于克拉美-罗下界。

  • 基于稀疏约束的低复杂度可变分数时延滤波器

    王静雯,周文静,沈明威,韩国栋

    2024(2):481-489, DOI: 10.16337/j.1004-9037.2024.02.020

    Abstract:

    针对基于Farrow结构的可变分数时延(Variable fractional delay , VFD)滤波器需求解大量子滤波器系数这一关键问题,本文将稀疏约束理论引入滤波器的权系数优化中,研究具有稀疏系数的Farrow结构滤波器。在极大极小(Minimax)准则下,通过添加L1正则化约束项改进权系数优化模型,在系数(反)对称性基础上进一步增加系数的稀疏度。然后,采用交替方向乘子法(Alternating direction method of multipliers ,ADMM)进行权系数迭代求解。仿真实验表明,本文提出的基于稀疏约束的VFD滤波器在保证高延迟精度的同时,乘法器和加法器分别减少了47.69%和58.60%,极大地降低了系统运算量以及复杂度。

  • 基于脑电节律能量与模糊熵的VR诱发晕动症水平检测研究

    周占峰,化成城,柴立宁,严颖,刘佳,付荣荣

    2024(2):490-500, DOI: 10.16337/j.1004-9037.2024.02.021

    Abstract:

    晕动症一直是影响虚拟现实用户体验及限制虚拟现实行业发展的一个关键因素。为解决这一问题,本文研究了虚拟现实晕动症对大脑神经活动的影响,并利用脑电特征对晕动症水平进行检测。为得到可度量眩晕水平的特征,记录受试者在体验眩晕测试场景前及过程中的脑电信号,计算节律能量和模糊熵,并利用统计分析进行特征选择,最后分类验证该特征的有效性。结果表明,受试者产生晕动症时,CP4和Oz的θ、α频段能量及C4的β、γ频段能量显著降低(p<0.01);在模糊熵方面,δ频段有FC4、Cz模糊熵值显著升高(p<0.000 1),β频段有O1模糊熵值显著降低(p<0.000 1)。对比线性判别分析(Linear discriminant analysis, LDA)、逻辑回归(Logistic regression, LR)和支持向量机(Support vector machine, SVM),K最近邻(K-nearest neighbor, KNN)算法的分类效果较好,它在节律能量和模糊熵上的分类准确率分别为89%和91%。本研究表明脑电节律能量及模糊熵有望成为晕动症水平检测的有效指标,为研究虚拟现实晕动症成因及缓解方案提供客观依据。

微信公众号二维码
快速检索
检索项
检索词
卷期检索