许敏强-计算机科学与技术学院

许敏强

发布者: 发布时间：2023-09-26 浏览次数：

许敏强

职称/职务：高工/讯飞数码首席科学家

专业：人工智能

研究方向：语音识别、多模态认知计算与内容安全

邮箱：mqxu7@iflytek.com

教育背景

2005.9-2011.7，中国科学技术大学，电路与系统，博士
2008.9-2010.9，伊利诺伊香槟分校（美国），IFP实验室，国家公派联培博士研究生
2001.9-2005.7，中国科学技术大学，电子信息科学与技术，学士

社会工作

2023.2-现在，讯飞数码，语音识别、多模态认知计算与内容安全等，首席科学家
2019.3-2023.1，国音智能，语音识别、语义理解等，首席科学家&研究院院长
2017.10-2019.3，百度，百度云事业群，语音识别、数字人技术，团队负责人
2013.4-2017.9，阿里巴巴，M工作室/iDST研究院，语音识别，阿里语音团队创始人之一，声纹算法负责人
2011.8-2013.3，盛大集团，创新院语音分院，语音识别，算法工程师
2008.5-2008.9，微软亚洲研究院，语音组，数字人技术

奖励情况

5. 2024年，安徽省合肥市高层次人才D类

4. 2018年，百度云事业群最佳团队奖, 百度最佳团队提名

3. 2018年，百度最高奖入围前20名

2. 2015年，浙江省杭州市余杭区“重点产业高层次人才引进(C类)”

1. 2008年，国家公派留学生奖学金

评测

11. 2024年，ASVspoof5，音频鉴伪比赛，非特定人开集任务，第一；特定人闭集、开集任务，均列第一

10. 2022年，大数据技能大赛，日语语音识别，优胜奖、最佳计算奖

9. 2022年，FFSVC 2022远场说话人识别，自监督任务和半监督任务，均列第一

8. 2022年，CNSRC 2022，说话人识别(开放赛道)，第一

7. 2021年，NIST SRE 2020(美国国家标准技术署说话人识别评测)，清华-国音联队，第一

6. 2021年，VoxSRC 2021，声纹识别track1(固定训练集)和track2(开放训练集)任务，均列第一

5. 2021年，VoxSRC 2020，声纹识别track1(固定训练集)和track2(开放训练集)，均列第一 (永久开放阶段，2021.03)

4. 2020年，中国人工智能大赛，音频深度伪造检测任务，第一名

3. 2008年，NIST SRE，多个项目中，获得一个第一名、一个第二名、两个第三名

2. 2006年，NIST SRE，对话电话语音说话人识别项目，第二名、第三名

1. 2005年，NIST SRE，对话电话语音说话人识别项目，第二名、第三名

主持项目

5. xxx可视化大模型技术研究，xx委，国家级，2024.8-2026.7，课题负责人，270万

4. 基于人工智能的DY YG图像智能化预处理技术研究，国家重点研发计划，国家级，2024.7-2026.6，课题负责人，366万

3. 基于大模型的DY数据内容分析及QB挖掘技术研究，国家重点研发计划，国家级， 2024.7-2026.6，课题负责人， 426万

2. 声纹识别大数据研判平台，2020.3-2022.2，参与，810万

1. 声纹数据库识别算法融合技术攻关，2019.7-2020.7，参与，50万

学术成果

19. [C] Yanyan Liu, Minqiang Xu*, Yihao Chen, Liang He, Lei Fang, Sian Fang, Lin Liu, Denoising GER: A Noise-Robust Generative Error Correction with LlM for Speech Recognition, IJCNN 2025(CCF C)

18. [C] Yihao Chen, Jialong Wang, Yunqi Hao, Minqiang Xu*, Liang He, Lei Fang, Sian Fang, Sample-to-Sample Learning and inverted bottleneck for Speaker Verification, IJCNN 2025(CCF C)

17. [C] Yunqi Hao, Yihao Chen, Minqiang Xu*, Liang He, Lei Fang, Sian Fang, Lin Liu, Wav2DF-TSL: Two-stage Learning with Efficient Pre-training and Hierarchical Experts Fusion for Robust Audio Deepfake Detection, IJCNN 2025(CCF C)

16. [C] Zhaorui Sun, Yihao Chen, Jialong Wang, Minqiang Xu*, Lei Fang, Sian Fang, Lin Liu, Enhancing Self-Supervised Speaker Verification Using Similarity-Connected Graphs and GCN, IJCNN 2025(CCF C)

15. [J] Di Wang, Meiqi Hu, Yao Jin, Yuchun Miao, Jiaqi Yang, Yichu Xu, Xiaolei Qin, Jiaqi Ma, Lingyu Sun, Chenxing Li, Chuan Fu, Hongruixuan Chen, Chengxi Han, Naoto Yokoya, JING ZHANG, Minqiang Xu, Lin Liu, Lefei Zhang, Chen Wu, BO DU, Dacheng Tao, Liangpei Zhang, HyperSIGMA: Hyperspectral Intelligence Comprehension Foundation Model, IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI), 2025 (CCF A，中科院一区Top，IF 24.3)

14. [C] Yunqi Hao, Minqiang Xu*, Yihao Chen, Yanyan Liu, Liang He, Lei Fang, Lin Liu, Integrating Spectro-Temporal Cross Aggregation and Multi-Scale Dynamic Learning for Audio Deepfake Detection, ICASSP 2025(CCF B)

13. [TR] Yihao Chen, Haochen Wu, Nan Jiang, Xiang Xia, Qing Gu, YunQi Hao, Pengfei Cai, Yu Guan, Jialong Wang, Wei-Lin Xie, Lei Fang, Sian Fang, Yan Song*, Wu Guo*, Lin Liu*, Minqiang Xu*, USTC-KXDIGIT system description for ASVspoof5 Challenge, 2024

12. [C] Hongxia Zhang, Minqinag Xu*, Liang He, Scene Text Recognition via k-NN Attention-based Decoder and Margin-based Softmax Loss, PRCV 2024(CCF C)

11. [J] Di Wang, Jing Zhang, Minqiang Xu*, Lin Liu, Dongsheng Wang, Erzhong Gao, Chengxi Han, Haonan Gu, Bo Du, Dacheng Tao, Liangpei Zhang, MTP: Advancing Remote Sensing Foundation Model via Multitask Pretraining, IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, Vol. 17, pp. 11632–11654, 2024(IF5.5)

10. [C] Liang He, Zhihua Fang, Zuoer Chen, Minqiang Xu, Ying Meng, Penghao Wang, Multi-View Speaker Embedding Learning for Enhanced Stability and Discriminability. ICASSP 2024: 10081-10085(CCF B)

9. [C] Di Wang, Jing Zhang, Bo Du, Minqiang Xu*, Lin Liu, Dacheng Tao, Liangpei Zhang, SAMRS：Scaling-up Remote Sensing Segmentation Dataset with Segment Anything Model, NeurIPS 2023(CCF A)

8. [C] Zhida Song, Liang He, Baowei Zhao, Minqiang Xu, Yu Zheng, Dynamic Fully-Connected Layer for Large-Scale Speaker Verification. INTERSPEECH 2023: 2003-2007

7. [C] Miao Zhao, Yufeng Ma, Yiwei Ding, Yu Zheng, Min Liu, Minqiang Xu*， Multi-Query Multi-Head Attention Pooling and Inter-Topk Penalty for Speaker Verification. ICASSP 2022: 6737-6741(CCF B)

6. [TR] Yu Zheng, Yihao Chen, Jinghan Peng, Yajun Zhang, Min Liu, Minqiang Xu*, The SpeakIn System Description for CNSRC2022. Tech. Report, https://arxiv.org/abs/2209.10846

5. [TR] Yu Zheng, Jinghan Peng, Yihao Chen, Yajun Zhang, Jialong Wang, Min Liu, Minqiang Xu*, The SpeakIn Speaker Verification System for Far-Field Speaker Verification Challenge 2022. Tech. Report, https://arxiv.org/abs/2209.11625

4. [C] Miao Zhao, Yufeng Ma, Min Liu, Minqiang Xu*, The SpeakIn System for VoxCeleb Speaker Recognition Challange 2021, INTERSPEECH 2021 VoxSRC2021 Workshop

3. [TR] Yu Zheng, Jinghan Peng, Miao Zhao, Yufeng Ma, Min Liu, Xinyue Ma, Tianyu Liang, Tianlong Kong, Liang He*, Minqiang Xu*, THUEE system description for NIST 2020 SRE CTS challenge. Tech. Report, https://sre.nist.gov/pub/3, 2021

2. [C] Minqiang Xu, Xi Zhou, Beiqian Dai, Thomas S. Huang, GMM kernel by Taylor series for speaker verification. INTERSPEECH 2009: 1283-1286

1. [C] Minqiang Xu, Xi Zhou, Zhen Li, Beiqian Dai, Thomas S. Huang, Extended Hierarchical Gaussianization for scene classification. ICIP 2010: 1837-1840

培养学生信息

目前在读硕士研究生6人，已联合培养毕业研究生5人。研究生就业情况如下：
张红霞(2021级)，入职建设银行
王佳龙(2021级)，入职讯飞
关钧匀(2021级)，入职讯飞
刘燕燕(2022级)，入职奇瑞集团
郝韵其(2022级)，入职讯飞

其他

中国计算机学会(CCF)会员； CCF语音对话与听觉专委会执行委员，中国光学工程学会空间信息技术专业委员会委员；
下列期刊和会议审稿人：
IEEE Transactions on MultiMedia(TMM),InterSpeech, ACM MultiMedia(ACMMM)