黄志华
发布者:     发布时间:2025-09-17    浏览次数:

黄志华

undefined

副教授,硕士研究生导师

语音语言方向,包括音频信号处理与检测,言语感知,机器学习与智能计算。

办公室&实验室:新疆大学博达校区信息楼B405&B415

电子邮件:zhhuang@xju.edu.cn,echohzh@163.com

联系电话:(+86)

教育背景

  1. 2007.9-2012.6,上海交通大学电信学院,通信与信息系统,博士研究生

  2. 2001.9-2005.6,新疆大学信息科学与工程学院,通信与信息系统,硕士研究生

  3. 1995.9-1999.6,新疆大学电子系,信息工程,本科

工作简历

  1. 2017/12 - 至今,新疆大学,信息科学与工程学院,副教授

  2. 2004/09 - 2017/12,新疆大学,信息科学与工程学院,讲师

  3. 1999/09–2004/09,新疆大学电子系,助教

研究内容

研究内容包括:语音增强、语音合成,语音感知,基于声音信号的健康检测,语音伪造音检测、语音关键词检索、机器学习等。

社会工作

  1. 中国计算机学会会员

  2. 中国声学学会会员

  3. CCF NOI赛新疆赛区技术委员会委员

奖励情况

  1. 新疆大学青年教师教学优秀奖

  2. 新疆大学优秀本科毕业论文指导教师

  3. 新疆大学优秀班主任

主持项目

  1. 国家自然科学基金(地区基金),复杂环境下多语言言语感知机理及其在语音增强上的应用研究(项目编号:12464060), 31万,2025.1.1-2028.12.31

  2. 新疆维吾尔自治区自然科学基金面上项目  基于可懂度感知的自适应语音增强关键技术研究(2022D01C59), 7万, 2022.4-2025.4

  3. 国家科技部重点研发项目子课题,基于子词的方言关键词检索方法研究(项目编号:2018YFC0823402),90万,2019.2-2022.1

  4. 新疆维吾尔自治区重大科技专项子课题,复杂音频数据的分析与处理 (项目编号:2016A03007),20万,2016.10-2020.12

  5. 新疆维吾尔自治区自然科学基金面上项目,基于压缩采样的语音特征提取关键技术(2017D01C044), 7万, 2017.7-2020.7

  6. 横向课题,语音降噪软件系统,20万,2020.8-2021.1

参与项目

  1. 国家自然科学基金(地区基金),唱歌辅助系统相关技术的研究(61761041),37万, 2018.1-2021.12

  2. 国家自然科学基金(地区基金), 基于无监督学习方法的口语理解与人机对话行为研究(61663044), 42万元,  2017.1-2020.12

  3. 横向课题,智能语音AI项目,90万,2021.1.1-2024.12.31

学术成果

  1. Huang Z, Chen K, Yan Y. TV-MDiff: A Zero-Shot Text-To-Speech and Zero-Shot Voice Conversion System with Mamba-Based Diffusion Model[C]//International Joint Conference on Neural Networks(IJCNN). 2025.

  2. Chen K, Huang Z, He L, Yan Y. UnitDiff: A Unit-Diffusion Model for Code-Switching Speech Synthesis[J]. IEEE Signal Processing Letters. 2025.32:1051-1055.

  3. Chen K, Huang Z, He L, Yan Y. ZCS-CDiff: A Zero-Shot Code-Switching TTS System with Conformer-based Diffusion Model[C]// International Conference on Acoustics, Speech and Signal Processing(ICASSP). 2025.

  4. Jiang Y, Huang Z. Fast Sampling Based on Policy Gradient for Diffusion-Based Speech Enhancement[C]//2024 IEEE 14th International Symposium on Chinese Spoken Language Processing (ISCSLP). 2024: 576-580.

  5. Liang X, Huang Z. The Contributions of Formants to the Intelligibility in Uyghur Sine-Wave Sentences[C]//2024 IEEE 14th International Symposium on Chinese Spoken Language Processing (ISCSLP). 2024: 1-5.

  6. Lu K,Huang Z,Yin M,Chen K.  Optimizing Uyghur Speech Synthesis by Combining Pretrained Cross-Lingual Model[J]. ACM Transactions on Asian and Low-Resource Language Information Processing. 2024, 23(9):1-11.

  7. Chen K, Huang Z, Lu K. Yan Y. CosDiff: Code-Switching TTS Model Based on A Multi-Task DDIM[C]// IEEE International Conference on Multimedia and Expo( ICME). 2024.

  8. Li M, Huang Z. WavLM and Omni-Scale CNNs: Enhancing Boundary Detection in Partially Spoofed Audio[C]//2024 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC2024). 2024: 1-5.

  9. Sun Z, Huang Z, Xu X, et al. Cross-Model Knowledge Distillation and Metadata Fusion for Respiratory Sound Classification[C]//National Conference on Man-Machine Speech Communication(NCMMSC2024). 2024: 370-377.

  10. Xiong Y, Huang Z. M-CMGAN: Attempting to Use Mamba on Speech Enhancement[C]//National Conference on Man-Machine Speech Communication(NCMMSC). 2024: 15-27.

实验室招生

实验室以语音感知与声信号处理的基本理论与应用技术为研究方向,围绕多场景下的语音生成、语音感知、语音增强和声信号检测的相关理论与技术展开研究。目前已在多语言混合的语音合成、多语言语音感知、多场景下的语音增强、声信号疾病识别、低空无人机检测、伪造语音检测领域共计发表论文三十余篇,申请国家发明专利10项,软件著作权5项。实验室面向校内外招收信息与通信工程、新一代电子信息技术专业的硕士研究生,有意者可将个人简历和本科成绩单发至邮箱zhhuang@xju.edu.cn。