黄志华
 |
副教授,硕士研究生导师
语音语言方向,包括音频信号处理与检测,言语感知,机器学习与智能计算。
办公室&实验室:新疆大学博达校区信息楼B405&B415
电子邮件:zhhuang@xju.edu.cn,echohzh@163.com
联系电话:(+86)
|
教育背景
2007.9-2012.6,上海交通大学电信学院,通信与信息系统,博士研究生
2001.9-2005.6,新疆大学信息科学与工程学院,通信与信息系统,硕士研究生
1995.9-1999.6,新疆大学电子系,信息工程,本科
工作简历
2017/12 - 至今,新疆大学,信息科学与工程学院,副教授
2004/09 - 2017/12,新疆大学,信息科学与工程学院,讲师
1999/09–2004/09,新疆大学电子系,助教
研究内容
研究内容包括:语音增强、语音合成,语音感知,基于声音信号的健康检测,语音伪造音检测、语音关键词检索、机器学习等。
社会工作
中国计算机学会会员
中国声学学会会员
CCF NOI赛新疆赛区技术委员会委员
奖励情况
新疆大学青年教师教学优秀奖
新疆大学优秀本科毕业论文指导教师
新疆大学优秀班主任
主持项目
国家自然科学基金(地区基金),复杂环境下多语言言语感知机理及其在语音增强上的应用研究(项目编号:12464060), 31万,2025.1.1-2028.12.31
新疆维吾尔自治区自然科学基金面上项目 基于可懂度感知的自适应语音增强关键技术研究(2022D01C59), 7万, 2022.4-2025.4
国家科技部重点研发项目子课题,基于子词的方言关键词检索方法研究(项目编号:2018YFC0823402),90万,2019.2-2022.1
新疆维吾尔自治区重大科技专项子课题,复杂音频数据的分析与处理 (项目编号:2016A03007),20万,2016.10-2020.12
新疆维吾尔自治区自然科学基金面上项目,基于压缩采样的语音特征提取关键技术(2017D01C044), 7万, 2017.7-2020.7
横向课题,语音降噪软件系统,20万,2020.8-2021.1
参与项目
国家自然科学基金(地区基金),唱歌辅助系统相关技术的研究(61761041),37万, 2018.1-2021.12
国家自然科学基金(地区基金), 基于无监督学习方法的口语理解与人机对话行为研究(61663044), 42万元, 2017.1-2020.12
横向课题,智能语音AI项目,90万,2021.1.1-2024.12.31
学术成果
Huang Z, Chen K, Yan Y. TV-MDiff: A Zero-Shot Text-To-Speech and Zero-Shot Voice Conversion System with Mamba-Based Diffusion Model[C]//International Joint Conference on Neural Networks(IJCNN). 2025.
Chen K, Huang Z, He L, Yan Y. UnitDiff: A Unit-Diffusion Model for Code-Switching Speech Synthesis[J]. IEEE Signal Processing Letters. 2025.32:1051-1055.
Chen K, Huang Z, He L, Yan Y. ZCS-CDiff: A Zero-Shot Code-Switching TTS System with Conformer-based Diffusion Model[C]// International Conference on Acoustics, Speech and Signal Processing(ICASSP). 2025.
Jiang Y, Huang Z. Fast Sampling Based on Policy Gradient for Diffusion-Based Speech Enhancement[C]//2024 IEEE 14th International Symposium on Chinese Spoken Language Processing (ISCSLP). 2024: 576-580.
Liang X, Huang Z. The Contributions of Formants to the Intelligibility in Uyghur Sine-Wave Sentences[C]//2024 IEEE 14th International Symposium on Chinese Spoken Language Processing (ISCSLP). 2024: 1-5.
Lu K,Huang Z,Yin M,Chen K. Optimizing Uyghur Speech Synthesis by Combining Pretrained Cross-Lingual Model[J]. ACM Transactions on Asian and Low-Resource Language Information Processing. 2024, 23(9):1-11.
Chen K, Huang Z, Lu K. Yan Y. CosDiff: Code-Switching TTS Model Based on A Multi-Task DDIM[C]// IEEE International Conference on Multimedia and Expo( ICME). 2024.
Li M, Huang Z. WavLM and Omni-Scale CNNs: Enhancing Boundary Detection in Partially Spoofed Audio[C]//2024 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC2024). 2024: 1-5.
Sun Z, Huang Z, Xu X, et al. Cross-Model Knowledge Distillation and Metadata Fusion for Respiratory Sound Classification[C]//National Conference on Man-Machine Speech Communication(NCMMSC2024). 2024: 370-377.
Xiong Y, Huang Z. M-CMGAN: Attempting to Use Mamba on Speech Enhancement[C]//National Conference on Man-Machine Speech Communication(NCMMSC). 2024: 15-27.
实验室招生
实验室以语音感知与声信号处理的基本理论与应用技术为研究方向,围绕多场景下的语音生成、语音感知、语音增强和声信号检测的相关理论与技术展开研究。目前已在多语言混合的语音合成、多语言语音感知、多场景下的语音增强、声信号疾病识别、低空无人机检测、伪造语音检测领域共计发表论文三十余篇,申请国家发明专利10项,软件著作权5项。实验室面向校内外招收信息与通信工程、新一代电子信息技术专业的硕士研究生,有意者可将个人简历和本科成绩单发至邮箱zhhuang@xju.edu.cn。