黄志华-计算机科学与技术学院

黄志华

发布者: 发布时间：2025-09-17 浏览次数：

黄志华

副教授，硕士研究生导师

语音语言方向,包括音频信号处理与检测，言语感知，机器学习与智能计算。

办公室＆实验室：新疆大学博达校区信息楼B405&B415

电子邮件：zhhuang@xju.edu.cn，echohzh@163.com

联系电话：(+86)

教育背景

2007.9-2012.6,上海交通大学电信学院,通信与信息系统，博士研究生
2001.9-2005.6,新疆大学信息科学与工程学院,通信与信息系统，硕士研究生
1995.9-1999.6,新疆大学电子系,信息工程,本科

工作简历

2017/12 - 至今，新疆大学，信息科学与工程学院，副教授
2004/09 - 2017/12，新疆大学，信息科学与工程学院，讲师
1999/09–2004/09，新疆大学电子系,助教

研究内容

研究内容包括：语音增强、语音合成，语音感知，基于声音信号的健康检测，语音伪造音检测、语音关键词检索、机器学习等。

社会工作

中国计算机学会会员
中国声学学会会员
CCF NOI赛新疆赛区技术委员会委员

奖励情况

新疆大学青年教师教学优秀奖
新疆大学优秀本科毕业论文指导教师
新疆大学优秀班主任

主持项目

国家自然科学基金(地区基金)，复杂环境下多语言言语感知机理及其在语音增强上的应用研究(项目编号：12464060), 31万，2025.1.1-2028.12.31
新疆维吾尔自治区自然科学基金面上项目基于可懂度感知的自适应语音增强关键技术研究(2022D01C59), 7万, 2022.4-2025.4
国家科技部重点研发项目子课题，基于子词的方言关键词检索方法研究(项目编号：2018YFC0823402)，90万，2019.2-2022.1
新疆维吾尔自治区重大科技专项子课题，复杂音频数据的分析与处理 (项目编号：2016A03007)，20万，2016.10-2020.12
新疆维吾尔自治区自然科学基金面上项目，基于压缩采样的语音特征提取关键技术(2017D01C044), 7万, 2017.7-2020.7
横向课题，语音降噪软件系统，20万，2020.8-2021.1

参与项目

国家自然科学基金(地区基金)，唱歌辅助系统相关技术的研究(61761041)，37万, 2018.1-2021.12
国家自然科学基金(地区基金), 基于无监督学习方法的口语理解与人机对话行为研究(61663044), 42万元, 2017.1-2020.12
横向课题，智能语音AI项目，90万，2021.1.1-2024.12.31

学术成果

Huang Z, Chen K, Yan Y. TV-MDiff: A Zero-Shot Text-To-Speech and Zero-Shot Voice Conversion System with Mamba-Based Diffusion Model[C]//International Joint Conference on Neural Networks(IJCNN). 2025.
Chen K, Huang Z, He L, Yan Y. UnitDiff: A Unit-Diffusion Model for Code-Switching Speech Synthesis[J]. IEEE Signal Processing Letters. 2025.32:1051-1055.
Chen K, Huang Z, He L, Yan Y. ZCS-CDiff: A Zero-Shot Code-Switching TTS System with Conformer-based Diffusion Model[C]// International Conference on Acoustics, Speech and Signal Processing(ICASSP). 2025.
Jiang Y, Huang Z. Fast Sampling Based on Policy Gradient for Diffusion-Based Speech Enhancement[C]//2024 IEEE 14th International Symposium on Chinese Spoken Language Processing (ISCSLP). 2024: 576-580.
Liang X, Huang Z. The Contributions of Formants to the Intelligibility in Uyghur Sine-Wave Sentences[C]//2024 IEEE 14th International Symposium on Chinese Spoken Language Processing (ISCSLP). 2024: 1-5.
Lu K，Huang Z，Yin M，Chen K. Optimizing Uyghur Speech Synthesis by Combining Pretrained Cross-Lingual Model[J]. ACM Transactions on Asian and Low-Resource Language Information Processing. 2024, 23(9):1-11.
Chen K, Huang Z, Lu K. Yan Y. CosDiff: Code-Switching TTS Model Based on A Multi-Task DDIM[C]// IEEE International Conference on Multimedia and Expo( ICME). 2024.
Li M, Huang Z. WavLM and Omni-Scale CNNs: Enhancing Boundary Detection in Partially Spoofed Audio[C]//2024 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC2024). 2024: 1-5.
Sun Z, Huang Z, Xu X, et al. Cross-Model Knowledge Distillation and Metadata Fusion for Respiratory Sound Classification[C]//National Conference on Man-Machine Speech Communication(NCMMSC2024). 2024: 370-377.
Xiong Y, Huang Z. M-CMGAN: Attempting to Use Mamba on Speech Enhancement[C]//National Conference on Man-Machine Speech Communication(NCMMSC). 2024: 15-27.

实验室招生

实验室以语音感知与声信号处理的基本理论与应用技术为研究方向，围绕多场景下的语音生成、语音感知、语音增强和声信号检测的相关理论与技术展开研究。目前已在多语言混合的语音合成、多语言语音感知、多场景下的语音增强、声信号疾病识别、低空无人机检测、伪造语音检测领域共计发表论文三十余篇，申请国家发明专利10项，软件著作权5项。实验室面向校内外招收信息与通信工程、新一代电子信息技术专业的硕士研究生，有意者可将个人简历和本科成绩单发至邮箱zhhuang@xju.edu.cn。