信息科学与工程
 首页  学院概况  机构设置  师资队伍  科学研究  人才培养  党建工作  学生活动  招聘就业  实践教学  安全管理 
教授

黄浩
2017年03月01日 11:19:00   审核人:

黄浩

undefined

教授、博士研究生导师

研究领域:语音与声学信号处理、自然语言处理、机器学习

办公室&实验室:新疆大学校本部2号教学楼410室,新疆大学校本部科技楼313室

电子邮件:hwanghao@gmail.com,huanghao@xju.edu.cn

联系电话:(+86)0991-8582023

教育背景

  1. 2004.09-2008.11 上海交通大学 电子工程系 博士

  2. 2001.09-2004.07 新疆大学 电气工程学院 硕士

  3. 1995.09-1999.07 上海交通大学 信息与控制工程系 学士

工作简历

  1. 2017.01-至今 新疆大学信息科学与工程学院 教授

  2. 2009.10-2016.12 新疆大学信息科学与工程学院 副教授

  3. 2008.01-2009.09 新疆大学信息科学与工程学院 讲师

  4. 1999.09-2008.01 新疆大学电气工程学院 讲师

学术兼职

  1. IEEE会员,国际语音通信协会会员,中国计算机学会会员,中国声学学学会会员

  2. 下列期刊或者国际会议的审稿人:

    IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP).

    IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP).

    IEEE Spoken Language Technology Workshop (SLT).

研究内容

长期从事音频、语音与语言信息处理、多媒体信息处理、机器学习与人机交互技术等领域的研究工作。当前研究兴趣包括:语音识别、语音合成与转换、语音信号处理、语音关键词检出、对话系统与语音交互、语音内容与音频场景分析等。

学术合作

与新加坡南洋理工大学Tesemak实验室 Eng Siong Chng教授,Haihua Xu博士,日本NICT Sheng Li博士长期保持学术合作与学生交流访问。

主持项目

  1. 科技创新2030-“新一代人工智能”重大项目以中文为核心的多语种自动翻译研究-课题2-面向资源稀缺的多语种语音识别 2020.11-2023.10 参与/课题技术负责人,365万

  2. 国家重点研发项目 民族民间文化资源传承与开发利用技术集成与应用示范(项目编号:2017YFB1402100) 课题1:民族民间文化资源收集和民族语言文化传播研究( 课题编号:2017YFB1402101) 课题负责人  2017.12 -2020.11 100 万元

  3. 国家自然科学基金地区基金 “基于无监督学习方法的口语理解与人机对话行为研究”(2017.1-2020.12)  42万元

  4. 国家自然科学基金地区基金“口语对话系统技术在自由表述语言学习中的应用研究-以新疆少数民族学生的普通话学习为例”(2014.1-2017.12) 45万元

  5. 国家自然科学基金地区基金“面向新疆少数民族汉语语言学习的自动发音错误检测方法的研究” (2010.1-2012.12) 24.0万元

学术成果

代表性论文

在语音与声学处理顶级期刊IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP)、Journal of the Acoustical Society of America (JASA) 权威国际会议(ICASSP, INTERSPEECH)发表论文多篇(以下信息更新至2021年3月):

  1. Guodong Ma, Pengfei Hu, Jian Kang, Nurmemet Yolwas, Shen Huang*, Hao Huang*. Leveraging Phone Mask Training for Phonetic-Reduction-Robust E2E Uyghur Speech Recognition. Interspeech 2021. (Top Conference, CCF Rank C).

  2. Jicheng Zhang, Yizhou Peng, Pham Van Tung, Haihua Xu, Hao Huang *, Eng Siong Chng. E2E-based Multi-task Learning Approach to Joint Speech and Accent Recognition. Interspeech 2021. (Top Conference, CCF Rank C).

  3. Kai Wang, Hao Huang*, Ying Hu, Zhihua Huang, Sheng Li.  End-to-End Speech Separation Using Orthogonal Representation in Complex and Real Time-Frequency Domain.  Interspeech 2021. (Top Conference, CCF Rank C).

  4. Xiao Kang, Hao Huang*, Ying Hu, Zhihua Huang. Connectionist temporal classification loss for vector quantized variational autoencoder in zero-shot voice conversion. Digital Signal Processing (2021): 103110. (SCI)

  5. Hao Huang*, Kai Wang, Ying Hu, Sheng Li. Encoder-Decoder based Pitch Tracking and Joint Model Training for Mandarin Tone Classification. The 46th IEEE International Conference on Acoustics, Speech and Signal Processing, June, 6-11, Toronto, Canada, 6943-6947, 2021. (Top Conference, 2021, CCF Rank B)

  6. Weiqi Gao, Hao Huang*. A gating context-aware text classification model with BERT and graph convolutional Networks. Journal of Intelligent and Fuzzy Systems. vol. 40, no. 3, pp. 4331-4343, 2021. (SCI)

  7. Tingzhi Mao, Yerbolat Khassanov, Van Tung Pham, Haihua Xu, Hao Huang*, Eng Siong Chng. Approaches to Improving Recognition of Underrepresented Named Entities in Hybrid ASR Systems. The 12th International Symposium on Chinese Spoken Language Processing (ISCSLP), 2021.

  8. Haobo Zhang, Haihua Xu, Van Tung Pham, Hao Huang*, Eng Siong Chng. Monolingual Data Selection Analysis for English-Mandarin Hybrid Code-switching Speech Recognition. The 21st Annual Conference of the International Speech Communication Association, (INTERSPEECH), 2392-2396, 2020. (Top conference, CCF Rank C)

  9. Zhong Ying, Ying Hu*, Hao Huang, and Wushour Silamu.  A Lightweight Model Based on Separable Convolution for Speech Emotion Recognition. Proc. Interspeech 2020 (2020): 3331-3335.

  10. 董兴磊,胡英*,黄浩,吾守尔.斯拉木,基于稀疏卷积非负矩阵部分联合分解的单声道语音分离. 自动化学报,2020.

  11. Hao Huang*, Haihua Xu, Ying Hu, Gang Zhou, A transfer learning approach to goodness of pronunciation based automatic mispronunciation detection. Journal of the Acoustical Society of America (JASA).  142(5), 2017. (TOP Journal, CCF Rank B)

  12. Haihua Xu, Hang Su, Chongjia Ni, Xiong Xiao, Hao Huang, Eng Siong Chng and Haizhou Li. Semi-supervised and Cross-lingual Knowledge Transfer Learnings for DNN Hybrid Acoustic Models under Low-resource Conditions. INTERSPEECH 2016. (Top conference, CCF Rank C)

  13. Hao Huang*,Haihua Xu,Xianhui Wang,Wushour Silamu,Maximum F1-Score Discriminative Training Criterion for Automatic Mispronunciation Detection, IEEE/ACM Transactions on Audio, Speech and Language Processing, 23 (4), 787-797, 2015.(SCI, Top journal, CCF Rank B)

  14. 黄浩*,徐海华,王羡慧,吾守尔.斯拉木,自动发音错误检测中基于最大化F1值准则的区分性特征补偿训练算法,电子学报,2015,43(7):1294-1299.

  15. Hao Huang, Wang J, Abudureyimu H. Maximum F1-score discriminative training for automatic mispronunciation detection in computer-assisted language learning. Thirteenth Annual Conference of the International Speech Communication Association (INTERSPEECH), 2012. Oral Presentation (Top conference, CCF Rank C).

  16. 黄浩*、李兵虎、吾守尔·斯拉木. 区分性模型组合中基于决策树的声学上下文建模方法.自动化学报, 09期, 1449-1458, 2012 ,EI, 期刊论文

  17. Hao Huang*, Binghu Li. Lattice Based Discriminative Model Combination Using Automatically Induced Phonetic Contexts. 12th Annual Conference of the International Speech Communication Association, INTERSPEECH 2011, Florence, 2011/8/29, Poster Presentation. (Top conference, CCF Rank C)

  18. 黄浩*、李兵虎. Automatic context induction for tone model integration in Mandarin speech recognition,中国邮电高校学报(英文版), 19(1), 94-100, 2012/1/20

  19. Xiong Y, Zhu J, Huang Hao, Haihua Xu. Minimum tag error for discriminative training of conditional random fields. Information Sciences, 2009, 179(1): 169-179. (SCI CCF Rank B)

  20. Huang Hao, Zhu J. Discriminative incorporation of explicitly trained tone models into lattice based rescoring for Mandarin speech recognition[C]. Acoustics, Speech and Signal Processing, 2008. ICASSP 2008. IEEE International Conference on. IEEE, 2008: 1541-1544.(Top conference, CCF Rank B)

  21. HUANG H, Jie ZHU. Discriminative tonal feature extraction method in mandarin speech recognition. The Journal of China Universities of Posts and Telecommunications, 2007, 14(4): 126-130.EI 期刊论文

  22. Huang H, Zhu J. Minimum phoneme error based filter bank analysis for speech recognition. 2006 IEEE International Conference on Multimedia and Expo (ICME), 2006: 1081-1084 (CCF Rank B).

荣誉奖励

  1. 黄浩 1/4 “A Transfer Learning Approach to Goodness of Pronunciation for Automatic Mispronunciation Detection” 第十五届自治区自然科学优秀论文奖二等奖 排名第一 获奖人:黄浩 徐海华 胡英 周刚

  2. 黄浩 1/4 “Maximum F1-Score Discriminative Training Criterion for Automatic Mispronunciation Detection” 第十四届自治区自然科学优秀论文奖一等奖 排名第一 获奖人:黄浩 徐海华 王羡慧 吾守尔.斯拉木

  3. 黄浩 1/2 “Automatic context induction for tone model integration in Mandarin speech recognition” 第十二届自治区自然科学优秀论文奖三等奖, 2013.9 排名第一 获奖人:黄浩 李兵虎

培养学生信息

目前读硕博士研究生19人,学生在读期间有机会赴海内外合作伙伴(大学与研究机构)进行为期6个月至两年的合作研究、交流实习。欢迎对我的研究方向感兴趣、自我驱动、不怕困难并敢于自我挑战,以及有志成为语音语言智能研究方向的科学家和工业界从业者的有志青年报考我的博士硕士研究生。 近年访问研究(实习)的学生与就业情况:

王俊超 (南洋理工大学,百度,入职百度语音组)

李文杰 (南洋理工大学,字节跳动,入职百度语音组)

张皓博 (在读,南洋理工大学)

茆廷志 (在读,南洋理工大学,阿里巴巴)

彭亦周 (在读,南洋理工大学)

张记成 (在读,南洋理工大学)

麻国栋 (在读,腾讯)

关闭窗口

新疆大学信息科学与工程学院  地址:新疆乌鲁木齐市胜利路666号
电话:8582558  邮编:830046
ICP备案号:
新ICP备号05003919