米尔阿迪力江·麦麦提
发布者:     发布时间:2025-09-17    浏览次数:

米尔阿迪力江·麦麦提

undefined

博士,硕士生导师

研究领域:人工智能,自然语言处理,机器翻译,多模态大模型

办公室&实验室:

电子邮件:miradeljan51@xju.edu.cn

联系电话:

个人简介

中国共产党党员,2025年4月加入新疆大学从事教学科研工作,以高层次青年优秀人才A类引进至新疆大学计算机学院。2025年5月遴选为硕士研究生导师。2021年6月于清华大学计算机系获博士学位,师从孙茂松院士和刘洋教授,主要研究方向为低资源场景下的神经机器翻译方法。博士毕业后,于2021年7月加入阿里巴巴达摩院研究中心机器智能与语言技术实验室,担任NLP高级算法工程师,负责跨境电商AI智能客服系统的语义理解与意图分析等核心技术研发。2023年9月入选新疆维吾尔自治区"天池英才"计划;2024年8月获批国家自然科学基金青年科学基金项目。现任中国人工智能学会多语言智能信息处理专委会委员、中国计算机学会自然语言处理专委会委员、中国中文信息学会机器翻译专委会委员及民族语言文字信息专委会常委。主要研究方向为自然语言处理、机器翻译及文本语义理解。在EMNLP、NAACL、CIKM、ACM TALLIP、IJIS、TST、KBS等国内外顶级会议和期刊发表论文20余篇,长期担任ACL、EMNLP、AAAI、COLING、NAACL、IJCNN等国际顶级会议及ACM TALLIP、IJIS、JCSR等国际期刊审稿人与程序委员会委员。作为负责人或技术骨干参与国家自然科学基金项目、国际合作项目及企业横向课题多项,现主持国家自然科学基金青年基金项目、新疆维吾尔自治区高层次引进人才项目,以及国家自然科学基金评审专家。

教育背景

  1. 2015年9月—2021年6月  清华大学  计算机科学与技术专业  博士学位

  2. 2012年9月—2015年6月  新疆大学      软件工程专业      硕士学位

  3. 2008年9月—2012年6月  新疆大学  计算机科学与技术专业  学士学位

  4. 2007年9月—2008年6月  新疆大学       语言学院           预科

工作简历

  1. 2025年4月— 至今                 新疆大学               专任教师

  2. 2023年4月— 2025年4月  中国科学院新疆理化技术研究所       研究助理 (RA)

  3. 2021年7月— 2023年3月  阿里巴巴达摩院全球研究中心    NLP高级算工

  4. 2020年7月— 2021年7月  阿里巴巴达摩院全球研究中心    研究实习 (RI)

学术服务

  1. 国内学术机构(专委会)兼职:中国人工智能学会多语种智能信息处理专委会委员; 中国计算机学会自然语言处理专委会委员; 中国中文信息学会青年工作委员会会员; 中国中文信息学会民族语言文字信息专委会常委; 中国中文信息学会机器翻译专委会会员

  2. 国外学术机构兼职:Association for Computing Machinery (ACM) 会员; Institute of Electrical and Electronics Engineers (IEEE) 会员

  3. 国内学术服务:CCMT 2024赞助主席; CCMT 2025低资源语言信息处理论坛共同主席;国家自然科学基金函评专家

  4. 审稿服务:

    会议:ACL, EACL, NAACL, EMNLP, AAAI, COLING, ACMMM, IJCNN, MLIP, CCMT, LREC

    领域主席(AC): IJCNN2025, ICASSP2026

    期刊: International Journal of Intelligent Systems (IJIS), ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), Knowledge-Based Systems (KBS), International Journal of Computer Science Review (JCSR), Scientific Reports, International Journal of Machine Learning and Cybernetics (JMLC), International Journal of Data Science and Analytics (JDSA), Artificial Intelligence Review

  5. 国际学术会议报告:

    1.CIKM2022, 海报展示,线上,2022.10

    2.NAACL2022, 海报展示,线上,2022.06

    3.EMNLP2021, 主会口头报告,线上,2021.11

    4.ICIS 2018, 主会口头报告,北京大学,2018.10

    5.ICCSIP 2018, 主会口头报告,北京大学,2018.11

  6. 国内高校&企业学术交流报告

    1.“The Power of AI for General Applications in Medicine”, 西湖大学信工学院, 杭州, 2025.04

    2.“大模型时代ToolLearning 的必要性探讨”,昌吉学院,新疆, 2024.10

    3.“浅谈大模型时代下低资源语言机器翻译研究进展”,伊犁师范大学,新疆, 2023.11

    4.“阿里巴巴达摩院EMNLP2021见闻”,杭州,浙江, 2021.8

    5.“低资源语言神经网络机器翻译”,中央民大,北京, 2019.11.12

    6.“形态丰富语言之间提高低资源语言神经网络机器翻译模型性能”,深圳新译科技,深圳, 2019.6

    7.“清华大学博士论坛”,口头报告,清华大学,北京, 2019.3

    8.“基于未监督领域自适应的低资源语言神经网络机器翻译”,北京大学,北京, 2018.09

研究方向

  1. 自然语言处理:机器翻译、语义表示、情感分析、多语言信息处理、多语言预训练语言模型以及Language Grounding

  2. 大规模语言模型:指令微调(Instruction Tuning)、工具学习 (Tool Learning)、检索/知识增强生成(RAG/KAG)、智能体(Agent)

  3. 机器学习:半监督学习、无监督学习、强化学习

  4. 自然语言处理应用:NLP 下游任务应用

学术合作

【学术界】

清华大学自然语言处理与社会人文计算国家重点实验室(孙茂松院士);西湖大学自然语言处理实验室(张岳教授);厦门大学语言智能技术课题组(苏劲松教授);东北大学自然语言处理实验室(朱靖波教授);新加坡南洋理工大学Ann Tuan Luu 教授团队; Mohamed bin Zayed University of Artificial Intelligence (MBZUAI) 大学Preslov 教授团队;香港城市大学数据智能实验室(马辰教授);澳门大学自然语言处理实验室(Derek 教授)。

【企业界】

阿里巴巴(阿里云-达摩院、通义实验室、阿里国际、蚂蚁金服、阿里妈妈、阿里健康以及天猫国际【北京、杭州】);华为(2012实验室【北京、杭州、西安】,泊松实验室,诺亚方舟实验室【香港、深圳】);字节(AI Lab【北京、深圳、杭州、上海】);网易(AI、游戏【杭州】);腾讯(AI Lab、微信搜索、桌面浏览器部、安全部门【北京、深圳】);百度(OCR团队、百度NLP、百度搜索【北京】);京东AI Lab(北京);三星AI 研究院(北京)。

以上学界和业界几家单位长期保持学术合作与学术交流。

主持项目

  1. 国家自然科学基金青年项目,基于大模型的资源匮乏语言机器翻译方法研究(项目编号:62406316),2025.01-2027.12,项目经费:30万,主持,在研,排名1/1;

  2. 自治区天池英才计划,基于大规模语言模型的低资源神经机器翻译方法研究,2024.01–2027.01项目经费:75万,主持,在研,排名1/1;

学术成果

  1. Mieradilijiang Maimaiti*, Yuanhang Zheng, Ji Zhang, Yue Zhang, Wenpei Luo, Kaiyu Huang, “Improving Cross-lingual Representation for Semantic Retrieval with Code-switching”, in Knowledge-Based Systems (KBS) 2025, (中科院SCI一区 Top, CCF推荐期刊)

  2. Mieradilijiang Maimaiti, Yang Liu*, Huanbo Luan, and Maosong Sun, “Enriching the Transfer Learning with Pre-Trained Lexicon Embedding for Low-Resource Neural Machine Translation”, Tsinghua Science & Technology (TST), volume 27, issue 1, p150-163, Feb 2022(中科院SCI二区)

  3. Mieradilijiang Maimaiti, Yang Liu, Huanbo Luan, and Maosong Sun,“Data augmentation for low‐resource languages NMT guided by constrained sampling”, International Journal of Intelligent Systems (IJIS), volume 37, issue 1, p30-51, Jan 2022 (中科院SCI二区, CCF推荐期刊)

  4. Mieradilijiang Maimaiti, Yang Liu*, Yuanhang Zheng, Gang Chen, Kaiyu Huang, Ji Zhang, Huanbo Luan and Maosong Sun, “Segment, Mask, and Predict: Augmenting Chinese Word Segmentation with Self-Supervision”, International Conference on Empirical Methods in Natural Language Processing (EMNLP), p2068-2077, 2021 (CCF B类)

  5. Mieradilijiang Maimaiti, Yang Liu*, Huanbo Luan, Zegao Pan, and Maosong Sun, “Improving the Data Augmentation for Low-Resource NMT Guided by POS-Tagging and Paraphrase Embedding”, ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), volume 20, issue 6, p1-21, 2021 (CCF C类)

  6. Mieradilijiang Maimaiti, Yang Liu*, Huanbo Luan, and Maosong Sun, “Multi-Round Transfer Learning for Low-Resource NMT Using Multiple High-Resource Languages”, ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), volume 18, issue 4, p1-26, 2019 (CCF C类)

  7. Mieradilijiang Maimaiti, Shunpeng Zou*, Xiaoqun Wang, Xiaohui Zou, “How to Understand: Three Types of Bilingual Information Processing?”, International Conference on Cognitive Systems and Signal Processing (ICCSSP), volume 1006, p3-16, 2019 (EI)

  8. Mieradilijiang Maimaiti, Xiaohui Zou*, “Discussion on Bilingual Cognition in International Exchange Activities”, International Conference on Intelligence Science (ICIS), volume 539, p167-177, 2018 (EI)

  9. Wenshen Xu*, Mieradilijiang Maimaiti*, Yuanhang Zheng, Xin Tang, and Ji Zhang+, “Auto-MLM: Improved Contrastive Learning for Self-supervised Multi-lingual Knowledge Retrieval”, Arxiv 2021, 共同一作

  10. Dawulie Jinensibieke*, Mieradilijiang Maimaiti+, Wentao Xiao*, Xiaobo Wang+, “How Good are LLMs at Relation Extraction under Low-resource Scenario? Comprehensive Evaluation”,Arxiv 2024 (EI),通讯作者

  11. Hongbin Na, Zimu Wang, Mieradilijiang Maimaiti*, Tong Chen, Wei Wang, Tao Shen, Ling Chen, “Rethinking Human-Like Translation Strategy: Integrating Drift-Diffusion Model with Large Language Models”, Arxiv 2024 (EI),通讯作者

  12. Jianhai Zhang, Mieradilijiang Maimaiti, Xing Gao, Yuanhang Zheng, and Ji Zhang, “MGIMN: Multi-Grained Interactive Matching Network for Few-shot Text Classification”, International Conference on North American Chapter of the Association for Computational Linguistics (NAACL), p1937-1946, 2022. (CCF B类)

  13. Bo Chen, Jiayi Liu, Mieradilijiang Maimaiti, Xing Gao, and Ji Zhang, “Generating Persuasive Responses to Customer Reviews with Multi-Source Prior Knowledge in E-commerce”, International Conference on Information and Knowledge Management (CIKM) , p2994-3002, 2022 (CCF B类)

  14. Yuanhang Zheng, Zhixing Tan, Meng Zhang, Mieradilijiang Maimaiti, Huanbo Luan, Maosong Sun, Qun Liu and Yang Liu*,“Self-Supervised Quality Estimation for Machine Translation”, International Conference on Empirical Methods in Natural Language Processing (EMNLP),  p3322-3334, 2021 (CCF B类)

  15. 赵小兵*,高璐,高定国,包乌格徳勒,米尔阿迪力江·麦麦提,刘洋,才智杰,孙媛.“少数民族语言分词技术评测数据集MLWS2021”[J]. 中国科学数据 (中英文网络版), 2022, 7(02):6-14. (北大核心,CSCD)

  16. Turghun Tayir, Lin Li, Xiaohui Tao, Mieradilijiang Maimaiti, Ming Li, Jianquan Liu, “Visual Pivoting Unsupervised Multimodal Machine Translation in Low-Resource Distant Language Pairs”, International Conference on Empirical Methods in Natural Language Processing (EMNLP), p5596–5607, 2024 (CCF B类)

  17. Turghun Tayir, Mieradilijiang Maimaiti, Jianquan Liu, “Low-Resource Machine Translation with Different Granularity Image Features”, The 7th Chinese Conference on Pattern Recognition and Computer Vision (PRCV), 2024 (CCF C类)

  18. Chuanlong Liu, Shuangying Li, Miaomiao Xu, Mieradilijiang Maimaiti, and Wushour Silamu, “Visual-Semantic Dual-Decoder Collaboration for Scene Text Recognition”, The 8th Chinese Conference on Pattern Recognition and Computer Vision (PRCV), 2025 (CCF C类)

  19. Yaolin Weng, Chuanlong Liu, Miaomiao Xu, Mieradilijiang Maimaiti, and Wushour Silamu, “MixFormer: A Cross-Modal Transformer for Arbitrary-Shaped Scene Text Detection”, The 8th Chinese Conference on Pattern Recognition and Computer Vision (PRCV), 2025 (CCF C类)

  20. Wenkai Li, Yongbing Mu, Miaomiao Xu, Mieradilijiang Maimaiti, Yanbing Li, and Wushour Silamu, “RAST: Residual-Attentive and Scale-aware Transformer for Robust Scene Text Recognition”, The 8th Chinese Conference on Pattern Recognition and Computer Vision (PRCV), 2025 (CCF C类)

专利

  1. 米尔阿迪力江·麦麦提,刘洋,栾焕博,孙茂松,“一种基于无监督领域自适应的神经网络机器翻译方法”,2019. 07. 12, 专利号ZL 2017 1 0139214.0(已授权)

  2. 孙茂松,米尔阿迪力江·麦麦提,刘洋,栾焕博,“神经网络机器翻译模型的训练方法及装置”,2020. 05. 19,专利号ZL 2018 1 0845896.1(已授权)

  3. 刘洋,米尔阿迪力江·麦麦提,栾焕博,孙茂松,“基于数据增强的低资源语言神经机器翻译方法与系统”,2021. 06. 15,专利号ZL 2021 1 0857215.5(已授权)

  4. 米尔阿迪力江·麦麦提,肖文涛,周喜,马玉鹏,杨雅婷,“基于跨语言表示学习的语义理解方法及装置”,2024.03.22,申请号 No:202410332204.9 (审核中,已受理)

  5. 米尔阿迪力江·麦麦提,王晓博,达吾列·金恩斯别克,“基于多语种机器翻译模型的低资源语言关系抽取数据集构建方法”,2024.08.21,申请号 No:202411148768.3 (审核中,已受理)

  6. 米尔阿迪力江·麦麦提,李一飞,杨雅婷,周喜, “一种基于主动学习的低资源语言机器翻译方法”, 2024.12.05,申请号:No.202411782239.9 (审核中,已受理)

  7. 米尔阿迪力江·麦麦提, 刘绍坤, 努尔麦麦提·尤鲁瓦斯, 许苗苗, 张森,吾守尔· 斯拉木, “基于双阶段依存增强图变换的方面级别情感分析方法及装置”, 2025.07.11, ,申请号:No. 202510957292.6 (审核中,已受理)

  8. 米尔阿迪力江·麦麦提, 张森, 努尔麦麦提·尤鲁瓦斯, 刘绍坤, 吾守尔·斯拉木, “基于多专家融合门控图神经网络对比学习的文本分类方法”, 2025.07.17, 申请号:No. 202510988886.3(审核中,已受理)

  9. 许苗苗,牟永滨,米尔阿迪力江·麦麦提,吾守尔·斯拉木, “一种基于编码器-解码器交互建模的场景文本识别方法”, 2025.08.22, 申请号:No.202511181074.4(审核中,已受理)

  10. 许苗苗,李文凯,米尔阿迪力江·麦麦提,吾守尔·斯拉木, “一种具有残差注意力与尺度感知的场景文本识别方法”, 2025.08.22, 申请号:No. 202511180973.2(审核中,已受理)

招聘信息

自然语言处理(Natural Language Processing, NLP)是人工智能领域的重要方向,被誉为“人工智能皇冠上的明珠”。随着深度学习、图计算等技术的快速发展,NLP在机器翻译、文本生成、语义理解等领域取得了突破性进展,同时也面临着低资源语言处理、可解释性、多模态融合等全新挑战。

我们可以为你提供:

1.专业的学术指导:导师团队在NLP领域深耕多年,研究方向涵盖机器翻译、大模型优化、低资源语言处理等前沿领域,可为学生提供一对一的科研指导。

2.优越的科研平台:实验室配备高性能计算资源(NVIDIA H100集群)、丰富的数据集(涵盖多语言语料库),并与国内外顶尖高校及企业保持紧密合作。

3.实习与就业支持:优秀学生可推荐至阿里巴巴、华为、字节跳动等企业实习或参与联合研究项目,积累业界经验。

4.学术交流机会:支持学生参加ACL、EMNLP、NAACL等国际顶级会议,并提供论文发表指导。

我们希望你能具备:

1. 数学基础:扎实的线性代数、概率论、高等数学功底,能够理解并推导机器学习算法。(考研成绩100以上优先考虑)

2. 语言能力:通过CET-6更好,具备优秀的英文文献阅读和学术写作能力。(实在不行近期的CET-6 成绩400+也可以考虑)

3. 专业能力:

编程是基本功:具备出色的编程能力,精通Python或C++。对数据结构和算法有深刻理解,并能将算法应用于解决实际问题。

扎实的理论基础:熟悉经典机器学习算法与熟练掌握深度学习理论。

框架是工具:至少掌握一种主流深度学习框架(PyTorch / TensorFlow)进行模型设计与开发。

比赛或项目是加分项:有算法竞赛/项目经验的同学会优先考虑,因为这直接体现了你的算法思维和动手能力。

4. 科研态度:勤奋、自律,对NLP研究充满热情,愿意接受挑战并持续学习。

(我们设立这些标准,是希望你能在入学后快速进入科研状态,而非从零开始学习基础知识。)

招生对象

欢迎计算机科学与技术、软件工程、人工智能、数学、自动化等相关专业的优秀学生申请!

申请方式:

请将个人简历(含本科GPA、语言能力、项目经验、实习经验、比赛经验、考研成绩等)发送至邮箱:miradeljan51[at]xju.edu.cn

邮件主题格式:[研究生申请]+[本科院校]+[本科专业]+[姓名]