1967年生人,南开大学杰出教授,博导,所长。1996年博士毕业于中国科学院声学研究所,之后加入IBM中国研究院,并于2021年加入南开大学计算机学院。其主要研究方向包括:语音识别、语音合成、多模态人机交互、多模态情感计算、脑电波事件检测、自然语言处理、人脸和姿态合成等人工智能热点研究领域。其工作成果包括世界上第一个支持连续语音、说话人无关的的汉语普通话语音听写机、语音到语音的翻译系统、文本可视化技术、基于心理语言学的性格预测解决方案等。直接参与或领导了IBM若干个著名的软件产品或平台的研发工作,包括IBM ViaVoice语音听写机、IBM沃森人工智能平台和IBM沃森医疗。在重要学术会议和期刊如SIGCHI, ICASSP, Interspeech, ICPR, ICMI, EBioMedicine 上发表超过50篇论文; 接近100个技术专利,包括多个高价值专利。




研究方向
智能语音技术,包括语音识别、语音合成、语音转换、语音情感识别、音频模式识别、音乐智能、构音障碍研究等;多模态交互技术,包括数字人技术、唇语识别技术、唇语合成技术、姿态生成等;以及人工智能应用技术,关注医疗、教育、军事、安保、智慧交通等领域;
撰写论文、专著、教材等
在重要学术会议以及期刊如SIGCHI, IJCAI, ICASSP, Interspeech, ICPR, ICME等发表超过60篇论文。
合著教材:《语音信息处理》,北京理工大学本科生教学教材,入选华为金课


科研项目、成果、获奖、专利等情况

在研科研项目:
语音及相关多模态基础模型评测方法与工具研究(科技部科技创新2030新一代人工智能重大项目,人工智能基础模型支撑平台与评测技术,2022-2025)
面向老年人汉语语音识别的预训练模型和领域自适应技术研究 (国基金项目,2022-2025)
南开大学-零犀科技人工智能技术联合研究中心 (南开-零犀,横向课题, 2023-2025)
低资源语音识别技术合作 (横向课题,2022-2023)

专利:共发表专利50项以上


讲授课程

《自然语言处理》(64学时,面向大二、大三本科生)
《语音信息处理》(64学时,面向大二、大三本科生)
《管理类讲座》 (16学时,面向硕士和博士研究生)



学生
积极承担本科毕业生的培养工作,两年内一共指导近20位本科生完成了毕业设计,毕设题目涉及语音识别与合成、自然语言处理、计算机视觉、区块链、情感计算、音乐智能、语种识别、多模态交互技术等多个热点领域。
目前正在指导8位研究生,包括5为硕士研究生和3为博士研究生,研究方向为智能语音技术和情感计算技术。




联系方式
E-mail: qinyong@nankai.edu.cn