大数据技术研究所

1967年生人，南开大学杰出教授，博导，所长。1996年博士毕业于中国科学院声学研究所，之后加入IBM中国研究院，并于2021年加入南开大学计算机学院。其主要研究方向包括：语音识别、语音合成、多模态人机交互、多模态情感计算、脑电波事件检测、自然语言处理、人脸和姿态合成等人工智能热点研究领域。其工作成果包括世界上第一个支持连续语音、说话人无关的的汉语普通话语音听写机、语音到语音的翻译系统、文本可视化技术、基于心理语言学的性格预测解决方案等。直接参与或领导了IBM若干个著名的软件产品或平台的研发工作，包括IBM ViaVoice语音听写机、IBM沃森人工智能平台和IBM沃森医疗。在重要学术会议和期刊如SIGCHI, ICASSP, Interspeech, ICPR, ICMI, EBioMedicine 上发表超过50篇论文；接近100个技术专利，包括多个高价值专利。

研究方向
智能语音技术，包括语音识别、语音合成、语音转换、语音情感识别、音频模式识别、音乐智能、构音障碍研究等；多模态交互技术，包括数字人技术、唇语识别技术、唇语合成技术、姿态生成等；以及人工智能应用技术，关注医疗、教育、军事、安保、智慧交通等领域；

撰写论文、专著、教材等
在重要学术会议以及期刊如SIGCHI, IJCAI, ICASSP, Interspeech, ICPR, ICME等发表超过60篇论文。合著教材：《语音信息处理》，北京理工大学本科生教学教材，入选华为金课

科研项目、成果、获奖、专利等情况
在研科研项目：语音及相关多模态基础模型评测方法与工具研究（科技部科技创新2030新一代人工智能重大项目，人工智能基础模型支撑平台与评测技术，2022-2025）面向老年人汉语语音识别的预训练模型和领域自适应技术研究（国基金项目，2022-2025）南开大学-零犀科技人工智能技术联合研究中心（南开-零犀，横向课题， 2023-2025）低资源语音识别技术合作（横向课题，2022-2023）专利：共发表专利50项以上

科研项目、成果、获奖、专利等情况

在研科研项目：
语音及相关多模态基础模型评测方法与工具研究（科技部科技创新2030新一代人工智能重大项目，人工智能基础模型支撑平台与评测技术，2022-2025）
面向老年人汉语语音识别的预训练模型和领域自适应技术研究（国基金项目，2022-2025）
南开大学-零犀科技人工智能技术联合研究中心（南开-零犀，横向课题， 2023-2025）
低资源语音识别技术合作（横向课题，2022-2023）

专利：共发表专利50项以上

讲授课程
《自然语言处理》（64学时，面向大二、大三本科生）《语音信息处理》（64学时，面向大二、大三本科生）《管理类讲座》（16学时，面向硕士和博士研究生）

学生
积极承担本科毕业生的培养工作，两年内一共指导近20位本科生完成了毕业设计，毕设题目涉及语音识别与合成、自然语言处理、计算机视觉、区块链、情感计算、音乐智能、语种识别、多模态交互技术等多个热点领域。目前正在指导8位研究生，包括5为硕士研究生和3为博士研究生，研究方向为智能语音技术和情感计算技术。

联系方式
E-mail： qinyong@nankai.edu.cn