编组
控制台用户中心

周明博士

澜舟公司创始人和首席执行官

周明博士简介#

周明博士,北京澜舟科技有限公司的创始人和 CEO。

周明于 1991 年在哈工大计算机系获博士学位,研发了中国最早的中-英机器翻译系统 CEMT-I。1991 年-1999 年在清华大学先后从事博士后研究和任教。1993-1999 年在日本领导了著名的中-日机器翻译产品 J-北京的研发。他于 1999 年加入微软亚洲研究院并在 20 余年间长期领导 NLP 研究。

他是世界顶尖的 NLP 专家,ACL fellow, 中国计算机学会会士和中国人工智能学会会士以及中国五所著名高校的博士生导师。他是中国和国际上 NLP 领域的领导者之一,曾任国际计算语言学会的 President,中国计算机学会副理事长。他在 NLP 最高会议 ACL 发表的论文数名列世界前茅。

他创办澜舟科技之前,曾任微软亚洲研究院的副院长,领导微软 NLP 领域的 R&D,覆盖了大模型、机器翻译、搜索、聊天和对话系统等技术并成为微软的重要产品例如 Windows,Office,Azure,Cognitive Service,小冰的核心技术。他领导的世界知名的微软大模型 UniLM 融合了 BERT 和 GPT 的优势,荣获了 2019 年乌镇互联网领先科技奖。

他于 2020 年底,离开工作了 21 年的微软亚洲研究院,在创新工场支持下,着手孵化一个大模型公司。澜舟公司于 2021 年 6 月正式成立。澜舟公司先后获得创新工场、科学家基金、联想创投&斯道资本、中关村科学城的投资。

该公司开发了著名的“孟子(Mengzi)”系列的大模型技术,专注 To B 开发行业大模型并应用到金融等重要领域。目前该公司在基于自研和开源模型 To B 应用方面尤其是金融领域,在中国处于领先地位。

澜舟公司曾获得 2021 年中国 HICOOL 全球创业大赛的一等奖及 AI 和金融赛道的第一名。它是达沃斯 2023 年技术先锋(Technology Pioneers),2023 年被列为 Information 评选出的五个有可能成为中国 OpenAI 的公司之一。

科研成就#

周明在机器翻译、语言学习、文本生成、聊天机器人和预训练模型等领域为 NLP 做出了重大的创新贡献。根据谷歌学者的数据,他的论文被引用了 46810 次,他的 H-index为 112。他是 2012-2020 年期间在 ML & NLP 领域发表论文最多的作者 https://www.marekrei.com/blog/ml-and-nlp-publications-in-2020/.

周明对机器翻译研究做出了巨大贡献。他是中国机器翻译研究的最早的研究者之一。早在 1991 年,作为他在哈工大的博士论文研究,他创建了中国第一个通过正式国家鉴定的汉英机器翻译系统(CEMT-I),该系统具有汉语解析、汉英句法转换和英语生成的分层短语结构规则系统。1998 年,他在日本高电社株式会社访问期间创建了一个基于依存句法结构规则系统的中日机器翻译产品(J-北京)。J-北京后来成为日本市场的中日机器翻译的领导者。他于 1999 年加入 MSRA 后,他的 MSRA-NLC 小组在统计机器翻译方面进行了许多创新研究,如大规模并行数据的网络挖掘,文档、句子和单词级别的对齐,词典提取,搭配提取,搭配翻译以及通过句法结构加强的机器翻译解码方法。2008 年,在美国国家标准与技术研究院(NIST)的开放式 MT 评估中,他的团队与 MSR-Redmond NLP 团队和其他研究合作伙伴的合作结果获得了最高的中英文 MT 质量排名。2012 年后,他的团队开始在机器翻译中试验深度学习方法,从在统计机器翻译中添加基于深度学习的特征到成功地进行神经机器翻译的端到端训练。他的团队为微软亚洲研究院(MSRA)的语音英汉翻译系统贡献了一个由深度学习功能增强的统计机器翻译引擎,该系统在 2012 年 10 月微软 21 世纪计算大会上由微软首席研究官 Rick Rashid 成功演示。这一演示激发了世界各地对深度学习方法进行语音和语言翻译的研究兴趣。2018 年,由他的团队和其他 MSR 团队创建的一种新型神经机器翻译系统能够以与人相同的质量和准确性将新闻文章的句子从中文翻译成英文。上述研究的创新方法已不断集成到微软多语言机器翻译云服务 Microsoft Translator 中。

周明对语言学习的研究也做出了很大的贡献。2005 年,他的团队和产品团队合作创建了英语写作助手系统(EWA),该系统为用户输入的单词序列提示相关的例句,以帮助用户写出更真实的句子。该系统当时集成到 MS Office 中,供英语作为第二语言用户使用。2010 年,他的团队和 MSRA 其他团队合作创建了 Engkoo(中文名字为“英库“)。这是一款开创性的软件,利用 NLP 和语音技术构建了大量的双语术语和句子,为中国用户创造了一种新的语言辅助技术,使他们最终能够像以英语为母语的人一样掌握英语。在他的设计中,该系统将从网络上挖掘的人工翻译、机器翻译和语言学习体验统一为一个用户友好的搜索和探索界面。该语言辅助系统获得了《华尔街日报》颁发的亚洲创新奖。它由微软必应搜索于 2012 年发布,为大量中国用户提供英语学习服务。

周明也对文本生成做出了巨大贡献。2001 年,他的团队为 MS Windows 创建了基于统计语言模型的 IME,同时支持中文和日语。2005 年,他在时任 MSRA 院长沈向洋提议和鼓励下,发明了世界上第一套实用的中文对联系统。当时,这项任务被视为人工智能中的一个难题,在研究界还没有得到很好的探索。他创造性地提出了一种基于短语的统计机器翻译算法来生成对联,并使用一组过滤器来去除违反语言约束的候选者。基于他的算法创建了一个国内流行的微软对联系统,连续三次在微软 21 世纪计算大会展示。它被广泛认为是中国第一个由人工智能生成的对联系统。后来扩展到作诗、作词、猜谜语等能力。微软对联是体现人工智能和中国传统文化结合的典范之作。

周明也为聊天机器人做出了巨大贡献。他的团队是微软社交聊天机器人小冰连天引擎的研究力量,小冰于 2015 年在中国首次发布,随后其日文版和英文版分别在日本和美国发布。他的团队开发了基于检索的对话生成引擎,将自然会话轮次从 4.3 次增加到 21 次。之后,他的团队开发了一种用于对话生成的深度学习引擎,进一步提高了聊天机器人的对话能力。这两种方法的混合引擎导致了更多样化的反应,使小冰在大模型方法前成为世界上最先进的聊天机器人。多年来,小冰在中国积累了 2 亿用户,在 2015-2019 年期间被视为微软的旗舰人工智能产品。

在最近 5 年中,周明也为大模型发展做出了重大贡献。他的团队通过跨任务、语言和模式的大规模自我监督预训练,创建了各种预训练模型。在这些模型中,一个新的统一预训练语言模型(UniLM)可以进行微调,以用于复杂的语言理解和生成任务。该模型使用三种类型的任务进行预训练:单向、双向和序列到序列预测。统一建模是通过使用共享的 Transformer 网络和使用特定的自注意掩码来控制预测条件的上下文来实现的。在 GLUE 基准以及 SQuAD 2.0 和 CoQA 问答任务上,UniLM 与 BERT 相比是有利的。UniLM 在五个自然语言生成数据集上取得了最新的成果,包括改进 CNN/DaylyMail 摘要任务、Gigaword 摘要任务、CoQA 生成问答和其他任务。UniLM 随后扩展到包括视觉、语音和布局在内的多种模式。UniLM 将语言理解和生成整合到一个预先训练的模型中,在研究界非常有影响力。2019 年,UniLM 获得了中国乌镇互联网创新奖。

除了上述创新性研究,周明小组对社交媒体分析的研究也很有影响力。他和合作者的论文“Learning Sentiment-Specific Word Embedding for Twitter Sentiment Classification”《为推特情感分类学习情感特定词嵌入》获得 1542 次引用,“Target-dependent Twitter Sentiment Classification”《依赖目标的推特情感分级》获得 1364 次引用,“Recognizing Named Entities in Tweets”“识别推文中的命名实体”获得 612 次引用。

他的团队也在把预训练模型用于代码自动化方面进行了开创工作。“CodeXGLUE: A Machine Learning Benchmark Dataset for Code Understanding and Generation”“CodeXGLUE: 用于代码理解和生成的机器学习基准数据集”构建了基准数据集,以促进程序理解和生成方面的机器学习研究。CodeXGLUE 包括 14 个数据集的 10 个任务集合,以及用于模型评估和比较的平台。CodeXGLUE 还具有三个基线系统,包括 BERT 风格、GPT 风格和编码器-解码器模型,使研究人员能够轻松使用该平台。这些数据和基线的可用性可以帮助开发和验证可应用于各种程序理解和生成问题的新方法。

NLP 社区服务#

周明为 ACL 社区做了大量的服务。他于 2017 年开始在 ACL 执行委员会任职,并于 2019 年成为 ACL 主席。随后,他于 2020 年至 2022 年在提名委员会任职。他是发起 ACL 亚太分会(AACL)的主要贡献者,该分会在亚太地区大力推动了 ACL 和 NLP。

2020 年,周明当选 CCF 副理事长,CCF 拥有 10 万多名会员。在此之前,他在 2015-2019 年期间担任中国主要 NLP 学术组织之一 CCF-NLP 的主任。

2009 年至 2013 年,他担任《计算语言学》编委。他还以不同的角色为许多会议服务。他曾担任 ACL 2000 和 ACL 2003 的区域主席,AIRS 2004 的 PC 主席,IJCNLP 2004 的交互式演示/海报主席,IJCNLP 2005 的区域主席、EMNLP/HLT 2005 的区域主任、NAACL/HLT 2006 的区域主任,COLING-ACL2006 的区域主席,IJCAI 2007 的区域主席;ACL 2008 的研讨会主席,SIGIR 2009 的宣传主席,CIKM 2004、CIKM 2005、 MT Summit 2004、MT Summit 2005、 AMTA 2002、 SIGHAN 2005、 SIGHAN 2006、 AIRS 2005、 AIRS 2006 的 PC 成员; COLING 2010 区域主席,SIGIR 2012 和 SIGIR 2013 区域主席。CCF NLP&CC 2012 PC 主席和 NLP&CC 2013 总主席,CCF 年度大会 CNCC-2019 的 PC 主席。

教育和合作方面的贡献#

在 1999 年加入 MSRA 之前,周明曾在清华任教 8 年。他担任过哈尔滨工业大学、天津大学、南开大学、北航大学、中国科学技术大学等 5 所高校兼职博士生导师。在过去的 20 年里,他指导了 20 余名博士生,他的团队培养了来自中国、日本、新加坡、韩国、美国、加拿大和澳大利亚 30 多所大学的 500 余名实习生。目前这些人士都已经成为各大公司和学校的 NLP 领军者和技术专家。

他曾担任微软-哈工大 NLP 联合实验室和微软-清华大学媒体与网络联合实验室主任十多年,负责制定研究方向和支持联合项目。他为中国 NLPCC 会议的建立也做出了重要贡献,NLPCC 被称为中国 ACL 会议,具有高度选择性,并以英语为官方语言,将中国 NLP 研究界与世界连接起来。他还为启动每年一度的中日 NLP 研讨会做出了重大贡献,以促进中日以及其他亚洲国家之间的合作。

作为中国计算机学会(CCF)的副理事长,他通过 CTO 俱乐部(C3)和技术前沿技术讲座等一系列项目,为推动大学与工业企业的合作做出了巨大努力。他在 CNCC(中国计算机大会)上成立了 CCF 创业峰会,以促进创业文化,加强基础研究与现实应用之间的合作。

ACL Fellow 荣誉#

凭借以上对杰出的学术研究、工业界贡献、卓越的 NLP 社区服务,以及对中国和亚洲 NLP 教育和合作的重要贡献,周明博士光荣当选 2023 年 ACL 会士。

——“为机器翻译、语言学习、文本生成以及中国和亚洲 NLP 的发展做出了重大贡献”。ACL Fellow 提名委员会,2023 年。

support
business