来自澜舟科技创始人周明的一封信

2022-06-10

今天是 6 月 10 日,对澜舟人是一个很特别的日子:澜舟科技满一周岁了!澜舟的历史揭开了新篇章!在过去的一年里,全体澜舟人在各界朋友的支持下,日复一日兢兢业业地工作,使得澜舟取得了飞跃的发展。我想借此机会,给大家写封信,讲一讲澜舟一年来的成长和对未来的一些期许。

我于 2020 年底离开工作了 21 年之久的微软亚洲研究院,加入了创新工场着手孵化一个自然语言处理(NLP)技术公司。我认为感知智能之后,在大规模语言模型的推动下,以 NLP 为代表的认知智能蓄势待发,而各行各业持续发展的数智化进程则给认知智能提供了用武之地。我设想孵化一个新公司,它提供先进的中文语言模型和 NLP 技术,客户无论在任何行业,做任何业务,如需 NLP 和认知智能,只要简单连上我们的云服务就可以享受价廉物美的服务,就象使用水和电一样简单。而 NLP 技术则随着大规模的使用不断演进。

向过去挥挥手,向未来进发。我组建了一个小团队,一开始只有两位员工和两位实习生,从零起步。那时候,谷歌等各大公司和科研机构都在比拼谁的语言模型大,规模不断翻倍。训练一个大模型需要几百张卡,海量的数据和有经验的团队,而这些,我都没有。而且即使我有,训练一个大模型耗资巨大,不绿色环保也不可持续发展。而我调研的所有的客户都期望用小模型以减轻训练和部署的代价。于是我们聚焦于“轻量化模型”的研发,从训练优化、模型优化到知识增强和数据增强,不断迭代,力争把轻量化做到极致。同时,我们也深入研究了经对大模型蒸馏和压缩以实现轻量化的技术。后来澜舟的轻量化模型叫做“孟子”模型。为什么取名“孟子”呢?《孟子》有云:“以力服人者,非心服也,力不赡也”这恰好代表了我们认为“模型不能一味追求大”的观点和轻量化模型的技术追求。而一年后的今天,我注意到很多公司和学校都开始重视轻量化模型,澜舟已经幸运地走在前面了。

孟子模型,小模型,大智慧。我们一个十亿参数量的小模型,在 CLUE 榜上名列榜首,居然赢了许多百亿甚至千亿级别的大模型,堪称四两拨千斤。借 CLUE 登榜的东风,我们的“孟子新一代认知服务引擎”,包括孟子模型及新一代翻译、生成和搜索技术,在北京市的全球 HICOOL 创业大赛中,在 4800 多个国内外参赛队伍中,一路过关斩将,获得了 HICOOL 最高奖及人工智能和金融赛道的第一名。随后 10 月份,我们顺利获得了联想创投、斯道资本共同领投、创新工场跟投的人民币近亿元的 Pre-A 轮融资

澜舟公司是于去年 6 月 10 日正式成立的。现在有很多人好奇地问我“澜舟“这个名字的由来。说起来,“澜舟”的名字的背后还有一个传奇故事呢。我在孵化团队之前,就开始琢磨公司名字了。我们是做语言处理的,因此我想到“语言之舟”这个思路,英文的名字就是“langboat”,然后我再考虑对应成中文。我前一半用音译,后一半意译,组成了“澜舟”这个名字。后来我休假在云南抚仙湖边漫步的时候,发现一摩崖石刻上赫然刻着“画中飞白鹭,镜里照蘭舟”两行诗句。“蘭”和“澜”同音和形近,古人的诗句暗合了我心中的名字,这简直是太神奇了。

澜舟对于我来说,是一个企业,也像是一个孩子。看着她每天都在成长,我心中感到无比自豪。在澜舟成立一周年之际,我要感谢所有澜舟人,是你们的智慧、汗水和付出,实现了澜舟的今天的成就。我们短短一年时间就建立起来了能打硬仗的算法、产品、工程、运营、HR 和行政团队,并且我们正在建立销售团队。这里,我想强调澜舟的实习生的培养。自孵化以来,澜舟先后接待了中外 20 余所知名高校的八十名实习生,他们对澜舟的发展也做出了重要贡献。

今天,澜舟无论是在语言模型、机器翻译、文本生成,还是行业搜索,凡是在我们发力的领域都达到了国际一流的水准。比如,机器翻译、文本生成已产品化落地;语言服务的 SaaS 平台和行业搜索引擎开始了邀测。我们跟华为等标杆企业建立了紧密合作关系。孟子开源社区被选入《科创中国开源创新 50 强》榜单。我们在云栖大会、智能投研联盟、中国知识图谱和语义计算大会、机器之心 AI 科技大会、中金启元讲座等广受关注的行业和学术大会上做特邀报告。综合以上的成绩,我可以负责任地说,澜舟在短短一年间,实现了几近完美的开局。

在此一周年之际,我要感谢支持我们的合作伙伴。他们在澜舟起于微末之时所给予的帮助令我终生难忘。孵化之初,我们就跟知乎建立了合作关系并进行了多次交流;随后我们与传神公司开展了机器翻译合作,目前“任度”机器翻译引擎覆盖了 20 余垂直领域,在传神平台上支持着数以万计的译员;我们和数说故事及其子公司容徽合作的智能文案产品 contentnote 在去年 12 月底也正式上线了;早在 2021 年 8 月,我们与华为云就语言模型和 NLP 相关技术签订了合作协议,今天我们的技术已经用于华为的产品中。我们的孟子语言模型又先后应用在与同花顺和云从科技的合作项目中。几天前,我们和华夏基金宣布成立了金融 NLP 联合实验室,共促金融科技创新。在接下来的几个月,大家还会听到更多好消息。

澜舟科技一路走来,是与开复和创新工场的鼎力支持分不开的。我们是在创新工场孵化下,起步、成形并逐渐发展起来的。澜舟最初的资金来源于由创新工场人工智能工程院和前沿科技基金主导的种子轮和天使轮融资。我想借此机会,向开复和创新工场表示衷心的感谢。同样,我要感谢联想创投和斯道资本所给予的支持。他们在战略方向,产品研发和市场布局等各个方面也都给予了大力支持。

2022 年是澜舟科技的产品元年。除了继续加深我们跟上述大客户的重要合作项目,一系列基于孟子认知智能技术的行业 NLP 的 SaaS 服务也将推向市场。我们的澜舟行业搜索也将服务于金融和经济的客户。与产品推出同步,我们也会继续拓展孟子开源社区,围绕语言模型通过模型和 code 开源、讲座和答疑等多种形式培养 NLP 生态。我们最近启动了“Lang-Lab(狼来吧)”黑科技项目,鼓励员工和实习生大胆提出创新项目,并通过澜舟的产品和开源社区,服务千千万万的用户。

2022 年疫情进入第三年,黑天鹅事件连续不断,国际形势动荡。而大厂裁员和小厂倒闭消息不绝于耳;互联网红利不再,人工智能泡沫破灭的论调喧嚣尘上;在语言大模型方兴未艾之际,元宇宙、无代码、Web 3.0 又粉墨登场。澜舟刚刚启航,怎么样才能拨开迷雾,辨认方向,渡过一个个艰难险阻,平稳地驶向理想的港湾?古人说:苟日新,日日新,又日新。每一天,我们都要面对不确定性,保持定力不迷失航向;每一天,我们都要在大浪里奋力搏击,立在时代发展的潮头。

我认为澜舟要做好三件事情:

第一,守正出奇。坚持开发轻量化模型和新一代 NLP 技术。与此同时,我们要了解新形势、观察新事物、学习新技术,择机切入新领域,拓展新机会。

第二,脚踏实地。我们研发的不是“花瓶”的技术,我们要做的是解决实际问题的产品。我们不追求大而全,要做专精特新。要结合客户的场景,用优良的服务解决客户业务最后一公里的问题。这不是一蹴而就的,我们要不断给自己提出更高要求,努力打造我们的产品和服务。

第三,仰望星空。我们要投入适当力量钻研 AI 面临的重大问题,包括小数据学习、可解释能力、知识和推理以及 AI 产品的伦理问题。取得简单可实施的技术并应用到新一代的产品中。

“不畏浮云遮望眼,守得云开见月明”。澜舟志在 AI 的星辰大海,成为世界 NLP 产品的领导者。最后我想强调,要实现这一宏伟目标,人才是关键。我们将继续招收优秀员工和实习生。澜舟要创造良好的文化和工作环境,帮助他们成长。我们也将继续与企业和高校合作,共同推动本领域的人才培养、技术研发和落地应用。

创业征途上的每一天,我们都修炼着心智、提升着能力、扩大着境界,收获着喜悦,赢得着尊重。创业的成功固然令人期待,不过我提醒大家,创业有起点却没有终点,我们永远在路上。大家要享受创业的过程,欣赏一路上的山川起伏,大江奔腾。我们时不时地也会遇到狂风暴雨,但待云开日出,美丽的彩虹也将出现在天边。

创伟业,长风破浪会有时。

驾澜舟,直挂云帆济沧海!

周明 澜舟公司创始人、CEO

2022 年 6 月 10 日

核心技术

预训练语言模型

开发者社区

© 2021 澜舟科技
langboat
京公网安备 11010802035393号京ICP备2021021087号