编组
控制台用户中心

孟子 GPT 大语言模型

孟子 GPT 大模型是基于团队自研技术研发的大规模语言模型,可处理多语言、多模态数据,同时支持多种文本理解和文本生成任务,能快速满足不同领域、不同应用场景的需求。孟子是国内著名的大模型品牌,多次在中文大模型基准评测,例如 C-EVAL、SUPERCLUE 等取得优胜成绩。孟子大模型已于 2023 年底通过网信办生成式人工智能备案,并已正式面向公众开放服务。

功能介绍

知识问答

通过问答的方式帮助用户直接获取所需要的信息,无需再做搜索和筛选

通用写作

能够按照用户的要求撰写多种类型、题材的文章,并通过自然语言对话来控制内容创作的效果

多语言翻译

在对话中实现多语言的翻译,相比传统翻译效果更加流畅自然

金融场景任务

针对金融场景的特殊任务进行模型优化,帮助行业工作者能够更高效的完成工作

文档问答

在给定文档中查找答案,并回答用户关于文档内容的问题

代码生成

自动生成编程代码,根据用户的需求创建程序代码片段

技术方案

mengzi-advantage

支持多种模型架构

  • 自回归模型:如 GPT
  • 自编码模型:如 BERT
  • Encoder-Decoder 模型:T5
mengzi-advantage

轻量模型性能强化

  • 多预训练任务融合
  • SMART 对抗训练
  • 知识蒸馏
mengzi-advantage

基于知识图谱增强

  • 基于实体抽取的增强
  • 知识图谱增强(isa 关系)
  • 知识图谱转文字
mengzi-advantage

基于语言学知识增强

  • 成分句法融合增强的 Mask 机制
  • 语义角色 Embedding 融合增强
  • 依存关系的注意力权重约束剪枝
mengzi-advantage

小样本/零样本学习

  • Prompts 模板构造
  • 多任务学习技术
  • 覆盖常见信息抽取场景,开箱即用
mengzi-advantage

基于检索增强

  • 知识解耦
  • 可解释性强
  • 外部知识组件实时更新

技术优势

advantage

在金融知识图谱搭建、研报脱水、公告抽取等多个任务上获得了超过常规模型的表现

advantage

支持 BERT、GPT、T5 等架构,能够覆盖文本理解、文本生成等不同场景

line2line2line1centerline4
advantage

支持图文双模态输入,能够更好地处理图文相关任务

advantage

支持对垂直领域进行快速定向优化,支持从 10M 到 1B 不同规模

能力资质

C-Eval 排行榜

*排名截止2023年8月

#01234
模型名称MengziChatGLM2InternLM-123BGPT-4*AiLMe-100B v2
发布机构澜舟科技Tsinghua & Zhipi.AIShanghai AI Lab & Sense TimeOpenAIAPUS
提交时间2023/8/252023/6/252023/8/222023/5/152023/7/25
平均71.571.168.868.767.7
平均(Hard)48.8505054.955.3
STEM62.364.463.567.165.4
社科文学87.281.681.477.672.3
人文科学76.873.772.764.571.2
其他68.671.36367.864
#模型名称发布机构提交时间平均平均(Hard)STEM社科文学人文科学其他
0Mengzi澜舟科技2023/8/2571.548.862.387.276.868.6
1ChatGLM2Tsinghua & Zhipi.AI2023/6/2571.15064.481.673.771.3
2InternLM-123BShanghai AI Lab & Sense Time2023/8/2268.85063.581.472.763
3GPT-4*OpenAI2023/5/1568.754.967.177.664.567.8
4AiLMe-100B v2APUS2023/7/2567.755.365.472.371.264

CLUE 排行榜

*排名截至2021年7月30日

排名123
模型孟子MotianBETRTSG人类水平
规模十亿十亿百亿
总分82.9082.1581.8086.68
AFQMC79.8278.3079.8581.00
TNEWS64.6857.4257.4271.00
IFLYTEK65.0865.4664.5480.30
OCNLI81.8784.9785.9390.30
WSC202096.5594.8395.1798.00
CSL89.8790.1789.0084.00
CMRC201882.2585.3083.8092.40
CHID96.0094.4393.0687.10
C389.9888.4987.4496.00
排名模型规模总分AFQMCTNEWSIFLYTEKOCNLIWSC2020CSLCMRC2018CHIDC3
1孟子十亿82.9079.8264.6865.0881.8796.5589.8782.2596.0089.98
2Motian十亿82.1578.3057.4265.4684.9794.8390.1785.3094.4388.49
3BETRTSG百亿81.8079.8557.4264.5485.9395.1789.0083.8093.0687.44
人类水平86.6881.0071.0080.3090.3098.0084.0092.4087.1096.00

资质证书

certificate
certificate
certificate
certificate
certificate
certificate
certificate
certificate
certificate
certificate

备案情况

大模型备案号Beijing-MengZiGPT-20231205
网信算备110108396388101240013号
网信算备110108396388101240021号

落地场景

scene

公告抽取

模型可以从大量的文本中提取出公告信息,方便快速获取重要信息。
scene

小说生成

模型可以根据用户提供的信息,自动生成小说内容。
scene

情感分类

模型可以对文本进行情感分析,区分出文本中的正面、负面或中性情感。
scene

研报分类

模型可以对研究报告进行分类,按照不同的主题进行归类。
scene

新闻摘要

模型可以自动生成新闻摘要,快速提供新闻要点信息。
scene

知识图谱搭建

模型可以根据已有的知识,构建知识图谱,方便快速查询。
scene

问答系统

模型可以通过语义分析,提供问题的答案。
scene

图文互检

模型可以对文本和图片进行匹配,检查是否相符。

相关推荐

澜舟智库

提供智能Al搜索,知识库问答,Al辅助写作等功能,助力企业快速搭建安全可靠的专属知识中台,打造AI2.0企业知识生产力新范式。

澜舟智会

智能会议分析助手,能够实现会议文字精准转录及多维度智能分析,广泛适用于办公会议、教学演讲、媒体访谈等各类场景,实现会议内容的价值挖掘。

澜舟智搭

澜舟科技在 “一横N纵” AI 原生应用架构上精心打造的企业智能 Agent 应用搭建工具平台。 NLP 能力,可以通过 API 进行调用。

了解孟子 GPT 模型

产品服务

关于我们

孟子社区

最新动态

加入澜舟

商务合作邮箱

公司地址

北京市海淀区北四环西路(街)52 号方正国际大厦 16 层 1603


gongan京公网安备 11010802035393号京ICP备 2021021087号

经营许可证编号:合字 B2-20220333

大模型备案号:Beijing-MengZiGPT-20231205


合作:

bd@langboat.com

地址:

北京市海淀区北四环西路(街)52 号方正国际大厦 16 层 1603

公众号:

ewm

support
business