开源模型
开源模型
孟子预训练模型是基于澜舟团队自研的大规模预训练语言模型。可处理多语言、多模态数据,同时支持多种理解和生成任务,能快速满足不同领域、不同应用场景的需求。 目前孟子已对外发布多个开源模型,并在持续扩充中。
采用遮蔽语言建模(MLM)、词性标注和句子顺序预测(SOP)作为训练任务。这个模型可以用来完成多种中文自然语言处理任务,包括文本分类、情感分析、实体识别、自动摘要等。
基于财经新闻和研报数据进行训练,能够更好的完成金融场景的任务。
300G 中文语料库上的预训练模型。适用于文案生成、新闻生成等可控文本生成任务。
基于 Mengzi-T5-base 的多任务模型,使用 27 个数据集和 301 个提示进行混合训练,可通过 prompt 完成各种任务。
基于中文语料从头训练,适用于文本续写、小说生成等任务。
国画风格的文图生成模型,可以完成电影海报、专辑封面、风景画等不同生成任务。
还有更多孟子开源模型可见 孟子开源模型