澜舟科技开源孟子3-13B大模型支持免费商用

2024-04-01 11:35:12 北京商报网 

北京商报讯(记者 杨月涵)4月1日,澜舟科技正式宣布Mengzi3-13B开源,对学术研究完全开放,同时支持免费商用。

今年3月18日,澜舟科技推出了其“一横N纵”孟子大模型系列及产品体系。其中,“一横”的核心——孟子大模型技术,经过高效迭代后,孟子大模型V3版本的Mengzi3-13B也正式与大家见面。

据介绍,相较于今年1月发布的孟子大模型GPT V2系列(包括孟子大模型-标准、孟子大模型-轻量、孟子大模型-金融、孟子大模型-编码),Mengzi3-13B在数据集质量上有了显著的提升。其采用的Mengzi-3数据集规模高达3T tokens,涵盖了网页、代码、书籍、论文等多元化、高质量的数据来源。

在MMLU、Chinese-MMLU、GSM8K、HUMAN-EVAL等多项公开数据集进行的模型效果评估中,Mengzi3-13B均展现出了卓越的性能表现。在参数量20B以内的轻量化大模型领域,Mengzi3-13B在中英文语言能力方面的成绩尤为突出,具备了出色的实用性和高性价比,能更好的满足企业的商业化需求。

(责任编辑:王治强 HF013)
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读