百川智能开源中英文大模型只需登记即可商用
日前,由搜狗创始人王小川创立的百川智能方面宣布,推出、并开源拥有70亿参数量的中英文预训练大模型“baichuan-7B”。据悉,目前baichuan-7B大模型已在Hugging Face、Github 以及Model Scope平台发布。
据了解,为验证该模型的各项能力,baichuan-7B在C-Eval、AGIEval和Gaokao三个最具影响力的中文评估基准进行了综合评估,并且均取得了优异的成绩,已成为同等参数规模下中文表现最优秀的原生预训练模型。其在中文C-EVAL的评测中,baichuan-7B的综合评分达到了42.8分,在AGIEval评测里的综合评分达到34.4分,在GAOKAO评测中的综合评分则为36.2分。
此外,baichuan-7B不仅中文方面表现优球速体育官方异,在英文上表现同样亮眼。例如在MMLU的评测中,baichuan-7B的综合评分达42.5分,大幅领先英文开源预训练模型LLaMA-7B的34.2分,以及中文开源模型ChatGLM-6B的36.9分。
据悉,由于秉持开源精神,baichuan-7B的代码采用了Apache-2.0协议,模型权重为免费商用协议,因此只需进行简单登记即可免费商用。而baichuan-7B此次开源的内容,则包含推理代码、INT4量化实现、微调代码,以及预训练模型的权重。其中,微调代码方便用户对模型进行调整和优化,推理代码与INT4量化实现则有助于开发者低成本地进行模型的部署和应用,预训练模型权重开源后,用户可直接使用预训练模型进行各种实验研究。
目前,北京大学和清华大学已率先使用baichuan-7B模型推进相关研究工作,并计划未来与百川智能进入深入合作,共同推动baichuan-7B模型的应用和发展。
对此,清华大学互联网司法研究院院长、计算机系教授刘奕群表示,baichuan-7B模型在中文上的效果表现十分出色,其免费商用的开源方式也展现出了开放的态度,不仅贡献社区、还能推动技术发展。据其透露,该团队计划正基于baichuan-7B模型开展司法人工智能领域的相关研究。
北京大学人工智能研究院助理教授杨耀东认为,baichuan-7B模型的开源将对于中文基础语言模型的生态建设,以及学术研究产生重要推动作用。同时他表示,将持续关注相关领域探索,并且在中文大语言模型的安全和对齐上进行进一步深入研究。
百川智能CEO王小川则表示,“此次开源模型的发布是百川智能成立2个月后的第一个里程碑,对百川智能而言是一个良好的开局。baichuan-7B模型不仅能为中国的AGI事业添砖加瓦,也将为世界大模型开源社区贡献新的力量。”
上一篇:多家企业公开宣布将申请chain下一轮新通用顶级域名品牌词竞争拉开序幕
栏 目:Apache
本文标题:百川智能开源中英文大模型只需登记即可商用
本文地址:http://aihaoedu.com/fuwuqijiaocheng/2806.html
您可能感兴趣的文章
- 10-26华为云 DTSE 团队通过开源专业服务助力马来西亚 X 集团平滑迁移上云
- 10-26四方云动 工信部处罚阿里表明了什么信号?
- 10-26IBM在“宽松的”Apache许可下发布最新Granite基础模型
- 10-26ALC (Apache Local Community) Beijing是什么?
- 10-26什么是Apache?Apache是什么意思?
- 10-24如何在网站上开启HTTPS功能呢?
- 10-24德国主权技术基金两年内向开源领域投资超过 2490 万美元
- 10-24知道创宇:从创宇盾感知Apache Log4j2 曝光前后惊魂24小时态势
- 10-24频频出现拼写、音标、翻译等内容错误 莫让词典类APP误人子弟
- 10-23Apache配置文件中文版
阅读排行
推荐教程
- 10-03法语助手法汉-汉法词典 apache是什么意思_apache的中文解释和发音_的翻译怎么读
- 09-25亚马逊AWS将OpenSearch开源搜索项目移交至Linux基金会实现社区主导治理
- 10-08鄱阳湖读bo还是po?鄱阳湖位于哪个省?
- 08-2531个绝对惊艳的数据可视化作品让你感受“数据之美”!
- 08-30漏洞利用接踵而至:Apache为Log4j发布2170新版补丁修复
- 06-29Apache中国下载镜像开通
- 08-29Apache HTTP Server 2451 发布 - OSCHINA
- 06-24Apache服务器迎来5年内首次重大更新:云计算支持
- 06-24数据可视化|看得懂的数据
- 08-30Apache基金会正式宣布Apache InLong成为顶级项目