首页 手机网 财经号下载
入驻财经号 登录 客服 |
广告
首页> 财经> 正文

作业帮发布银河大模型,C-Eval、CMMLU双榜排名第一

财经号APP
时代财经时代财经 2023-09-02 14:00:09 300
分享到:

本文来源:时代财经 作者:唐洛

9月2日至6日,2023中国国际服务贸易交易会在北京举办,作业帮受邀参展,并正式发布自研银河大模型。在服贸会现场,银河大模型在智能解题、知识问答、中英文写作及AI伴学等方面的出色表现吸引了大量现场观众的互动体验。

同时作业帮公布了银河大模型在C-Eval、CMMLU两大权威大语言模型评测基准的成绩。数据显示,作业帮银河大模型表现卓越,以平均分73.7分位居C-Eval榜首;同时在CMMLU榜单Five-shot和Zero-shot测评中分别以平均分74.03分及73.85分位列第一,成为首个同时在上述两大权威榜单平均分排名第一的教育大模型。

银河大模型作为作业帮自主研发的大语言模型,深度融合作业帮多年的AI算法沉淀和教育数据积累,是一款专为教育领域量身打造的覆盖多学科、多学段、多场景的教育大模型。它不仅具备高度的多学科知识解答能力,更能协助不同学段学生进行创意写作,同时还能够实现自主提问、陪伴式辅导等,助力学生个性化学习与成长。

作业帮银河大模型的综合实力在权威测评榜单中得到验证。作为全球最具影响力的中文评测集之一,C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含13948道多项选择题,涵盖52个不同学科和四个难度级别。根据C-Eval排行榜的最新数据显示,作业帮银河大模型以平均分为73.7分位居榜首。

在由MBZUAI、上海交通大学、微软亚洲研究院共同推出的CMMLU榜单中,作业帮银河大模型表现同样出色,在Five-shot和Zero-shot 测试中分别以74.03分及73.85分占据榜首。

据了解,CMMLU共涵盖了67个主题,涉及自然科学、社会科学、工程、人文以及常识等。在CMMLU榜单中的卓越表现,再次印证了作业帮银河大模型在知识储备和语言理解方面的突出实力。

作业帮银河大模型不仅在中文方面表现优异,在英文方面表现同样不俗。由美国加州大学伯克利分校、哥伦比亚大学、芝加哥大学等高校联合打造的全球性大规模多任务语言理解评测基准MMLU,在集合了科学、工程、数学、人文、社会科学等领域的57个科目的评测中,作业帮银河大模型平均分高达71.88分,体现了其在英文领域的专业能力和问题解决能力。

作业帮表示,作业帮银河大模型即将在作业帮APP等学习工具、智能硬件、智能图书、教育数字化等业务场景中实现应用,同时将持续优化银河大模型性能与多模态能力,加速推进在更多教育场景的落地实践。

财经号声明: 本文由入驻中金在线财经号平台的作者撰写,观点仅代表作者本人,不代表中金在线立场。仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。同时提醒网友提高风险意识,请勿私下汇款给自媒体作者,避免造成金钱损失,风险自负。如有文章和图片作品版权及其他问题,请联系本站。

0条评论 网友评论文明上网,理性发言

中金登录 微博登录 QQ登录

    举报此人

    X
    确认
    取消
    广告

    温馨提示

    由于您的浏览器非微信客户端浏览器,无法继续支付,如需支付,请于微信中打开链接付款。(点击复制--打开微信--选择”自己“或”文件传输助手“--粘贴链接--打开后付款)

    或关注微信公众号<中金在线>底部菜单”名博看市“,搜索您要的作者名称或文章名称。给您带来的不便尽请谅解!感谢您的支持!

    复制链接

    鲜花打赏 X

    可用金币:0

    总支付金额:0

    您还需要支付0
    我已阅读《增值服务协议》
    确认打赏

    1鲜花=0.1元人民币=1金币    打赏无悔,概不退款

    举报文章问题 X
    参考地址

    其他问题,我要吐槽

    确定