记者1月11日从商汤科技获悉,近日,中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单,商汤商量SenseChat3.0位列中文大模型总榜排名第一。
记者1月11日从商汤科技获悉,近日,中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单,商汤商量SenseChat 3.0位列中文大模型总榜排名第一。在新增的AI Agent(AI智能体)子榜中,SenseChat 3.0同样排名第一,领先所有国内中文大模型以及GPT-3.5和Claude 2,表现仅次于GPT-4,展示了商汤在大模型领域创新发展及释放生产力的优势,以及在探索AGI道路上的积累与潜力。
SuperCLUE是中文通用大模型的综合性评测基准,旨在对大模型在各个能力维度上的表现进行全方位的评估,是国内最具专业性和代表性的中文大模型评测基准之一。此次评测选取了目前国内外最具代表性的20个通用大语言模型。
商汤科技表示,目前全球领先的AI智能体,几乎都以领先大模型GPT-4为核心驱动,它们借助强大的工具使用能力等,可将复杂问题拆解成可实现的子任务、类人的自然语言交互等能力。商量SenseChat 3.0作为领先的中文大模型,通过使用代码解释器、API调用和搜索三类常用工具来解决复杂任务,灵活搭建AI智能体应用,支撑企业的生产力革新。
目前,商量SenseChat已经在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业与超过500家客户建立了深度合作。商汤科技认为,作为具备强大工具使用能力的大模型,商量SenseChat的持续快速提升,为商汤发展更强大的、能够像人类一样进行交互的AI智能体,以及面向AGI道路的探索,都将提供重要的基础和支撑。
来源:中国证券报·中证网 作者:
温馨提示:最新动态随时看,请关注金投网APP。
相关推荐
- 财政部重磅发布!利好50万亿市场
- 《数字中国发展报告(2022)》显示,2022年我国数字经济规模已超过50万亿元,数字经济占GDP比重达到41.5%,位居世界第二位。数据已成为第五大生产要素。
- 国内新闻 商业 科学 探索 0
- 上交所召开支持中央企业发行科技创新及绿色债券高质量发展座谈会
- 1月10日,上交所在北京举办支持中央企业发行科技创新及绿色债券座谈会。会议旨在深入贯彻中央金融工作会议精神,充分发挥中央企业在科技创新、绿色低碳领域的示范引领作用,做好科技金融、绿色金融等五篇大文章。
- 国内新闻 利率 交通 探索 0
热点话题
- 中国成单身大国有哪些反思和危害?
- 中国成单身大国有哪些反思和危害?哪怕生活...[详情]
- 霍金再次发出警告 究竟科技和毁灭要怎么看待?
- 霍金再次发出警告究竟科技和毁灭要怎么看待...[详情]
- 一分钟带你看懂美联储加息到底是咋回事!
- 一分钟带你看懂美联储加息到底是咋回事!对...[详情]
- 朋友圈的微商还能盛行多久?
- 朋友圈的微商还能盛行多久?最恨微商的还得...[详情]