商汤商量：获SuperCLUE 9月评测中文大模型总榜第一排名

0评论

0阅读

2024-1-12 8:10:14

记者1月11日从商汤科技获悉，近日，中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单，商汤商量SenseChat3.0位列中文大模型总榜排名第一。

记者1月11日从商汤科技获悉，近日，中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单，商汤商量SenseChat 3.0位列中文大模型总榜排名第一。在新增的AI Agent(AI智能体)子榜中，SenseChat 3.0同样排名第一，领先所有国内中文大模型以及GPT-3.5和Claude 2，表现仅次于GPT-4，展示了商汤在大模型领域创新发展及释放生产力的优势，以及在探索AGI道路上的积累与潜力。

SuperCLUE是中文通用大模型的综合性评测基准，旨在对大模型在各个能力维度上的表现进行全方位的评估，是国内最具专业性和代表性的中文大模型评测基准之一。此次评测选取了目前国内外最具代表性的20个通用大语言模型。

商汤科技表示，目前全球领先的AI智能体，几乎都以领先大模型GPT-4为核心驱动，它们借助强大的工具使用能力等，可将复杂问题拆解成可实现的子任务、类人的自然语言交互等能力。商量SenseChat 3.0作为领先的中文大模型，通过使用代码解释器、API调用和搜索三类常用工具来解决复杂任务，灵活搭建AI智能体应用，支撑企业的生产力革新。

目前，商量SenseChat已经在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业与超过500家客户建立了深度合作。商汤科技认为，作为具备强大工具使用能力的大模型，商量SenseChat的持续快速提升，为商汤发展更强大的、能够像人类一样进行交互的AI智能体，以及面向AGI道路的探索，都将提供重要的基础和支撑。

来源：中国证券报·中证网作者：

温馨提示：最新动态随时看，请关注金投网APP。

手机探索

<上一篇 工信部：部署推进制造业重点产业链高质量发展行动

下一篇> 最高增长超800%！近百家公司披露业绩预告