腾讯发布开源MoE大语言模型Hunyuan-large:总参数398B为业内最大
来源:快科技 发表于2024-11-05 20:45:38 编辑:时寒峰

  原标题:腾讯发布开源MoE大语言模型Hunyuan-large:总参数398B为业内最大

  11月5日消息,腾讯今日宣布推出业界参数规模最大、效果最好的开源MoE大语言模型Hunyuan-Large。

  Huanyuan-large模型的总参数量为389B、激活参数为52B、训练token数量为7T、最大上下文长度为256K、词表大小为12.8w。

  在技术创新方面,Hunyuan-large通过高质量的合成数据来增强模型训练,弥补了自然数据的不足。

腾讯发布开源MoE大语言模型Hunyuan-large:总参数398B为业内最大

  其中,该模型预训练支持处理高达256K的文本序列,大幅提升了长文本上下文的处理能力,能够更高效地完成长文本任务。

  据了解,Hunyuan-large在CMMLU、MMLU、CEva1、MATH等多学科综合评测集上表现优异,在中英文自然语言处理、代码生成、数学运算等9大能力维度中全面领先,超越了Llama3.1和Mixtral等一流开源模型。

  此外,腾讯还宣布将推出自研的长文评测集“企鹅卷轴(PenguinScrolls)”,以填补行业在真实长文评测集上的空白。

  企鹅卷轴基于公开的金融、法律、学术论文等长文本构建,文本长度从1K到128K不等,覆盖深度阅读理解和长文推理任务。

投稿邮箱:lukejiwang@163.com
相关推荐
360集团发布纳米AI智能体,开启高效搜索与分析新时代
360集团发布纳米AI智能体,开启高效搜索与分析新时代

原标题:360集团发布纳米AI智能体,开启高效搜索与分析新时代 360集团近期震撼

AI2025-06-16 20:38:15

Meta推出AI视频编辑新技能,一键换装换场景轻松玩转视
Meta推出AI视频编辑新技能,一键换装换场景轻松玩转视

原标题:Meta推出AI视频编辑新技能,一键换装换场景轻松玩转视频创作 meta公司

AI2025-06-15 20:35:34

黄仁勋论AI与就业
黄仁勋论AI与就业

原标题:黄仁勋论AI与就业 近期,关于人工智能(AI)发展对就业市场的影响引

AI2025-06-14 17:53:04

夸克高考志愿大模型上线,智能生成专属填报报告助力
夸克高考志愿大模型上线,智能生成专属填报报告助力

原标题:夸克高考志愿大模型上线,智能生成专属填报报告助力考生 阿里巴巴

AI2025-06-12 18:17:45

ChatGPT高级语音模式大升级,情感丰富更自然,多语言翻
ChatGPT高级语音模式大升级,情感丰富更自然,多语言翻

原标题:ChatGPT高级语音模式大升级,情感丰富更自然,多语言翻译功能来袭!

AI2025-06-08 11:09:31

Meta携手迪士尼、A24,新智能眼镜Loma能否靠独家内容吸
Meta携手迪士尼、A24,新智能眼镜Loma能否靠独家内容吸

原标题:Meta携手迪士尼、A24,新智能眼镜Loma能否靠独家内容吸睛? 据最新报道

AI2025-06-05 20:10:55

OpenAI付费企业用户数猛增,预计年收入将达127亿美元
OpenAI付费企业用户数猛增,预计年收入将达127亿美元

原标题:OpenAI付费企业用户数猛增,预计年收入将达127亿美元 在周三的最新动

AI2025-06-05 19:50:37

首批!蚂蚁“AI健康管家”通过大模型可信评估 4000万用
首批!蚂蚁“AI健康管家”通过大模型可信评估 4000万用

原标题:首批!蚂蚁AI健康管家通过大模型可信评估 4000万用户已受益 6月3日消息

AI2025-06-03 20:48:17

仿生突破!可自我修复人造肌肉赋能软体机器人与可穿
仿生突破!可自我修复人造肌肉赋能软体机器人与可穿

原标题:仿生突破!可自我修复人造肌肉赋能软体机器人与可穿戴设备 在自然

AI2025-06-02 11:49:42

AI黑客大战,智能体竟能超越人类?
AI黑客大战,智能体竟能超越人类?

原标题:AI黑客大战,智能体竟能超越人类? 近期,网络安全领域迎来了一场前

AI2025-06-02 11:40:08