如期兑现！讯飞星火V4.0整体超越GPT-4 Turbo，8个国际权威测试集测评第一

摘要小枫来为解答以上问题。如期兑现！讯飞星火V4.0整体超越GPT-4 Turbo，8个国际权威测试集测评第一,这个很多人还不知道，现在让我们一起来看...

小枫来为解答以上问题。如期兑现！讯飞星火V4.0整体超越GPT-4 Turbo，8个国际权威测试集测评第一,这个很多人还不知道，现在让我们一起来看看吧~.~！

　　讯飞星火V4.0来了！6月27日，科大讯飞（002230）在北京发布讯飞星火大模型V4.0及相关落地应用。讯飞星火V4.0七大核心能力全面提升，整体超越GPT-4 Turbo，在8个国际主流测试集中排名第一，国内大模型全面领先。

　　大模型个性化时代到来！讯飞星火APP/Desk全新升级，发布“个人空间”，打造更懂你的AI助手；面向专业领域的个性化应用，科大讯飞升级讯飞晓医APP，上线个人数字健康空间，打造每个人的健康助手；业界首发星火智能批阅机，“AI助教”助力老师减负增效、因材施教；讯飞AI学习机升级 1对1 答疑辅导功能，打造每个孩子的AI学习助手。

　　面向万物互联时代，星火语音大模型再突破，发布74个语种/方言免切换对话，破解强干扰场景下语音识别难题，发布国际领先的极复杂场景语音转写技术，并通过云边端及软硬一体化解决方案，赋能汽车、家电、机器人等领域人机交互变革。此外，面向企业“人工智能+”场景价值落地最后一公里，科大讯飞正式发布星火企业智能体平台，并推出星火商机助手、星火评标助手等典型智能体案例，助力企业价值创造。

　　8个国际主流测试集测评第一，讯飞星火V4.0 整体超越GPT-4 Turbo

　　今年中高考真题实测中，讯飞星火语数外各科“成绩”均排名第一，被评为“更会做题的大模型”；在科研上，讯飞星火助力中国科学技术大学刘海燕教授团队，将蛋白质设计成功率从0.1%提升到20%，设计所需时间从6个月降到1天；赋能每个人，帮助一位不懂法律知识的70岁老人顺利要回养老钱欠款、帮助一位听障人士圆了文学梦······讯飞星火正成为我们每个人的AI助手。

　　自去年9月全面开放以来，讯飞星火APP在安卓公开市场累计下载量达1.31亿次，在国内工具类通用大模型App中排名第一，并围绕写作、编程、工作、学习等涌现出一批用户喜爱的热门助手。今年“618大促”，星火大模型加持的智能硬件销量同比增长超70%，月均使用次数超4000万，越来越多的用户开始享受到大模型带来的红利。

　　现场基于全国首个国产万卡算力集群“飞星一号”，讯飞星火大模型V4.0正式发布。讯飞星火V4.0 七大核心能力全面升级，全面对标GPT-4 Turbo，并实现在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面的整体超越。

　　讯飞星火V4.0在图文识别能力上进一步升级，在科研、金融、医疗、司法、办公等场景的应用效果已领先GPT-4o。此外，星火长文本能力也全新升级，并针对长文档知识问答的幻觉问题，业界首发溯源功能。

　　外部权威测试集也体现出讯飞星火V4.0的领先性。在国内外12项大模型主流测试集中，讯飞星火在8个测试集中排名第一，超越GPT-4 Turbo等国际大模型，国内大模型全面领先。

　　现场，刘庆峰展示了讯飞星火V4.0在复杂指令、复杂逻辑推理、空间推理、高中数学等方面的效果，星火“智商”再度进化。以空间推理为例，“Bob在客厅里。他拿着一个杯子走到厨房。他把球放进杯子里，然后拿着杯子走到卧室。他把杯子倒过来，然后走到花园。他把杯子放在花园里，然后走到车库。问题：球在什么地方？”讯飞星火可以基于空间和常识推断出球在卧室的地面上，这些能力的进步对于以后的具身智能、家庭机器人都具有意义。

　　大模型个性化时代到来！讯飞星火首发“个人空间”，数百万用户一键拥有“AI智能全家桶”

　　大模型在给我们的工作、生活带来便利的同时，也存在各家生成内容差不多、生成内容较泛、不够实用的情况，怎么样让大模型更好用，在工作生活中形成独特的价值？科大讯飞给出答案——打造更懂你的AI助手。

　　如何打造懂你的AI助手？刘庆峰提出，AI助手要能够基于用户画像进行个性化表达，基于使用历史进行记忆学习，基于个人资料进行增强学习。在构建用户个人画像时，人设风格可以自己选定，也可以根据对话和使用历史动态完善，进而形成个性化的表达风格；AI助手再结合个人资料，就可以生成个性化和针对性内容。

　　基于此，讯飞星火APP及桌面版全新升级改版，率先发布“个人空间”，用户可以上传自己的工作、学习、生活、健康等各类资料，形成每个人的专属知识库，再结合人设，让大模型生成更个性化内容。此外，讯飞星火首批上线 14 个智能体，面向特定场景打造专属助手。

　　科大讯飞研究院院长刘聪现场演示“个人空间”效果，当他上传了女儿写的小作文并选取符合女儿风格的AI人设标签后，星火生成了一篇活泼、可爱更个性化的文章；当他上传了讯飞翻译机的产品海报、用户短视频、相关录音，星火也可以根据这些多模态信息生成产品培训文档，还可以对生成的信息进行多模态溯源。大模型进入个性化时代，大模型工作、学习“可用性”飙升！

　　此外，星火大模型还打通了全系讯飞C端软硬件产品生态，数百万智能硬件用户一键拥有“星火全家桶”。比如讯飞智能办公本、智能录音笔的文件可以一键同步到星火个人空间中，通过数据互通、操作联动，把一篇办公本里会议记录同步到星火中，就可以让星火进行公文写作，还可以做PPT，以及生成待办事项等，带来更高效的办公体验。

　　个人数字健康空间来了！讯飞晓医APP下载量超1200万

　　面向专业领域的个性化应用，科大讯飞升级讯飞晓医APP，发布个人数字健康空间，打造每个人、每个家庭的AI健康助手。

　　在医疗领域，讯飞星火医疗大模型再次升级，医疗核心能力全面超过GPT-4 Turbo和GPT-4o。在此基础上，讯飞晓医APP各项能力持续升级，覆盖1600种常见疾病、2800种常见药品、6000种常见检查检验，满足用户在看病前、用药时、检查后的核心场景健康需求。当前，讯飞晓医APP累计下载量1200万，用户好评率98.8%，主动推荐率42%。

　　现场刘庆峰介绍，讯飞晓医APP上线的“个人数字健康空间”，它能够根据电子病历、检查报告、体检报告等用户个性化资料，构建个人数字健康空间，在看病前可以进一步剖析病症原因，用药时给出药物禁忌的个性判断，在检查后联合对比给出数据变化，并通过角色切换，了解其他家庭成员的健康状况。

　　目前讯飞晓医APP已通过数据安全与隐私保护的多类权威认证，进一步保障健康数据的安全。在当前医疗资源相对匮乏的情况下，讯飞晓医 APP 的出现有效缓解了社会对医疗服务的迫切需求，为个人及家庭健康管理提供了新的模式。

　　老师最强辅助！星火智能批阅机让老师作业批改负担下降90%

　　得益于底座大模型的升级和面向教育复杂场景的图文识别效果进一步提升，科大讯飞发布首款星火智能批阅机，它集智能批改、精准学情、个性学习于一体，它支持自由排版，不限纸张大小的作业，在支持多学科多题型智能批改的同时，还能即时生成多维学情报告，还为老师作业讲评和面批辅导提供了素材。刘聪在现场演示了星火智能批阅机批改作业的全流程，15份学生作业半分钟就能批改完成，批改模拟了真人笔迹，和老师平时批改作业几乎一样。

　　有了星火智能批阅机，老师多了一个减负增效、因材施教的AI助手，原先要90分钟才能批改完的作业，现在只要5分钟就能完成；人工分析学情要60分钟，现在星火1分钟就能完成；得益于个性化作业，学生的错题解决率也从50%提升到73%。

　　在今年中高考评测中，讯飞星火被外界评为“更会做题的大模型”。本次讯飞星火进一步升级了讯飞AI学习机的 AI 1对1 答疑辅导功能，既能进行多模态启发式讲解、自由问个性化解答，也可以进行互动探究式学习、超拟人引导式伴学等，让孩子多了一位“AI辅学老师”。

　　数据显示，相比较传统解题视频学习，AI答疑辅导的学习方式让孩子的学习完成率提高到90%，错题解决率提升到93%，孩子更愿意主动思考，学习效率更高，自信心也增强了。

　　星火语音大模型发布74个语种方言“自由对话”，破解强干扰场景下语音识别难题

　　近期科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化》项目，获得国家科学技术进步奖一等奖。发布会现场国奖得主再出“王炸”，星火语音大模型迎来新突破。

　　刘庆峰认为，语音将成为万物互联时代人机交互的主要方式，人机交互最重要的场景是远场、噪声、多人说话、多语言，因此万物互联时代的AIUI（人工智能用户界面）要满足远场高噪声、多语言多方言、全双工、多模态等标准。科大讯飞也主导制定了全双工语音交互ISO/IEC国际标准，并于2023年5月发布。

　　面向万物互联时代，本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力，可支持37个语种、37种方言“自由对话”。其中，37个语种识别效果领先OpenAI whisper-V3，37个方言识别效果平均提升30%。现场，科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果，能让输入效率大大提高。

　　科大讯飞还发布了软硬件一体化讯飞同传系统，可支持大会同传、会议同传、展厅同传、旅游同传等多场景使用。本次参会的嘉宾座位上同样配备讯飞同传的收听设备，佩戴后即可实时收听多语种AI同声传译。

来源：C114通信网

以上就是关于【如期兑现！讯飞星火V4.0整体超越GPT-4 Turbo，8个国际权威测试集测评第一】的相关内容，希望对大家有帮助！

标签：

如期兑现！讯飞星火V4.0整体超越GPT-4 Turbo，8个国际权威测试集测评第一

猜你喜欢

最新文章