极目新闻记者 姚岗 发自北京
6月27日,科大讯飞在北京发布讯飞星火大模型V4.0及相关落地应用。极目新闻记者从现场获悉,讯飞星火V4.0七大核心能力全面提升,讯飞星火APP及桌面版全新升级改版,发布“个人空间”。

讯飞星火大模型V4.0正式发布
自去年9月全面开放以来,讯飞星火APP在安卓公开市场累计下载量达1.31亿次,在国内工具类通用大模型APP中排名第一,并围绕写作、编程、工作、学习等涌现出一批用户喜爱的热门助手。今年“618大促”,星火大模型加持的智能硬件销量同比增长超70%,月均使用次数超4000万,越来越多的用户开始享受到大模型带来的红利。
现场基于全国首个国产万卡算力集群“飞星一号”,讯飞星火大模型V4.0正式发布。讯飞星火V4.0七大核心能力全面升级,图文识别能力进一步升级。此外,星火长文本能力也全新升级,并针对长文档知识问答的幻觉问题,业界首发溯源功能。
现场,科大讯飞董事长刘庆峰展示了讯飞星火V4.0在复杂指令、复杂逻辑推理、空间推理、高中数学等方面的效果,星火“智商”再度进化。以空间推理为例,“Bob在客厅里。他拿着一个杯子走到厨房。他把球放进杯子里,然后拿着杯子走到卧室。他把杯子倒过来,然后走到花园。他把杯子放在花园里,然后走到车库。问题:球在什么地方?”讯飞星火可以基于空间和常识推断出球在卧室的地面上,这些能力的进步对于以后的具身智能、家庭机器人都具有意义。
破解强干扰场景下语音识别难题
刘庆峰认为,语音将成为万物互联时代人机交互的主要方式,人机交互最重要的场景是远场、噪声、多人说话、多语言,因此万物互联时代的AIUI(人工智能用户界面)要满足远场高噪声、多语言多方言、全双工、多模态等标准。科大讯飞也主导制定了全双工语音交互ISO/IEC国际标准,并于2023年5月发布。
面向万物互联时代,本次星火语音大模型发布的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率大大提高。
科大讯飞还发布了软硬件一体化讯飞同传系统,可支持大会同传、会议同传、展厅同传、旅游同传等多场景使用。
针对强干扰场景下的语音识别难题,科大讯飞突破了多人混叠场景下的极复杂场景语音转写,即使在三人混叠说话场景也能实现86%的语音识别准确率。三位讯飞研究院的研究员现场实测了在噪音场景下,同时混叠着说话,正常人耳已难以听清,只见讯飞星火的多模态能力不但实现了三人重叠语音的角色分离,还能实时转写出每个人说的话,炸裂的效果引发现场掌声不断。未来基于多模态的声音识别技术,将应用在讯飞听见智慧办公、智慧屏等会议办公产品中。
大模型正在推动人机交互变革,语音领域的所有应用都值得被重构。在大模型加持下,星火汽车智能座舱全新升级,不但具备了多语种多方言的“自由交互”,还具备多情感多模态的超拟人交互。
极目新闻记者看到,此次活动现场还有三款搭载星火智能座舱的汽车展示。据悉,星火大模型为一汽、奇瑞、广汽、江淮、长城等车企的众多车型,赋予了高度智能的交互体验。
大模型个性化时代到来
大模型在给工作、生活带来便利的同时,也存在各家生成内容差不多、生成内容较泛、不够实用的情况,怎么样让大模型更好用,在工作生活中形成独特的价值?科大讯飞给出答案——打造更懂你的AI助手。
如何打造懂你的AI助手?刘庆峰提出,AI助手要能够基于用户画像进行个性化表达,基于使用历史进行记忆学习,基于个人资料进行增强学习。在构建用户个人画像时,人设风格可以自己选定,也可以根据对话和使用历史动态完善,进而形成个性化的表达风格;AI助手再结合个人资料,就可以生成个性化和针对性内容。
基于此,讯飞星火APP及桌面版全新升级改版,率先发布“个人空间”,用户可以上传自己的工作、学习、生活、健康等各类资料,形成每个人的专属知识库,再结合人设,让大模型生成更个性化内容。此外,讯飞星火首批上线14 个智能体,面向特定场景打造专属助手。
科大讯飞研究院院长刘聪现场演示“个人空间”效果,当他上传了女儿写的小作文并选取符合女儿风格的AI人设标签后,星火生成了一篇活泼、可爱更个性化的文章;当他上传了讯飞翻译机的产品海报、用户短视频、相关录音,星火也可以根据这些多模态信息生成产品培训文档,还可以对生成的信息进行多模态溯源。大模型进入个性化时代,大模型工作、学习“可用性”飙升。
星火智能批阅机帮助老师减负
得益于底座大模型的升级和面向教育复杂场景的图文识别效果进一步提升,科大讯飞发布首款星火智能批阅机,它集智能批改、精准学情、个性学习于一体,它支持自由排版,不限纸张大小的作业,在支持多学科多题型智能批改的同时,还能即时生成多维学情报告,还为老师作业讲评和面批辅导提供了素材。刘聪在现场演示了星火智能批阅机批改作业的全流程,15份学生作业半分钟就能批改完成,批改模拟了真人笔迹,和老师平时批改作业几乎一样。

有了星火智能批阅机,老师多了一个减负增效、因材施教的AI助手,原先要90分钟才能批改完的作业,现在只要5分钟就能完成;人工分析学情要60分钟,现在星火1分钟就能完成;得益于个性化作业,学生的错题解决率也从50%提升到73%。
据悉,本次讯飞星火进一步升级了讯飞AI学习机的AI 1对1答疑辅导功能,既能进行多模态启发式讲解、自由问个性化解答,也可以进行互动探究式学习、超拟人引导式伴学等,让孩子多了一位“AI辅学老师”。
星火开发者生态加速增长
讯飞星火大模型带来行业赋能的同时,也在助力开发者生态蓬勃发展。自今年1月30日讯飞星火V3.5发布以来,短短5个月,星火开发者生态加速增长,开发者数从598万增长到702万,新增超104万;海外开发者数超40万;大模型开发者达57万。越来越多开发者正加入星火生态,释放更多刚需场景的应用价值。
刘庆峰说,只有自主可控的繁荣生态,才有中国通用人工智能的大未来。面向未来的人工智能新生态,他强调要关注源头技术生态、智能体生态、应用生态和行业生态,实现自主可控和软硬一体,才能实现大模型的深度落地;既要科学理性地认识中美在大模型上的综合差距,也要有信心快速追赶,给出从源头技术、到产业生态、再到应用落地的一整套的打法,以长期主义来打造真正自主可控的AI产业生态。
