首页 > 科大讯飞:多模态大模型驱动汽车智能化新变革

科大讯飞:多模态大模型驱动汽车智能化新变革

智能化已成为汽车行业的核心发展趋势,贯穿智能座舱、自动驾驶等多个领域。随着大模型技术的发展,汽车智能化竞争愈发激烈,车企面临着从价格战转向价值战的挑战。2025年3月20日,在第三届AI定义汽车论坛上,科大讯飞智能汽车事业部副总经理、科大讯飞苏州研究院执行院..

智能化已成为汽车行业的核心发展趋势,贯穿智能座舱、自动驾驶等多个领域。随着大模型技术的发展,汽车智能化竞争愈发激烈,车企面临着从价格战转向价值战的挑战。

2025年3月20日,在第三届AI定义汽车论坛上,科大讯飞智能汽车事业部副总经理、科大讯飞苏州研究院执行院长支洪平表示,科大讯飞在大模型领域成果显著,其讯飞星火大模型是国内唯一基于全国产平台训练的通用大模型。在汽车智能化应用方面,多模态大模型使汽车人机交互更自然、拟人且情感化,科大讯飞通过技术优化,将交互速度降至1.5秒以下,还支持多种语言免切换交流,并能精准识别车内车外场景物品 。

同时,科大讯飞利用自身算力底座和星火大模型构建智能体搭建平台,实现丰富智能体上车。例如,与支付宝合作的咖啡助手,支持车内刷脸无感支付订咖啡。在汽车音效领域,科大讯飞也有诸多创新,如嗨唱功能(无麦K歌)、星火调音师、超临感环绕声等,智慧声场使车内空间可玩性大大增加。

支洪平 | 科大讯飞智能汽车事业部副总经理、科大讯飞苏州研究院执行院长

以下为演讲内容整理:

汽车智能化发展趋势剖析

在当前汽车产业的发展格局中,智能化已成为不可阻挡的核心趋势,深度重塑着汽车行业的发展轨迹。中国汽车工程学会发布的2024年和2025年汽车十大趋势显示,智能化贯穿于汽车产业的多个关键领域,不仅在智能座舱的交互体验中占据重要地位,还对自动驾驶技术以及车内音效等方面产生着深远影响。进入2025年,智能化更是成为汽车行业前行的关键引领力量,其重要性与日俱增。

2024年春节期间Deepseek R1的出现引发了广泛关注,在这一背景下,吉利等二十多家车企迅速将相关大模型应用于车端,这一现象体现了人工智能领域的“平权化”趋势。企业能够借助外部的基础能力,以较低成本获取强大的技术支持,为自身发展提供有力支撑。然而,在接入基础能力之后,如何围绕用户需求打造闭环式的价值体验,成为企业面临的重要课题。这需要企业深入理解用户需求,将技术与实际应用场景紧密结合,从产品设计、功能开发到售后服务等各个环节,构建起完整的价值交付体系,提升用户的整体体验。

图源:科大讯飞

在自动驾驶领域,行业正处于从早期采用者向早期大众过渡的关键阶段,这一过程犹如跨越一道鸿沟,充满挑战。2025年2月10日,比亚迪发布的天神之眼系统,开启了全民自动驾驶的新篇章,使得低价位车型的自动驾驶成为行业新的竞争焦点。在价格战不断升级的市场环境下,如何打造性价比更高、性能更优的自动驾驶系统,成为车企必须攻克的难题。这不仅要求车企在技术研发上加大投入,提高自动驾驶系统的安全性和可靠性,还需要优化成本结构,提升产品的市场竞争力,实现从单纯的价格竞争向价值竞争的转变。

从人工智能的发展历程来看,自1956年达特茅斯会议起,历经四次发展浪潮,在算力、算法和数据的共同推动下,如今已迎来智慧涌现和通用人工智能的曙光。科大讯飞于2023年5月推出讯飞星火大模型,并在近两年时间里进行了七次重大迭代升级。该模型对标国际先进水平,是国内唯一基于全国产平台训练的通用大模型,这一成果彰显了科大讯飞在人工智能领域的技术实力和创新能力。

展望2025年,大模型与汽车的融合将聚焦于人机交互和场景创新两个关键领域。在人机交互方面,多模态大模型将使人机交互更加自然、拟人化且富有情感。传统的人机交互速度较快,但引入大模型后,由于语音输入、模型处理、后端联网服务以及语音反馈等环节的增加,交互速度显著下降。科大讯飞致力于提升交互效率,目前已将交互时间缩短至1.5秒以下,接近传统人机交互的平均水平。此外,多模态大模型还支持普通话与方言、普通话与外语的自然切换,能够感知用户的情感和情绪,实现更加自然流畅的交互。从交互范围来看,从单人交互逐渐扩展到多分区交互,车内的司机和乘客都能得到精准的交互响应。同时,多模态交互还涵盖对车内车外场景物品的识别,包括车标、车型、动物、景观、地标以及车内人员的数量、年龄、表情和情绪等,为用户提供更加个性化、智能化的服务。

基于多模态大模型的汽车智能化创新实践

针对不同大模型在不同应用场景下的特点,科大讯飞提出“快思考”与“慢思考”相结合的交互策略。以DeepSeek为代表的大模型在深度推理方面表现出色,例如在逻辑运算、数学计算和代码处理等方面具有优势,但交互速度相对较慢;而讯飞星火等大模型则在闲聊、垂直领域知识库查询等方面速度较快,交互体验良好。基于此,科大讯飞根据用户提出的问题类型,智能分配算力资源,选择合适的模型进行处理。对于简单的车辆控制指令,如调节车窗、空调温度等,采用“快思考”模型快速响应,确保高效便捷;而对于旅游规划、餐厅推荐等需要多轮交互和深度推理的复杂问题,则启用“慢思考”模型,通过多轮交互提供更具价值的解决方案,提升用户体验。

科大讯飞凭借自身的算力底座和星火大模型,构建了一套完整的工具链,为车企和第三方伙伴搭建智能体提供了有力支持。通过智能体平台,不仅可以开发科大讯飞自身的应用,还能促进第三方应用的创新发展。以医疗、教育、用车助手等智能体为例,这些应用为用户提供了更加专业、便捷的服务。此外,科大讯飞与支付宝合作开发的咖啡助手,实现了车内语音订咖啡和刷脸无感支付的功能。用户在开车途中只需通过语音下达指令,即可完成咖啡预订,并利用车内摄像头刷脸支付,到达目的地后可直接取咖啡,极大地提升了用户体验,为用户带来了更加自然、流畅的交互方式。

随着新能源汽车的普及,车内高品质音乐体验成为消费者购车时的重要考量因素。科大讯飞凭借其在行业内的领先优势,推出了一系列创新的音效功能。“嗨唱功能”或“无麦K歌”,通过对音频源进行分轨处理,将人声分离出来,用户可以在车内进行独唱、对唱、伴唱和领唱等多种形式的K歌活动,将汽车变成移动的K歌房。以经典歌曲《铁血丹心》为例,用户可以根据自己的需求消除或保留特定歌手的声音,与他人合唱,丰富了车内娱乐的玩法。“星火调音师”功能则满足了用户对个性化音效的需求。用户可以通过自然语言提出对音效的调整要求,如提高高音的明亮度、增强低音的厚重感等,系统经过多轮交互后,将车内音响调校到用户满意的状态,并支持用户将个人调校模式上传至云端,供其他用户下载使用,实现了行业生态的共创。针对网上音乐声道格式的局限性,科大讯飞利用AI分轨技术,将常见的双声道立体声音乐转化为具有强烈空间感和立体感的7.1.4声道音响效果,充分发挥了车内多通道音响的优势,为用户带来更加沉浸式的音乐体验。

图源:科大讯飞

在自动驾驶领域,端到端模型逐渐兴起。传统的自动驾驶分模块执行,从传感器采集数据,经过感知、决策、规划到控制,存在信息传递损耗和效率低下的问题。而端到端模型则从传感器输入直接到轨迹输出,形成一个完整的单一大模型。这种模型能够减少信息损失,提高规划的拟人化程度,更好地适应复杂场景,最终实现全域领航。

科大讯飞对车企的多元赋能与合作成果

科大讯飞不仅关注汽车本身的智能化发展,还着眼于车企在营销、客户管理、客户服务以及生产管理等方面的智能化需求,提供全面的解决方案。在营销环节,利用大数据和人工智能技术,帮助车企精准定位目标客户群体,制定个性化的营销策略,提高营销效果和市场占有率。在供应链管理方面,通过智能化的数据分析和预测,优化供应链流程,降低成本,提高供应链的效率和灵活性。在客户服务领域,借助智能客服系统,实现快速响应客户咨询,提升客户满意度。在生产管理方面,利用人工智能技术优化生产流程,提高生产效率和产品质量,助力车企实现全面的智能化转型。

截至目前,讯飞星火大模型已落地10余款车型,在助力中国车企出海方面取得了显著成绩。在中国汽车出海的前十强车企中,有八家选择与科大讯飞合作。这充分体现了科大讯飞在汽车智能化领域的技术实力和行业影响力,也表明了车企对科大讯飞解决方案的高度认可。通过与车企的紧密合作,科大讯飞将自身的技术优势与车企的产业资源相结合,共同推动汽车智能化技术的发展和应用,为中国汽车产业在全球市场的竞争中赢得了优势。

图源:科大讯飞

在汽车智能化的浪潮中,科大讯飞凭借对行业趋势的敏锐洞察、持续的技术创新以及与车企的深度合作,在智能座舱、人机交互、智慧声场和企业数字化等多个领域进行了全面布局。随着技术的不断进步和应用场景的持续拓展,科大讯飞有望在未来汽车智能化的发展进程中发挥更加重要的作用,与车企携手共进,推动中国乃至全球汽车产业向更高水平的智能化迈进。

(以上内容来自科大讯飞智能汽车事业部副总经理、科大讯飞苏州研究院执行院长支洪平于2025年3月20日在第三届AI定义汽车论坛发表的《多模态大模型驱动汽车智能化新变革》主题演讲。)

来源:盖世汽车