多模态大语言模型的崛起与应用 AICon

发布时间:2025年11月3日    来源:szf

多模态大语言模型,正在重新定义人工智能的能力边界,推动着各行各业的变革。无论是在电商、营销、设计、视频创作、动画制作,还是在文本分析等领域,多模态技术都正逐步展现出其巨大的潜力。
2024年12月13-14日,AICon全球人工智能开发与应用大会·北京站,将再次汇聚全球顶尖AI专家,展示最新的AI技术和应用创新。在此次会议中,我们特别推出专场《多模态大语言模型的崛起与应用》,深入探讨多模态大语言模型的核心优势与实际应用案例,介绍多模态技术如何通过处理和融合多种数据类型,推动行业创新,优化业务解决方案,并加速实际业务场景中的落地与实践。更多议题可以复制链接到浏览器查看大会日程(或点击阅读原文):https://aicon.infoq.cn/202412/beijing/schedule本次专题的出品人为高杰博士,其目前担任蔚来汽车人工智能研发负责人&高级总监。有20年语⾳处理、⾃然语⾔处理和机器学习的相关⼯作经验。此前,他曾在腾讯、微软和阿里巴巴担任重要职位,参与语音识别、自然语言处理和AIoT领域的多个技术研发与产品落地工作。
精彩分享一
Aquila-VL-2B是2B级别SOTA的多模态模型。该模型基于Llava-onevision的训练思路,引入多分辨率来提升对图像内容的理解。
本次专题下,智源研究院技术经理刘广将带来《Aquila-VL-2B多模态模型的数据构建与高效训练实战》演讲,分享模型数据集的构建和处理过程,包括多种数据来源数据的格式统一以及数据选择,针对弱项的数据合成等。此外,还讨论了对训练效率和框架的提升,在FlagScale框架上实现了相对Deepspeed训练效率1.7倍的提升。Aquila-VL-2B的创新之处在于系统化的构建了多模态模型的数据,训练以及评测的pipline。
精彩分享二
在全球化传播中,如何通过多模态大语言模型有效传达品牌的情感与文化成为企业面临的重要挑战。明略科技多模态大模型部门负责人赵晨旭将带来分享《非标模态的多模态大语言模型如何模拟人类主观感受》。
他将探讨当前生成式人工智能在多模态内容创作中的应用,尤其是在广告、视频和图像等内容资产的生产中面临的挑战。他指出,尽管中国品牌已开始运用AI技术来提升全球传播能力,但现有技术在理解和模拟人类主观情感方面仍存在较大空白。当前的挑战之一是缺乏适合评估全球化品牌传播效果的数据集和基准,尤其是缺少能够衡量视频内容中情感反应的评测标准。
本次分享将为听众揭示如何弥补这些技术空白,并推动多模态大语言模型在全球传播中的实际应用。
精彩分享三
在过去的一年里,多模态大模型因其广泛的潜在应用而受到了前所未有的关注。
阿里云高级算法专家谢榛将在演讲《行业多模态大模型训推加速落地思考》中,深入探讨多模态大模型在行业应用中的发展现状、面临的挑战及未来前景。过去一年,多模态大模型因其在各行业中的潜在应用价值受到了广泛关注,然而,在技术落地过程中仍存在诸多难题。谢榛将结合团队近期的两个工作——CityLLava(2024CVPRAICityChallengeTrack2winner)和IVTP(ECCV2024),介绍多模态模型的迭代过程及其在训练和推理阶段的加速优化技术。
精彩分享四
从2023年6月开始,蔚来座舱智能化团队开始研发面向智能座舱应用场景的多模态大模型的技术预研工作,经过1年多的系统搭建、数据集构建和训练部署方案的实践,取得了一些技术进展和一定的多模态大模型的应用认知。
蔚来汽车座舱智能感知团队负责人牛建伟将带来演讲《蔚来座舱多模态大模型的应用实践》,分享包括对于车载场景的算法适配的训练流程、数据采集筛选和清洗方法、多分辨率以及多VITencoder的模型改进方法、端侧部署的具体实践情况。同时,作为多模态模型的一部分也会简要介绍在语音大模型方面的一些最新进展。
会议推荐
就在12月13日-14日,AICon将汇聚70+位AI及技术领域的专家,深入探讨大模型与推理、AIAgent、多模态、具身智能等前沿话题。此外,还有丰富的圆桌论坛、以及展区活动,满足你对大模型实践的好奇与想象。现在正值9折倒计时,名额有限,快扫码咨询了解详情,别错过这次绝佳的学习与交流机会!

你可能还想读

Default Image

欧美最顶尖的5家云厂商,都在押注什么?

大数据产业创新服务媒体 ——聚焦数据·改变商业 在数字时代的大潮中,人工智能技术如同一股强劲东风,正以前所未有的速度席卷全球云服务行业,推动其步入前所未有的智能升级阶段。随着计算能力的飞跃与数据量的爆炸性增长,AI技术在云服务领域的融合应用 […]

发布时间:2025年11月3日
Default Image

台积电表忠心的速度有点快

近期有消息称,美国已要求台积电从11月11日开始,停止向中国大陆客户运送常用于人工智能(AI)应用领域的先进芯片,专门针对我国的人工智能领域。此消息虽然没有官宣,不过据了解这条消息基本属实,目前国内公司如果想做高性能AI相关芯片,台积电大概 […]

发布时间:2025年11月3日
Default Image

AI行业存在泡沫吗?

观·察 泡沫的形成是技术发展吸引投资的必要过程,而泡沫的破灭则可以促使社会和制度进行调整,为新技术的全面应用和经济的可持续增长创造条件。 ——陈永伟 图片来源:东方IC AI行业存在泡沫吗? 文/陈永伟 前几天,AI(人工智能)圈出了一件大 […]

发布时间:2025年11月3日
Default Image

外媒:台积电停供大陆7纳米AI芯片

据路透社10日报道,美国商务部致函台积电,要求从11日开始停止向中国大陆客户供应7纳米及更先进工艺的AI芯片。这一出口限制措施主要针对用于人工智能加速器以及图形处理单元(GPU)的芯片。 报道称,美商务部的这封信函允许美国绕过相关规则制定过 […]

发布时间:2025年11月3日
Default Image

李彦宏:智能体是AI应用的最主流形态 即将迎来爆发点

“过去24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。” 11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具”秒哒”。 […]

发布时间:2025年11月3日
Default Image

AI闯关双十一:受伤的还是人类

或许大家还没意识到今天才是双十一。因为当双十一这天真来了,人们的感觉却是”双十一购物节”已经结束了。 步入”16岁”的双十一,从”光棍节”到”购物节”。在经历了奥数般的计算、复杂的玩法、到点蹲点抢红包等等规则后,今年的消费者显得格外疲倦。 […]

发布时间:2025年11月3日
Default Image

NPU:真需求?假创新?

👆如果您希望可以时常见面,欢迎标星🌟收藏哦- 来源:内容编译自theregister,谢谢。 如果您现在还没有听说过神经处理单元(NPU),那么您一定错过了英特尔、AMD和高通一年的人工智能营销。 在过去的12个月中,这些专注于AI的处理器 […]

发布时间:2025年11月3日
Default Image

是时候重新认识To B圈的「双11」了

“双11″曾是一场商业与技术的伟力创造的”奇观”。但对于toB圈而言,只有当它造就的”奇观”成为寻常,下一个奇迹才会诞生。 11月11日,时针指向23点59分,杭州阿里巴巴云谷园区灯火通明。阿里云双11″作战指挥室”数据监控大屏上,销售额以 […]

发布时间:2025年11月3日