多模态大语言模型的崛起与应用 AICon

发布时间:2025年11月3日    来源:szf

多模态大语言模型,正在重新定义人工智能的能力边界,推动着各行各业的变革。无论是在电商、营销、设计、视频创作、动画制作,还是在文本分析等领域,多模态技术都正逐步展现出其巨大的潜力。
2024年12月13-14日,AICon全球人工智能开发与应用大会·北京站,将再次汇聚全球顶尖AI专家,展示最新的AI技术和应用创新。在此次会议中,我们特别推出专场《多模态大语言模型的崛起与应用》,深入探讨多模态大语言模型的核心优势与实际应用案例,介绍多模态技术如何通过处理和融合多种数据类型,推动行业创新,优化业务解决方案,并加速实际业务场景中的落地与实践。更多议题可以复制链接到浏览器查看大会日程(或点击阅读原文):https://aicon.infoq.cn/202412/beijing/schedule本次专题的出品人为高杰博士,其目前担任蔚来汽车人工智能研发负责人&高级总监。有20年语⾳处理、⾃然语⾔处理和机器学习的相关⼯作经验。此前,他曾在腾讯、微软和阿里巴巴担任重要职位,参与语音识别、自然语言处理和AIoT领域的多个技术研发与产品落地工作。
精彩分享一
Aquila-VL-2B是2B级别SOTA的多模态模型。该模型基于Llava-onevision的训练思路,引入多分辨率来提升对图像内容的理解。
本次专题下,智源研究院技术经理刘广将带来《Aquila-VL-2B多模态模型的数据构建与高效训练实战》演讲,分享模型数据集的构建和处理过程,包括多种数据来源数据的格式统一以及数据选择,针对弱项的数据合成等。此外,还讨论了对训练效率和框架的提升,在FlagScale框架上实现了相对Deepspeed训练效率1.7倍的提升。Aquila-VL-2B的创新之处在于系统化的构建了多模态模型的数据,训练以及评测的pipline。
精彩分享二
在全球化传播中,如何通过多模态大语言模型有效传达品牌的情感与文化成为企业面临的重要挑战。明略科技多模态大模型部门负责人赵晨旭将带来分享《非标模态的多模态大语言模型如何模拟人类主观感受》。
他将探讨当前生成式人工智能在多模态内容创作中的应用,尤其是在广告、视频和图像等内容资产的生产中面临的挑战。他指出,尽管中国品牌已开始运用AI技术来提升全球传播能力,但现有技术在理解和模拟人类主观情感方面仍存在较大空白。当前的挑战之一是缺乏适合评估全球化品牌传播效果的数据集和基准,尤其是缺少能够衡量视频内容中情感反应的评测标准。
本次分享将为听众揭示如何弥补这些技术空白,并推动多模态大语言模型在全球传播中的实际应用。
精彩分享三
在过去的一年里,多模态大模型因其广泛的潜在应用而受到了前所未有的关注。
阿里云高级算法专家谢榛将在演讲《行业多模态大模型训推加速落地思考》中,深入探讨多模态大模型在行业应用中的发展现状、面临的挑战及未来前景。过去一年,多模态大模型因其在各行业中的潜在应用价值受到了广泛关注,然而,在技术落地过程中仍存在诸多难题。谢榛将结合团队近期的两个工作——CityLLava(2024CVPRAICityChallengeTrack2winner)和IVTP(ECCV2024),介绍多模态模型的迭代过程及其在训练和推理阶段的加速优化技术。
精彩分享四
从2023年6月开始,蔚来座舱智能化团队开始研发面向智能座舱应用场景的多模态大模型的技术预研工作,经过1年多的系统搭建、数据集构建和训练部署方案的实践,取得了一些技术进展和一定的多模态大模型的应用认知。
蔚来汽车座舱智能感知团队负责人牛建伟将带来演讲《蔚来座舱多模态大模型的应用实践》,分享包括对于车载场景的算法适配的训练流程、数据采集筛选和清洗方法、多分辨率以及多VITencoder的模型改进方法、端侧部署的具体实践情况。同时,作为多模态模型的一部分也会简要介绍在语音大模型方面的一些最新进展。
会议推荐
就在12月13日-14日,AICon将汇聚70+位AI及技术领域的专家,深入探讨大模型与推理、AIAgent、多模态、具身智能等前沿话题。此外,还有丰富的圆桌论坛、以及展区活动,满足你对大模型实践的好奇与想象。现在正值9折倒计时,名额有限,快扫码咨询了解详情,别错过这次绝佳的学习与交流机会!

你可能还想读

Default Image

AI眼镜厂商Solos发布两款新智能眼镜,售价249美元起

36氪获悉,AI眼镜厂商Solos在香港举办的2025智能眼镜研讨会上官宣了新一代智能眼镜产品。此次新品拓展了其AirGo产品线,带来了两款新产品:聚焦音频交互的AirGo™ A5和具备视频功能的AI眼镜AirGo™ V2。Solos Ai […]

发布时间:2025年11月3日
Default Image

大模型为深度伪造带来土壤,业界呼吁跨学科联合攻坚鉴伪技术

·鉴伪技术开发需要跨学科合作,当前的鉴伪技术以软件算法为主,未来将走向软硬一体。大模型兴起为深度伪造带来土壤,业界呼吁跨学科联合攻坚鉴伪技术。在大模型时代,人工智能合成语音与真实语音之间的界限变得越发模糊,提升与之匹配的识别技术迫在眉睫。7 […]

发布时间:2025年11月3日
Default Image

小米AI眼镜发布,支持“看一下支付”,1999元起

6月26日,小米重磅发布“面向下一代的个人智能设备”——小米AI眼镜。全新小米AI眼镜具备可支付功能,内置支付宝“看一下支付”,方便用户在双手忙碌或不便使用手机时,通过眼镜扫码支付,安全又便捷。据悉,小米AI眼镜现已开售,1999元起。小米 […]

发布时间:2025年11月3日
Default Image

小米AI眼镜发布,支持“看一下支付”,1999元起

6月26日,小米重磅发布“面向下一代的个人智能设备”——小米AI眼镜。全新小米AI眼镜具备可支付功能,内置支付宝“看一下支付”,方便用户在双手忙碌或不便使用手机时,通过眼镜扫码支付,安全又便捷。据悉,小米AI眼镜现已开售,1999元起。小米 […]

发布时间:2025年11月3日
Default Image

小米首款AI眼镜在京东开售 1999元起晒单享3期免息

6月26日,小米正式推出其首款AI眼镜,定位为“面向下个时代的个人智能设备”,目前已在京东同步上架开售,售价1999元起,叠加国补优惠后到手价低至1699元。京东还为该款AI眼镜推出限时福利,京东购机用户可参与抽奖,有4台免单机会,晒单用户 […]

发布时间:2025年11月3日
Default Image

6月国产手机各价位段销量冠军出炉:华为中高端齐开花

【CNMO科技消息】近日,有数码博主曝光了2025年6月国产手机各价位段销量冠军机型。CNMO注意到,华为在中高端市场全面领先,实现“齐开花”的强势表现;OPPO Reno14则包揽全价位段和部分中端市场冠军;vivo则在特定区间占据优势。 […]

发布时间:2025年11月3日
Default Image

华为发布Pura80系列手机 售价6499元起

观点网讯:6月11日,华为召开Pura80系列及全场景新品发布会,发布了Pura80系列手机、华为WATCH5等产品。据悉,华为Pura80系列包括Pura80,Pura80 Pro及Pro+,Pura80 Ultra四款产品。发布会上,华 […]

发布时间:2025年11月3日
Default Image

2699元起 华为nova10系列今日发布_TechWeb

【TechWeb】2022年7月4日,华为正式发布华为nova10系列新品手机。华为nova10系列将于2022年7月8日10:08正式开售,共有“10号色”“曜金黑” “普罗旺斯““绮境森林”四种颜色提供选择。其中华为nova10 128 […]

发布时间:2025年11月3日