今天(7日)上午,2023世界人工智能大会战略合作伙伴商汤科技召开“大爱无疆·日日新”人工智能论坛,重磅推出“商汤日日新”大模型体系的多方位全面升级,以及在该体系下的一系列大模型产品更新和落地成果。
(资料图)
“大模型的突破掀起了人工智能的新一轮技术革命,随之而来的是产业需求呈现爆炸式增长,全新的应用场景和应用模式正迅速涌现。商汤希望通过‘大模型+大装置’持续推动AI基础设施能力的跃进提升,不仅打造通用能力更加强大的基础模型,也进一步高效融合不同垂直领域的专业知识,构建更懂行业、更具专长的专业大模型,从根本上降低大模型的下游应用成本和门槛,让大模型的产业价值在千行百业中绽放。”商汤科技董事长兼CEO徐立表示。
寓意“模型迭代速度和处理问题的能力可以日日更新”,商汤大模型体系在其“大模型+大装置”的AGI战略布局下,正进行着高速迭代。作为千亿级参数的自然语言处理模型,商汤商量2.0版本突破了大语言模型输入长度的限制,并推出不同参数量级的模型版本,可完美适配移动端、云端等不同终端及场景的应用需求,降低部署成本。商汤的自研生成式大模型商汤秒画3.0的模型参数从今年4月首次发布以来的10亿提升至70亿量级,能够实现专业摄影级的图片细节刻画。
不仅如此,商汤如影2.0数字人生成平台相较1.0版本的语音和口型流畅度提升30%以上,实现4K高清视频效果,并带来AIGC生成形象及数字人歌唱功能。此外,商汤琼宇2.0的空间重建效率提升20%,渲染性能提升50%,每100平方公里场景的建图时间仅需38小时即可完成(1200 TFLOPS/秒算力支持);而商汤格物2.0对小物体的纹理及材质还原达到毫米级精细度,并突破对高反光和镜面物体的采集难题。
依托“商汤日日新”大模型体系在底层技术领域的快速迭代,商汤正积极通过大模型的多模态能力组合赋能产业升级,并带来诸多引领行业的全新突破——
在医疗场景,商汤基于海量医学知识和临床数据打造了中文医疗语言大模型“大医”,提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力,未来也即将支持医学图像、文本、结构化数据等多模态综合分析,并可不断提升医疗语言理解和推理能力,持续赋能医院诊疗效率及患者服务提升。
在线上短视频、直播平台,商汤如影2.0生成的数字人正得到广泛应用,商汤还与多个头部企业达成渠道战略合作,共建“云+AIGC+短视频直播”生态,为行业带来更高效、低成本、便捷易用的AI视频和营销工具。
在智能汽车领域,商汤绝影智能座舱、智能驾驶、车路协同等行业应用也已在大模型的加持下突破创新边界。在智能座舱里,商汤通过视觉、听觉等多模态融合,全方位感知用户需求,通过标签化数据记录用户习惯和偏好,提供专属个性服务。同时,商汤还通过大模型强大的环境理解、逻辑思维和内容生成能力,带来更懂用户的“车舱大脑”,以及可支持形象、语音快速定制的数字人进行拟人化交互,带来集安全、娱乐、教育及效率于一体的智能座舱体验。
车舱外,依托“大模型+大装置”的强大能力,商汤绝影部署端云协同,统一流量入口,支持私有化部署及千万量级的应用需求。在人工智能领域最具学术影响力的顶级会议之一——国际计算机视觉与模式识别会议(CVPR)2023中,商汤及联合实验室还首个提出感知决策一体化的自动驾驶通用大模型UniAD,开创了以全局任务为目标的自动驾驶大模型架构,并斩获最佳论文奖,为自动驾驶技术与产业的发展提出了新的方向。“要说面向量产,它肯定还是有一定的周期的。我们本身在自动驾驶领域是有量产经验的。在过去的一些方法BEV等,以及其他的一些智驾的系统,我们会找到一些非常难解决的例子,这些例子用现在的这套UniAD的框架去进行测试,就看到有比较显著的提升。”商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚表示。
基于此,商汤打造车路云协同的交通体系,凭借多模态多任务通用大模型开发路侧视觉感知大模型,结合琼宇2.0及格物2.0构建智能交通孪生与仿真,并利用商量2.0的感知推理和人机交互能力推动车路云共同向大模型对话式交互的演进。
“在大模型的加持下,通过多轮对话,结合身体各种体征,智能车舱能够做健康咨询,在紧急的情况下还可以自动启动智能救援。”王晓刚表示,“在旅行方面,有了语言模型,可以从海量的数据中自动为大家制定出行攻略,而且可以自动连接到App,方便快捷地实现操作。”
新民晚报记者郜阳
标签:
参与评论