科技动态

瞄准垂直领域 拥抱生产生活——大模型加速人工

在2024中国国际数字经济博览会上,工作人员向参观者介绍金融大模型。冯维健 摄

  用户输入简短的文字,大模型自动生成创意图像和视频;扫描X光、CT影像,大模型辅助医生为患者分析诊断病情;1分钟内快速预测未来10天的天气,若有极端天气可能,提前发出预警……当前,人工智能大模型蓬勃发展,各式各样的新应用层出不穷,正在加速赋能千行百业。

  从通用转向垂直

  近日召开的2024中国国际数字经济博览会上,一批数字技术、数字服务、数字产品领域的前沿场景得到重点展示。与往届展会相比,本次大会首次专门开辟人工智能大模型展区,集中展示全国32个垂类大模型应用场景及主要成果,内容涵盖医疗、中医药、钢铁、化工、港口、金融等10多个领域。

  大模型是指拥有超大规模参数、复杂计算结构的机器学习模型。南京航空航天大学人工智能学院教授李丕绩表示,大模型分为通用大模型和垂类大模型。与通用大模型相比,后者立足企业所在垂直领域业务,用业务数据打造垂类大模型,在各自业务场景中实现降本增效。

  随着大模型行业快速演进,其专业领域也不断细分。对特定场景而言,并非所有企业都需要通用大模型的“全能”,而是更需要模型的精度。“相比之下,通用大模型的开发成本高,常伴随十亿元甚至百亿元的高昂成本。”李丕绩表示,通用大模型如同“地基”,有不同的训练语料,就可以搭建不同的“房子”。对于某些应用场景来说,花费较低成本训练出一个垂类大模型,也能很好满足用户需求。

  “大模型已经从语言模型走向多模态,这是技术走向落地的一个重要阶段。”北京智源人工智能研究院副院长兼总工程师林咏华表示,当前,在通用领域,大模型初步呈现了一定的场景应用能力,然而,在医疗健康、教育等垂直领域,大模型所展现的能力尚不足以支持专业应用,其主要原因在于模型训练缺乏高质量可用的行业数据集。

  360集团创始人周鸿祎表示,大模型不是产品而是能力,能力结合场景才能产品化。通过细分场景,拆解业务流程,就可以训练对应的专业模型来解决政府和企业专业场景的需求问题。

  国家工业信息安全发展研究中心党委副书记吴铁男表示,近年来,国内外企业和机构迅速跟进,积极推进大模型研发。截至今年7月30日,全国已有197个大模型产品通过备案,其中行业大模型占比达70%。

  拥抱生产生活

  作为人工智能领域的技术新高地,大模型正以前所未有的速度赋能千行百业。通过其在各领域的广泛应用,可以实现更高效、更智能的服务和决策过程,推动产业持续创新和发展,开辟更多生产生活应用新场景。

  气管插管模拟训练、虚拟腹腔镜手术训练、消化内镜诊疗模拟训练……对医学院校来说,各类手术的临床教学和实践训练是一项重要环节。展会上,一家企业推出的医学模拟训练系统结合大模型对医院临床诊断中各科室病例数据的学习与训练,模拟出十余种常见的医学检查和手术实操场景,帮助医学生更快融入临床。

  上传卫星遥感图像,大模型快速完成图像解译和分析,生成助力农业生产的详尽报告和结果……河北农业大学展出的农业遥感大模型,让众多农业企业经营者和种粮大户眼前一亮。

  “农业遥感大模型建立在海量的自然灾害遥感图像、病虫害图像、气象环境数据等多模态样本数据的基础上,通过环境监测和分析预测技术,为农业生产提供智能支持。”河北农业大学信息中心副主任王春山说,其应用场景涵盖自然资源调查与监测、农业水肥方案推荐、农业保险准确计算等领域。

  环境污染治理也是目前垂类大模型落地的领域之一。有专家表示,过去环境污染防治更多依靠实地考察和人工决策,而垂直大模型的落地为环境污染治理提供了技术支撑,依托数据就能对污染处理作出更加客观精准的判断,实现科学治污、精准治污。数字技术与环保大模型的进一步融合,将推动环境监管领域实现更加智能化、精准化和高效化的发展。

  大模型之“大”,不仅在于其规模化参数众多,更在于它所蕴含的巨大潜力和广阔应用场景。吴铁男表示,大模型正在向纵深发展,加速赋能千行百业。随着生产智能化、决策精准化、工业绿色化趋势的演进,工业大模型在实践中正加速发展,大模型有望成为驱动新型工业化的新引擎。

  统筹发展与安全

  科学技术是一把“双刃剑”,任何技术的发展都有两面性。如今,大模型的发展日新月异,如何统筹大模型发展和安全引起专家和社会各界的广泛关注。

  吴铁男表示,大模型的快速发展加剧了人工智能安全风险,引发更多担忧,如“算法黑箱”、不可解释等内生问题,过度使用、恶意应用等技术滥用问题,以及数据依赖导致的隐私泄露、数据滥用、“数据投毒”等性质更恶劣的问题。

  在吴铁男等专家看来,大模型要想获得长远与可持续发展,仍需突破多重壁垒。

  一是技术迭代快。新技术层出不穷,前沿技术变化快。尽管大模型已在大量垂直领域“多点开花”,但仍然尚未产生实质性、大规模应用。

  二是数据获取难。高质量信息数据相对匮乏,行业数据尚未实现开放、流动和共享。

  三是场景待挖掘。我国工业门类众多,目前大模型应用场景仅集中在电力、钢铁等少数变现能力强的场景。深度场景应用不足,可作为经验复制推广的典型场景仍需进一步挖掘。

  四是安全顾虑高。工业场景容错率低,安全风险顾虑较高,当前部分企业的人工智能安全意识与安全能力仍有不足,阻碍了大模型在相关领域和场景的应用。

  林咏华表示,在给生产生活带来巨大变迁的同时,大模型在数据、算力和算法等方面仍面临挑战。当下,我国人工智能行业需要解决的不仅仅是资源储备的问题,还有生态共建的问题,上下游需要以开源开放的心态建设生态。

  大模型的训练往往需要海量数据的支撑。香港浸会大学深圳研究院副院长宋俊表示,由于不同部门之间的系统往往不相通,彼此相通的数据有限,希望通过大模型作为切入点和抓手,把这些跨部门的数据有机串联起来,得出更有效的计算结果,让更多数据进行更有效的“破冰”。(记者 冯维健)

[ 责编:雷渺鑫 ]