“百模大战”中,工业大模型如何闯出“新天地”?

观众在2024世界智能产业博览会中国电信展区参观。记者 赵子硕 摄

观众在2024世界智能产业博览会上的天士力展区了解数智本草大模型。记者 李然 摄

提问“外感风寒推荐哪些方剂”,系统在几秒钟内就能列出麻黄汤、桂枝汤等方剂与具体成分;提问“身体湿气重有哪些危害”,系统也能快速给出全面解答、提出饮食调理等治疗方法……走进天津天开高教科创园5号楼,天大智图(天津)科技有限公司的工作人员正忙碌地对“海河·岐伯”中医药大模型展开内测。公司研发总监徐大为说,在人工智能辅助下,大模型能为临床医生提供内容更广泛、更全面的辅助诊疗建议,进一步提高中医诊疗效率。

提出问题,迅速获得专业回答;输入需求,在线进行服装设计;提供图纸,自动完成冰箱组装……近期在天津举办的2024世界智能产业博览会上,一批聚焦工业、制造业应用的垂直领域大模型成为与会人士关注的焦点。

推动大模型更加深入赋能工业制造业,是人工智能行业发展的重要方向。但由于供需不匹配、数据难获得、算力水平低等问题,工业大模型当前的发展速度和规模仍受制约。面对人工智能“百模大战”风起云涌的现实环境,工业大模型如何聚焦细分领域、加速创新破局?

工业大模型发展如火如荼

随着新一代人工智能技术的发展,基于大模型的生成式人工智能以学习能力强、处理速度快、服务个性化等优势,成为智能科技领域的“宠儿”,尤为吸睛。

作为海尔卡奥斯工业互联网平台在人工智能领域的前沿科技成果,卡奥斯工业大模型COSMO-GPT亮相2024世界智能产业博览会。在产品发布环节,卡奥斯工业智能研究院执行院长秦承刚分享了卡奥斯工业大模型在助力工业企业优化工艺、流程、成本、效率等方面的功能。

“通过对开源大模型进行微调训练,卡奥斯工业大模型COSMO-GPT注入了562个工业数据集,拥有300多万条高质量工业数据、3900多个机理模型和200多个专家模型,推理准确率达到了96%以上,意图识别准确率达到了85%以上。”秦承刚说。

羚羊工业大模型也吸引了许多观众驻足体验,他们纷纷就“地效翼船的工作原理是什么”“生产制造焊条要依据哪些标准”等话题进行提问,大模型都能第一时间回复。在大模型的工业视觉质检助手中,上传一张图片,输入“识别没有戴安全帽的人”,系统很快就能准确进行判断。

羚羊工业互联网股份有限公司总裁徐甲甲说,羚羊工业大模型是以讯飞星火认知大模型的通用能力为核心技术底座,结合工业场景实际需求打造的大模型,具有工业文本生成、工业知识问答、工业理解计算、工业代码生成、工业多模态等核心能力,可以从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。

“过去一年,大模型的长足进步使得信息分发获取、内容生产、全自然交互都显现出极大不同,逐步改变着科研范式、产业形态与市场竞争格局。”科大讯飞股份有限公司董事长刘庆峰表示,随着“底座”能力的提升,不少技术进展将能与大模型“通”“专”结合,赋能行业发展。

不同于通用大语言模型,研发工业领域垂类大模型需要大量生产工艺、质量检测等核心数据。菲特(天津)检测技术有限公司创始人曹彬回忆,最初,企业虽依靠长期实践积累了大量工业数据,但并没想到这竟会成为公司发展的一笔宝贵财富。

“现在,这些数据成了我们技术创新的‘核心秘籍’。”曹彬说,依托数据优势与核心算法平台,企业研发的工业垂类大模型就像生产线上的专家“智囊团”与实时“诊疗师”,针对生产瓶颈与设备故障迅速“对症下药”、答疑解难,并提出优化生产调度和调整工艺参数的建议,推动产品提质升级、帮助企业降本增效。去年,该公司实现营业收入2.33亿元,收入连续三年快速增长。

工业和信息化部赛迪研究院发布的数据显示,2023年,中国生成式人工智能的企业采用率已达15%,市场规模约为14.4万亿元。专家预测,2035年生成式人工智能有望为全球贡献近90万亿元的经济价值,其中中国将突破30万亿元。

“未来,通过发挥数据要素的‘融合剂’和‘催化剂’作用,现有业态和数字业态将得以进一步跨界融合,衍生叠加出新环节、新链条、新活动形态,推动产业升级。”天津理工大学计算机科学与工程学院教授王劲松说。

多重短板制约规模化应用

业内人士表示,以基础大模型为技术底座、以工业应用为切入点推动AI行业发展已成为业内共识,但目前供需不匹配、数据难获得、算力水平低等问题仍在制约大模型进一步发挥赋能效用。

——不够“聪明”,部分产品仅能“打酱油”。多位受访人士表示,大模型在制造业领域应用潜力巨大,但目前不少大模型仍难以匹配适应企业生产的实际需要。佛山市顺德区捷通数码科技有限公司总经理廖伟权表示,企业的智能监控终端产品需要进行视觉训练,若有大模型帮助,可大幅提高效率,但目前市面上可用的大模型产品有限。

部分政务大模型声称具有工业相关内容,但其专业化水平相对较低。360集团创始人周鸿祎说,一些大模型在企业和政府内部应用时,使用者会发现其不仅缺乏行业深度,对业务也并不熟悉。“这些大模型一般是基于互联网上的公开数据训练而成的,往往难以满足实际需求。”

——“各自为战”,数据要素流动难。大规模数据是大模型能力的基础保障,但目前数据体系建设仍存在多项短板。国家智能网联汽车创新中心首席科学家李克强表示,受限于工业场景碎片化、工业领域训练数据采集整理困难等问题,单一企业开发的大模型往往存在数据量不足、完备性不够等问题,导致大模型与行业融合应用难。王劲松认为,尽管我国拥有海量的数据资源,但是数据“孤岛”和数据“烟囱”问题依然严峻,迫切需要找到突破口、打破数据壁垒。

同时,数据隐私与版权等问题也在一定程度上制约了数据的流动。“现在的知识已经被大模型解构甚至‘像素化’了,很难直观地看出大模型产生的内容参考引用了哪些知识、信息或艺术风格。”清华大学新闻与传播学院教授沈阳表示,随着AI对人类的理解越来越全面深入,其对人类隐私的侵犯也会越来越直接和严峻,在数据交易过程中数据版权的保护也会更加困难,这使得数据确权问题成为一项挑战。

——算力“卡壳”,公共云占比较低。大模型发展背后必须有庞大的算力基础作为支撑。专家表示,公共云是破解我国“人工智能+”时代算力“供不上、用不起”的重要抓手,能以资源利用效率最大化的方式,让更多的用户享受普适普惠的算力服务,但目前公共云发展仍存在不少短板。国家信息中心发布的《“人工智能+”时代公共云发展模式与路径研究》显示,2018年至2022年,我国在用数据中心机架总规模年均增速超过30%,但2022年上架率仅58%,低于全球平均水平。

国家信息中心信息化和产业发展部主任单志广认为,目前我国算力利用率仍不高,公共云占比较低尤其制约了大模型规模化应用。

加速破局尚需多方合力

专家认为,随着人工智能技术和应用领域持续拓展,政府、企业等各方仍需积极参与,推出更多满足各行业需要的垂直大模型,推动产业转型升级和高质量发展。

首先,加快推进数据要素市场建设。2023年底,国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,旨在推动建设人工智能高质量数据集,并鼓励社会公益机构、大模型企业、新型数商积极参与,为大模型加速发展奠定了制度基础。王劲松认为,应加快构建重要领域数据资源基础库,加速完善面向现代化产业体系建设的数据开发开放和流通使用制度体系和服务生态。在保证安全的前提下,加速建设数据要素市场,加强数据供给激励,给予数据采集、加工、流通、应用等不同环节相关主体一定的试错空间,鼓励面向数据要素价值实现的科技创新和产业创新,着力推动数据高质量供给与数据创新性应用的双向赋能和快速迭代,为发展新质生产力拓展要素配置空间。

其次,依托开发者团队为产业赋能。刘庆峰认为,打造一支覆盖各行业的开发者团队,是实现大模型为产业赋能的重要保障。据介绍,2023年5月6日“讯飞星火”正式发布以来,已新增超过273万开发者,其中大模型直接相关的开发者数量超过52万,企业级用户超过32万。秦承刚也表示,打造人工智能开放创新平台至关重要,只有通过一系列应用场景的大规模实践,根据用户需求反复验证和优化,才能形成符合工业转型和高质量发展需要的智能体,从而进一步复制推广。

再次,专注单一领域,把大模型做小。“最近联想、苹果、微软、三星都在把模型做小,要让模型上电脑、上手机、上汽车。块头越做越小,能力越变越强。”周鸿祎说,目前,不宜再追求一个大模型解决所有的问题,而需强调术业有专攻,让一个大模型解决一个专业问题,再由多个专业大模型组合起来一起为政府和企业工作。“只要思路转变了,过去限制大模型走进政府和企业的很多问题都会迎刃而解。”

联想集团董事长兼CEO杨元庆也认为,将小参数的大模型部署在政府和企业内部,可以保证数据安全。他表示,公共智能与私域智能共存、互补构成的“混合式人工智能”,将成为大势所趋。最佳路径是打造人工智能个人终端设备,拥有强大的本地异构算力,还能够建立个人知识库,连接开放的人工智能应用生态,从而带来新的巨大增长机遇。(记者 王宁 刘惟真)