中国信通院工物所工业高质量数据集研究成果登上《数字化转型》期刊封面
近日,工业和信息化部主管期刊《数字化转型》2026年第6期封面刊发中国信息通信研究院(以下简称中国信通院)程彤彤、尹子航、徐婷婷、刘阳的署名文章《工业制造领域高质量数据集建设路径与实践研究》。文章系统梳理全球主要经济体工业数据发展战略,深度阐释工业制造高质量数据集的核心内涵、问题与挑战,构建覆盖数据采集、治理、标注、评测、共享全环节的工业制造高质量数据集建设体系,为制造业数字化、智能化转型提供完整理论支撑与落地实践指引。
(一)搭建分层差异化全流程建设框架,破解工业数据价值挖掘难题
文章究结合全国数据标准化技术委员会发布的技术文件《高质量数据集 建设指南》与工业制造场景的特殊需求,针对通用大模型、专业小模型两类应用设计差异化建设路径,从业务需求、端云协同采集、机理约束清洗、智能分级标注,到数据增强、版本管理、动态监测、闭环质量评估形成完整链路,适配工业时序信号、设备图像、工艺文本等多模态异构数据处理,满足各类工业智能应用的数据供给需求。
(二)标准化建设与技术工具链打造协同发力,筑牢工业数据集底层支撑
工业高质量数据集落地离不开统一标准体系与全链路技术工具支撑,一方面依托高质量数据集技术文件要求、OPC UA等通用工业协议推进行业标准化,统一元数据、标注、数据互通规则;另一方面依靠数据采集、智能标注、数据合成增强、数据集管理、隐私安全等技术形成完整工具链,解决数据采集难、标注效率低、故障样本稀缺、敏感数据管控难等现实问题,推动工业数据工具开源普惠,降低中小企业自建数据集的成本门槛。
(三)构建安全可信协同生态,以场景落地驱动工业数据集长效迭代升级
工业制造领域高质量数据集建设不能仅限于技术与流程层面,还需完善数据安全防护、行业共享机制与产业应用生态。在安全层面依托数据脱敏、隐私计算、分级分类管理保障企业工艺、生产参数等商业机密;在共享层面搭建行业数据联盟、安全沙箱、区块链溯源流转体系,探索数据开源、联合建模、知识产品化多元商业化模式;在应用层面围绕缺陷质检、预测性维护、智能排产等典型制造场景构建数据集,以真实业务需求反向优化数据集采集、标注标准,全方位助力我国工业智能化转型与新型工业化建设。
中国信通院工业互联网与物联网研究所在工业制造领域高质量数据集标准制定、评测服务、开源数据服务等方面积累了丰富经验。该成果的发布,为工业制造领域高质量数据集的建设提供系统性的方法论指导和实践参考,有力支撑我国工业智能化转型与新型工业化建设。
联系人:
程彤彤,中国信通院工业互联网与物联网研究所,高级工程师,博士,研究方向:工业智能化、数据治理。
所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。
举报邮箱:1002263188@qq.com