AI的“老师”进化了

当你在高速路上开启自动驾驶模式,车辆为何能精准判断变道超车时机?
这是因为它“看懂”了车道线,或者更准确地说,是学习了车道线的专业数据集,读懂了车道线实际含义。
这背后,数据标注——这位AI的“老师”功不可没。数据标注,就是给文本、语音、图片、视频等各种各样的数据“打标签”。标注后的数据可以被AI或机器学习理解。
近期,国家数据局陆续发布了涉数据标注相关的典型案例,小众的数据标注产业也逐渐走入公众视野。数据标注如何支撑智能时代?它的未来又将驶向何方?
产业朝着智能迈进
2016年,秦子雄大学毕业,第一份工作便是数据标注的质量检验。如今,他已成为海天瑞声的高级项目经理,负责自动驾驶图像类数据标注。海天瑞声是AI数据行业首家也是唯一一家主板上市公司。
项目正式启动前,秦子雄都要上手标注数据。以标注车道线数据为例,他向记者演示了一帧(张)车道线数据标注的全过程:在这帧图片中,他需要找到车道线,人工画线标注出来。这些标注后的车道线数据经整理后形成数据集,成为AI学习现实路况的“教材”。
在他看来,数据标注在业内已经火了很久,只是现在才逐渐被公众了解。
《2025高质量数据集发展研究报告》显示,我国数据标注相关产业产值超83亿元。数据标注产业的繁荣与人工智能热潮紧密相连。“高质量的标注数据是AI模型的‘教材’,直接影响着AI的准确性和可靠性。”海天瑞声董事会秘书张哲接受本刊记者采访时说。
如果用一个词总结数据标注产业发展趋势,那便是智能。这一趋势的背后,既有AI发展对海量优质数据的需求,也有传统人工标注模式效率低下、成本高昂的考量。
秦子雄日常工作所用的多模态数据智能标注与管理平台,正是数据标注产业迈向智能的体现。

登录后获取阅读权限
去登录
本文刊登于《中国经济周刊》2025年12期
龙源期刊网正版版权
更多文章来自

订阅