本书使用浅显易懂的语言,系统介绍了数据标注的概念、分类,重点是通过各个项目来阐述文本数据、图像数据、语音数据等几类数据标注的工具、步骤、规范和质检。通过理论与项目实战相结合,帮助读者由浅入深地学习和实践,从而真正掌握数据标注的理论、技术和实施。本书既可以作为大数据人才培训的基础教材,也适用于初学者的入门教材,以及为大数据初级、中级标注员岗位提供理论知识和技能的行业培训教材。
求秋音,浙江大学信息电子技术专业,教务处主任,高级讲师,计算机网络管理高级技师,全国优秀指导教师,浙江省技工计算机学科带头人,绍兴市计算机学科带头人,绍兴市计算机组大组长,绍兴市跨界融合创新团队,绍兴市教育信息化专家。参加上海第二工业大学的全国中职骨干教师网络管理员培训,赴德国参加"德国职业教育研修班”,赴加拿大参加绍兴市高层次人才学习。
项目1 数据版面分析 1
任务1 认识数据标注 1
1.1.1 什么是数据标注 1
1.1.2 数据标注与人工智能的关系 2
1.1.3 数据标注分类和平台 2
1.1.4 数据标注流程 2
1.1.5 学生自我学习单 5
1.1.6 学习评价表 6
任务2 安装与使用标注软件 Labelme 7
1.2.1 搭建Labelme工具的安装环境 7
1.2.2 Labelme工具的安装 7
1.2.3 Labelme 工具的使用方法 8
1.2.4 学生自我学习单 12
1.2.5 学习评价表 13
任务3 学习版面分析标注规范 14
1.3.1 版面分析 14
1.3.2 标注规范 14
1.3.3 画框规范 15
1.3.4 注意事项 19
1.3.5 学生自我学习单 25
1.3.6 学习评价表 26
任务4 学习版面分析基础属性规范 27
1.4.1 标注规范 27
1.4.2 画框规范 27
1.4.3 学生自我学习单 29
1.4.4 学习评价表 31
任务5 学习版面分析易错点 32
1.5.1 基础属性 32
1.5.2 关键要素 32
1.5.3 学生自我学习单 35
1.5.4 学习评价表 36
作业与练习 37
项目2 手写文本数据标注 39
任务1 了解文本标注应用领域 39
2.1.1 认识文本标注 39
2.1.2 客服行业 40
2.1.3 金融行业 40
2.1.4 医疗行业 41
2.1.5 学生自我学习单 42
2.1.6 学习评价表 43
任务2 学习手写文本数据标注规范 44
2.2.1 标注要素 44
2.2.2 文本转写操作步骤 45
2.2.3 文本转写操作要求 45
2.2.4 标注规范说明 46
2.2.5 学生自我学习单 50
2.2.6 学习评价表 51
任务3 学习画框规范 52
2.3.1 基本原则 52
2.3.2 画框方式 52
2.3.3 框的属性列表 53
2.3.4 学生自我学习单 54
2.3.5 学习评价表 55
任务4 学习文本行画框要求和案例 56
2.4.1 紧致画框 56
2.4.2 分开画框 56
2.4.3 涂抹处理 56
2.4.4 非文字处理 58
2.4.5 插入文字 59
2.4.6 纵向文字排版 59
2.4.7 箭头符号的处理 59
2.4.8 涂鸦的处理 61
2.4.9 流程图的处理 62
2.4.10 坐标图的处理 62
2.4.11 表格的处理 62
2.4.12 公式的处理 63
2.4.13 学生自我学习单 64
2.4.14 学习评价表 65
作业与练习 66
项目3 图像数据标注 68
任务1 认识图像数据标注 68
3.1.1 什么是图像标注 68
3.1.2 图像标注应用领域 69
3.1.3 车牌号框图标注规范 70
3.1.4 人脸框图标注规范 71
3.1.5 医疗影像标注 71
3.1.6 学生自我学习单 73
3.1.7 学习评价表 74
任务2 了解图像数据标注工具 75
3.2.1 抠图圣手平台登录 75
3.2.2 抠图圣手标注流程 77
3.2.3 抠图圣手操作说明 80
3.2.4 图像标注规则 80
3.2.5 学生自我学习单 81
3.2.6 学习评价表 82
任务3 标注马路栏杆 83
3.3.1 道路两侧及对向车道中间栏杆的标注 83
3.3.2 栏杆中广告牌或广告横幅的标注 83
3.3.3 栏杆上有植物的标注 84
3.3.4 不同区域栏杆的标注 84
3.3.5 高架桥上的栏杆标注 85
3.3.6 学生自我学习单 87
3.3.7 学习评价表 88
任务4 标注路边的墙类建筑 89
3.4.1 围墙上的栏杆标注 89
3.4.2 施工工地围挡和广告立体墙标注 90
3.4.3 高架桥标注 90
3.4.4 被遮挡的墙标注 91
3.4.5 墙上或墙下有植物标注 92
3.4.6 学生自我学习单 94
3.4.7 学习评价表 95
任务5 标注路边杆状物 96
3.5.1 路边杆状物的标注要求 96
3.5.2 颜色一致杆子的标注 97
3.5.3 被物体截断杆子的标注 98
3.5.4 重叠杆子的标注 100
3.5.5 有底座交通杆子的标注 101
3.5.6 特殊红绿灯杆子标注 102
3.5.7 树干标注 103
3.5.8 学生自我学习单 105
3.5.9 学习评价表 106
任务6 学习地面印刷物标注规范 107
3.6.1 车道线?实线和车道线?虚线的标注 107
3.6.2 停止线标注 108
3.6.3 待转区的标注 111
3.6.4 禁停区的标注 112
3.6.5 减速带的标注 113
3.6.6 道路箭头的标注 113
3.6.7 停车让行线的标注 114
3.6.8 减速让行线的标注 114
3.6.9 振荡标线的标注 115
3.6.10 学生自我学习单 116
3.6.11 学习评价表 117
任务7 学习道路可通行区域标注规范 118
3.7.1 连续道路可通行区域标注 118
3.7.2 栏杆下面的通行道路标注 118
3.7.3 不连续的道路通行区域标注 119
3.7.4 确定的通行区域标注 120
3.7.5 自行车道标注 121
3.7.6 停车位的标注 121
3.7.7 其他 123
3.7.8 学生自我学习单 125
3.7.9 学习评价表 126
作业与练习 127
项目4 拍搜标注案例 128
任务1 学习数据集标注标准 128
4.1.1 拍搜标注数据需求 128
4.1.2 检测标注框类别 129
4.1.3 检测标注方式 130
4.1.4 学生自我学习单 131
4.1.5 学习评价表 132
任务2 标注检测框 133
4.2.1 题框 133
4.2.2 文本行框 135
4.2.3 答案框 136
4.2.4 图框 137
4.2.5 表框 137
4.2.6 题号框 137
4.2.7 学生自我学习单 139
4.2.8 学习评价表 140
任务3 学习拍搜标注 141
4.3.1 图中文本行 141
4.3.2 单个题目的多个图 141
4.3.3 表中有图 142
4.3.4 单个题目和周边文字 143
4.3.5 应用题的答案行 143
4.3.6 题目的解析部分 143
4.3.7 学生自我学习单 145
4.3.8 学习评价表 146
任务4 标注转写物理化学图文 147
4.4.1 整体流程 147
4.4.2 画框规范 147
4.4.3 属性规范 149
4.4.4 转写规范 152
4.4.5 学生自我学习单 154
4.4.6 学习评价表 155
作业与练习 156
项目5 语音数据标注 157
任务1 认识语音数据标注 157
5.1.1 什么是语音标注 157
5.1.2 语音数据标注工具 157
5.1.3 语音标注分析六大元素 159
5.1.4 学生自我学习单 161
5.1.5 学习评价表 162
任务2 了解语音标注Praat工具 163
5.2.1 Praat 工具的介绍 163
5.2.2 Praat 工具的使用 163
5.2.3 Praat 工具标注常用操作指令 164
5.2.4 学生自我学习单 165
5.2.5 学习评价表 166
任务3 客服语音转写 167
5.3.1 用Praat工具打开语音文件 167
5.3.2 开始标注语音文件 167
5.3.3 工具自查 checktool 173
5.3.4 学生自我学习单 174
5.3.5 学习评价表 175
任务4 学习录音数据标注规范 176
5.4.1 语音文件分类 176
5.4.2 语音标注层级 176
5.4.3 标注规范细则 177
5.4.4 质检验收标准 181
5.4.5 学生自我学习单 182
5.4.6 学习评价表 183
作业与练习 184