微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

【语义分割】算法理论梳理:基础理论/常见网络FCN、DeepLab、LR-ASPP、UNet、U2Net

目录

语义分割

1. 常见数据集格式

2. 常见语义分割评价指标

转置卷积

1. 运算步骤(s为步长,p为padding,k为卷积核尺寸)

2. 优势以及存在的问题

膨胀卷积

1. Gridding Effect网格效应

2. 小目标分割效果差的问题

3. 膨胀卷积的一些特点

FCN

DeepLabV1

DeepLabV2

DeepLabV3

LR-ASPP

UNet

U2Net


语义分割

语义分割(semantic segmentation),对每个像素进行分类;区别于实例分割和全景分割。

1. 常见数据集格式

  • PASCAL VOC:调色板(PNG图片,P模式,palette),边缘为255,损失计算过程忽略255
  • MS COCO:针对图像中的每一个目标都记录了多边形坐标(polygons)
  • 分割结果:mask蒙版,每个像素数值对应类别索引

2. 常见语义分割评价指标

  • Pixel Accuracy(Global Acc):总共预测正确的像素个数 / 目标的总像素个数
  • mena Accuracy:每个目标的Acc,然后目标求均值
  • mean IoU每个目标的IoU再求平均(常用,如下图所示)

eg:目标A的IoU计算图示

转置卷积

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐