数字图像表示:像素、颜色空间、通道。OpenCV基础操作:滤波、边缘检测、形态学处理。图像变换、几何变换、特征点检测,构建CV应用的基础工具箱。
计算机视觉
计算机视觉
文章列表
- 21
- 22ImageNet数据集解析。数据增强策略(RandAugment、AutoAugment、MixUp、CutMix)。训练ResNet、EfficientNet、Vision Transformer,达到SOTA性能的完整pipeline。
- 23目标检测的核心挑战。R-CNN系列:R-CNN、Fast R-CNN、Faster R-CNN。单阶段检测器:YOLO系列、SSD、RetinaNet。Anchor-Free方法:CenterNet、FCOS。NMS后处理技巧。
- 24FCN、U-Net、DeepLab系列语义分割算法。Mask R-CNN实例分割。Panoptic FPN全景分割。分割评估指标(mIoU、Dice系数),以及分割在医学影像、自动驾驶中的应用。
- 25人体姿态估计原理。OpenPose、HRNet、ViTPose等算法解析。人脸关键点检测、手部关键点、全身姿态估计。自顶向下vs自底向上方法对比,以及在体育分析、交互中的应用。
- 26视频数据的时空特性。3D CNN(C3D、I3D)、Two-Stream方法、TSN、TSM。SlowFast网络、Video Transformer。动作识别在视频监控、内容审核中的应用。
- 27从GAN到Diffusion Models。StyleGAN生成高保真人脸。神经风格迁移原理与实现。CycleGAN图像翻译。Stable Diffusion、DALL-E等文生图模型解析。
- 28场景文字检测:EAST、DBNet、TextSnake。文字识别:CRNN、ASTR。端到端OCR:ABINet、ParseQ。文档版面分析、表格识别,以及OCR在票据处理、文档数字化中的应用。
- 29人脸检测(MTCNN、RetinaFace)、关键点定位、人脸对齐。人脸识别:ArcFace、CosFace、SphereFace。活体检测、人脸属性分析,以及隐私保护与合规要求。
- 303D数据表示:点云、体素、网格。PointNet++、DGCNN点云神经网络。3D目标检测、3D语义分割。在自动驾驶LiDAR处理、机器人视觉中的应用。