计算机视觉

文章列表

21
计算机视觉导论：图像基础与OpenCV实战
第 21 期 2026-07-20 · 7 分钟阅读入门
数字图像表示：像素、颜色空间、通道。OpenCV基础操作：滤波、边缘检测、形态学处理。图像变换、几何变换、特征点检测，构建CV应用的基础工具箱。
22
图像分类实战：从数据集到SOTA模型
第 22 期 2026-07-20 · 7 分钟阅读实践
ImageNet数据集解析。数据增强策略（RandAugment、AutoAugment、MixUp、CutMix）。训练ResNet、EfficientNet、Vision Transformer，达到SOTA性能的完整pipeline。
23
目标检测：从两阶段到单阶段算法
第 23 期 2026-07-20 · 7 分钟阅读进阶
目标检测的核心挑战。R-CNN系列：R-CNN、Fast R-CNN、Faster R-CNN。单阶段检测器：YOLO系列、SSD、RetinaNet。Anchor-Free方法：CenterNet、FCOS。NMS后处理技巧。
24
图像分割：语义分割与实例分割
第 24 期 2026-07-20 · 8 分钟阅读进阶
FCN、U-Net、DeepLab系列语义分割算法。Mask R-CNN实例分割。Panoptic FPN全景分割。分割评估指标（mIoU、Dice系数），以及分割在医学影像、自动驾驶中的应用。
25
关键点检测与姿态估计
第 25 期 2026-07-20 · 9 分钟阅读进阶
人体姿态估计原理。OpenPose、HRNet、ViTPose等算法解析。人脸关键点检测、手部关键点、全身姿态估计。自顶向下vs自底向上方法对比，以及在体育分析、交互中的应用。
26
视频理解与动作识别
第 26 期 2026-07-20 · 8 分钟阅读前沿
视频数据的时空特性。3D CNN（C3D、I3D）、Two-Stream方法、TSN、TSM。SlowFast网络、Video Transformer。动作识别在视频监控、内容审核中的应用。
27
图像生成与风格迁移
第 27 期 2026-07-20 · 10 分钟阅读前沿
从GAN到Diffusion Models。StyleGAN生成高保真人脸。神经风格迁移原理与实现。CycleGAN图像翻译。Stable Diffusion、DALL-E等文生图模型解析。
28
OCR文字检测与识别实战
第 28 期 2026-07-20 · 10 分钟阅读实践
场景文字检测：EAST、DBNet、TextSnake。文字识别：CRNN、ASTR。端到端OCR：ABINet、ParseQ。文档版面分析、表格识别，以及OCR在票据处理、文档数字化中的应用。
29
人脸识别完整技术栈
第 29 期 2026-07-20 · 10 分钟阅读进阶
人脸检测（MTCNN、RetinaFace）、关键点定位、人脸对齐。人脸识别：ArcFace、CosFace、SphereFace。活体检测、人脸属性分析，以及隐私保护与合规要求。
30
3D视觉与点云处理
第 30 期 2026-07-20 · 6 分钟阅读前沿
3D数据表示：点云、体素、网格。PointNet++、DGCNN点云神经网络。3D目标检测、3D语义分割。在自动驾驶LiDAR处理、机器人视觉中的应用。