Skip to content
司马顿的博客
司马顿的博客

司马顿的博客

计算机视觉的发展是多技术的融合

Posted on 2018年6月22日2019年4月30日 By 司马顿

计算机视觉(CV)在人工智能(AI)领域扮演首要角色。

作为CV三大顶会之一,CVPR 2018正在如火如荼的召开。

这些年直播、短视频、自动驾驶的兴起,让CV更是大放异彩。

CV的应用方向包括图片分类、目标检测、语义分割、目标跟踪、姿态估计、3D重建等。

各方面技术的发展日新月异,优质的模型和算法与日俱增。

ResNet, Inception, Yolo, SSD, Mask-RCNN, OpenPose…

这些众所周知的优秀模型,各自在特定领域解决了问题。

我认为面向互联网的计算机视觉应用,下一代应该是各技术的融合,而不是分割。

看如下图:

这个图体现的结果,是将视频里的人体姿态,进行实时三维建模。

用到了几乎所有CV技术,包括:

  1. 目标检测与分类:首先要检测出每个人体目标
  2. 语义分割:分割出人体的像素单位,与背景区别开
  3. 姿态估计:估算出人体的姿态关键点(网状多点)
  4. 目标跟踪:跟踪人体运动轨迹,捕捉上下文信息
  5. 3D重建:将视频里的2D信息重建为3D,补充深度信息

而这样的CV产品,可以广泛应用在多个方面。

比如最近很火的秒变大长腿与瘦腰。

比如跳舞、健身的动作矫正。

比如在线试衣。

甚至全息投影也是可以的。

CV多技术的融合,可以使生活更美好、梦想更简单。

技术发展的代表案例,可以参考DensePose。

Print this entry

博客 AI行业观点

文章导航

Previous post
Next post

Archives

  • 2022 年 9 月 (2)
  • 2022 年 8 月 (2)
  • 2022 年 7 月 (2)
  • 2022 年 6 月 (1)
  • 2022 年 5 月 (4)
  • 2022 年 4 月 (18)
  • 2022 年 3 月 (13)
  • 2022 年 2 月 (6)
  • 2022 年 1 月 (8)
  • 2021 年 12 月 (14)
  • 2021 年 11 月 (7)
  • 2021 年 10 月 (19)
  • 2021 年 9 月 (25)
  • 2021 年 8 月 (45)
  • 2021 年 7 月 (33)
  • 2021 年 6 月 (10)
  • 2021 年 3 月 (2)
  • 2021 年 2 月 (8)
  • 2021 年 1 月 (8)
  • 2020 年 12 月 (20)
  • 2020 年 11 月 (11)
  • 2020 年 10 月 (14)
  • 2020 年 9 月 (33)
  • 2020 年 8 月 (17)
  • 2020 年 7 月 (21)
  • 2020 年 6 月 (20)
  • 2020 年 5 月 (10)
  • 2020 年 4 月 (17)
  • 2020 年 3 月 (18)
  • 2020 年 2 月 (11)
  • 2020 年 1 月 (7)
  • 2019 年 12 月 (13)
  • 2019 年 11 月 (14)
  • 2019 年 10 月 (8)
  • 2019 年 9 月 (9)
  • 2019 年 8 月 (13)
  • 2019 年 7 月 (12)
  • 2019 年 6 月 (20)
  • 2019 年 5 月 (18)
  • 2019 年 4 月 (18)
  • 2019 年 3 月 (11)
  • 2019 年 2 月 (12)
  • 2019 年 1 月 (15)
  • 2018 年 12 月 (15)
  • 2018 年 11 月 (13)
  • 2018 年 10 月 (13)
  • 2018 年 9 月 (21)
  • 2018 年 8 月 (29)
  • 2018 年 7 月 (23)
  • 2018 年 6 月 (21)
  • 2018 年 5 月 (5)

标签

AI (24) Apache Drill (11) 加拿大 (21) 宇宙与人生 (19) 情感 (281) 技术 (75) 抑郁症 (68) 新冠病毒 (13) 汽车 (30) 生活 (333) 职场 (25) 行业观点 (60) 读书文艺 (48)
©2025 司马顿的博客 | WordPress Theme by SuperbThemes