计算机视觉：我们最需关注的前沿领域！

网友投稿2022-06-07 08:40:02

　　几个星期前，纽约举行了LDV视觉峰会。该峰会专注于计算机视觉的高潜力领域。它涵盖了从3D成像，VR深入学习到Facebook实时视频的各个领域。这个领域在各个行业都得到密切关注。

　　计算机视觉的潜力不可小视

　　LDV峰会创始人Evan Nisselson在LDV视觉峰会开场白中表示：现今，被链接在一起的相机和视觉传感器可以说是无处不在。这些无处不在的录像和实时大数据，可组合成智慧建筑。其能够根据人的运动量调节能量分配。这也将引领智能家园的到来。那时，你的镜子可以告诉你体重是否增加，你喝了多少酒。这都得益于内置的3D扫描仪和气体传感器。

　　而且，一旦这成为现实，镜中广告就可以让你买到低热量食物以及阿司匹林，并在几分钟内直接送到浴室交付给你。

　　计算机能看到人类看不见的东西

　　计算机并不只通过我们现在这个领域所知道的图像识别方式来“看”世界（计算机通过将图像分解成像素来认知世界）。计算机视觉依赖于可实时访问的大数据，地理定位，传感器，超声波，和其他类型的数据（如热成像），可以让一台电脑“看到”人类无法看到的东西：例如气体，热量等。

　　计算机视觉的应用远远超过处理大量图像这个范畴。它除了快速识别那些人已经可以看到的东西，真正的作用是处理那些人看不到的东西。基于扩充内存，可以“看”到气体泄漏。计算机视觉通过多个实时渠道将使超人的感觉变为现实。

　　目前我们还没有这种技术。正如康奈尔大学计算机视觉技术教授Serge Belongie所说的那样：“正如你现在看到的计算机视觉领域中的状态，我们无法在人们没有具象概念的情况下，告诉一个人某个东西是什么。我们真能告诉人们的是，像香蕉和自行车这种看见的东西。”但，这就是进步，将来计算机视觉能够而且将会通过照片中提取出来的信息，告诉人们更多的数据。

　　如果我们得不到足够的训练数据，我们会变得停滞不前

　　深度学习网络，低成本以及更快计算能力的计算机，使得判定图像识别能力的游戏规则已经被改变。但除非它们有机会获得大量的图像训练数据，否则这些辉煌的算法就什么也不是。就说医学影像所面临的问题：绝大多数可被用于训练数据的图片是专有的，基本被这两个庞然大物所持有：谷歌Facebook。考虑到目前用户共享和上载在这些公司消费平台上的数据量，这一趋势没有明显放缓的迹象。就像Greylock的合伙人Josh Elman接受记者采访时提醒的一样，它们会变成计算机视觉发展道路上的潜在障碍，如果两家大公司一直持有所有的训练数据的话。

　　VR和AR需要计算机视觉

　　一些人认为，现在虚拟现实（VR）和增强现实（AR）被过度炒作。而把计算机视觉带入这两项技术纯属能源浪费。不过，VR与AR这两种技术都需要长期的发展。作为进一步提升，它们都需要高品质的计算机视觉功能来完善其技术（如使用图像识别来提高VR 的“互动”形式）。

　　很多人把今天的VR技术比做90年代中期的互联网：或许它目前还不是主流可获利的技术，但在将来会被广泛应用。计算机视觉技术越是先进，它的功能将吸引更多的人们来关注VR和AR，也会使得其更加实用并变得可盈利化。

　　计算机视觉已经在人身安全方面增加了投入力度

　　除了深度学习和AI，另一项大型科技的发展趋势就是机器人。是的，大多数机器人会需要（并且绝对需要）计算机视觉。从掌管流水线检验到所做的一切，都会需要这项技术。例如，Nanotronics公司使用图像识别来寻找计算机内存晶圆的缺陷，这比使用人类更精确，更快速。

　　通过LDV视觉峰会我们可得知，现在仍然是计算机视觉发展的初期。但是，目前的创新有一个光明的未来，无论是在业务层面和更广泛的社会层面。研究还证实，令年轻工程师兴奋的是:相较以往，会有更多的机会来改变产业内一部分的游戏规则。