让荣耀和小米高管互掐的ToF技术究竟是什么?

时间:2019-02-22
都说“文人相轻”,近我发现同行互怼的情况,在技术行业也蛮常见。这不,荣耀和小米两边的高管前几天就打起了嘴仗。
  先是荣耀手机的副总裁熊军民发了条微博,晒了晒肌肉。
 

  没过多久,小米集团的副总裁卢伟冰就看不下去了,直接炮轰荣耀近重点推技术是噱头,骗用户瞎花钱。
  

  之所以小米这边反应激烈,我估计还是荣耀说了这么一句:
 

  巧了,近这阵子小米的宣传口径确实很“战斗”。
  

  被骂之后,荣耀这边也很快回击:
  

  双方你来我往,在微博上打起了隔空太极……
  作为一个科技科普作者,双方的交火点——ToF技术吸引了我的注意。
  两边都是的国产手机厂商,一边说ToF代表着一个大的行业方向;另一边却说它是“骗用户花钱的噱头”。
  那么,这个ToF究竟是什么呢?究竟是黑科技还是辣鸡?本期走近科学推文,幺哥和你一起寻找真相……ToF其实是深度摄像头的技术方案之一,要解释深度摄像头,那还得从iPhone说起……2018年,iPhone X让我们认识了一个叫Face ID的东西,也就是刷脸验证,在此之前,手机大多用指纹或密码来解锁。
  说起来,人脸识别技术其实早就有了!比如2015年,马云就在德国汉诺威的一个会议上当中刷过脸。
 

  (大家可能在网上都看过这张照片)
  那么问题来了,人脸识别既然早就有了,中间隔了三四年才用来作手机解锁?其中一个很大部分的原因就在于深度摄像头技术的成熟。
  我们知道,普通摄像头捕捉到的永远是一个二维图像,也就是三维世界在镜头方向的二维投影。
  这就会导致一个问题:摄像头无法感知物体真实的立体形状,也很难直接分辨一张照片的前景和背景,甚至无法辨别照片和真人。
  举个例子,摄像头看见前面有个孙越,以为是个几百公斤的大胖子,可对方一站起来,其实是个纸片人(减肥成功后的孙越)。
 

  这导致一个很严重的问题,用照片很容易骗过基于普通摄像头的人脸识别。
  之所以2018年iPhone敢用人脸解锁,正是因为用了深感摄像头技术,这项技术能让摄像头直接捕捉到三维图像信息,区分照片和真人。
  怎么做到的呢?
  幺哥了解到,目前深感摄像头技术有三个主流的技术方案。
  种方法叫3D结构光,也就是iPhone用的方案。
  考你一个问题:
  如果你的面前2米远摆着一副画家冷军的油画,真假难辨,它的右边站着一个真人,你观察的视角无法移动,可以用辅助工具,请问如何快速分辨哪个是真人,哪个是油画?
 

  冷军作品《小姜》
  如果你手头有一支能投射图案的激光笔(就是我们小时候玩的那种红色激光笔),事情就好办了。
 

  把图案打在两个物体身上,如果图案线条发生扭曲,就说明是三维物体,如果图案没发生扭曲,说明是平面图案。
  这就是3D结构光的基本原理。iPhone X的人脸识别就是基于类似原理,使用时,它会用红外线射得你一脸,然后用摄像头捕捉图案变形的规律,从而判断物体形状或脸部轮廓。
  

  (OPPO新款手机人脸识别也用的3D结构光)
  第二种方法叫双目立体成像,用两个摄像头来捕捉图像,再用软件计算还原出3D信息。
  原理有点类似人的两只眼睛,主要基于视差原理。当你盯着一个物体看,反复交替眨左右眼,你会发现看到的两个画面有略微不同。
  人的大脑可以在一瞬间比对两个画面的细微差距,脑补出“三维感”。计算机则通过“三角测距”等数学原理计算并还原出3D信息。

  这个方案不需要主动发射光,成本也比较低,但计算量很大,对处理器的硬件配置要求较高。
  正如人的眼睛其实是两个极其精密的摄像头,人的3D视觉主要依靠大脑的计算来“脑补”。
  第三种方法就是荣耀手机用的ToF方案了。
  ToF的全称是Time of Flight,翻译过来一般叫“飞行时间测距”。
  顾名思义,当摄像头拍摄一个物体时,摄像头旁的元件会biubiubiu发射一段段的激光到物体的表面。
  只要掐表计算激光脉冲“折返跑”的时间,经过计算就能知道目标物体的距离。
  它既可以发射脉冲调制信号,也可以发射连续光波信号……只要在连续波中调制出一定的规律,计算发射信号和接受信号的相位偏移就能算出距离。
  

  总之,它是基于“光波的飞行时间”来计算距离的。
  由于这三种方法的原理不同,所以在工作距离、深度、XY分辨率、抗干扰、功耗等方面各有利弊,适用场景也不同。
  小米的产品经理@王腾Thomas 在微博上已经把几种方案的对比整理好了,大家可以感受一下:
 

  可以看出,ToF方案目前适用的场景是3D建模、AR应用和体感游戏。
  具体能干什么用呢?
  说来也巧,年前的荣耀V20手机发布会在北京举办,幺哥去了现场溜了溜,翻出几张当时拍的照片讲讲。
  现场,V20手机代言人胡歌把手机放在面前大约两米的桌子上,试玩了一款滑雪体感游戏。
  (坐后面拍不太清,将就看吧……)
 

  主持人说,除了滑雪,V20还能玩譬如羽毛球、劲舞时代、飞镖之类的体感游戏,ToF深感镜头会直接捕捉到人的肢体和手势动作。
  另一个演示是让一个人站在镜头前,手机画面出现一个3D小人,她会跟随人做出各种动作,比如跳起欢快的广场舞。
  

  不过我个人觉的这两个场景稍微有点小众,像我这样不怎么运动的安静美男子平时不会经常用。
  相对来说,ToF的另一个应用——3D美体塑性,对于我这种每逢佳节胖三斤的人来说,可以说是非常适用了。
  现场演示效果非常夸张,而且不仅支持拍照瘦身,还支持视频瘦身,甚至能用在抖音上:
 

  (左边是使用后,右边是使用前)
  更厉害的是,由于ToF获得深度信息后,能把人体和背景完美区分开,实现“人瘦墙不歪”的效果。
 

  现场就演示了这三项,但据我所知,ToF技术的想象力并不止于此,毕竟它让摄像头捕捉到的信息多了一个维度。
  比如拍照时,它能辅助对焦,更好地虚化背景;可以来扫描并估算一个物体的体积,测量距离。
  5G网络普及以后,ToF的应用场景可能更多,虽然目前还没实现,但不妨跟幺哥一起开个脑洞:
  陪女朋友逛街时,不再需要反复试衣服,直接用ToF深感摄像搭配VR、AR技术来试穿衣服和鞋子,还能轻易实现个性化定制,让优衣库不再需要试衣间。
  装修或布置房间时,直接用ToF技术扫描并生成屋内物品的完整信息,在手机上查看家具摆放效果,省得挪来挪去反复比对。
  开VR时会议,ToF深感摄像头能直接扫描并创建虚拟的你,和VR会议中和另一个人互动…(不知道Pornhub会不会基于这个原理开发点儿什么)听起来或许有些胡扯,但这并非幺哥章口就莱。被称为“硅谷预言帝”的凯文凯利也曾经预言过未来世界的样子。
  他说:
  未来会出现一个镜像世界(Mirror World),物理世界的每个东西都将出现虚拟的复制品。每一条街道、每一个灯柱、每一栋建筑、每一间房间都将在镜像世界中拥有全尺寸的数字景象……虚拟世界就像是物理世界的一面镜子。
    具体他是怎么说的,有兴趣的浅友可以自行学习,emmm……总之听起来比我说的可玄乎多了。但只要世界真朝向充满VR、AR的方向发展,ToF等深度摄像技术必不可少。
  说回小米和荣耀的微博骂战。
  2月15日那天,荣耀副总裁熊军民在微博上晒出一组荣耀V20手机的宣传图,主打3D美体。
 

  随后小米副总裁卢伟冰又转发评论:
 

  结合之前他口中“是个噱头,骗用户瞎花钱”的说法,可以看出卢总可能并不是对ToF技术本身有意见(否则小米也不会做技术预研了),而是他认为ToF用来做3D美体、体感游戏等应用没啥用,是个噱头。所以他才讽刺用户“你以为自己瘦了吗?”
  这次荣耀和小米关于ToF的争执,归根结底还是在于两家公司对用户、和对技术发展方向上的理解不同。
  这种差异没办法一较高下,就像你爱上树摘苹果吃,我爱弯腰捡草莓吃,本没有高下之分,只是单纯不同罢了。
  但是这种差异一旦长期积累,却会对某项单点技术造成影响。苹果摘得多了,爬树本领自然就强。
  正如荣耀认为ToF很重要,所以大力投入研发,突破了问题,并实现量产,把它变成了V20手机上的3D美体、体感游戏等功能;小米认为ToF噱头,没用,所以自然也就停留在技术预研阶段,没有真正应用。在ToF这个单点上,荣耀确实走在前面。
  骂战的,小米这边也承认:ToF确实是个大的行业方向。但基于各种考量决定暂时不投入量产,未来会在他们认为“合适的时间”做出来。
  049ednc20190220.jpg
上一篇:数据采集和仪器:数据处理和校准
下一篇:探析射频识别应用系统的运行环境与接口方式

免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

相关技术资料