十万年前地球上至少有六种不同的人,但今日,世界舞台为什么只剩下了我们自己?在人类不断进化过程中,是什么起到了关键作用?《人类简史》作者尤瓦尔·赫拉利开宗明义地给出了答案:认知革命。
语言、文字的创造,让智人学会协同作战,狩猎效率和生产分工加速人类发展,自从认知革命之后,智人就能依据不断变化的需求迅速调整行为,这等于开启了一条采用“文化演化”的快速道路,而不再停留在“基因演化”这条总是堵车的道路上。
随着时间的推移,认知革命作为农业革命、科学革命的基石伴随着其它更高阶技术形态的进步而不断演变,这其中最为显性的认知进化,当首推机器视觉技术的发展。
用双眼观察世界是人类与生俱来的能力,也是人类最为核心的生物功能之一。但是如前文所说,生物基因进化这条路常常堵车,现代人类的视力不但相比十万年前的智人可能尚有不及,而且生物功能受到生命周期的影响,近视、弱视、散光、色盲、失明等病痛严重局限了现代人类探索和观察世界的能力。
如果无法看得更远,人类如何知道浩瀚苍穹之大?如果看不清分子原子的细微形态,如何描绘生命基因密码?善于利用工具的人类发明出了机器视觉弥补了人类视觉的天然短板,近年来,随着人工智能技术的飞速发展,机器视觉正在从模仿人类视觉到超越人类视觉的道路上不断演进。
纵观人类认知历程中的前三次视觉革命
与人类相对缓慢的进化不同的是,机器视觉的演进之路是迅速而具有颠覆意义的,机器看世界的方式也在经历着革命性突破。首先是色彩维度,正如婴儿的“视界”早期只有黑白两色,早期的摄影受感光材料以及后期技术的局限只能记录单调的黑白世界。直到19世纪末,随着光学研究的突破,摄影师采用不同颜色滤镜拍摄并经过后期合成彩色照片,使得机器的视觉能力向前迈出第一步。
随后,机器视觉迎来了从模拟到数字的第二次革命,依然以大家常见的摄影摄像为例子,早期摄影是利用胶片感光来模拟成像,伴随着数字技术的成熟,数码相机拍照手机逐渐取代模拟记录影像的方式,机器观察记录世界的方式变得更加高效便捷。
第三次视觉革命来自于电荷耦合元件在摄影摄像产品中的应用,将光信号转换成电荷信号能够获得更高解析度画面,像素数从初期的10多万增加到千万像素像素总量的大幅度提升,使画面细节能够得到更细腻的展现,机器视觉从普清走向高清时代。
3D视觉引爆第四次视觉革命
近年来,伴随着3D传感行业的迅猛发展,机器视觉迎来轰轰烈烈的第四次视觉革命,视觉升维迎来历史性的技术爆发,让其他三次视觉革命都略显黯然失色,第四次视觉革命最大的特点体现在机器直接从之前的2D平面“视界”进化到3D立体“视界”,刷脸支付、Face ID、VR、无人便利店、智能机器人等人工智能产品从实验室走向普罗大众身边,频频以“未来产品”姿态曝光,其背后起到关键作用的黑科技便是3D视觉技术,已经成为人工智能界的新宠。
人类利用科技提升机器的视觉能力,模拟人的双眼,这听起来似乎没什么了不起。但是在商业应用中,3D视觉的影响力不亚于在亚马逊森林搅动风暴的蝴蝶,以目前火爆市场的支付宝刷脸支付为例,拿目前出货量最多的3D视觉代表性企业奥比中光来说,搭载了其3D结构光的刷脸支付产品,能够通过点阵投影仪把数万个光点投射到用户的面部,通过3D摄像头找到对应光点,再利用三角测量原理计算出光点的深度信息,从而达到3D面部识别的效果并完成支付。相比过去2D视觉的人脸识别,3D视觉能轻易识破平面照片或者视频等欺骗,让支付的安全性和便捷性得到革命性升级。同时在机器视觉技术的帮助下,刷脸支付能够带来更好的体验,大大降低安全隐患。
生物的演化都是依偱着自然选择的法则,这也恰如其分地概括了人类智慧逐渐取代自然演化生物法则的革命道路。3D视觉技术引爆的第四次视觉革命为人工智能终端赋予了一双智慧之眼,随着硬件技术不断进步,算法与软件持续优化,机器除了能看清立体世界,更能看“懂”世界。在这场轰轰烈烈的视觉革命中,低成本、高性能的3D传感技术将作为未来智能硬件的核心,支撑AIOT智能硬件的快速发展,助推万物互联时代开启。
|