谷歌在Google Cloud Next ’17 大会上,发布了包括新客户、新合作伙伴、新产品开发等一系列消息,再度发力云服务。
在这次大会上,谷歌宣布收购著名数据科学社区 Kaggle ,引起业界震动。
但庖叔更关注的,倒是另一个重磅技术的发布:视频内容识别
庖叔还记得很多年以前,第一次看到把一张图片拖进谷歌搜索框,就能识别出图片的内容,并搜索出相似图片时的震撼。
而如今,视频居然也能被识别了?
这就是谷歌云视频识别平台,将视频上传就能进行识别。
废话不多说,来看看识别的效果。
测试的Demo是一部场景丰富的广告片
识别的过程大概是这样的
视频的镜头在不停切换,右下角的场景标签也在实时变化。
庖叔截几张大图让大家看看识别结果
此时的画面是这个场景
实时识别出来的结果显示:92%的可能是野生动物(Wildlife),91%的可能是动物(Animal),81%是动物园(Zoo),78%是旅游胜地(Tourist destination)。
除了动物园和旅游胜地不一定准确,前两个标签正确无误。
镜头切到特写,识别结果实时变化为:
后两个标签变成了:90%的可能为老虎(Tiger),68%的可能为陆生动物(Terrestrial animal)谷歌图片搜索识别,非常准确。
场景转换。
大象(Elephants)、长颈鹿(Giraffe)全都无压力识别。
虽然还是Beta版本,但感觉可用度非常高。
感兴趣的朋友可以点开视频看完整的识别过。
(建议在wifi下观看)
关于视频识别的技术原理,谷歌没有透露更多的信息。但我们可以用图片识别的原理来理解视频识别。因为视频本质上也是若干帧图像的连续播放。
当我们要识别一张图片的时候,简单来说,要分以下几个步骤:
先用算法算法对图片进行特征提取。提取前也可能会对图像进行压缩、颜色简化等预处理。
将提取的特征进行编码。
编码后与数据库进行比对,给出相似图像。也可以是给出相似度、检索词等。
说起来很简单,但每一步都涉及到很复杂的算法。海量的数据如何编排才能达到最快的检索速度。这些都是图像识别的核心技术。
等这套系统推广开来,最直接的好处就是,我们可以用视频内容的关键词来搜索视频了。
谷歌还将此技术以 API 的形式开放谷歌图片搜索识别,以后我们还能见到更多视频识别奇思妙想的运用。
———END———
限 时 特 惠:本站每日持续更新海量各大内部创业教程,一年会员只需128元,全站资源免费下载点击查看详情
站 长 微 信:jiumai99