2007 年国内视频搜索引擎分析报告
一,背景
互联网正在经历着飞速发展的时代,在过去短短的几年里互联网从以telnet,email为代表的粗陋文本时代,一跃发展为丰富的宽带多媒体时代。互联网基础设施的快速改善,使我们今天不仅可以通过互联网欣赏到丰富多彩的图文内容,还可以进行视频通讯和网络游戏。
网络视频做为一个行业进入人们的视野是从美国Youtube的奇迹开始的,随之便一发而不可收,仅 2006 年以来,中国互联网行业如雨后春笋一样涌出 300 多家网络视频企业,相当于平均每周诞生 2 家,网络上的视频数量也已成爆炸式增长。
在线搜索服务超越电子邮件,已成为今天网民最常用的互联网应用。视频搜索定将成为搜索引擎服务业新的竞争点。
二,分析对象
国内的视频搜索引擎服务商几乎都是近 1 年内出现的,大体可分为门户类和专业类两种。
而多数搜索引擎技术却大同小异,这些视频搜索引擎是否能够满足视频用户日趋增加的需求?现在已经完善到什么程度?未来会向哪些方向发展?让我们共同体验有可能成为引领此番网络视频革命的先驱们。
谷歌(http://video.google.cn/)
9 月21 日正式对外发布。有热门、幽默、娱乐、体育、音乐和动画六大栏目。并对当天 100 大视频进行排行。
百度(http://video.baidu.com/)
汇集了几十个在线视频分享网站的视频索引资源而建立。
Leexoo(http://www.Leexoo.com/)
雷搜视频搜索引擎今年 8 月初推出测试版,是目前世界上唯一一款基于视觉特征分析技术的视频搜索引擎。该引擎在搜索结果中以多个图片方式提供了视频摘要,使用户可以更加直观地选择要观看的视频。该款视频搜索引擎除了提供文字搜索视频的服务外,还第一次推出了图片搜索视频和视频搜索视频的服务。该搜索引擎同时提供在线视频、手机视频、P2P视频搜索等不同类型视频的搜索服务。
Openv(http://www.Openv.com/)
于 2006 年3月推出,采用英国Autonomy公司的视频搜索技术,目前有包括央视、滕讯搜搜、新华网在内的多家合作搜索站点,号称电视视频搜索全球第一。
Pcpie(http://www.Pcpie.com/)
于 2006 年底推出,号称有国内最大的视频数据量。
搜狗(http://v.sogou.com/)
搜狐网旗下的视频搜索引擎,支持Flash视频搜索和在线观看。
爱问(http://v.iask.sina.com.cn/)
新浪网旗下的视频搜索引擎,支持Flash视频搜索和在线观看,以站内视频搜索为主。
雅虎(http://video.cn.yahoo.com/)
搜索结果均来自于同一个视频网站,所以不计入分析队列。
搜搜(http://video.soso.com/)
搜索技术和搜索结果均套用Openv的数据,所以不计入分析队列。
三,分析
为了更好的对以上具有代表性的视频搜索引擎有个更深入的了解,现以一些网民和行业共同关注的数据对其进行评测,举例说明。
1,搜索结果数量:
方法:通过在几个网站输入“美女”、“搞笑”、“nba”等常用视频搜索关键字,统计其返回的实际有效搜索结果数(通过一直向下翻页,去掉重复结果)。结果数愈多,代表搜索结果越丰富。
谷歌:标注结果与可显示结果数不符,平均搜索结果量约 1000。
百度:标注结果与可显示结果数不符,平均搜索结果量约 2000。
Leexoo:平均搜索结果量约 40000。
Openv:标注结果与可显示结果数不符,平均搜索结果量约 1100。
Pcpie:标注结果与可显示结果数不符,平均搜索结果量约 3500。
搜狗:标注结果与可显示结果数不符,平均搜索结果量约 2000。
爱问:标注结果与可显示结果数不符,平均搜索结果量约 1000。
小结:Leexoo的数据相比而言更真实。虽然网民对于搜索结果很少翻到 10 页以后,但是这绝不说明搜索引擎可以肆无忌惮的狂编出几百万的虚构数据,再者,对于内容表现更为丰富且更加强调娱乐性的视频而言,用户对传统文本搜索结果很少翻到 10页以后的这一行为习惯也正在改变。总之,对搜索引擎服务商而言,也许你们索引库有很多内容,但是你们还是应该按照用户能看得到的内容数目告诉用户。
2,搜索内容丰富:
方法:通过在几个网站输入“输入法”、“螺丝”、“autocad”等非常用视频搜索关键字,统计其返回的实际有效搜索结果数。结果数愈多,代表搜索结果越丰富。
谷歌:标注结果与可显示结果数不符,平均搜索结果量约 300。
百度:标注结果与可显示结果数不符,平均搜索结果量约 800。
Leexoo:平均搜索结果量约 20。
Openv:平均搜索结果量约 30。
Pcpie:标注结果与可显示结果数不符,平均搜索结果量约 30。
搜狗:标注结果与可显示结果数不符,平均搜索结果量约 400。
爱问:标注结果与可显示结果数不符,平均搜索结果量约 200。
小结:这个结果可见传统大公司的实力和积累。百度不愧是中文第一搜索引擎。Pcpie,Openv,Leexoo的规模还是比较小。
3,搜索结果信息丰富程度和用户体验
支持的用“Y”表示,不支持的用“N”表示
比较项目 谷歌 百度 Leexoo Openv Pcpie 搜狗 爱问
视频代表图片 Y Y Y N Y Y Y
Title Y Y Y Y Y Y Y
描述信息 N N Y Y N N N
格式 N N Y N N N N
大小 N N Y N N N N
时长 Y N Y N N N Y
视频上网时间 N N Y N N N Y
视频观看次数 N N Y N N N N
视频预览 N N Y Y Y N N
视频摘要帧 Y N Y N N N N
小结:
1、 从这张表,可以看出来各个视频搜索的技术特点,传统文本搜索引擎服务商,对视频的搜索结果,仍是以文本表现方式为主,几乎都不提供更能体现视频内容特点的视频预览和视频摘要,反而是 Leexoo 这种新兴的以视频处理技术见长的小公司,更能在搜索结果中体现视频本身的特点。
2、 这张表,反映出不同视频搜索引擎服务商对于用户在视频搜索方面的体验的把握程度。网络视频以用户上传为主,其文本描述信息极为简单甚至没有,或者干脆“文不对题”。而传统文本搜索引擎服务商,仍是以擅长的文字表现为主,但由于搜索结果中不能体现视频内容特征,主导用户点击行为的仍然是排序。而 Leexoo 这种新兴的视频搜索服务商,由于其结果中对于每一个视频结果均给出了 7帧摘要帧图片,以及一段视频的预览,用户可以不必通过文本,直接通过图片以及视频预览片断可以更直观地选择视频。显然,这种方式对视频搜索用户而言更加友好,更加直观,颠覆了传统文本搜索所建立的按照排序来点击搜索结果的用户行为习惯。
3、 百度等搜索引擎甚至连视频的文本描述信息都没有给出来。
4、 传统文本搜索引擎服务商在视频搜索的技术和用户体验方面,落后于新兴的服务商。业内传言,百度甚至没有自己的视频搜索蜘蛛,只是每天向各个视频网站索要其视频索引信息来提供搜索服务,从结果来看,有一定的依据。
4,搜索准确性和有效性: 通过输入不同关键词的搜索结果进行分析。
谷歌:根据视频内容的文本信息(标题、说明、标签等)进行分类显示。显示最相关的结果,而省略了部分与已显示的结果相似的条目。
百度:根据视频内容的文本信息进行分类显示。
Leexoo:通过对视频内容的视觉特征和文本信息分析而显示出相应的结果。准确率颇高。
Openv:通过 Autonamy 的技术在电视类视频的搜索上有很高准确率。 Pcpie:通过测试,准确率不是很高,远没有达到号称按帧搜索的精度。
搜狗:根据视频内容的文本信息进行分类显示。
爱问:根据视频内容的文本信息进行分类显示。
小结:Leexoo 的视频特征分析技术在视频搜索上占有了绝对的优势。Openv 则依靠 Autonamy的语音识别技术在电视类视频上取得了领先。其他的搜索引擎则只能依靠对标签等文字信息的分析进行检索。Pcpie 号称“帧搜索”而实际精准度却很难说服大众。
5,可搜索的视频分类。
支持的用“Y”表示,不支持的用“N”表示
比较项目 谷歌 百度 Leexoo Openv Pcpie 搜狗 爱问
在线视频 Y Y Y Y Y Y Y
手机视频 N N Y N Y N N
P2P视频 N N Y N N N N
小结:视频搜索引擎应该是广义的对互联网上所有的视频文件进行搜索的引擎。而不是窄意的只对以 flash 视频为代表的在线视频的搜索。Leexoo 对互联网上三大类视频都做了索引。
Pcpie 只对手机视频和在线视频加以区分,其他搜索引擎依然最基本的搜索格式。
4,搜索准确性和有效性:通过输入不同关键词的搜索结果进行分析。
谷歌:根据视频内容的文本信息(标题、说明、标签等)进行分类显示。显示最相关的结果而省略了部分与已显示的结果相似的条目。
百度:根据视频内容的文本信息进行分类显示。
Leexoo:通过对视频内容的视觉特征和文本信息分析而显示出相应的结果。准确率颇高。
Openv:通过 Autonamy 的技术在电视类视频的搜索上有很高准确率。
Pcpie:通过测试,准确率不是很高,远没有达到号称按帧搜索的精度。
搜狗:根据视频内容的文本信息进行分类显示。
爱问:根据视频内容的文本信息进行分类显示。
小结:Leexoo 的视频特征分析技术在视频搜索上占有了绝对的优势。Openv 则依靠 Autonmy的语音识别技术在电视类视频上取得了领先。其他的搜索引擎则只能依靠对标签等文字信息的分析进行检索。Pcpie 号称“帧搜索”而实际精准度却很难说服大众。
5,可搜索的视频分类。
支持的用“Y”表示,不支持的用“N”表示
比较项目 谷歌 百度 Leexoo Openv Pcpie 搜狗 爱问
在线视频 Y Y Y Y Y Y Y
手机视频 N N Y N Y N N
P2P视频 N N Y N N N N
小结:视频搜索引擎应该是广义的对互联网上所有的视频文件进行搜索的引擎。而不是窄意的只对以 flash 视频为代表的在线视频的搜索。Leexoo 对互联网上三大类视频都做了索引。
Pcpie 只对手机视频和在线视频加以区分,其他搜索引擎依然最基本的搜索格式。
6,搜索来源广泛性
通过输入不同“site:网址”或通过关键词查询组合进行分析。
谷歌:内容来源约 20 个。
百度:内容来源约 40 个。
Leexoo:内容来源约 70个。
Openv:内容来源约 70 个。
Pcpie:内容来源约 30 个。
搜狗:内容来源约 40 个。 爱问:内容来源约 40 个。
小结:Leexoo 在全国号称有 300 余家视频网站中收录了约 1/4,基本功颇为扎实。Openv 的内容来源分为电视类视频和网络类视频两部分,其电视类视频占总视频来源大约 2/3。其他搜索引擎则基本在一个水平线上,唯有谷歌刚刚步入视频搜索这个行列,该做的事还真的很多。
7,特色功能
谷歌:
1,搜索结果支持 rss 订阅。
2,视频内容的评级和举报。
3,部分视频内容具有缩略图功能。
百度:
1,搜索结果矩阵显示,每页多达 20个。
2,内容较为全面的视频专题。
Leexoo:
1,搜索结果支持视频片段预览。
2,搜索结果提供按内容变换而截取的 7 个预览图片。
3,搜索结果去除部分重复视频。
4,提供图片搜索视频及视频搜索视频服务。
5,提供不良视频举报功能。
Openv:
1,搜索结果支持矩阵和列表两种显示方式。
2,搜索结果支持视频片段预览。
Pcpie:
1,首页有搜索和门户两种模式。
2,提供放映大厅和上传视频服务。
搜狗:
1,搜索结果矩阵显示,每页多达 20个。
2,搜索关键词排行榜。
3,支持在结果中搜索功能。
爱问:
1,搜索结果支持按相关性和按时间排序两种显示方式。
2,搜索结果提供搜索视频和搜索专辑两种选项。
小结:显示样式和排序方式的变化已不足以区分搜索引擎有何质的改变,所以多数搜索引擎其实都处于同一档次上。其中谷歌的搜索结果支持 rss 订阅是一个创新,但不会成为其领先于其他搜索引擎的技术壁垒;Pcpie的头像搜索也仅仅是个初级的模型,并没有真正的使用。
视频和文本的最大不同就在于视频是非结构化的数据,能否做到脱离标题,标签等具有诱惑性的说明而直接去对实质内容进行分析,并给网民以真实的反馈,这将成为搜索引擎质变的门槛。真正具有质变潜质的是 Leexoo,搜索结果提供按内容变换而截取的 7 个预览图片,说明了其技术可以做到按视频内容进行搜索,而提供图片搜索视频及视频搜索视频服务则是进一步证明了此能力。
2007年国内视频搜索引擎分析报告(五)
四,总结
谷歌:目前在其搜索网站上没有什么体现视频搜索方面的新技术,据说,Google的视频采集爬虫尚处于初级阶段,需要针对每一家视频网站开发专门的采集器。
与.COM的Google视频搜索相比,可是被阉割的厉害,甚至连提交收录视频网站的最基本功能都没有,做个除了搜索什么功能都没有纯粹的“视频搜索引擎”。而说到搜索,最可笑的是谷歌连自家Google Video以及Youtube的视频内容都不收录。如此疲于赶场式的谷歌视频搜索,真是让所视频搜索用户贻笑大方。
百度:目前在其搜索网站上没有什么体现视频搜索方面的新技术,其视频索引主要来自于各个视频网站每天直接给百度的贡献——百度还没有自己的网络视频爬虫。百度曾跟Autonomy合作, 希望采用后者的技术,但是后者同时是Openv的核心技术提供商。最近传闻,百度还在四处寻找和采购新的视频搜索与分析技术。
没有过多的修饰,没有过多的步骤,一切从简。
Leexoo:从网络视频爬虫、采集、分析到索引,拥有全线核心技术,发展潜力比较大。
或许不是最大的,但绝对是最有潜力的,因为技术实在高出一截,因为对视频的理解确实够深刻。
Openv:视频搜索引擎技术来自国际上领先的非结构化搜索技术提供商Autonomy,但是,
Autonomy的技术是对音频的分析,对于视频搜索引擎还不存在缺陷,同时,Openv在网络视频的爬虫技术上还是空白。另外,由于核心技术受制他人,难以保证及时响应中国互联网视频搜索用户的需求。事实上,Openv已经更多的转变为一个面向电视台的搜索技术服务提供商+视频分享网站。
电视视频与网络视频的结合,是一大特点,到底能有多大市场,还有待于时间检验。
Pcpie:具有视频分享网站类似的广告模式,具有视频搜索引擎相近的功能。号称按帧搜索,结果比标签搜索还不准确。在视频搜索领域里尚缺乏核心竞争优势。值得一提的是技术研发团队在哪里,似乎是海外
搜狗:虽然与百度基本相同,但是在结果中的二次搜索功能可以很方便的把搜索结果再次细分,搜狗的技术特点体现在了细微之处,可谓用心良苦。
爱问:包括热门推荐、最新上传等等。爱问视频搜索并不是要做视频搜索引擎,而是想以 “视频搜索”吸引用户过来尝试,再以此为基础创建一个视频分享的社区。
目前来看,最好的视频搜索是百度,其在内容、用户体验、页面等方面占据优势,这得益于其在国内文本搜索领域里的统治地位。但是致命的弱点是其未能突破文字搜索转换成视频搜索的技术门槛,在视频搜索领域缺乏最基本的技术支撑。可以预见未来的视频搜索行业中,Leexoo将会是最强有力的竞争者,其是以对视频特征分析的技术构建行业壁垒,提高搜索精准度,进而影响用户体验。搜索引擎是以技术为主导的产品,Leexoo已经具备颠覆视频搜索行业的基本潜质。
2006 年视频行业呈现了超强的发展势头,2007 年视频网站之间的竞争变得越发激烈,而视频搜索引擎的对决会为时不远,谁能更好的满足网民的需求,谁又能引领视频搜索行业的方向性发展。让我们拭目以待,不过还是先祝愿大家都尽情发挥自己的优势,一路走好。
没有评论:
发表评论