|
|
|
|
移动端

爱奇艺CTO汤兴:AI贯穿整个视频流程 理解和决策有待发展

近日,爱奇艺CTO汤兴接受了51CTO的专访,整个交流围绕AI在视频领域的应用实践展开,主要涉及应用实践、制约因素、技术不足等。

作者:王雪燕来源:51CTO|2018-02-05 19:28


【51CTO.com原创稿件】有史可鉴,每个内容形态都会衍生出一大批互联网公司,经过很长一段时间的激烈角逐,最终巨头显现。视频作为重要的内容形态之一,是获取信息必不可缺的来源。据艾瑞统计,2017年8月爱奇艺单月用户播放时长就有 76.8 亿小时,相当于 88 万年,这是从时间维度上看视频数量的爆发。从空间维度上,视频已经深入到资讯、娱乐、社交、安防、教育、交通、以及医疗等各行各业。这些足以证明:我们正身处在视频爆发的风口。

近日,爱奇艺CTO汤兴接受了51CTO的专访,据了解,他刚刚在中国首席技术官联盟、科技部现代服务产业联盟主办的“中国IT武林大会暨2017年度中国IT年度人物颁奖盛典”上,凭借对大数据、AI等技术的创新应用荣获“2017中国IT年度人物杰出CTO奖”。故整个交流围绕AI在视频领域的应用实践展开,主要涉及应用实践、制约因素、技术不足等。

汤兴·爱奇艺CTO

AI在视频行业走到哪一步了?

汤兴表示,视频行业存在几个明显的矛盾需要解决:

  • 日益增长的生产采购成本和内容收入之间的矛盾;
  • 爆炸性的内容增长和用户找不到想看的内容之间的矛盾;
  • 水涨船高的营销费用和转化效果不够高之间的矛盾;

目前,不管是爱奇艺还是国内外的其他视频网站,其实都在尝试用技术手段、AI能力去解决这些重要问题。AI技术已经在视频的整个创作、生产、分发、播放、变现流程中开始发挥作用,在一些分支中已经取得了非常令人瞩目的突破,催生很多落地的AI应用,在提高运营效率、提升用户体验、提升商业化能力等方面发挥了重要作用。

国内外、平台之间的应用存在明显差别

当问及国内外、平台之间的应用是否有明显的差别?他说,平台与平台之间的应用差别还是比较大的,例如国外的视频平台包括Youtube这样的以用户生成内容(UGC)为主的平台,也包括Netflix这样的以优质自制作品为主的平台。在国内各个平台也有自己的特色,拿爱奇艺来说,专业生产内容(PPC)赢得业界和观众的一致好评。

除长视频平台,还有大量的直播平台、短视频平台,例如花椒、奇秀、快手、火山小视频、爱奇艺头条等。不同的业务形态,不同的用户画像,决定了应用在开发、运营中都有明显的区别。具体到AI上,不同的场景适合用不同的模型解决,不同的数据集训练出来的模型参数也会大不相同。

就经验而言,视频行业很多痛点是有共通性的,各方都在尝试用AI去化解:

  • 如内容生产、审查和推荐,现在全网每天新增海量的视频,人工无法满足这个海量的生产需求,用AI做几乎是必然。
  • 如国外YouTube,Facebook等,国内爱奇艺和其他平台,都在用AI提升创作、生产、运营、变现的效率,例如:智能特效、智能编目(自动生成封面图、标题、摘要、关键词)、个性化推荐等。

目前来看,大家应用的方向是比较相似的,差异在于技术水平、应用深度。

AI在视频应用过程中理解与决策有待发展

众所周知,AI智能水平从浅入深有“感知、理解、决策”等多个层级,目前在感知方面如语音识别、人脸识别、大数据分析,搜索等方面相对成熟,而视频理解和决策方面有待发展。

视频理解是AI视频应用的基础,具体技术包括图像识别、行为识别、语义分析等诸多方面,更加综合,也更加复杂。AI现在对视频的理解与人类还有一定差距,需要让机器在视频大数据训练中更多的使用弱监督学习,强化学习和迭代学习。

同时,创作、分发和营销环节的AI决策技术也有待加强,未来我们不仅需要AI辅助人类创作,还希望AI能有助于内容采购、内容分发和营销服务,强化学习、GAN等技术还有待进一步研发。

AI与视频业务融合有三方面略显不足

其一:目前全网还有大量的视频内容有待二次、多次利用,赋予视频内容更长的生命周期,既有助于避免用户错过优质体验,也可以产生更多的长尾价值,激励创作者进一步创作更多更优秀的作品。在这个过程中需要更好的版权技术去促进视频内容的交易和流通。

其二:和电商、广告业务的融合,视频的价值还没有被充分挖掘,例如视频和商业未来还有更多的效率更高、体验更好的结合形式,为了达成这一目标,视频理解、用户画像、智能交互、智能推荐等技术需要进一步提高。

其三:视频和硬件业务融合,VR/AR/MR技术目前还没有完全成熟,超高清视频用户体验有待进一步优化,我们相信,在这些技术取得进一步突破,视频与新技术的融合更好地完成后,我们将再一次重新定义视频。

详解爱奇艺的AI实践

AI技术在爱奇艺视频的创作、生产、分发、播放、变现、售后服务等方面都得到广泛应用,贯穿整个视频流程。

创作方面,内容制作周期长,早期投入大,风险高。爱奇艺依托影视剧流量预测系统,精准采购影视剧,为投资、广告、营销提供有力支持。

生产方面,得益于AI,视频生产的效率大幅提高。爱奇艺情感识别在ACM Emotiw2016和CCPR MEC2016情感识别竞赛获得第一名。基于爱奇艺大脑的视频理解算法,通过智能拆条、字幕识别、人脸识别、情感识别、事件检测等多种智能算法,让视频的标签更加精准,时间轴更加丰富。爱奇艺视频数量从2014年到2017年增长了约20倍,但生产相关员工人数仅增长约2倍。精彩片段的剪辑通过AI技术的生产效率提升2.5倍。视频审核量增加60%,审核人数基本不变。封面图生成通过AI技术实现全自动生成,每天为几十万UGC视频自动生产封面图。

分发方面,AI实现智能分发,优化用户体验,提高会员收入。爱奇艺全网搜索涵盖最全的全网视频内容,索引视频数超5亿,是业界最大的全网视频搜索引擎,目前高峰搜索量突破3亿,整体日导流量突破4亿。同时基于智能推荐系统,对用户进行精准内容分发,整体日均导流达6亿,且一直维持着高增长的势头,AI功不可没。

播放方面,爱奇艺构建业界领先的HCDN混合内容分发网络,流畅地服务着各端数亿级的用户。每天提供高达13Tb以上的同运营商同城的免费本地峰值带宽,位居互联网业界第一,在互联网视频等大数据全网分发上取得了非常重要的应用价值。

变现方面,爱奇艺应用了闪植、随视购、创可贴、原创贴、麒麟神算自助广告投放等多种广告技术,实现视频内物品的电商导流、广告植入的后期定制等功能。基于大数据的分析和用户脸谱画像,可以实现基于用户兴趣的精准投放,提升广告转化率。

售后服务方面,“奇小艺”是由爱奇艺自主研发的一款智能客服助手机器人,并于2016年12月25日正式发布。凭借爱奇艺在大数据、NLP、机器学习方面的技术积累,精炼为数以万计条业务知识库以及有趣的寒暄语料库。智能客服解答有效率90%,仅智能客服一项,为公司节约近200个客服人员投入。

按需调整,AI解决痛点问题

汤兴表示,技术架构上,爱奇艺采用的是云+端的SOA服务架构模式,海量数据存储和大计算主要都是在云端,通过平台、服务的形式实现。

在需求调整方面,针对重点业务进行快速迭代。以创作环节为例:有句话说“拍电影就像赌博”,视频投资创作、版权采购的成本,是娱乐行业最大的成本,以前大概40%-50%,现在占比更高。前期内容投入如此巨,结果如此高不确定性,是行业很大的一个痛点。

这个痛点对制作方参与电影拍摄的积极性的影响是很大的,也不利于整个行业的发展。不管是对于制作方,还是平台以及广告商等其他参与者来说,都非常需要一个更加准确的市场预测工具,以此为依据去选择剧本、制作班底和演出人员,从而降低风险,提高回报。

对此,爱奇艺基于大数据技术以及特征工程、机器学习等AI相关技术研发了基于机器学习的多时间窗口影视剧流量预测系统,并通过算法改进不断的提升性能。目前该系统提前180天电影票房预测准确率81%,提前180天、360天电视剧流量预测准确率88%,预测结果在版权采购、自制剧立项、广告合作等各个环节都有很好应用。

AI发展路上的三座大山

对于哪些要素制约AI在视频领域蓬勃发展,汤兴这样回答:AI在任何行业的发展,第一要有充足的数据;第二,要有强大的硬件基础设施,第三要有先进的算法;还有一个不能忽视的就是真实的应用场景。这些因素对于AI在视频行业的落地其实都非常重要,缺一不可。

具体到视频领域,制约AI在视频领域进一步发展如下三方面:

第一:数据量还需要更大,因为视频在我们的未来生活中会扮演更加重要的角色,使用视频的场景也会越来越多,在如此多变的需求下开发更精准的AI应用,需要有更大、更高质量的数据作为训练支撑;面对信息孤岛的问题,平台之间的数据开放和共享也是迫切需要解决的挑战。

第二:更加先进的底层算法和技术,现在业界也在热议AI是否是“炼金术”,谷歌的AlphaGo Zero也展现了不需要大量现实数据输入条件下AI自我训练的能力,因此视频领域可能同样要拥抱这样一场新的变革。底层技术的突破所带来的想象空间是巨大的,它有机会去解决前面所述的数据、基础设施在内的多种问题。

第三:背后的核心因素:人才。要解决上面的这些问题,最终还是要靠人来实现。据领英公司统计,全球190万AI人才,中国只有5万。现在我国AI人才仍然存在大量缺口,这也是制约AI在视频领域发展的最重要因素。迫切需要高校、培训机构、公司等联合培养出更多的高水平AI技术人才和管理人才。

爱奇艺的AI娱乐路线图

技术创新方面,2018年我们重点会关注超高清窄带视频、强化学习、无监督学习、GAN、小样本学习、多模态融合、区块链等技术,并将其应用在短视频生产、看点提取、用户交互、搜索推荐、版权管理、智能营销等应用场景。

业务结合方面,爱奇艺致力做到“更懂内容、更懂用户、更懂合作伙伴”。相对应地,技术方面,希望AI是具体地与这三方面业务的需求相结合,推动战略的落地。

更懂内容。PGC方面我们研发了影视剧流量预测、选角系统等工具帮助大投入的创作;通过视频识别、内容理解,来提高视频生产和标注的效率。在UGC方面,我们希望通过AI实现人人都是导演,让用户更便捷地进行视频内容创作,产出更多优质的内容。

更懂用户。通过大数据分析和个性化搜索推荐,利用AI让用户获得最需要最合适的视频内容,创造更好的用户体验,是我们会持续努力的方向。

更懂合作伙伴。进一步打通视频和广告、电商业务,在优质的视频观看体验基础上,使营销更加自然化、情景化,在不打扰用户的同时,拓宽视频娱乐商业化的边界,同时我们还希望在开放平台、在线教育、医疗和互联网金融等方面进行更多尝试。

【被访人简介】

汤兴,2002年于中国科技大学获得数学博士学位及经济管理第二学士学位,现任爱奇艺CTO,从2012年3月至今,一直任此要职;负责管理产品、技术、运营、渠道四大版块。曾就职英特尔、Google。曾任谷歌上海研发中心技术总监,全面负责Google视频搜索业务并参与YouTube视频搜索服务的研发。

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

【编辑推荐】

  1. 爱奇艺CTO汤兴:道天地将法,《孙子兵法》的管理之道
【责任编辑:wangxueyan TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢
24H热文
一周话题
本月最赞

读 书 +更多

精通ASP.NET 2.0+XML+CSS网络开发混合编程

本书以最新的ASP.NET 2.0为基础,详细阐述了当前网络开发的经典架构ASP.NET 2.0+XML+CSS的各个知识点,以及SQL Server 2005的相关知识。全...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊