天虎科技  >  正文

一周要回审9千万条视频?人工审核哭了,百度AI笑了……

2018-11-09   来源: 天虎科技


今年初,一家互联网巨头因内容违规等原因被整改,随即放出了大批人工审核编辑的招聘需求。当时其内容审核编辑团队人数已超过4000人,而这个数据还会继续增加。


实际上,随着我国互联网监管从“底线监管”到“生态监管”,对于各个UGC平台的内容审核提出了更高要求。雇佣大量人力进行内容审核已很平常。


此前走红的“鉴黄师”可以称得上是内容审核中的细分领域了。但人每天能看的图和视频终归是有限的,怎么也干不过机器。比如,当接到一周内要回溯9千万条视频任务时,人工审核们肯定觉得太苦逼,但对机器审核来说,可能就不一样。


不过,过去的机器审核,说实话也有点傻,比如在母婴论坛中,机器审核看到母亲们晒出的婴儿洗澡的图片,很可能就判定为涉黄。


现在,在AI审核的辅助下,信息服务行业也许将迎来生产力的大解放。


百度大脑信息服务行业解决方案亮相

 

百度大脑自10月18日开始在全国将举办7场专题活动,展示人工智能与不同行业、具体场景结合创新的价值。作为第二站,百度大脑行业创新论坛·信息服务专场11月8日在成都菁蓉汇举行,百度AI技术生态部总经理喻友平分享了百度大脑平台与信息服务领域的AI技术解决方案。


为人所关注的是,百度大脑信息服务行业解决方案的发布,能为内容从业者带来什么价值呢?


百度AI技术生态部总经理喻友平介绍,百度大脑信息服务行业解决方案应用百度大脑的核心技术,解决信息服务领域存在的问题——用户体验的改善和业务端的效率、风控水平的提高。百度大脑信息服务行业解决方案涵盖了语音搜索、图像搜索、智能录入、有声阅读、语音播报、口碑分析、个性化推荐、内容分类、内容审核等细分领域需求,为这些服务打上了AI的标签。


在业务端,解决效率主要是内容分类,利用EasyDL定制模型训练平台,快速形成内容标签并归类。


风控针对内容审核,利用AI技术对文字、图片、视频、音频进行审核的手段都较为成熟,可以达到标准统一、准确高效、可定制化的审核要求。里面包括了很多内容形式的审核。比如有意思的是,在视频审核中,赌博、抽烟、枪击声等都可以审核出来。


在客户端,辅助决策主要是个性化推荐和基于NLP技术的口碑分析;辅助操作包括语音播报、有声阅读、智能录入、用户搜索(语音搜索、图像搜索)。


听听行业一线的“炮火声”


在信息服务领域内,虎哥看到了类似行业创新合伙人的几个典型案例。天府TV副总经理岑明聪、一下科技副总裁陈太峰、太平洋汽车网资讯总监曾俊华,分别从自身企业需求出发,介绍了百度AI是如何为其赋能的。


天府TV:百度AI帮助构建完整审核体系


天府TV是有着成都音像出版社有限公司背景的视听网络新媒体。岑明聪认为,百度AI能帮天府TV构建起完整的审核体系。“百度大脑刚好可以跟天府TV形成优势互补,我们借助百度AI能力,构建天府TV自己的内容审核播控平台和解决方案。”


内容审核传统的方式是用人工,不仅成本高,也容易漏审出错。而天府TV携手百度大脑,看中的就是百度大脑的技术优势和可持续性,大大降低视频、图片、文字、音频等内容审核过程中的错审、漏审等问题,并显著降低人力成本。


在天府TV的入库检测、智能审核、人工审核、监管控制一系列的审核体系中,入库检测对视频进行初筛,随后百度AI会对内容打标签,根据标签不同匹配不同的校验库。随后进入人工审核,人工对机器标记过的视频进行复审。

值得一提的是,经过复审和抽审后,视频进行播放时也会进入监管体系。百度AI会及时响应临时变动的审核需求,对于播出的内容做管控。

一下科技:一周内完成9000多万视频回查

对于旗下有一直播、秒拍、小咖秀等产品的一下科技而言,每天有海量、多样化的视频内容上传,庞大的数据量对内容审核提出了巨大挑战,纯人工审核内容得大量堆人力。


陈总表示,一个短视频审核员工在上岗前,需要学习300多页将近5万字的教材,学习时间在28个工作日,培训完成后还需要2-3周进行上岗培训。


即便这样,也不能保证审核就完全准确。本着对于AI平台“可拓展性强”的要求,一下科技与百度AI合作推出了AI+人工的审核体系。


一下科技借助百度大脑技术进行内容过滤,节省了很多人力成本。“内容标准化以后,大大提高了内容审查的安全性,也提升了我们的工作效率。今年6月,我们有一个需求,要审核9000多万条视频,平均每个视频时长3分钟。如果通过人工,这需要很长时间,可是我们通过百度AI进行审核,一周就完成了这个工作。”


太平洋汽车网:以图搜车提升访问量

运营16年累计了上亿张汽车图片的太平洋汽车网,也在利用百度的AI识图功能提升其用户体验。


曾俊华介绍,借助百度车型识别和定制化训练平台EasyDL两款产品,拍照识车的实现很简单,可应用到图片搜车功能上。一部分车型不需要训练,只需要调取百度车型识别接口就可以实时得到结果,另外一些新车款的识别也很简单,只要按照车系进行图片分类,然后打包上传,不需要其他的操作,系统就会自己训练车型识别模型。


这样。用户拍摄车辆就能识别出该车辆的车系。即便是拍摄到车头灯、车尾箱、车模型,百度AI也能识别出对应车辆。


拍照识车对太平洋汽车网带来了实实在在的价值,最直接的就是降低了门槛,提高了效率。识别时间不超过3秒,识别率高达89%,另外11%是因为全新的车系或者海外特殊版的车型、古老车型,识别模型还在训练中。拍照识车功能让移动端的访问量提升了7%。


行业协会:传统出版业转型升级迫切需要百度大脑


在随后的圆桌论坛上,中国音像与数字出版协会副秘书长王勤表示,传统出版业的转型升级,迫切需要百度大脑基于类神经网络的智能处理系统,希望基于文本理解和深度学习技术,把编辑长期积累的经验和智慧,系统收集、整理并通过机器学习形成智能处理系统,从而充分发挥百度大脑在内容创作、生产加工、前置审查、播出监管,以及播后评价等关键环节,发挥越来越重要的作用,为内容产业发展提供智力支撑。


百度AI解决内容行业四大痛点


百度AI技术生态部高级产品经理袁运筹,从当下审核4个痛点出发,介绍了百度能解决哪些问题:


1.审核维度不全面

百度提出了文本、图像、视频全形式的识别能力,不仅如此,在每个形式的方向上还提供了多维度的审核能力,比如色情、名人、广告等等维度,以满足用户需求。

2.审核标准不对齐

百度会将每个维度的审核拆分成各个分类,以满足不同场景下的不同需求。


以色情审核为例,由于电商与直播平台对于“色情”的定义各不相同,因此百度会将“色情”拆分为16个分类:女性性感、男性性感、卡通性感、行为亲密、儿童裸露等等。根据电商和直播平台对业务需求的不同,自定义对“色情”的判断从而完成审核。


3.定制新审核维度成本高

企业要训练出自己的审核模型,不仅需要大量的标注数据、还需要长时间的训练时间,一套系统可能要花费几十万,对于企业来说成本太高。使用百度的EasyDL,只需要开发者上传几十张标记好的照片,百度就可以完成训练。


4.接入成本高


百度会在后台以并发的形式进行审核,而不需要用户发送多次请求耗费成本。同时针对以往视频审核“平均抽帧”的方式,百度推出关键帧抽取的智能算法,通过比对视频前后帧场景的变化判断系统是否要对这一帧进行审核,从而为用户节省资源。另一方面,百度会为用户提供免费额度“比如在图像审核方面,每个用户每天每个维度都有2000次的免费调用额度,足够一般的开发者使用。”


正是这种简单易用,诸如家图网、趣头条、百姓网等等平台都在以EasyDL结合自己的需求应用到实际场景下提升效率。“其中趣头条用百度视频审核提升效率80%,百姓网用百度内容审核后,效率和准确度上升了30%。”

 

百度大脑寻找行业创新合伙人


关于百度大脑的进展,这次活动上也透露出3点值得关注的信息。


第一,百度大脑平台化的开放赋能已经辐射至全国,惠及包括文化娱乐、企业服务、教育培训、金融等在内的各行业,调用量和开发者数量都迎来了井喷式增长。


百度大脑目前开放的能力已经超过130项,每日外部调用量超过60亿,加入燎原计划的合作伙伴超过300家,百度AI开放平台上的开发者数量超过80万,是国内最大的人工智能开放平台。


第二,开放场景化能力,只是百度大脑整个开放平台架构中的一环。百度大脑已经开放了定制平台与硬件开放平台,可快速实现AI能力定制。


同时,AI市场让开发者和合作伙伴找到了最适合的落地变现途径,AI市场近期还上线了“模型交易”功能,进一步帮助开发者在AI时代变现。


第三,百度AI技术生态部总经理喻友平提到,百度大脑推出了燎原2.0计划:旨在将百度大脑、开发者、AI产品/方案、AI市场和客户进行紧密连接,形成闭环。百度重点提出行业创新合伙人概念,即在每个细分领域中挑选出最多三家企业行业创新合伙人,企业一旦入选,就可获得百度大脑提供的专项技术支持,百度将与行业创新合伙人共同设计、运营、推广AI产品和方案。


目前,小能科技已成为首家行业创新合伙人,并发布了第一款行业创新合伙人产品“小能智慧场景云客服”。


如果成都的技术开发者和有落地场景的企业,看到了这样的需求机会,不妨可以考虑成为百度大脑的行业创新合伙人哦。



天虎科技   罗曙驰  尚志  彭春志


联系我们
  • 公司信息:四川华西都市网络科技有限公司
  • 地址:四川省成都市红星路二段70号四川日报报业集团
  • 电话:028-86969141
  • 邮编:610012
  • 投稿邮箱:2224894013@qq.com
关注天虎科技微信公众号

关注天虎科技微信公众号

华西都市网首页