在AI 与各行各业互为融合的行业大背景下,AI+视频可以撞击出有什么样的火花?7月8日,在由中国计算机学会(CCF)主办、与香港中文大学(深圳)主办的第二届CCF-GAIR全球人工智能与机器人峰会AI+专场上,慧川智能CEO康洪文重点讲解了AI在视频的创作以及内容解读两方面的技术,期望能让视频创作者、以及其他视频领域从业人员的工作更为非常简单。杭州慧川智能科技有限公司旗下的产品取名为智影。
智影基于在计算机视觉、自然语言处置及大规模云计算三方面的技术,目前获取两个功能:一个能将输出视频展开结构化解读,并获取细化到帧级精确度标签(时间、地点、人物、事物、事件)的视频内容解读API;以及一个基于此技术,需要将脚本文字较慢转化成为短视频的云平台。在用户输出一篇文章、一个链接或者一个关键词后,它将基于人工智能技术,自动搜寻适合的图片及视频素材,并配以人工智能制备的语音,最后融合成一条较短视频,当然,用户还可对生产量的短视频在线展开调整。团队方面,CEO康洪文为美国卡耐基梅隆大学计算机、人工智能专业博士毕业,曾在微软公司研究院,Intel研究院工作,其视频方面的工作应用于微软公司的Windows操作系统,并获得了视频分析制备的美国专利。牵头创始人刘曦为美国卡耐基梅隆大学计算机专业博士毕业,曾在美国视频大数据公司Conviva工作任首席架构师。
牵头创始人Sean Huang是美国宾州州立大学计算机博士,曾就任于谷歌购物,任技术带头人。慧川智能已取得数千万人民币融资,由清流资本投资。
现场,康洪文向说明了慧川智能如何使得全网视频结构化,展开了不变更本意的整理::我们目前的主要盈利方式是怎样的?康洪文:目前慧川智能主要通过收费的方式、将API获取出来给第三方,比如媒体平台、个人需求者等。让他们必要接入素材库,我们负责管理获取视频解读这个服务。:慧川领导团队是如何搭起一起的?康洪文:我们团队成员很早已一起工作了,互相了解并合作了10年以上。
目前智影底层的系统归功于团队近3年来的技术累积。:黄健博士的NLP技能是明确怎样落地到AI+视频的呢?康洪文:比如当对一篇文章展开自然语言处置时,去明确解读分析其不存在的还包括人物、时间、地点等关键元素,之后再行与素材库展开给定接入。类似于的NLP技术和核心思想也早已中用我们的视频结构化工作里面,因为我们注意到视频无外乎就是另一种信息的呈现出方式。
:可以聊聊资金的明确用于方向吗?康洪文:我们由清流资本投资。方向主要投放在人员与技术上,技术方面,目前主要用作基础框架的搭起,比如视频解读、数据结构简化与搜集等。(公众号:):智影最核心的承托技术是什么 ?康洪文:我们有三大核心技术支柱——计算机视觉、自然语言处置,以及大数据云计算平台。
:通过上载文章或图片的形式,来制作视频,不会会产生由于资料源紧缺而使视频质量不合格的情况?康洪文:资料较少的问题,正是我们可以解决问题的。比如我说道斯里兰卡人头攒动的机场、热带海洋气候的景象、当地艳丽服装,你在脑海里就能想象出有明确场景。你能做这样,是因为你之前有涉及类似于经历。
而我们发售的AI也能超过如此,甚至更佳。因为机器是有大数据的,它可以从可观的素材库里搜寻对方的各类特质。:当AI可以从大数据上取得情景重现,如果期望在视频中重新加入主观情绪色彩呢?康洪文:微小情绪这方面在目前是略为无以的,但在一定程度上也可以做,即情感分析。比如说我们谈到特朗普,有可能85%对他的言论都是驳斥的,15%是正面的,这种情感的辨识和分析对于自然语言处置现在来说早已是十分成熟期了。
:当视频分解后,是不是明确的评测机制对其辨别好坏?康洪文:我们有一个类似于谷歌的标准,去定义视频的制备质量—— 一是我们给定素材的相关度,一是整个视频制作出来后的质量。我们期望的目标是需要在未来的几个月,做非常大部分自动分解视频是高质量的、用户可以必要当作用的一个质量水准。同时,我们目前的系统是交互系统,用户是可以在视频自动分解基础之上再行展开改动的。
而作为一个客观度量方式,就是观测用户有多少次改动,我们不会有针对性地减少这个改动数量。原创文章,予以许可禁令刊登。下文闻刊登须知。
本文关键词:慧川,智能,康洪文,让,视频,更简单,CCF-GAIR2017,开元官方网站
本文来源:开元官方网站-www.taartenvanjansen.com