融合AI智能媒资库

下一代人工智能媒体资源管理库

方案简介

相较于传统离线媒体资源管理系统,融合AI智能媒资库一方面打破传统网络“孤岛”运行模式,实现基于互联网上载、审核、入库、编目、下载等业务流程,另一方面集成AI人工智能引擎,引入编目前移及智能标签概念,提供基于语音、图像、场景等的智能编目工具,实现媒体资源管理的高效化、智能化。 同时,AI智能媒资库可与极速EE2.0非线性编辑系统、极速EE-I云非编系统无缝对接,实现媒资库素材在线编辑功能。

方案特点

一、重构业务流程

1、内容入库编目业务流程

        内容提交入库申请,可选设置审核流程,审核通过之后进行后台AI智能编目(标签化编目),编目完成根据素材属性可选择入库到个人媒资库空间,仅供自身浏览使用,也可选择入库到公共媒资库,作为公共素材所有人可见可使用。媒资库内容支持在线二次编目。

        一般素材可提交入库申请之后直接进行后台AI智能编目,然后直接入在线媒资库。

        AI智能编目包括视频人物信息编目、语音信息编目、场景信息编目、基本信息编目等。

2、内容生产业务流程

        在线媒资库内容、素材可直接通过拖拽的方式上非编时间线进行编辑。打开本地极速EE2.0非线性编辑软件,如若不登录网络非编账号,可做单机非编使用;登录网络账号,新建网络工程文件,在线媒资库将嵌入素材框板块,素材可直接拖拽到非编时间线进行编辑,实现媒资库在线编辑功能。

3、内容检索下载业务流程

        在线媒资库可通过AI编目标签、关键词进行内容检索、下载。

        互联网任意地点通过WEB访问极速融通业务平台,打开在线媒资库模块,检索框输入需要检索的内容标签、关键词等信息,通过检索内容找到所需要的素材,可在线浏览,若需下载,须提交在线媒资库内容下载申请,审核通过之后可下载相关内容。

二、AI智能编目应用

1、AI智能编目工具

        对视音频文件进行AI分析,将视音频内容结构化,得出人像信息、语音转文本结果、智能镜头拆条结果。这些结果从微观角度对视音频内容进行编目描述,相较传统编目更加细致,将所有标签结果与内容的关键时码关联,形成一套针对视音频内容的全新智能编目体系和规则。

1.1 人像信息编目

        在内容入在线媒资库的同时,利用AI的能力,可快速识别视频、图片内容中的人物信息,并对关注的人物进行识别、汇聚、标签、编目。

        将人物添加到系统特征库内,利用AI人工智能技术,通过智能人脸识别,与上载的素材进行比对,快速分析视音频内容中的图像、语音信息,并对其进行AI智能编目。编辑记者在系统内直接输入需要查找的人物名称即可快速检索到素材库中所有的相关人物素材,有效缩短素材查找环节的时间。同时,提供以图检索视频功能,编辑记者通过上传一张人物的正面照,即可检索查看相关匹配的人物专题汇聚内容。

1.2 语音信息编目

        快速识别视频中的声音并转化成文字,通过自定义标签、关键词的方式对视频语音进行编目,通过标签、关键词检索可定位出相关标签、关键词所在视频及其时间点。

        编辑记者可对系统内的素材的主要结果进行快速预览,将语音转写的文本信息导出,包含导出整段视音频的语音文本信息,同时支持入出点内的语音文本信息结果。有效地缩短编辑记者的前期准备时间,提高工作效率。

1.3 场景标签编目

        基于AI深度学习能力、场景识别能力,通过自定义视频截帧间隔,自动识别截帧画面内的场景标签并进行自动编目,场景内容涵盖人物、风景、人造物、建筑、动植物、食物等大类,包含了日常生活的各个信息维度。

        检索场景标签、关键词,可定位相关视频内容、标签所在的视频位置,方便在线媒资库内容编辑时内容检索。

1.4 基本信息编目

        记者内容上传在线媒资库,通过AI自动识别能力,获取内容基本信息如:上传人信息、上传地址信息、时间信息等,并进行基本信息编目。

        通过检索记者信息、地址信息、时间信息可快速检索相关内容。

1.5 其他信息编目

        基于AI人工智能服务基础,可定制其他信息编目方式

2、AI系统功能设计

图:AI功能架构

        智能内容处理系统提供传统节目、互联网等各种资源的采集、智能处理。采用开放的应用服务平台框架,灵活组配,实现对内容进行有效的组织、管理。

        开放的基础设施架构:智能内容处理系统由基础平台支撑,将不依赖单一设备商及软件商,兼容并蓄,持续可扩展、可发展。

        开放的业务支持:按照松耦合的思路,以资源池化,微流程,组件等方式,满足各类业务流程的定义。

        系统依托电视台现有资料内容通过目录扫描的方式,获取或转码生成低码率视音频资料,基于已定义的标签通过视音频AI引擎进行自动标签化处理。本系统由以下子系统组成:内容采集管理、业务服务、用户权限管理、引擎服务管理、检索服务、统一对外接口工具等组成。

        内容采集管理模块:提供用户配置系统纳管的内容源路径,并提供对该内容源的业务属性进行设置的功能。如:制作网内容、新闻网内容等。 

        引擎服务管理模块:提供对人脸、语音、场景、ocr等智能识别引擎的管理,对视音频内容进行全面标注。

        用户管理模块:提供用户的权限管理等功能;

        业务服务模块:提供智能拆条、打点下载、语音转写、实用工具集等服务。

        检索服务模块:提供对智能识别的素材进行检索服务功能的模块。

        统一接口工具:提供媒资、制作等业务系统的内容出入库、结构化数据出库接口。


3、 AI工具集

        OCR文字识别工具

        OCR文字识别工具主要作为编辑记者在日常工作中使用,编辑记者点击OCR工具的截图,即可截取画面上的任意位置进行文字识别,识别后的文本结果将在右侧OCR工具下展示,支持在线编辑修改。

        语音转写工具

        通过对已有音频文件、视频文件口播进行识别,将音频内容转写为文本信息,辅助人工进行快速检索,实现全量、增量自动化智能转写,提升内容的检出率。

        智能拆条工具

        通过智能化技术将已播出的节目拆条成一条条独立的条目,然后用于丰富和完善新闻资讯节目数据的信息通道,提高节目内容的生产效率以及拆条后的视频质量。

        AI镜头批注工具

        通过智能拆条后,用户可将不同的条目进行分段合并处理,并加以人工进行镜头批注,同时作为后期检索源数据。

        语音校对工具

        系统支持对文件内的音频进行语音识别,并转换成文本信息,但是AI引擎无法达到100%识别率,需要进一步校对文本信息。用户可以在现有的语音转文本结果上进行文本校对,在检索结果语音部分点击“语音文本校对”即可。

        语音文本校对有时间轴和纯文本模式,纯文本模式专注于文字本身校对,时间轴模式支持合并连续不间断的文字,方便后期业务制作。