CIAC2023:AI认知大模型深度赋能媒体智创融合
8月3日,以“智慧广电 未来视听”为主题的中国(北京)国际视听大会(CIAC2023)在北京亦创国际会展中心举行。本届大会设立七大专题展区,举办开幕式、北京新视听峰会和专业论坛活动30余场,全景展示视听全产业链发展成果。300余位视听行业知名企业家、专家学者、主管部门领导、生态合作伙伴、投资机构代表,2000余家视听企业机构、媒体以及近30000余名专业观众齐聚大会。
在8月4日上午的智慧广电创新发展论坛上,科大讯飞智慧传媒产品总监 邵青做了“AI认知大模型深度赋能媒体智创融合”主题分享,与论坛嘉宾共同探索认知大模型赋能媒体智能创新之道,助力大视听内容高效高质生产。
会上,邵青从内容、管理、安全三个维度,深度介绍了大模型、AIGC对媒体业务的支撑赋能。
从内容生产的角度来看,大模型在语义理解、推理、生成等方面具备着极强的能力和潜力,在稿件生成、改写、扩写、缩写等方面与媒体有着天然的亲和度,可以辅助记者、编辑对现有选题及素材进行效率化规整及产出。
通过感知+认知的组合模式,从过去的语音转文字、图片转文字、机器翻译这些平行转换,到文字转语音、文字转虚拟人的多模态生成,到如今的音视频、片段型文字转语音、视频的智能化多模态生成,每一个新的阶段都能够为媒体工作者带来更高工作效率、更多元化的创意与展现方式的提升。
讯飞听见写作:AI写作、更会写
讯飞听见基于科大讯飞星火大模型推出的讯飞听见写作是一款具有强大AI内容生成功能和广泛应用价值的软件应用,通过采用人工智能技术,在自动将音视频文件转化为文字的同时,对内容进行深度分析,从而根据用户的指令需求,实现新闻稿件、会议纪要等文案的快速输出。
讯飞听见写作的应用场景非常广泛,可以用于新闻采访、会议记录、讲座笔记等多个场景,不仅可以提高媒体工作者的内容记录工作效率,还可以AI自动生成全文摘要,帮助用户快速了解文章主要内容,制定工作计划和梳理工作待办,从而更好地管理和规划工作,节省时间和精力。
从内容管理的角度,大模型同样可以基于语义理解、推理等能力为媒体内容管理带来新鲜血液,与过去基于nlp的标签化处理相比较,大模型可以根据用户的倾向性、使用习惯、专业领域等方面,带来更为丰富的标签化体系建设、智能化内容摘要的生成也更加通顺、符合素材内容的主旨。
从内容安全的角度,大模型对于数据情感、逻辑的分析更为精准,区别于过去的关键词识别,大模型往往能够识别出一句话或一篇文章所带有的隐含意味,从而实现篇章级的理解。过去识别不出来的冷笑话、隐喻、暗讽等内容可以更加有效的进行筛选与把控,在新媒体内容井喷式生产的时代背景下,大模型能力可以成为内容审核人员的一个好帮手。
智能文稿唱词系统:全面赋能行业融合创新
听见智能文稿唱词系统是一款以语音转写为核心的字幕和文稿制作软件,转写结果包括字幕模式和文稿模式,满足字幕制作和音视频整理成文字的需求。它集成采集,转写,音频编辑,翻译等功能于一体,可实现5-10分钟完成1小时的音频转写,通过文字剪辑音频的功能,让音频剪辑和文稿编写同时完成,帮助工作人员提高工作效率。
2017年讯飞听见与央总台技术局成立“智能语音课题”项目组,目前在包含国内及海外6个记者站、38个部门已经常态化使用;字幕制作效率提高3倍,结束了几十年“拍”字幕的历史,连续五年《春节联欢晚会》使用,并获得春晚十大技术创新与应用,工作人员从16人减少到4人、平均制作时间减少23%。
通过与总台用户合作建设的平台一体化人工智能媒体业务制作基座。当前服务已扩展至八个国家的多语种文本、字幕翻译制作,并在语音合成、图像识别等领域有深层次的业务化应用落地。
2018年,讯飞听见与新华社完成语音语言服务平台搭建,服务于总社编辑部门、国内外分社、直属企事业单位,在辅助新闻录音素材采集、视频素材唱词制作效率提升3倍,月平均2500小时 。又与人民日报成立“人民日报智慧媒体国家重点实验室”,为社内提供中英文转写、翻译服务,两会期间报道提供中英文实时字幕支持,发稿效率提升2倍。
在当前广播电视行业5G+4/8k+AI的技术发展背景下,从认知智能突破到感知智能的大规模与训练模型无疑是人工智能行业赋能媒体业务生产的又一重大突破,代表着从传统的机器内容识别与转换迈入了机器内容自主生成的新阶梯。
媒体产业发展进入全新阶段,讯飞听见希望能不断聚合广电行业力量,开放数字化平台能力,深化媒体融合发展,为合作伙伴赋能,助力实现新时代可持续发展“智慧媒体新未来”。