天眼查APP显示,近日,杭州热电集团股份有限公司申请的“一种无纸化会议的音频智能记录方法及存储介质”专利公布。
摘要显示,本发明提供了一种无纸化会议的音频智能记录方法及存储介质,可以利用目标图像检测模型对会议窗口对应的视频数据内的每个发言人进行身份识别、面部视频与嘴部视频获取,进而通过嘴部视频确定每个发言人的发言状态,并能从视频数据中获取每个发言人处于露脸发言状态时的目标视频。能通过目标声纹检测模型将会议窗口对应的音频数据按发言人的声纹类别行音轨分离,并将音轨分离得到的各目标音频与各目标视频的时间戳进行比对,进而将时间戳重合度最高的目标音频与目标视频进行匹配,从而能将同一所述发言人在相同时间区段内的目标视频和目标音频关联,得到对应的会议记录数据。
(责任编辑:刘畅 )
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论