天眼查APP显示,近日,科大讯飞股份有限公司申请的“长文本训练数据生成方法、相关装置及计算机程序产品”专利公布。
摘要显示,本申请公开了一种长文本训练数据生成方法、相关装置及计算机程序产品,涉及人工智能领域,本申请首先获取长文本源数据,而后利用大语言模型的生成能力生成长文本源数据的相关问题和对应答案,并基于所生成的各答案之间的相似度进行答案自我一致性校验,确定出可信度最高的答案,作为最终答案,再利用长文本源数据、相关问题和对应的最终答案生成长文本训练数据,实现了长文本训练数据生成任务,提高了适用于长文本处理任务的训练数据配置效率和质量,为优化大模型在长文本处理任务上的模型性能提供基础。
(责任编辑:张晓波 )
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论