合合信息“百宝箱”亮相长沙程序员节,助力开发者文档处理高效升级

2024-11-18 11:30:53 商务信息

近日,第五届长沙·中国1024程序员节在湖南长沙隆重举行。本次大会由湖南省工业和信息化厅、湖南湘江新区管理委员会、长沙市工业和信息化局、长沙信息产业园管委会以及CSDN联合主办,汇聚了众多科技精英与开发者,共同探讨编程技术的最新进展与创新应用。

大会期间,合合信息向广大开发者推出了智能文档处理“百宝箱”系列产品(简称“百宝箱”),并提供了免费体验机会。“百宝箱”覆盖文档处理流程的多个节点,包括解析界面可视化、关键信息提取、解析效果测评等,能够批量、高效地解析多种版式的文档材料。针对文档解析精度低、解析效果评估难以及大模型幻觉等问题,“百宝箱”提供了全面而有效的解决方案。

长沙·中国1024程序员节《模型与工具》论坛现场

在长沙·中国1024程序员节的《模型与工具》论坛上,合合信息智能创新事业部研发总监常扬详细介绍了“百宝箱”的三大产品。他表示,对于技术人员而言,一款能够“开箱即用”的工具能够极大地提升开发效率。为解决个人及中小型企业技术人员在开发过程中遇到的“水土不服”问题,合合信息发布了一组文档解析界面前端可视化组件,开发者可以通过这些组件对解析效果进行交互,实现更高精度的解析和个性化开发。

文档解析可视化前端界面

此外,“百宝箱”还开源了合合信息自研的文本向量模型代码——acge模型。这款模型曾在2024年3月荣登C-MTEB榜单第一名,支持长文档嵌入检索,兼顾效率和性能,能够有效提升大模型RAG应用效果。目前,acge模型在开源机器学习社区和模型库Hugging Face平台上的单月下载量已达到30,423次,为越来越多的开发者提供了优化大模型性能的有力支持。

针对市面上文档解析产品效果缺乏统一标准的问题,“百宝箱”中的“文档解析测评工具”为开发者提供了定量测评依据及服务。该工具从表格、段落、标题、阅读顺序、公式等多维度对文档解析工具进行筛选,并以雷达图等可视化形式展示结果,帮助开发者直观地看到文本识别、解析和翻译的效果,从而节省筛选时间。

会上,常扬还分享了“智能文档处理百宝箱”在知识库搭建、智能文档抽取、大模型预训练语料与数据治理快速入库以及文档翻译场景中的深度应用。通过这些应用案例,合合信息展示了“百宝箱”在提升文档处理效率和准确性方面的巨大潜力。

未来,合合信息将继续致力于提升智能文档处理技术的效率和准确率,为知识库产品开发提供有力支持,推动文档处理技术的不断创新与发展。

【免责声明】此文内容为本网站转载其它媒体或转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。

(责任编辑:董萍萍 )

【免责声明】【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读