chaguwang.cn-查股网.中国
查股网.CN
金山办公(688111)内幕信息消息披露
 
个股最新内幕信息查询:    
 

金山办公再获AI国际顶会肯定,Monkey 多模态大模型被CVPR 2024接收

http://www.chaguwang.cn  2024-03-25  金山办公内幕信息

来源 :IT之家2024-03-25

  继 WPS AI 正式开启公测,实现 AI 技术在国内办公领域的率先落地之后,近日,金山办公技术上又有新进展。金山办公与华中科技大学联合研发的 Monkey 多模态大模型,被人工智能领域的国际顶级会议 CVPR 2024 接收。与此同时,金山办公还与华科大围绕“Monkey”在文档领域进行重要升级,推出文字多模态大模型 TextMonkey,在多项文档理解任务上取得国际领先,向通用文字识别迈出坚实的一步。

  “Monkey”发布于 2023 年年底,是金山办公与华中科技大学软件学院联合研发的多模态大模型。该模型能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。这一成果还曾在 Meta AI 公认的国际权威“司南”多模态大模型排行榜中名列开源模型榜首,仅次于行业领先者 OpenAI 的 GPT4V 以及谷歌的 Gemini 等闭源模型。

  而近日,金山办公与华科大再次升级推出文字多模态大模型 TextMonkey,更是突破了通用文档理解能力的边界。在场景文字识别、办公文档摘要生成、数学问题解答、文档版式分析、表格理解、图表问答以及电子文档关键信息抽取等 12 项权威文档数据集上取得了显著成果。

  例如,TextMonkey 可以用于帮助用户解答数学题并给出解题步骤,推动教育自动化的发展;TextMonkey 还能够帮助人们理解结构化图表、表格以及文档数据,通过将图像内容转化为轻量级的数据交换格式,方便记录和提取。由于 TextMonkey 模拟了人类视觉认知的方法,这使它能自然而然地识别高清文档图像中各部分的相互关联,并灵敏地鉴别出图像内的关键要素。并且,基于对用户多样化需求的深入理解,TextMonkey 可以通过文本定位技术强化了答案的准确性,提升了模型的解释性,有效提高了在处理各类文档任务上的表现。

  

  当前,随着企业加速数字化转型,文档与图像的多模态结构化分析及内容提取显得尤为关键。无论处理的是随意拍摄的图片、电子文档、办公软件文件还是图表分析报告,快速、自动化、精确的数据处理对于提升企业的生产效率具有决定性意义。TextMonkey 的推出,创新性地为办公自动化、智慧教育、智慧金融等领域的技术突破带来了通用解决方案,为全面提升通用文档理解能力带来曙光。

  值得一提的是去年 4 月份,WPS AI 首次亮相,金山办公将 WPS AI 定位为大语言模型的应用方,将应用大模型重构办公软件,为用户提供 AIGC(内容创作)、Copilot(智慧助理)和 Insight(知识洞察)三方面全新的产品体验。去年 11 月,WPS AI 正式开启公测实现 AI 技术在国内办公领域的率先落地。

  在企业用户市场,金山办公推出办公新质生产力平台——WPS 365,并通过 WPS 365 将 AI 技术开放赋能给企业客户。AI 的应用让 WPS 365 变得更加智能和高效,无论是文档编辑、数据分析还是企业项目管理,AI 都能提供精准高效的支持,极大提升企业的工作效率。WPS 365 还提供 WPS 协作,打造以 IM 为核心的协同办公平台,减少团队成员的沟通成本,帮助企业构建更加紧密和高效的团队。

  加码 AI 和协作,为金山办公业务的快速增长注入了动力。根据金山办公最新财报显示,2023 年,金山办公营收与净利润全面增长,营业收入 45.56 亿元,同比增长 17.27%;归属于母公司所有者净利润 13.18 亿元,同比增长 17.92%。主营业务中,订阅业务作为金山办公核心的增长引擎,2023 年收入 36.11 亿元,占总收入比 79%,同比提升 8 个百分点。

  2024 年,金山办公将继续秉持“技术立业”和“用户第一”的理念,围绕“多屏、云、内容、协作、AI”战略,为来自全球 220 多个国家和地区的用户提供办公服务。

有问题请联系 767871486@qq.com 商务合作广告联系 QQ:767871486
www.chaguwang.cn 查股网