来源 :格灵深瞳2026-01-09
岁末年初,多家媒体发布2025年度奖项评选结果,涵盖AI技术创新、产品应用、上市公司投关等多个领域。格灵深瞳入选机器之心、证券之星、同花顺等多项榜单。
格灵深瞳深耕视觉算法与多模态大模型,持续构建“模型算法–产品方案-AI服务”的端到端能力,致力于AI技术在多元场景下的落地应用,赋能千行百业智能化升级。
在核心技术方面,格灵深瞳自主研发视觉基础模型GLINT-MVT,基于多年视觉算法积累,在传统ViT架构上改造增强,大幅提升图像分割任务性能,加强图像理解与泛化能力,能更快、更好、更广泛地支持下游任务。GLINT-MVT v1.5不仅入选国际顶级学术会议ICCV 2025,还收获Highlight论文荣誉。对比其他视觉编码器(如OpenAI的CLIP、谷歌的SigLIP),GLINT-MVT v1.5在OCR任务上表现更优,在局部和文字特征上具有更好的表达能力。在此基础上,团队对视频进行高效编码,即将发布GLINT-MVT v2.0,统一支持图片视频,提升视频特征表达能力。
基于GLINT-MVT模型基座,格灵深瞳构建多模态大模型LLaVA-OneVision-1.5(4B & 8B),使用超过8500万中文数据进行训练,成本不超过1.6万美元。GLINT-VLM在全球知名开源社区LLaVA发布,将训练数据、代码和模型权重全链路开源。在多项公开多模态基准上,LLaVA-OneVision-1.5表现优于同等规模的Qwen2.5-VL。
在AI Infra方面,格灵深瞳通过高质量数据清洗、自研训练框架和异构推理框架,三大核心要素协同优化,可将训练数据量需求减少50%,模型FLOPs利用率提升30%,推理性能提升20%,实现以更少资源投入获取更高模型性能,为企业提供经济高效的AI解决方案。
针对视觉算法开发周期长、端侧适配复杂等痛点,格灵深瞳推出一站式边缘端开发平台GLINT AI Edge Studio。通过自研GLINT-MVT、Adapter-Tuning训练技术及统一推理框架,平台能够快速构建高性能视觉模型、自动适配多种边缘设备,全面解决视觉应用规模化落地的难题,确保各类边缘业务的稳定可用与高效运行。平台即将开放邀请制内测。
在行业应用方面,格灵深瞳已将核心技术转化为面向智慧金融、城市管理、政务及特种、智慧体育等多领域的人工智能产品及解决方案,并根据客户需求不断优化升级。
智慧金融领域,推出元识·金砖/睿镜视频智算系统和元识·S-Agent金融超级助手两大拳头级产品方案,全面深入银行核心业务场景。系统平台已服务多家银行,实现安防、运营与业务流程智能化;
城市管理领域,深瞳“战狼”多模态解决方案搭载新一代VLM,采用全国产化方案对视频图像数据解析,满足多警种需求,广泛应用于公安实战;
政务及特种领域,推出软硬件一体化AI基础设施与智能体开发平台,涵盖支持国产化部署的多款大模型一体机与AIPC,可提供开箱即用、安全可控、全栈国产化的智能政务能力,打通政务信息化场景下智能体落地的最后一公里;
智慧体育领域,产品方案已从体育中考延展到校园场景闭环,构建校园体育教学、训练与测试的新形态。近期智慧体育解决方案已在湖南、四川等地落地应用。
此次入选多家媒体榜单,既是对格灵深瞳的支持与认可,也是鼓励和鞭策。新的一年,格灵深瞳将持续在技术与产品解决方案上进行端到端迭代创新,打磨优化AI服务能力,赋能行业客户将AI能力融入核心业务,与客户共同成长,真正实现AI时代的效率提升与智能化升级。