| 序号 |
代码 |
股票简称 |
加入日期 |
入选理由 |
| 1 |
300168 |
万达信息 |
2025-11-24 |
2025年3月4日公司在互动平台披露:万达信息成功研发大模型医疗语料工具软件,可用于大模型医疗语料的治理、开发、整合及重构。 另外,万达信息和“小库”语料终端的发布者上海库帕思科技有限公司以及多家国产芯片厂商共同成立语料终端创新联合体。作为创新联合体的重要成员,万达信息凭借在医疗、智慧城市等领域拥有的丰富行业经验和大量的数据资源,为“小库”语料终端提供高质量的垂类语料数据与模型算法支持,进一步丰富语料终端的场景化智能应用行业覆盖范围。同时,万达信息在数据安全和隐私保护方面的技术积累,也将有助于提升语料终端的安全性和可靠性。
|
| 2 |
600308 |
华泰股份 |
2025-11-18 |
2025年11月17日公司在互动平台披露:公司全资子公司瞬捷数科的造纸行业AI语料库入选山东省重点行业语料库揭榜挂帅项目。该语料库计划整合造纸全产业链的多元数据,经专业处理后可支撑行业大模型的开发、训练与微调,适配自然语言处理等AIGC相关的AI任务。同时,公司通过研发的瞬捷云链造纸产业大模型,依托上述语料库支撑起造纸“产业大脑”、数字孪生工厂等项目,可以实现生产、质检等全链条的数智化协同。
|
| 3 |
300287 |
飞利信 |
2024-12-17 |
2024年12月10日公司在互动平台披露:公司旗下丽水云数据中心已升级为算力(智算)中心,并以此为依托展开了与各大人工智能产品厂商及技术研究机构的合作。在Ai语料方面,我们已完成了数据处理平台向模型训练数据准备(构造、标注、增强)平台的技术升级,并参与了相关行业标准的技术要求制定工作。
|
| 4 |
300248 |
新开普 |
2024-12-02 |
2024年10月30日公司在互动平台披露:新开普在人工智能领域积极探索,并逐步建立了自己的AI语料库,用于支持智能服务和产品的研发。公司语料库的构建结合了多个渠道的数据,包括获取版权和许可的私有数据和公开数据源,并针对收集到的数据做了严格的清洗和预处理,公司对语料库的维护,采用分层存储和分布式管理的方法,使用大数据处理技术实现数据的高效管理和快速检索,同时建立了完善的版本控制机制和数据更新流程。通过这些措施,新开普的AI语料库能支持多种应用场景,如智能推荐、语义理解、自动问答等,提高产品和服务的智能化水平。
|
| 5 |
688500 |
慧辰股份 |
2024-10-11 |
2024年9月27日公司投资者关系活动记录表披露:在算法模型领域,经过十余年服务超大型客户及公共服务领域的沉淀形成了行业知识库、算法模型库与大量专业数据分析报告等,为公司AI模型的训练提供了丰富的训练语料库,形成了面向领域场景的多个大模型生成技术,慧辰大模型内容生成算法、语音合成算法及数字人算法已经通过国家网信办互联网信息服务算法备案。具体在服务商业消费与营销类场景的产品,包括“慧AI”、“AIGC+洞察创新”、“AIGC+数字营销”、“AIGC+客户体验”、“AI数字分身”等,可全面赋能客户的商业运营。
|
| 6 |
601360 |
三六零 |
2024-09-11 |
针对世界前沿的AI技术和AI安全难题,360躬身入局大模型。依托多年人工智能技术积累及搜索浏览器等场景优势,360推出自研千亿参数的认知型通用大模型“360智脑”,可覆盖大模型应用所有场景,综合能力位列国内大模型第一梯队。同时,公司基于“360智脑”底层能力推出了税务大模型、安全万事通大模型、医疗大模型、保险行业知识大模型、政务大模型,问题识别准确率、回答准确率均达到95%以上。基于360智脑的能力将自有两大优势场景“360浏览器”“360搜索”颠覆式升级为“360AI浏览器”“360AI搜索”,市场反响强烈。2023年12月,在全国信息技术标准化技术委员会人工智能分委会全体会议上,国内首个官方“大模型标准符合性评测”结果公布,360智脑成为首批通过评测的四款国产大模型之一。依靠360浏览器、360搜索等高频流量入口,形成了10T+优质文本数据及海量图文视频数据,内容覆盖全球多个语种、涉猎金融、法律、房产、体育、医药等全行业范围,形式包括文档、书籍、散文、诗歌等,为大模型训练提供了大规模、多样性、高质量的训练语料。
|
| 7 |
002195 |
岩山科技 |
2024-06-26 |
2024年4月26日公司在互动平台披露:公司有自己的AI语料库,用于AIGC大模型的训练语料主要基于公司旗下上海二三四五网络科技有限公司拥有的数据及通过互联网获取的公开信息,经过大量数据清洗、整理工作而产生。
|
| 8 |
603888 |
新华网 |
2024-05-07 |
2024年4月29日公司在互动平台披露:新华网正积极布局人工智能大模型及其深度应用,拥有丰富权威的新闻和传媒数据作为专属大模型语料库建设基础,我司AIGC-Safe平台亦在通过采集大量国内外生成式视频内容训练AI鉴别模型。语料库建设会随着新华网在人工智能大模型领域应用场景的开发有序推进。
|
| 9 |
300785 |
值得买 |
2024-04-28 |
公司从最初的消费内容业务向智能营销等方向延展,可以借助更广泛的业务触达消费者、电商平台和品牌商,并依托所沉淀的消费数据对消费产业形成更深层次的理解。目前,随着公司逐步沉淀来自于消费内容业务板块和智能营销业务板块等的更多数据资源,已形成一个能够涵盖人、货、场等多种维度的底层数据体系。截至2025年6月末,公司商品数据库已经收录了34.7万+品牌、2290.9万+聚合商品。这些数据一方面提升了“什么值得买”平台结构化展示商品信息的能力,提升了“什么值得买”平台搜索与推荐内容分发的效率,提升了其他消费内容业务和智能营销业务的运营效率;另一方面对公司训练“值得买消费大模型”,以及为品牌提供围绕营销全链路的数据洞察和营销解决方案也发挥重要作用。
|
| 10 |
603721 |
*ST天择 |
2024-04-28 |
2024年是中广天择音视频数据算料业务的启动元年。公司聚焦大模型基模训练与垂直领域优化需求。公司以4K超高清专业级原生视频为核心的视频算料、以48kHz高保真音频垂类场景数据库为核心的音频算料,已实践将标注前置嵌入原数据生产工作流。自身专业的成建制算法研发团队对多模态算料的处理加工及精品定制数据等工作形成技术底座,构筑天择特有的精品算料数据库,形成“多模态融合+垂类精加工”的全链路算料体系。公司对国内大模型公司已完成交付数万小时音视频粗加工及精加工数据集,报告期已确认近500万元收入。
|
| 11 |
002343 |
慈文传媒 |
2024-04-20 |
2024年4月17日公司在互动平台披露:公司与多家AIGC公司就慈文传媒20多年来积累的丰富的视频语料数据库正在磋商相关合作,双方就对应的价格、合作的模式、授权的界定范围等均正在进行洽谈。
|
| 12 |
002878 |
元隆雅图 |
2024-04-08 |
公司持续强化AI技术驱动的差异化竞争优势,通过成立AI研究院,深度开发营销垂类AIGC模型,构建行业领先的AI数据中心。实现了产品创意设计、图文视频内容生产、达人智能匹配、IP数字资产生成等全流程AI化升级,显著提升业务效率与服务质量。公司自主研发的UOVAMETA平台已升级为SaaS多链数字私域社群运营平台,通过整合WEB3、AIGC文生图垂类模型、AR/VR及3D生成技术,打造虚实融合的快速开发能力。平台支持企业一站式完成数字藏品创作、沉浸式场景搭建及智能会员运营,为客户提供更高效的IP数字化营销解决方案。通过持续迭代AI技术与深化行业应用,公司构建了从内容生产到数字营销的全链路智能服务体系,进一步巩固了在创意营销与WEB3商业化方面的领先优势。2023年6月9日公司在互动平台披露:公司创意设计团队已经在使用ChatGPT及一些AI绘画工具辅助创意设计工作,以拓宽创意思路、提高工作效率。2024年5月22日公司在互动平台披露:公司基于新媒体营销业务长期积累的爆品文案,可以作为AIGC模型训练的语料。
|
| 13 |
600373 |
中文传媒 |
2024-04-08 |
在图书市场方面,据开卷数据显示,公司全年在综合零售市场实洋占有率为2.96%,实洋排名第4,实洋品种效率为1.89,同比上升3位,取得近年来最好水平。在“走出去”方面,公司积极谋划出访工作,向世界讲好江西故事,深度融入国外市场,高位推进合作项目,全年实现版权输出489项,涉及38个语种,37个国家和地区,其中17个项目入选“2023年经典中国国际出版工程”和“2023年丝路书香工程”,文化输出彰显实力。在教材教辅方面,公司顺利中标2023—2025年义务教育阶段免费教科书单一来源采购项目,夯实了未来三年经营发展基础。旗下发行集团在全国新华发行系统总体经济规模排名中位居第四,连续8年稳居全国同行业第一阵营,印发集团获评国家新闻出版署首批“国家印刷示范企业”称号,连续第9年荣登“中国印刷包装企业100强”排行榜,连续3年位列全国印刷集团总体经济规模综合评价第二位。
|
| 14 |
600839 |
四川长虹 |
2024-04-08 |
2024年7月2日公司在互动平台披露,长虹云帆AI平台拥有多维感知、多重理解、多任务管理、多模交互、内容激发的五大能力。目前该平台面向智能电视用户群体,基于公司对智慧生活的深刻理解,并依托更多传感设备和多重AI算法,深度理解用户行为意图,为用户提供更加精准、更多形式的内容和服务,例如全场景AI对话、AI壁画、口语陪练、全科知识问答、生成式内容创作等创新场景。目前该平台搭载在CHiQ品牌主销机型上。2023年报披露:智能电视方面,本集团聚焦“多模态交互、画质”等核心技术,形成了屏幕、芯片、内容、传输等关键环节的全链路8K完整解决方案,先后推出全球首台“超脑”AI大模型电视,全球首台星闪电视、全球首款超两万分区Mini LED ARTIST星箔电视、8K高清和288Hz高刷电视、200英寸巨幕激光影院等。
|
| 15 |
300341 |
麦克奥迪 |
2024-04-08 |
在医疗领域,历经十余年深耕,公司已累积超1,260万例DNA倍体宫颈筛查标本、40多万例其他组织DNA倍体标本及100万张典型病例数字病理切片,成为国内最大的病理数据库之一。这些数据不仅能为AI辅助诊断产品的开发提供海量训练基础,还能支撑公司利用数据推动病理科从传统模式向智能化、标准化转型;同时,智慧光学可协同开发硬件设备与AI软件,优化远程数字病理会诊系统的服务效率,未来进一步构建覆盖远程诊断、质控、教育培训的全链条智慧病理服务体系。
|
| 16 |
300369 |
绿盟科技 |
2024-04-03 |
2024年3月29日公司在互动平台披露:训练数据的来源、质量、多样性等因素在安全行业大模型的研发过程中起着至关重要的作用。公司经过多年的积累和转化,形成覆盖运营、攻防等多个方面的高质量语料数据体系,确保训练数据具备高质量、全面性和实时性,并做好数据隐私和安全保护以确保数据的合法获取和使用。
|
| 17 |
300413 |
芒果超媒 |
2024-04-03 |
2024年3月27日公司在互动平台披露:公司丰富的版权内容数据资产为“芒果大模型”(行业垂类大模型)的研发提供了高质量的训练语料。我们非常重视这些数据的价值开发,并将分类整理的数据用于“芒果大模型”的训练。近期,我们推出的国内首个AI导演“爱芒”,就是基于“芒果大模型”衍生的细分场景推理模型创新应用。爱芒在湖南卫视、芒果TV播出的《我们仨》节目中首秀,承担助理导演的职责,负责与艺人沟通确定节目行程、撰写分镜头脚本、创作文案、设计节目游戏、完成vlog剪辑等等。
|
| 18 |
300418 |
昆仑万维 |
2024-04-01 |
公司作为中国领先的人工智能科技公司,近年来在AI大模型、AI搜索、AI短剧、AI音乐、AI游戏、AI社交等多个领域取得了显著进展,构建了全面的AI业务布局。公司通过自研技术持续迭代“天工”系列大模型,在复杂任务处理、多模态等方面实现多项突破,整体AI技术实力稳居行业第一梯队。公司自研的AI音乐大模型达到行业SOTA,位居全球第一;公司开源的SkyworkR1V多模态思维链推理模型达到开源SOTA,位列全球同类型开源模型第一;公司面向AI短剧创作的SkyReels视频大模型达到全球领先水平。此外,公司旗下的大模型学习强化Skywork-Reward奖励模型亦达到全球第一,成为Kaggle官方推荐的数学rewardmodel。同时,昆仑万维积极推动AI技术的普惠化应用,开源多项核心技术,赋能全球开发者与用户,为全球AI生态建设不断贡献力量。
|
| 19 |
002362 |
汉王科技 |
2024-04-01 |
公司以AI技术为驱动,以“技术+服务”模式及App满足B端、G端、C端客户的数字化、智能化需求,并形成数据采集、数字化提取、知识图谱、数据分析、智能化数据输出的数据服务链及App等产品体系,目前客户主要包括司法、金融、人文、档案、医疗等重点行业客户及C端App用户。
|
| 20 |
000156 |
华数传媒 |
2024-03-27 |
公司拥有庞大的版权节目资源,与800多家内容供应商合作,拥有百万小时的数字化节目内容媒体资源库,包括电影、电视剧、综合资讯节目、娱乐综艺、原创动漫和音乐节目等,同时着眼优质内容聚合、垂直领域细分与本地内容运营。丰富的媒体资源储备为与运营商和终端厂商的长期合作奠定了基础,为用户提供多样化的收视内容。
|
| 21 |
002649 |
博彦科技 |
2024-03-25 |
在AI大模型领域,公司积极与国内外主流大模型厂商建立生态与技术协作关系,凭借在行业场景化落地的突出表现,荣获百度智能云“大模型最具成长伙伴奖”。依托原有“人工智能计算平台”技术基座,公司持续为行业客户提供涵盖数据标注、模型开发、训练、部署及推理服务的一站式解决方案。为进一步加速企业级AI应用进程,公司自主研发了具备可扩展性与集成能力的“AI Agent平台”,其采用模块化架构设计,可有效降低开发复杂度,实现与企业现有系统的无缝对接,形成灵活且可扩展的智能化解决方案,显著缩短AI项目交付周期。2024年内,公司已在金融、制造等领域成功落地多个大模型行业应用解决方案,其中与渤化资产的战略合作项目,在企业级层面有效助力客户的智能化转型。2023年7月28日公司在互动易平台披露:公司为部分客户提供AI大模型训练相关的语料、数据标注、数据训练等服务。
|
| 22 |
300229 |
拓尔思 |
2024-03-24 |
2024年,公司为解决各数据产品部门多源异构数据采集分散、治理割裂、标准缺失、应用滞后四大痛点,研发了拓思数据平台。该平台定位为拓尔思集团的企业级数据资产智能中枢,构建“采-存-治-用”全链路赋能体系,通过基础治理、智能增强、应用赋能三级架构支撑前台业务场景数星、网察、数家等数据服务产品实时数据调用,实现场景化服务支撑,推动数据要素向业务价值的深度转化,进一步释放数据资产潜能。截至2024年12月31日,公司累计采集的数据总量超5,000亿条。公司每日新增数据采集量平均约为5亿条以上,每年新增文本与图片超1,500亿条,短视频约400亿个,每年经处理后的文字与索引存储300TB以上。公司始终紧跟国家政策导向,是国内首批数据资产入表的上市企业之一。公司数据服务类OpenAPI已在北京、上海、深圳、郑州、湖南、浙江、贵阳、西部等数据交易所挂牌。另外,公司积极参与国家重要行业语料库的共建工作,如中国互联网安全协会数据集、CCI中国互联网语料集等。
|
| 23 |
002401 |
中远海科 |
2024-03-24 |
面对数字经济和人工智能的迅猛发展,公司聚合算力、数据、算法、场景等核心资源,明确“算力基础、数据供给、算法牵引、场景落地”为发展路径。公司已构建一个适当规模的算力资源池,通过公司自主研发的混合云计算管理平台,集私有云、公有云及容器云为一体,无缝集中管理跨多个数据中心的云计算资源。公司已研发形成支撑从数据采集、存储、分析、可视化展示、移动应用的数据中台技术架构体系,加速构建高质量的航运大数据集作为关键生产要素,以融合的多源数据为驱动,以机器学习、强化学习、深度学习等算法为工具,深度挖掘数据中的隐藏模式和规律,船视宝平台已经研发了超200种核心算法,能够自动识别和预测船舶的各种行为。
|
| 24 |
603000 |
人民网 |
2024-03-24 |
针对大模型存在的意识形态风险,实验室研发构建生成式AI内容安全评估体系,对国内主要的大模型进行多轮次评估。建设主流价值语料库,已完成3千多万篇基础语料、10万余对问答语料,并在部分大模型厂家得到应用验证,大幅提高了大模型的安全性。初步构建由“舆图-网络-决策”构成的境内外舆论传播认知技术体系。推出系列智能技术应用,包括“谛听”舆论安全风控平台、“天目”智能识别系统、“智晓助”涉政智能风控平台、“写易”写稿助手等。依托内容安全能力,人民网在以智能科技服务党政机关、教育医疗、企事业单位方面构建了独特优势,为公司内容风控、内容聚合分发、内容运营等业务全面赋能。2023年,成功推出大模型内容安全评估体系,建成主流价值语料库,推出面向党政应用的智能写作、 问答大模型“写易”,中标国务院办公厅2023年至2024年国家政务服务平台和国家“互联网+监管”系统运营服务项目,为中华全国总工会研发的智能写作平台成功上线。
|
| 25 |
300609 |
汇纳科技 |
2024-03-24 |
2024年,公司深度整合多模态大模型能力,建设了深度结合线下商业场景的大规模高质量多模态数据集,开发了新一代多模态细粒度行人Re-ID系统;面向垂直应用场景,全面整合LLM大模型、多模态大模型、AI Agent等AI技术能力,开发ASR语音转写、文本语义分析、图像理解与分析等垂类AI大模型,构建多个垂类AI场景解决方案,赋能餐饮零售、政务等泛行业客户;同时,面向海外业务场景,积极整合海外先进AI能力与自研产品,打造国际化AI客流解决方案。在数据要素方面,2024年,公司开发了汇纳大数据底座软件;综合运用区块链、数字身份DID、安全载体、可信时间戳、国密密码等技术,构建开发了汇纳可信数字身份系统、汇纳数据空间和安全交换平台等新解决方案,面向多场景推广应用。
|
| 26 |
300654 |
世纪天鸿 |
2024-03-24 |
公司基于30年所积累的专业化、系统化的教育内容,具备大模型训练三个必备要素之一的“语料”资源,由于该“语料”资源已经实现出版流程,其差错率达到万分之一以下,结合原有渠道优势可以在教育场景中开发基于大模型的垂直领域AI+教育应用。公司所投资的笔神作文在AI作文辅导领域持续突破,目前笔神作文APP累计用户超过2,200万,作文社区每月投稿量超过30万篇,积累了500多万篇的优质的作文语料。笔神作文的语料库积累了5年时间,超过30万篇基于人工反馈的专业微调数据,作为全国领先的中小学生作文学习平台和投稿社区,形成了较强的竞争壁垒。
|
| 27 |
300364 |
中文在线 |
2024-03-24 |
公司拥有海量优质正版内容资源和创作者资源,结合公司在文学领域的语料数据,目前公司自研的“中文逍遥”数字内容智能生成模型,在保留通用性能力的前提下有效提升小说创作质量,实现小说辅助创作、续写,以及基于角色设定的聊天机器人等功能。此外,公司也在研发推动更多AI多模态产品落地,目前公司已使用AI生成了漫画、动态漫。公司在AI多模态领域持续投入,未来在AI多模态加持下,IP开发制作难度大幅下降,制作周期大幅缩短,打破产能瓶颈,加速了IP商业化落地的进展,借助AI大幅提升公司IP的商业化变现速度。公司历经20多年数字文化领域深耕,沉淀丰富数字内容。公司基于自有大模型数据需求,不断整合高质量数据包含文字/音频/图片/视频等多种类型数据600TB,目前已有有声书及干音、百万量级中英文出版物、原创文学数据、视频数据,以及亿级图片、题库、期刊、行业问答、中外文平行语料等近40种文字和多模态语料及成品语料集。目前,公司已与数十家大模型建立数据及数据服务合作,其中包含央国企、互联网巨头及AI新势力等多家头部大模型。
|
| 28 |
300182 |
捷成股份 |
2024-03-24 |
作为国内领先的数字版权分销商、全媒体文化传播服务提供商、数字生活内容运营商,公司集版权采购、数字分销、内容运营于一身,携手国内外千余家出品公司,积累了10万余小时的影视、动漫、节目版权内容,面向广电、互联网新媒体、运营商等媒体渠道进行数字化发行,全面覆盖数字电视、OTT、IPTV、电脑、平板、手机、户外流媒体等全媒体终端。一个由“海量数字内容矩阵”、“全产业媒体发行集群”和“全媒体终端交互式覆盖”形成的“云”、“端”、“场”一体化的运营模式,带来了上中下游全产业融合式服务的文化传播生态。在人工智能快速发展的背景下,影视拍摄过程中大量的素材可以通过清洗、标注、加工等技术处理形成数据集成,作为AI模型训练的优质训练语料。公司作为国内领先的数字版权分销商,积累了海量的影视、动漫、综艺节目、纪录片内容,具备极佳的利用潜力。
|
| 29 |
300226 |
上海钢联 |
2024-03-24 |
作为行业领先的数据服务商之一,突破传统数据集成模式,聚焦AI技术与垂类大模型深度应用,构建“数据生产-智能分析-决策赋能”全价值链服务体系。公司积极探索行业大模型研发和另类数据采集领域,打造“大模型数据标注平台”,不断完善大宗商品行业垂类大语言模型“钢联宗师”及“小钢”数字智能助手,持续加码大数据能力、深化AI技术创新打造上海钢联EBC产品,提供数字化转型解决方案。以需求为导向强化数据产品开发和服务,为产业链上下游各类企业、金融机构、政府等主体,提供精准的数据跟踪、深入的市场洞察和先进的数据决策解决方案,推动大宗商品行业数字化进程进入“认知智能”新阶段,与客户共同迈向创新突破和可持续发展之路。2024年8月,“上海钢联大宗商品价格智能预测算法”成功通过国家网信办备案,是国内大宗商品价格智能预测领域首个通过的算法备案;同年12月,“上海钢联宗师大宗商品行业垂直大模型算法”成功通过国家网信办备案;“小钢”数字智能助手1.6版本也获得了行业与相关部委的认可。
|
| 30 |
000681 |
视觉中国 |
2024-03-24 |
平台拥有可供版权授权的内容超过5.4亿,包括摄影、矢量图、视频、音乐、3D模型等各种类型的素材,是全球优质的同类视觉内容数字版权交易平台之一。平台聚合的海量、高质量、版权合规的内容数据,也是构建可信人工智能模型的关键基石,公司以应用为导向,持续加强人工智能高质量数据集建设,平台拥有可供AI大模型训练的合规内容数据超过7亿,位居行业领先地位。平台在人工智能产业链中凭借自身数据资源与场景应用优势,构建了覆盖数据采集、标注、审核、认证及授权的全链路AI大模型数据服务解决方案,已成为国内领先的多模态数据授权商。
|
| 31 |
002908 |
德生科技 |
2024-03-24 |
2024年3月6日公司投资者关系活动记录表披露:2023年底公司基于一卡通场景的服务积累,推出基于民生行业大模型的便民服务站(数字公务员),并已在青岛、南昌、东莞等地市试点,在推行过程中得到政府、银行的高度认可。服务站是政府服务、银行服务、及公司业务的核心引擎,通过人机交互的方式,服务下沉到基层。目前服务站训练的方向主要跟就业、社保、五险一金相关,根据不同地市的模型需求,也会包含其他个性化运营。公司智能知识运营服务已在全国60多个地市部署,为公司训练大模型积累了大量的语料,公司将在此基础上持续升级训练,目前已有近十个地市有明确的需求,订单量正在逐步增加。
|
| 32 |
300133 |
华策影视 |
2024-03-24 |
在人工智能快速发展的背景下,影视拍摄过程中大量的沉没素材可以通过清洗、标注、加工等技术处理形成数据集成,作为AI模型训练的优质训练语料。公司作为国内年产规模最大的影视公司,历史积累的原始拍摄素材数量庞大,具备极佳的利用潜力。公司已设立AIGC应用研究院,配置人工智能专家、AI人机共创复合型人才、影视数据专家等专职人才,以及专用设备、专项研发和投资资金。AIGC应用研究院的设立,是公司全面推进AIGC产业布局,以AIGC技术为核心驱动力量,在影视创意、制作、传播的全链条实现企业核心能力提升和商业模式创新,加快新技术在行业应用落地,实现企业高质量发展的重要一环。目前,公司已形成“全员知AI、会AI、用AI”的创新氛围,成为当前影视公司AIGC应用中的领跑者。
|
| 33 |
603533 |
掌阅科技 |
2024-03-24 |
2023年4月27日公司投资者关系活动记录表披露:首先,IP对于数字阅读垂直领域的模型非常有价值,我们也在把优秀的IP语料灌输到模型当中,来提升模型的AIGC智能化程度。其次,在IP衍生方面,AI可以帮助提升降低IP衍生成本,提升制作效率,从而提升IP衍生价值。在数字阅读垂直领域的模型当中,数据是非常有价值的,我们有近300TB的数据集,在业内处于领先地位。我们希望自身优质的语料数据能够用来训练我们自己在数字阅读垂直领域的模型,打造自身的竞争优势。
|
| 34 |
600100 |
同方股份 |
2024-03-24 |
在知识内容与服务领域,同方知网继续深耕于大规模集成化数字出版、超大型中外文知识资源数据库建设及数字出版、知识管理和智能信息处理技术研发,不断加快产品服务模式创新和技术革新,引领行业发展。2024年上半年,国家知识产权局中国专利信息中心与同方知网签署战略合作协议,双方将共同开展项目合作、数据对接及相关产品研发,为知识产权和科技信息服务等领域提供切实有效的解决方案;同方知网中标由中国科学技术协会科学技术创新部组织实施的“2024年度科技期刊双语传播工程”项目;同方知网策划开展“数字阅读”进机关、进校园、进法检、进企业、进医院等系列公益活动,累计为100余家机构开通新时代智慧党建学习平台等党政行业数据库阅读服务。针对企业科研人员,同方知网联合中国电子学会等8家行业组织发起“知识赋能创新发展”科技创新知识服务季活动,为180余家企业科研人员、科研管理人员提供高效知识服务。同方知网将知识传播与健康事业深度融合,推广中国医院知识总库CHKD、临床诊疗知识库、医药知识资源总库等专业知识库数字阅读体验。
|
| 35 |
601858 |
中国科传 |
2024-03-24 |
知识服务业务是基于海量的、权威的、系统的科技内容资源,通过对内容资源的碎片化、标引、语义关联、深度挖掘和系统分析,为科研用户提供面向科研立项、文献检索分析、实验模拟、文献撰写与成果发表、学术传播交流等整个科研生命周期的多元化、立体化、定制化服务。目前公司在知识服务业务板块主要布局了专业学科知识库、数字教育云服务、医疗健康大数据、期刊融合平台四大方向,已开发上线了“科学文库”“科学智库”“中国生物志库”“中科云教育平台(CourseGate)”“中科医库”“SciEngine全流程数字出版与知识服务平台”等多个数字化平台,为用户提供系统化的“科研解决方案”。
|
| 36 |
605186 |
健麾信息 |
2024-03-24 |
2024年3月21日公司在互动平台上披露:截至目前,公司累积的处方单数据已高达数十亿条,增长速度在10%左右。这些数据主要源自国内各大医院药房部门的处方药发药记录。全国百强医院中超过半数都是公司的合作伙伴,共同构建了强大的合作网络,确保了数据的专业性和参考价值。同时,公司拥有成熟的数据脱敏技术,能够在保护用户隐私的同时,确保脱敏后的数据可用于支持国内大型模型的训练工作。
|
| 37 |
688787 |
海天瑞声 |
2024-03-24 |
2024年3月15日公司在互动平台上披露:公司是专业的人工智能训练数据服务提供商,目前正在围绕AIGC/大模型数据服务领域进行投入、建设。一方面,公司将基于现有商业模式,开发大模型相关的专业训练数据集,该数据集建成后,将提供可供大模型训练和评测的不少于10个品类的专业数据集,显著提升行业内面向大模型训练数据集的类别和质量,协助实现公共数据、社会数据等各类高价值数据资源汇聚,实现基于大模型通用能力和垂直领域数据的训练学习。另一方面,公司计划将研发设计数据生产垂直大模型,公司全栈自研的数据生产垂直大模型,将可辅助完成面向多个下游任务的数据设计与处理规则,形成包括数据清洗方案设计、指令方案设计、指令泛化与迁移、指令数据验证、多模态数据方案等在内的多项生成能力,以及在上述方案下的原始数据及标注成果生成能力。 公司已与相关客户签订了大模型训练数据集相关的业务合同或意向订单。此外,公司已与其他大模型领域的知名机构签署了合作协议,未来拟围绕人工智能大模型数据处理技术、大模型数据集供给和大模型评测等方面进行合作。
|