chaguwang.cn-查股网.中国
查股网.CN

AI语料库概念股龙头股&AI语料库板块成分股

 
沪深个股板块DDE历史数据查询:    
 

◆成份股◆

序号 代码 股票简称 加入日期 入选理由
1 603888 新华网 2024-05-07

2 300785 值得买 2024-04-28

2024年4月8日公司在互动平台披露:公司已经在消费内容社区“什么值得买”中部分商品详情页面接入了Kimi,为用户提供商品提炼总结服务。未来,我们还将根据对此次接入情况的评估,决定是否将Kimi接入到更多的场景中。此外,公司拥有大量优质的消费内容和消费数据,是一个非常好的语料资源,我们双方团队正在合作,将我们脱敏后的消费内容和消费数据的API开放给Kimi,帮助Kimi提升在消费类问答中的表现。

3 603721 中广天择 2024-04-28

2024年4月10日公司在互动平台披露:公司多年来一直从事纪实类等视频节目生产,囤积大量的优质视频素材,可以为AI模型训练提供丰富的语料,近期分别为不同的客户输送了定制化的算料交付。

4 002343 慈文传媒 2024-04-20

2024年4月17日公司在互动平台披露:公司与多家AIGC公司就慈文传媒20多年来积累的丰富的视频语料数据库正在磋商相关合作,双方就对应的价格、合作的模式、授权的界定范围等均正在进行洽谈。

5 002878 元隆雅图 2024-04-08

公司拥有国内顶尖的创意策划和产品设计专业团队。公司是北京市设计创新中心、北京高精尖产业设计中心,自主创新积累有效知识产权超600项,成果荣获德国红点奖、iF设计奖、中国设计红星奖等国际国内知名奖项50余项。公司设计生产的2022年北京冬奥会及冬残奥会特许产品获北京冬奥组委主办创意设计奖项21项。子公司谦玛网络先后获得戛纳、长城、Oneshow、虎啸、数英、DMAA、Topdigital等100多项奖项。公司持续推进大IP战略,通过原创及多种授权合作方式不断扩大IP资源库,包括体育、动漫、游戏、文旅文博、国潮、原创艺术等多种类型的IP,打造能满足不同人群及多种场景需要的IP矩阵。公司是2008年北京奥运会、2010年上海世博会、2014年南京青奥会、2022年北京冬奥会及冬残奥会、成都第31届大运会等大型赛会的特许生产商和特许零售商,以及杭州第19届亚运会特许零售商。已签约NBA、环球影业、卢浮宫、TEAMCHINA(中国国家队)等多个知名IP。公司与北京海淀文旅签订了战略合作协议,开展海淀区“三山五园”IP数字化及运营合作,已落地数字圆明园建设、圆明园IP数字文创及实物周边开发项目。公司针对不同IP的特点,进行头部、腰部、尾部IP的分层次开发运营,已形成IP文创衍生品设计开发、数字文创设计与发行、IP内容创意、制作及传播、IP电商运营等一体化的全方案、可复制的IP运营体系。

6 600373 中文传媒 2024-04-08

据开卷数据显示,2023年上半年,中文传媒在全国图书零售市场实洋排名第6,实洋占有率为2.87%,实洋品种效率为1.76;电商渠道实洋占有率为3.1%,排名第5。在原有产品线继续保持良好销量的同时,新开发的产品线也已初显成效。如原有产品线《大中华寻宝系列》全系列发货码洋超过5亿元,《不一样的卡梅拉》累计销量达1.25亿册,保持了强盛劲头;新产品线《屁屁侦探》累计销量达892万册,已初现成效。此外,在今年参与的国内重要书展中,实现出版物版权输出157种,是上届的2倍多;公司精彩亮相第十九届深圳文博会和江西数字文化产业展,重点展示成果得到各方好评。

7 600839 四川长虹 2024-04-08

2024年4月1日公司在互动平台披露:公司有自建的AI语料库,主要用于AI相关算法、产品场景的研究应用。

8 300341 麦克奥迪 2024-04-08

历经十余年的耕耘,医疗业务所属质控中心数据库积累异倍体定量筛查诊断标本超过1,500万例,典型病例数字病理切片200多万张,这些数据将会是人工智能(AI)产品开发的基础。在此基础上,光电业务可开发硬件设备匹配相关应用软件,生产系列的AI人工智能辅助诊断产品。有效提升运营近十年的远程数字病理会诊系统服务效能,使远程会诊服务更具有效率。麦克奥迪历经三十年的市场磨砺,公司始终注重品牌的市场影响力及知名度。“MOTIC”品牌在谷歌搜索引擎上已有百万以上词条,成为享誉世界的民族品牌,并拥有NATIONAL、SWIFT、CLASSICA等光学显微镜品牌。光学显微镜产品获得法国科技质量监督评价委员会授予的“高质量科技产品”和“向欧盟市场推荐产品”,福建省对外贸易经济合作厅授予的“福建省重点培育和发展的国际知名品牌”。智能电气产品同样在行业内也是属于“隐形冠军”,在细分领域成为行业龙头。品牌优势与认可度,是参与市场竞争的重要助力。通过长期的勤恳奋斗与扎实积累,在客户心目中树立一个具有持续创新力、产品可靠、技术领先的企业形象。

9 300369 绿盟科技 2024-04-03

2024年3月29日公司在互动平台披露:训练数据的来源、质量、多样性等因素在安全行业大模型的研发过程中起着至关重要的作用。公司经过多年的积累和转化,形成覆盖运营、攻防等多个方面的高质量语料数据体系,确保训练数据具备高质量、全面性和实时性,并做好数据隐私和安全保护以确保数据的合法获取和使用。

10 300413 芒果超媒 2024-04-03

2024年3月27日公司在互动平台披露:公司丰富的版权内容数据资产为“芒果大模型”(行业垂类大模型)的研发提供了高质量的训练语料。我们非常重视这些数据的价值开发,并将分类整理的数据用于“芒果大模型”的训练。近期,我们推出的国内首个AI导演“爱芒”,就是基于“芒果大模型”衍生的细分场景推理模型创新应用。爱芒在湖南卫视、芒果TV播出的《我们仨》节目中首秀,承担助理导演的职责,负责与艺人沟通确定节目行程、撰写分镜头脚本、创作文案、设计节目游戏、完成vlog剪辑等等。

11 300418 昆仑万维 2024-04-01

公司将全力推进“昆仑天工”系列模型的研发与迭代升级,不断加强在相关方向的技术积累,以建立昆仑万维在人工智能领域的领先优势。2023年年内,公司将陆续发布音乐AI和游戏AI产品。在音乐方向,公司在完善现有模型算法的同时,将推出一系列音乐AI产品及内容,并将其融入现有产品生态。一方面赋能音乐创作者,通过提供行业领先的AIGC生产力工具,让其可以更高效地进行音乐创作;另一方面丰富StarMaker平台玩法与内容,为广大消费者带来更加精彩的音乐体验。此外,我们将与其他领域的头部企业和机构合作,共同推动音乐AI技术的发展进步。我们相信基于AI技术的新型音乐产品将为公司带来新的竞争优势,并进一步巩固我们在音乐AI领域的领先地位。在游戏方向,公司将通过人工智能技术赋能游戏制作,从而提高游戏开发的效率和质量,并加强游戏的多样性与可玩性。针对企业端,AI可以在游戏设计阶段,协助团队进行建模、美术素材生成、动画设计、纹理生成等工作,从而大幅压缩成本,提高效率;同时AI还可以协助游戏制作人员进行角色设计和游戏世界构建,提供更加引人入胜的游戏体验。针对玩家端,AI可以在游戏时为玩家提供更加智能化与个性化的游戏体验。例如,通过AI生成的游戏剧本和NPC角色,使游戏世界更加立体、真实。我们将持续探索并打造更加优秀的游戏AI产品,满足开发者和玩家的需求与期待。

12 002362 汉王科技 2024-04-01

2023年内,公司启动语音识别、语音合成、声纹识别的技术研发,并低成本高效率的取得技术突破,形成包括文字、图像、语音、视频在内的多模态数据在内的识别核心技术体系。基于大模型实际场景落地的出发点,结合公司资金、技术、资源等实际情况及对行业数据、行业背景知识理解的优势,公司聚焦AI行业大模型的研发,并于2023年10月12日发布具有“数据私有化、算力低成本化、深度专业化、知识实时化、生成精准化”五化特质的汉王天地大模型,旨在解决客户在应用大模型时对成本负担、数据安全、生成准确性等疑虑。目前,汉王天地大模型已经通过国家《生成式人工智能服务管理暂行办法》备案。目前汉王天地大模型已应用在公司智能办公本、智能电纸学习本系列产品的部分功能模块中,赋能产品实现话稿整理、会议纪要生成、智能判题等功能,未来公司更多智能硬件亦将搭载AI模型,帮助用户实现更多的AI功能。公司自研的古汉语大模型,构建了包括古籍句读、文言文转白话文、信息抽取、古籍档案智能著录等AI工具,同时将大模型语义理解能力与专业知识库的数据融合,大幅提升古汉语大模型的定向问答能力。经过人机多维度的对比评测,公司古汉语大模型在古籍的信息抽取与整理、历史人文知识问答以及古文翻译、诗词写作、对联等古文理解、演绎等能力上的综合表现优于通用大模型。2023年内,古汉语大模型在某省级档案馆落地应用,并入选北京市人工智能行业大模型创新应用白皮书。

13 000156 华数传媒 2024-03-27

公司吸纳国内外100多家知名节目内容供应商和众多普通节目内容供应商参与建设节目内容合作体系,已建成全国最大的数字节目内容库之一,拥有百万小时的数字化节目内容媒体资源库,包括电影、电视剧、综合资讯节目、娱乐综艺、原创动漫和音乐节目等,同时着眼优质内容聚合、垂直领域细分与本地内容运营。公司已上线求索4K超高清频道、央视4K轮播频道、4K超高清点播专区,打造真正的4K超高清家庭影院。丰富的媒体资源储备为与运营商和终端厂商的长期合作奠定了基础,为用户提供多样化的收视内容。

14 002649 博彦科技 2024-03-25

2023年7月28日公司在互动平台披露:公司也为部分客户提供AI大模型训练相关的语料、数据标注、数据训练等服务。

15 300229 拓尔思 2024-03-24

目前,公司拥有规模位列业界前茅的、经过领域知识加工的权威高质量公开数据1500亿+,涵盖近10年来的报刊数据、互联网主流新闻数据、新闻资讯客户端数据、政府类门户网站数据、权威第三方平台数据及行业资讯数据等。公司正积极与多家大模型头部厂商洽谈数据服务合作业务。未来,公司有望为全国更多MaaS服务商提供不同垂直领域的高质量预训练数据服务。

16 002401 中远海科 2024-03-24

2024年1月4日公司在互动平台披露,目前公司的船视宝数据产品在上海数据交易所挂牌,上海数据交易所搭建了良好的数据要素交易平台生态的功能,公司积极借助上海数据交易所的平台进一步推动公司相关服务的宣传营销和市场推广。

17 603000 人民网 2024-03-24

针对大模型存在的意识形态风险,实验室研发构建生成式AI内容安全评估体系,对国内主要的大模型进行多轮次评估。建设主流价值语料库,已完成3千多万篇基础语料、10万余对问答语料,并在部分大模型厂家得到应用验证,大幅提高了大模型的安全性。初步构建由“舆图-网络-决策”构成的境内外舆论传播认知技术体系。推出系列智能技术应用,包括“谛听”舆论安全风控平台、“天目”智能识别系统、“智晓助”涉政智能风控平台、“写易”写稿助手等。依托内容安全能力,人民网在以智能科技服务党政机关、教育医疗、企事业单位方面构建了独特优势,为公司内容风控、内容聚合分发、内容运营等业务全面赋能。2023年,成功推出大模型内容安全评估体系,建成主流价值语料库,推出面向党政应用的智能写作、 问答大模型“写易”,中标国务院办公厅2023年至2024年国家政务服务平台和国家“互联网+监管”系统运营服务项目,为中华全国总工会研发的智能写作平台成功上线。

18 300609 汇纳科技 2024-03-24

2023年9月20日公司在互动平台上披露:公司实体商业数据库包括商业环境、商圈概况、商场基础信息、商场品牌库、互联网数据等多维度数据,其数据来源主要基于公司独有的多年线下客流数据积累,以及公司通过团队自采、业务合作、数据采购与AI建模客流投射等多种方式获得的各维度数据。基于上述数据库,公司针对零售门店开发了包含门店网络规划、选址评估、运营状态监测、未来表现预测以及市场变化趋势分析等数据服务产品,目前签已约Apple、Adidas、Under Armour等多个国际一线品牌。

19 300654 世纪天鸿 2024-03-24

凭借强大的内容研发能力,公司具备快速应对考试改革与教材变化的能力,并可以为大模型训练提供优质语料。同作为大模型训练三个必备要素之一的“语料”,公司基于近30年所积累的专业化、场景化的教育内容,成为无论是通用大模型还是垂直领域精准模型都必不可少的来源之一。作为公司在探索人工智能在智慧教育场景的落地与应用,实现教育内容人工智能升级的重要实践,公司所投资的笔神作文在AI作文批改领域持续突破,目前笔神作文APP注册学生用户超过1600万,月活用户180万,作文社区每月投稿量超过30万篇,积累了500多万篇的优质的作文语料。笔神作文的语料库积累了4年时间,超过30万篇基于人工反馈的专业微调数据,作为全国领先的中小学生作文学习平台和投稿社区。

20 300364 中文在线 2024-03-24

2023年11月6日公司在互动平台上披露:公司深耕文化数字产业20余年,拥有海量的正版中文数据资源,数据总量超过60TB,旗下各个平台每天还会产生数以亿计的文字内容。同时公司也在为全市场的中文电子数据提供存证服务,使用公司自研的区块链国密算法+哈希值校验+区块链的技术手段,实现结果秒级上链实时核验,可为创作者快速确权。基于海量数据的内容优势,公司已跟多家模型公司签署数据采购协议,并推出“中文逍遥1.0”大模型,可实现一键生成万字,一张图写出一部小说,一次读懂100万字小说。

21 603533 掌阅科技 2024-03-24

2023年4月27日公司投资者关系活动记录表披露:首先,IP对于数字阅读垂直领域的模型非常有价值,我们也在把优秀的IP语料灌输到模型当中,来提升模型的AIGC智能化程度。其次,在IP衍生方面,AI可以帮助提升降低IP衍生成本,提升制作效率,从而提升IP衍生价值。在数字阅读垂直领域的模型当中,数据是非常有价值的,我们有近300TB的数据集,在业内处于领先地位。我们希望自身优质的语料数据能够用来训练我们自己在数字阅读垂直领域的模型,打造自身的竞争优势。

22 601858 中国科传 2024-03-24

目前,公司年出版新书超过3000种,已累计出版图书超过5万种,出版领域涉及科学(S)、技术(T)、医学(M)、教育(E)、人文社科(H)等多个学科,是国内学科分布最全、出版规模最大的综合性科技出版机构。公司作为国家级的科技期刊出版基地,目前出版期刊568种,其中中文期刊258种,英文期刊276种,中英文期刊8种,法文/法英期刊26种;共有143种被SCI、ESCI收录,其中59种期刊处于Q1区,4种期刊国际同学科期刊排名第一,28种期刊居国际同学科期刊排名前10%。

23 600100 同方股份 2024-03-24

在知识内容与服务领域,公司继续深耕于大规模集成化数字出版、超大型中外文知识资源数据库建设及数字出版、知识管理和智能信息处理技术研发,不断加快产品服务模式创新和技术革新,引领行业发展。同方知网成立人工智能研发团队,基于自身数据优势、技术积累开展自有大面模型研发,赋能知识密集型行业领域应用场景落地。同方知网在自研大模型的基础上,也与相关伙伴积极探索有效战略合作模式,目前已与相关头部企业签署战略合作协议,成立实验室共同研发行业大模型。目前,国内围绕数据要素的制度体系和交易市场正在加速构建,同方知网密切跟踪政策导向,开展了一系列数据要素领域的布局工作。2023年上半年,同方知网首批入选“北京市通用人工智能产业创新伙伴计划”的数据合作伙伴,成为入选的唯一央企子企业。同方知网与上海市数据交易所签署战略合作协议,双方将深入交流数据确权、登记、挂牌、上市、交易等相关政策和方案。

24 605186 健麾信息 2024-03-24

2024年3月21日公司在互动平台上披露:截至目前,公司累积的处方单数据已高达数十亿条,增长速度在10%左右。这些数据主要源自国内各大医院药房部门的处方药发药记录。全国百强医院中超过半数都是公司的合作伙伴,共同构建了强大的合作网络,确保了数据的专业性和参考价值。同时,公司拥有成熟的数据脱敏技术,能够在保护用户隐私的同时,确保脱敏后的数据可用于支持国内大型模型的训练工作。

25 688787 海天瑞声 2024-03-24

2024年3月15日公司在互动平台上披露:公司是专业的人工智能训练数据服务提供商,目前正在围绕AIGC/大模型数据服务领域进行投入、建设。一方面,公司将基于现有商业模式,开发大模型相关的专业训练数据集,该数据集建成后,将提供可供大模型训练和评测的不少于10个品类的专业数据集,显著提升行业内面向大模型训练数据集的类别和质量,协助实现公共数据、社会数据等各类高价值数据资源汇聚,实现基于大模型通用能力和垂直领域数据的训练学习。另一方面,公司计划将研发设计数据生产垂直大模型,公司全栈自研的数据生产垂直大模型,将可辅助完成面向多个下游任务的数据设计与处理规则,形成包括数据清洗方案设计、指令方案设计、指令泛化与迁移、指令数据验证、多模态数据方案等在内的多项生成能力,以及在上述方案下的原始数据及标注成果生成能力。 公司已与相关客户签订了大模型训练数据集相关的业务合同或意向订单。此外,公司已与其他大模型领域的知名机构签署了合作协议,未来拟围绕人工智能大模型数据处理技术、大模型数据集供给和大模型评测等方面进行合作。

26 000681 视觉中国 2024-03-24

2023年6月2日公司在互动平台披露,公司抓住AIGC的发展机遇期,并确定了“AI+内容+场景”发展战略,结合自身的交易场景、优质合规数据以及全球创作者社区等核心优势,专注“以客户为中心”的AIGC技术创新,以客户为中心来落地AIGC产品。AI对各行各业都有广泛的应用价值,公司主业主要在视觉内容与服务,主要在营销传播场景服务党政媒体、广告营销、品牌企业以及互联网平台企业。2022年度公司拥有的数字版权交易平台,主要为客户提供超过4亿的图片、视频、音乐海量优质、安全合规的版权素材服务。2023年3月,公司率先在全球版权素材行业推出了基于自然语言理解的AI智能搜索,客户不仅可以通过“关键字”进行搜索,也可以使用自然语言进行搜索,大大提升了客户获取优质内容的效率;5月上线AI创意工具,提供模特转换、插画转化等功能提高用户体验与工作效率。今后,公司将通过提供“AI智能搜索+AI灵感生成”的组合服务体系,将AI灵感生成服务集成到已有工作流中更好地服务客户。另外,训练数据集的质量、类型、合规性、风格都会决定AI生成的内容质量。公司拥有数以亿计的专业级且获版权许可的优质图片、视频音乐素材,是市场上少有的高质量素材的图像库之一,有助于确保模型生成内容安全合规,可用于商业用途的内容,不将风险转嫁给客户。公司将充分发挥海量、高质量、版权合规的数据集价值,与算力、算法战略合作伙伴一起合作打造专有的垂类AIGC视觉图像模型,共同探索全新的商业模式。

27 002908 德生科技 2024-03-24

2024年3月6日公司投资者关系活动记录表披露:2023年底公司基于一卡通场景的服务积累,推出基于民生行业大模型的便民服务站(数字公务员),并已在青岛、南昌、东莞等地市试点,在推行过程中得到政府、银行的高度认可。服务站是政府服务、银行服务、及公司业务的核心引擎,通过人机交互的方式,服务下沉到基层。目前服务站训练的方向主要跟就业、社保、五险一金相关,根据不同地市的模型需求,也会包含其他个性化运营。公司智能知识运营服务已在全国60多个地市部署,为公司训练大模型积累了大量的语料,公司将在此基础上持续升级训练,目前已有近十个地市有明确的需求,订单量正在逐步增加。

28 300133 华策影视 2024-03-24

2024年3月22日公司投资者关系活动记录表披露:公司的视频语料分两种,包括文字语料,如小说、剧本等;视频语料,如影视作品、视频拍摄素材等。目前公司语料主要用于训练自用垂直模型,暂未与通用大模型公司开展商业性质的合作。

29 300182 捷成股份 2024-03-24

公司下设文化集团作为公司在数字文化领域的主要业务实施平台,旗下全资控股包括华视网聚、星纪元等主要子公司,业务范围涵盖版权运营、产业服务、广告策划、影视投资、栏目制作等产业链集群。公司作为国内领先的数字版权分销商、全媒体文化传播服务提供商、数字生活内容运营商,集版权采购、数字分销、内容运营于一身,携手国内外千余家出品公司,积累了5万余小时的影视、动漫、节目版权内容,面向广电、互联网新媒体、运营商等媒体渠道进行数字化发行,全面覆盖数字电视、OTT、IPTV、电脑、平板、手机、户外流媒体等全媒体终端。在“海量数字内容矩阵”、“全产业媒体集群”、“全媒体终端交互式覆盖”的一体化运营所构建的基于“版权资源结构化控制”的上中下游全产业融合式服务的优势数字版权产业生态模式下,公司拥有腾讯、优酷、爱奇艺、芒果等视频端;中国移动、中国电信、中国联通等运营商端;以及华为、小米、微鲸等硬件提供商等优质客户,并与其保持了良好的长期战略合作;同时,公司在优势版权运营及全媒体特别是新媒体大数据分析的基础上,试水数字发行模式,面向包括互联网、无线、数字电视/IPTV/OTT等全媒体终端实现内容数字发行。

30 300226 上海钢联 2024-03-24

在数据积累方面,公司通过多年在大宗商品行业数据领域的深耕,使得钢联数据终端逐步成为国内全面、完整、权威的大宗商品数据库之一。公司应用分析模型与技术,将庞大的数据资产一站式整合,实现便捷的检索、提取、加工与分析功能。钢联数据库已建设大类数据库21个,细分数据库超过150个,涉及细分品种超过8000个,数据总量达33.5亿条,指标226万条。

有问题请联系 767871486@gmail.com 商务合作广告联系 QQ:767871486
查股网以"免费 简单 客观 实用"为原则,致力于为广大股民提供最有价值和实用的股票数据作参考!
Copyright 2007-2023
www.chaguwang.cn 查股网