联系我们

新闻投稿:jingjing@enec.net

商务合作:coco@enec.net

搜索
下载亿恩app

深度求索公司公布新型数据采集专利,助力大语言模型训练效率提升

1天前

国家知识产权局最新公告显示,杭州深度求索人工智能基础技术研究有限公司申请的“一种广度数据采集的方法及其系统”专利于4月1日正式公布。该技术旨在优化网页数据采集流程,通过智能筛选链接、分析内容质量及优化下载分配,显著减少低效或重复下载,从而提升数据质量并降低网络资源消耗。专利摘要指出,该系统采用独立的信息回灌队列设计,确保数据处理的稳定性,同时避免对目标网站造成流量冲击。当前,大语言模型训练依赖高质量、多样化的数据集,但传统采集技术常面临链接遗漏、过量访问及内容质量不足等问题。深度求索的解决方案有望为人工智能领域提供更高效的数据支持,推动自然语言处理技术发展。

更多精彩内容,请关注亿恩网微信公众号: (ENECNEWS

扫码关注二维码

) 每天为您推送最新,最热干货!
声明:亿恩网原创稿件,未经授权不得以任何方式转发。转载请联系:yujie@enec.net
分享:
5843 0 0
热门词条

产品侵权

千禧一代

国产

反垄断

父亲节

多平台

易佰网络

GBC

货代

跨境物流

上市

PayPal

网易考拉

库存

家电

DHL

英国电商

恶搞

新西兰

澳洲

社群

扫码加入社群

公众号

扫一扫
关注亿恩公众号

顶部