全球速看:最大CLIP!LAION发布CLIP的扩增定律
2022-12-29 10:40:05


【资料图】

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143

热门推荐

文章排行

  1. 2023-05-162020年正当防卫认定新规标准_正当防卫界限最新司法解释 全球快资讯
  2. 2023-05-16山东港口青岛港:全自动化码头效率高
  3. 2023-05-16严禁组织参加带有“小圈子”性质的违规吃喝!今起,青海全省执行“十严禁”|环球通讯
  4. 2023-05-16看了上海女人的夏季穿搭,我发现:发不过胸、裙不过膝,高级得体
  5. 2023-05-16安全课程护佑生命 体验活动生成技能 新动态
  6. 2023-05-16全球首发!湖南移动双万兆网络技术验证成功
  7. 2023-05-16墓砖上的乘法口诀:深圳出土刻文陶砖背后的岭南早期文明之谜-天天播资讯
  8. 2023-05-16环球热头条丨首扮老年妆上演“出逃外婆” 闫妮:寻找真正的自己 什么时候都不晚|封面会客厅
  9. 2023-05-16公告速递:暂停安信中债1-3政金债指数基金大额申购、大额转换转入及大额定期定额投资业务 天天微动态
  10. 2023-05-16天天热消息:酒企 2022 年年报:业绩增速优于沪深 300 与食品饮料行业,贵州茅台净利率创十年新高
  11. 2023-05-16多家银行宣布:这类存款“停摆”
  12. 2023-05-16昨日V型反转 今日震荡消化(5月16日早评)
  13. 2023-05-16AI狂飙时代,如何扼住技术的缰绳 焦点日报
  14. 2023-05-16520活动!小米自拍神器Civi2官方直降
  15. 2023-05-16元件板块5月15日涨1.27%,三环集团领涨,主力资金净流出1.54亿元 天天头条
  16. 2023-05-16【全球时快讯】《三级医院评审标准(2022年版)》医疗服务能力与质量安全监测数据-重点专业质量控制指标
  17. 2023-05-15求婚成功率最高的地方_怎样求婚成功的几率大-全球看点
  18. 2023-05-15[快讯]众合科技:投资庆阳市时空大数据云中心项目 实时
  19. 2023-05-15从东莞出发自驾游到附近一两天的时间有什么地方好介绍?
  20. 2023-05-15李想:因被很多同行投诉举报 暂停公布真实上险量数据 快播