训练
-
【机器学习:KNN算法/K近邻算法】
K 近邻算法 算法情况解读 KNN算法的基本思想是物以类聚,人以群分,它是一种贪心算法,可以用于做分类/回归任务。KNN算法认为,距离相近的实例(instance)总是具有类似的性…
-
【论文笔记】Towards Certifying l-infinity robustness using neural networks with l-infinity-dist neurons
原文地址 slides GitHub 代码 本文发表于 2021 ICML,提出了一个新颖的神经网络计算方式:对于网络中的每个神经元,不采用传统的线性转换+非线性激活函数的方式,而…
-
(转载)李宏毅自然语言处理——GPT3简介
李宏毅自然语言处理——GPT3简介 本文原地址:https://blog.csdn.net/yjw123456/article/details/119705148 引言 今天来介绍…
-
代码笔记18 pytorch中加载ResNet,导致过拟合或者测试时model.train()高于model.eval()
问题 训练网络往往需要加载预训练模型,主流的就是ResNet一类的预训练好的参数 但我在加载了预训练模型,并冻结与训练参数后,进行训练时,发现了两个问题 1 在进行tes…
-
西瓜书学习笔记一(第一章第二章)
第一章绪论 ` 1.2基本术语 数据集:各种数据的一个集合 样本: 每条记录是关于一个事件或对象(这里 是 一个西瓜)的描述 特征:反映事件或对象在某方面的表现或性质的事项,例如&…
-
Datawhale 吃瓜教程 Task01打卡
Datawhale 吃瓜教程 Task01打卡 感觉西瓜书蛮新手友好的,前两章都是在不厌其烦的介绍基础概念。 数据集就是我们要让机器学习的东西,希望机器能从中学习到“经验”,产生模…
-
[转载]OpenBMB:让大模型飞入千家万户
预训练大模型的三大挑战 :▶ 训练难:训练数据量大,算力成本高。▶ 微调难:微调参数量大,微调时间长。▶ 应用难:推理速度慢,响应时间长,难以满足线上业务需求。 https://m…
-
阿里巴巴稀疏模型训练引擎-DeepRec
导读:DeepRec从2016年起深耕至今,支持了淘宝搜索、推荐、广告等核心业务,沉淀了大量优化的算子、图优化、Runtime优化、编译优化以及高性能分布式训练框架,在稀疏模型的训…