【微信小程序淘宝客源码】【ORB策略源码】【解封网源码】加权稀疏分类器源码

【微信小程序淘宝客源码】【ORB策略源码】【解封网源码】加权稀疏分类器源码_加权分类法

2024-12-29 06:03:38 来源：个人单页源码下载分类：探索

1.[CVPR'2018]Unsupervised Feature Learning via Non-Parametric Instance Discrimination
2.用PointNet分类3D点云
3.CNTK101：使用CNTK进行线性回归
4.MQL-Meta Q Learning

加权稀疏分类器源码_加权分类法

[CVPR'2018]Unsupervised Feature Learning via Non-Parametric Instance Discrimination

作者在CVPR'的加权研究中揭示了视觉数据本身蕴含的表观相似性，而非完全依赖于语义标签。稀疏他们质疑：能否通过无标签的分类纯判别学习，构建一个反映图像外观相似性的器源权分有效度量？为此，他们提出了一种新颖的码加方法，即实例判别，类法微信小程序淘宝客源码将每个视为独特的加权类别，模型的稀疏任务转变为区分这些实例，这是分类对比学习中常见的代理任务。

然而，器源权分面对大量类别的码加问题，传统的类法softmax分类可能面临挑战。为解决这一难题，加权研究者采用noise-contrastive estimation (NCE)技术，稀疏模拟softmax的分类完整分布，并引入近似正则化来优化学习过程，使得模型在面对众多类别时仍能稳定学习。

核心目标是通过无监督学习，学习图像的表征，它能反映间的相似度。公式表达为：[公式]，通过神经网络映射到特征向量v，并用这个特征计算间的距离，相似的距离应更近。学习的目标可以看作一个无参数的分类任务，每个对应一个类别，特征通过神经网络映射为[公式]。

传统分类器的问题在于依赖于权重，且类别过多可能导致参数过多。作者提出无参数的softmax分类器，将类别权重简化为每个类别的表征，目标是最大化[公式]（对数似然估计）。为了减少计算，作者引入Memory Bank，ORB策略源码存储所有类别特征，通过迭代更新。

在解决类别过多问题上，研究者采用NCE和近端正则化，将多分类转化为二分类问题，以优化训练效率。至于测试阶段，通过模型得到表征，找出与之最相似的k个类别，并以加权K近邻的方式进行预测。

用PointNet分类3D点云

在本教程中，我们将学习如何训练PointNet进行分类。我们将主要关注数据和训练过程；展示如何从头开始编码 Point Net 的教程位于此处。本教程的代码位于这个 Github库中，我们将使用的笔记本位于这个 Github库中。一些代码的灵感来自于这个 Github库。

推荐：用 NSDT设计器快速搭建可编程3D场景

1、获取数据

我们将使用只有个类的较小版本的 shapenet 数据集。如果你使用的是Colab，可以运行以下代码来获取数据。警告，这将需要很长时间。

如果你想在本地运行，请访问上面第一行的链接，数据将自动下载为 zip 文件。

该数据集包含个带有类标识符的文件夹（自述文件中称为“synsetoffset”）。文件夹结构为：

自定义 PyTorch 数据集位于此处，解释代码超出了本教程的范围。需要了解的重要一点是，数据集可以获取 (point_cloud, class) 或 (point_cloud, seg_labels)。在训练和验证期间，我们向点云添加高斯噪声，并围绕垂直轴（本例中为 y 轴）随机旋转它们。解封网源码我们对点云进行最小-最大归一化，以便它们的范围为 0-1。我们可以像这样创建 shapenet 数据集的实例：

2、探索数据

在开始任何训练之前，让我们先探讨一些训练数据。为此，我们将使用 Open3d 版本 0..0（必须为 0..0 或更高版本）。

我们现在可以使用以下代码查看示例点云。你应该注意到，每次运行代码时点云都会以不同的方向显示。

你可能不会注意到噪音有太大差异，因为我们添加的量很小；我们添加了少量，因为不想极大地破坏结构，但这一小量足以对模型产生影响。现在我们就来看看训练分类的数据频率。

从图2中我们可以看出，这绝对不是一个平衡的训练集。因此，我们可能想要应用类别权重，甚至使用焦点损失来帮助我们的模型学习。

3、PointNet损失函数

当训练PointNet进行分类时，我们可以使用 PyTorch 中的标准交叉熵损失，但我们还想添加包括论文中提到的正则化项。

正则化项强制特征变换矩阵正交，但为什么呢？特征变换矩阵旨在旋转（变换）点云的高维表示。我们如何确定这种学习的高维旋转实际上是在旋转点云？为了回答这个问题，让我们考虑一些所需的旋转属性。

我们希望学习到的旋转是仿射的，这意味着它保留结构。我们希望确保它不会做一些奇怪的事情，例如将其映射回较低维度的空间或弄乱结构。我们不能只绘制 nx 点云来检查这一点，闽源码头但我们可以通过鼓励旋转正交来让模型学习有效的旋转。这是因为正交矩阵同时保留长度和角度，而旋转矩阵是一种特殊类型的正交矩阵。我们可以“鼓励”模型通过使用以下项进行正则化来学习正交旋转矩阵：

我们利用正交矩阵的一个基本属性，即它们的列和行是正交向量。对于完全正交的矩阵，图 3 中的正则化项将等于 0。

在训练期间，我们只需将此项添加到我们的损失中。如果你已经完成了之前关于如何编码PointNet的教程，可能还记得特征转换矩阵 A 由分类头返回。

现在让我们编写PointNet损失函数的代码。我们已经添加了加权（平衡）交叉熵损失和焦点损失的术语，但解释它们超出了本教程的范围。其代码位于此处。该代码改编自这个 Github库。

4、训练PointNet用于分类

现在我们已经了解了数据和损失函数，我们可以继续进行训练。

对于我们的训练需要量化模型的表现。通常我们会考虑损失和准确性，但对于这个分类问题，我们需要一个衡量错误分类和正确分类的指标。想想典型的混淆矩阵：真阳性、假阴性、真阴性和假阳性；我们想要一个在所有这些方面都表现良好的分类器。

马修斯相关系数 (MCC) 量化了我们的模型在所有这些指标上的表现，并且被认为是比准确性或 F1 分数更可靠的单一性能指标。MCC 的范围从 -1 到 1，其中 -1 是最差的性能，1 是最好的性能，0 是随机猜测。我们可以通过 torchmetrics 将 MCC 与 PyTorch 结合使用。新剧片源码

训练过程是一个基本的 PyTorch 训练循环，在训练和验证之间交替。

我们使用 Adam 优化器和我们的点净损失函数以及上面图 3 中描述的正则化项。对于点净损失函数，我们选择设置 alpha，它对每个样本的重要性进行加权。

我们还设置了 gamma 来调节损失函数并迫使其专注于困难示例，其中困难示例是那些以较低概率分类的示例。有关更多详细信息，请参阅笔记本中的注释。人们注意到，使用循环学习率时模型训练得更好，因此我们在这里实现了它。

请按照笔记本进行训练循环，并确保你有 GPU。如果没有，请删除调度程序并将学习率设置为 0.，几个 epoch 后你应该会得到足够好的结果。如果遇到任何 PyTorch 用户警告（由于 nn.MaxPool1D 的未来更新），可以通过以下方式抑制它们：

5、训练结果

我们可以看到，训练和验证的准确率都上升了，但 MCC 仅在训练时上升，而在验证时却没有上升。这可能是由于验证和测试分组中某些类的样本量非常小造成的；因此在这种情况下，MCC 可能不是用于验证和测试的最佳单一指标。这需要更多的调查来确定 MCC 何时是一个好的指标；即多少不平衡对于 MCC 来说是过多？每个类别需要多少样本才能使 MCC 有效？

我们来看看测试结果：

我们看到测试准确度约为 %，但 MCC 略高于 0。由于我们只有个类，让我们查看笔记本中的混淆矩阵，以更深入地了解测试结果。

大多数情况下，分类是可以的，但也有一些不太常见的类别，例如“火箭”或“滑板”。该模型在这些类别上的预测性能往往较差，而在这些不太常见的类别上的性能是导致 MCC 下降的原因。

另一件需要注意的事情是，当你检查结果（如笔记本中所示）时，将在更频繁的分类中获得良好的准确性和自信的表现。然而，在频率较低的课程中，你会发现置信度较低且准确性较差。

6、检查关键集

现在我们将研究本教程中最有趣的部分，即关键集。关键集是点云集的基本基础点。这些点定义了它的基本结构。这里有一些代码展示了如何可视化它们。

这里有一些可视化，请注意，我使用“draw()”来获得更大的点大小，但它在 Colab 中不起作用。

我们可以看到，关键集展示了其对应点云的整体结构，它们本质上是稀疏采样的点云。这表明训练后的模型实际上已经学会了区分差异结构，并表明它实际上能够根据每个点云类别的区别结构对其进行分类。

7、结束语

我们学习了如何从头开始训练PointNet以及如何可视化点集。如果你真的感兴趣，请尝试提高整体分类性能。以下是一些帮助你入门的建议：

CNTK：使用CNTK进行线性回归

如果你刚开始接触CNTK或者机器学习，我们的专栏正适合你！在这一讲中，你将会接触到一种在机器学习中简单高效且广泛应用的模型：该模型通过利用其可伸缩性，以最快的方式对海量数据集，利用现有的计算资源（一个或多个 CPU 内核、一个或多个 GPU、一组 CPU 或一组 GPU）通过 CNTK 库直观地进行数据分析。

我们的问题：一家癌症医院为我们提供了一批患者的数据，并希望我们能确定患者是否患有致命的恶性肿瘤：这是一个分类（classification）问题。为了能让我们对每个病人进行分类，医院提供的数据是：患者的年龄和肿瘤的大小。有了这些数据，我们就有了一个主观的想法：也许年轻的病人和/或小肿瘤患者不太可能患上恶性肿瘤？

在这一讲中，我们将机器生成的模拟数据集进行练习：每个病人在图表中表示成为一个点，这个点被称为数据实例（instance）。其中红色的点表示其患有恶性肿瘤、蓝色则表示良性。

我们的目标是构建一个分类器（classifier），它可以根据每个病人的属性（年龄和肿瘤大小）来进行学习，从而分辨出病人所患的肿瘤是良性还是恶性的。在这一讲中，我们会使用 CNTK 构造一个线性分类器（linear classifier）——这是一种深度学习网络中的基础元素。

逻辑回归（Logistic regression）是一种常用而基础的机器学习算法，它使用线性加权的特征组合，生成预测样本属于不同类的概率。在我们的例子中，分类器将产生一个区间在 [公式] 之间的概率，我们可以将它与某一个阈值 (如 [公式]) 相比，从而判断其所属的类别 ( [公式]类或 [公式]类）。我们的方法也可以很容易地扩展到存在多个类的情况。

逻辑回归（logistic regression，LR）网络是一种简单的模型。在过去的十年里，逻辑回归驱动了许多重要的机器学习算法及其应用。它属于一种线性模型，我们能将一组存储待分类实例特征的向量 [公式] （又称特征向量，下图中蓝色的点集）作为模型的输入，得出证据（evidence） [公式] （绿色节点的输出，又称激活）。在输入层的每一个特征都与输出层存在一个连接权重 [公式] （以不同粗细的黑线表示，见下图）

在本教程中，我们将使用 NumPy 库生成的合成数据。在真实世界的问题中，你会用到CNTK中的读取器（Reader），读取特征值（年龄和肿瘤大小），并与每个患者对应。模拟的年龄变量被缩小到与另一个变量的范围相似：这是数据预处理的一个关键方面，我们将在以后的教程中进一步了解这些内容。

在CNTK中，输入变量是面向用户代码的容器（container）。用户通过向输入变量提供不同的实例数据（数据点或数据点示例），等同于 (年龄、肿瘤大小) 元组在我们的例子中) 作为模型函数的输入 (也就是训练) 和模型评估 (又称测试)。因此，输入的形状必须与将提供的数据的形状相匹配。

在本例中，每一次迭代将对[公式] 个样本进行处理（上面图中的 [公式] 个点），也就是 [公式] 。我们想训练 [公式] 个数据点。如果数据中的样本数仅为 [公式] 个，则训练器将通过数据进行 [公式] 轮传递。这由 [公式]表示。注意：在现实世界中，我们会得到一定数量的标记数据 (在这个例子中，(年龄, 大小) 观察及其标签 (良性/恶性))。我们将其中的大量的数据（比如说 [公式] %）用于训练，并将剩下的部分用于评估训练过的模型。

对于评估, 我们将网络的输出[公式] 为两个类的概率分布, 每个观察的概率是恶性的或良性的。让我们比较一下真实的标签和预测出来的分类，他们应该一致。

对于数据可视化, 我们可以将结果可视化。在我们的示例中，可以使用患者的两个维度的属性作为输入 ([公式] 轴上的患者年龄和 [公式] 轴上的肿瘤大小) 来绘制数据，患者的肿瘤性质，即我们的输出表示为图像上点的颜色 (红色为恶性、蓝色为良性)。对于具有较高维度的数据，对数据进行可视化是一件充满挑战性的工作。还好我们有先进的降维技术, 如 [公式]，允许我们来做这样的可视化。

MQL-Meta Q Learning

本文首先观察到，即使不借助meta-RL算法，通过轨迹作为context也能实现与meta-RL当前最佳效果相当的结果，如图所示。

在此基础上，本文提出了名为MQL的新算法，其meta-training目标简单明了，即最大化训练任务的平均性能，具体表示为[公式]，它衡量的是策略在任务k中轨迹的评估性能。

MQL通过以下目标调整策略参数，旨在策略适应新任务时保持稳定。新任务上的性能由第一项衡量，[公式] 是新任务或meta训练任务的轨迹概率，用于加权旧数据在新任务上的表现。第三项[公式] 评估新任务与meta训练任务的相似性，防止策略在适应过程中过度适应某一特定情况。

在MQL的背景中，状态记为x，策略为u，策略网络采用确定性网络[公式]，值函数使用TD-loss进行训练。倾向性得分和ESS的计算涉及两个分布的比较，使用重要性采样方法定义，具体公式见文中。

MQL分为meta-training和适应新任务两个阶段。在meta-training阶段，目标是减小TD error，与传统基于梯度的meta-RL方法如MAML有所不同，MAML是通过最大化每个任务的fine-tune后性能。

在适应新任务阶段，MQL初始化策略参数采用元训练后的θ，并引入了off-policy adaptation。通过重要性采样权重，MQL利用meta-training的replay-buffer，通过logistic分类器对数据进行加权更新，以处理新任务的差异性。

实验结果表明，MQL在meta-RL基准上的表现优于现有方法，且具有较高的采样效率。尽管在特定环境下（如Ant-Goal-2D）存在性能下降，但MQL的适应性修正能够弥补这个问题。一系列消融实验验证了超参数设置的合理性，尽管MQL和TD3+context算法表现接近，但MQL展现出了独特的性能。

最后，通过可视化实验数据，λ值在ant-fwd-back训练过程中保持在0.左右，反映任务间的差异；而β值稳定在0.8，证明了权重设置的有效性。

【微信小程序淘宝客源码】【ORB策略源码】【解封网源码】加权稀疏分类器源码_加权分类法

热门资讯

推荐资讯