默认冷灰
24号文字
方正启体

第34章 数据融合异常 (5 / 6)

作者:我是躺赢狗 最后更新:2025/9/3 22:23:11
        置信度其实就是模型对自己输出结果的把握大小,例如一个分类任务,最终模型的输出会在Softmax函数的作用下,变成一连串的概率,

        比如分类到A的概率为80%,B任务的概率为10%以此类推。

        那么置信度就是采用概率大于一定数值的结果。

        这东西听上去玄乎,实际上也是一种比较死板的逻辑判断。

        除了这两种,筛选数据的方法其实还有很多,不过周昀都不满意,因为这些方法从他们的底层逻辑来看,都没有达到他想要看到的“智能”。

        突然,周昀手指一顿。

        如果从另一方面来看,数据筛选,还可以看作是一种数据蒸馏。

        数据蒸馏其实很好理解,蒸馏大家都知道,那么数据蒸馏就是通过某种手段将数据集提纯的方法。

        恰好,周昀发在NeurIPS上的AgileEdge这篇论文里就有一种数据蒸馏的方法,因为想要缩小模型,就等于缩小参数量,两者之间其实有着异曲同工之妙。

        直接拿过来用肯定不行,不过周昀感觉只要稍作修改,应该能达到他想要的效果,因为当初设计这种数据蒸馏方法的时候,就已经着眼于“智能”二字。

        内容未完,下一页继续阅读
(←快捷键) <<上一章 举报纠错 回目录 回封面 下一章>> (快捷键→)

大家都在看?