当前位置: 首页 > news >正文

手写代码,利用 mnist 数据集测试对比 kan 和 cnn/mlp 的效果

你好呀,我是董董灿。

kan 模型火了一段时间,很多人从理论的角度给出了非常专业的解读,基本结论是:从目前来看,kan 很难替代 mlp 成为一个更加经典的模型结构。

我这里就不从理论方面进行回答了,直接给出一个利用 KAN / CNN / MLP 分别对 Mnist 数据集进行验证的结果,我们直接从实验的结果出发,来看看这个 KAN 模型的效果如何?

为了做实验,我分别编写了 test_with_cnn_mnist.py 、test_with_kan_mnist.py 以及 test_with_mlp_mnist.py 三个代码脚本,使用相同的数据集,都是 mnist 进行训练和测试。

CNN 的效果

使用 CNN ,经过 5 个 epoch 的训练,最终 CNN 在测试集上的预测准确率是 98.36 %.

MLP 的效果

使用同样的数据集,利用 MLP 进行训练和推理,最终的预测准确度在 93.3 % 左右。

最后看一下 KAN 的效果

使用 KAN 模型对数据集进行训练,最终得到的准确度仅为 82.04%

对比一下

相同的数据集,都是 MNIST。

CNN 预测准确度: 98%

MLP 预测准确度:93%

KAN 预测准确度:82%

说明 KAN 模型在 MNIST 这种经典任务中的表现还有待提高。


最后,以上仅为本人自己测试,可能不严谨,毕竟是在学习 KAN 的过程中做的一个测试,但也能从一定程度上说明问题。

以上三个测试的实验源码有些长,不再这里贴了,如果你对此感兴趣,可以关注我的公众号:董董灿是个攻城狮 并后台回复“kan”或 “KAN” 获取以上三种模型的测试源码,当然也可以来我的知乎首页置顶文章,加我微信获取以上源码。

实验不易,点个赞呗~


http://www.mrgr.cn/news/38680.html

相关文章:

  • 实现Tiny-RAG:简化版的RAG模型
  • [Python学习日记-31] Python 中的函数
  • WPF MVVM入门系列教程(一、MVVM模式介绍)
  • python习题1
  • 在WPF中实现多语言切换的四种方式
  • 行为设计模式 -模板方法模式- JAVA
  • Hive命令及属性配置
  • 实验2 网络测试命令的使用及对等网组建
  • PostgreSQL 17:新特性与性能优化深度解析
  • 【重学 MySQL】四十一、子查询举例与分类
  • 计算机毕业设计 基于Python的音乐平台的设计与实现 Python+Django+Vue 前后端分离 附源码 讲解 文档
  • Flutter InAppWebView 路由导航处理
  • OpenGL ES简述(1)
  • Metahuman sdk官方 AI驱动口型蓝图优化
  • HTML+CSS 水滴登录页
  • 【软件测试】详解软件测试中的测试级别
  • C++动态内存管理
  • 老古董Lisp实用主义入门教程(12):白日梦先生的白日梦
  • 第十四届蓝桥杯真题Python c组F.棋盘(持续更新)
  • 报道|解读INFORMS期刊影响因子的下降及运筹与管理科学出版的未来