当前位置: 首页 > news >正文

计算机视觉与视觉大模型对板书检测效果对比

文章目录

  • 计算机视觉
    • 火山引擎ocr
    • 阿里云ocr
  • 视觉大模型
    • GPT4
    • kimi
    • 通义千问
    • chatGLM
    • 百度 全部正确
    • 某开源模型,效果不佳

计算机视觉

火山引擎ocr

在这里插入图片描述

阿里云ocr

在这里插入图片描述

视觉大模型

GPT4

在这里插入图片描述

kimi

在这里插入图片描述

通义千问

在这里插入图片描述

chatGLM

在这里插入图片描述
在这里插入图片描述

百度 全部正确

在这里插入图片描述

某开源模型,效果不佳

在这里插入图片描述


http://www.mrgr.cn/news/6323.html

相关文章:

  • 1089:数字反转
  • Spring Boot中使用SA-Token的全面指南
  • 打卡学习Python爬虫第四天|bs4爬取优美图库的小清新图片
  • Python与React结合:构建高效前端与后端的综合性技术探索
  • git错误fatal: Unpack error, check server log
  • wpf datagrid 设置自动新增行后 避免行内没有内容也会新增行处理
  • 江协科技STM32学习- P5 GPIO输出
  • 动手实现基于Reactor模型的高并发Web服务器(一):epoll+多线程版本
  • 解码极氪汽车的短期成效与长期定力
  • World of Warcraft [CLASSIC] Engineering 335-420
  • vue3 Props的用法(父传子)
  • SSL/TLS协议信息泄露漏洞修复
  • Java List 和 ArrayList
  • 移动云电脑手机端3.0全新升级,畅享个人便捷管理,筑牢安全管控防线
  • CoCoOp(论文解读):Conditional Prompt Learning for Vision-Language Models
  • MySQL——为表和字段取别名(1)为表取别名
  • C语言-将n个数输入时顺序的逆序排列,用指针函数实现
  • 【项目】仿mudo库实现高并发服务器
  • 分治算法的介绍与原理解析
  • 设计模式六大原则:依赖倒置原则详细说明和案例示范