当前位置: 首页 > news >正文

支付宝开放平台-开发者社区——AI 日报「8 月23 日」

1  Al与人类之间无休止斗争的又一个战场:验证码

新智元 |阅读原文

验证码作为区分人机的重要手段,正面临人工智能技术的挑战。Al 通过深度学习和神经网络技术,已能绕过多数验证码。同时,验证码技术也在不断进化,如 reCAPTCHA 通过分析用户行为来识别人类。未来验证码可能更侧重行为分析和生物识别,但隐私问题随之而来。Al在加强安全方面也扮演关键角色,预示着验证码与 Al的共生关系将进一步发展。

2  咳一咳就知道有没有病?谷歌开放 HeAR Al 模型 AP1,1亿条咳嗷声训练

医健网丨阅读原文

Google 研究人员开发了 Health Acoustic Representations (HeAR)模型,利用 Al 技术从声音中提取健康信息。HeAR 通过分析咳嗷等声音模式,助力早期疾病诊断。Google Research 团队使用 3亿条音频数据训练模型,特别针对1亿条咳嗷声音,HeAR 在医学音频分析中表现优异,尤其在跨麦克风泛化能力上。该技术开放给研究人员,支持定制生物声学模型,即使在数据稀缺情况下也能高效运作。印度的 Salcit Technologies 正利用 HeAR 加强其 Al模型,以提高结核病早期检测能力。HeAR 得到国际组织支持,有望成为低成本、可及的健康监测工具。

3  AI设计自己,代码造物主已来!UBC 华人一作首提 ADAS,数学能力暴涨 25.9%

新智元丨阅读原文

不列颠哥伦比亚大学的研究团队开发了智能体自动化设计 (ADAS) 系统,该系统通过元智能体搜索算法,自动设计并优化智能体,实现自我进化。在数学、阅读和推理等多个领域,新智能体展现出超越当前最佳设计的优越性能,尤其在数学领域淮确率提升了 25.9%。研究还证明了这些智能体在跨领域转移时的泛化和可转移性,为自动设计越来越强大的智能体系统开辟了新方向,预示着通用人工智能 (AGI) 的进一步发展。

4  4个人烧掉数百万 GPU,打造翻版 「Sora]

硅兔君|阅读原文

美国 Al创业公司Hotshot 仅用四人团队,耗资数百万 GPU,成功研发出视频模型 Hotshot。该模型基于

Transformer 扩散技术,能在快速对齐、一致性和运动方面提供高质量输出,支持生成更长、更高分辨率的视频。Hotshot 的测试版已开放试用,用户每天可免费生成两次无水印视频。公司成立 13 个月内连续推出三款 Al视频模型,创始人 Sastry 预测 AI 生成内容将在数字媒体中占据主流地位。

对此,你怎么看?

详情查看参与互动赢蚂蚁周边


支付宝开放平台-开发者社区

 「AGI 之路」 内容库

欢迎你的投稿!戳我进群


支付宝/钉钉扫码加入支付宝开发者钉组织,可了解支付宝开放能力最新动态,订阅文档更新消息,和同城同行业交流业务,与支付宝产研沟通交流。


http://www.mrgr.cn/news/5505.html

相关文章:

  • BaseCTF WEEK1 re复现-入土为安的第24天
  • halcon1
  • [Linux#40][线程] 线程控制 | 多线程
  • 设计模式六大原则:迪米特法则详细说明和案例示范
  • windows docker 执行apt-get 权限问题
  • 大数据-95 Spark 集群 SparkSQL Action与Transformation操作 详细解释与测试案例
  • Vue3 provide(父) + inject(子、子的子...)进行值的传递及显示
  • iOS 开发:Object-C 和 Swift 的区别 (AI问答)
  • 三种方法加密图纸!2024如何对CAD图纸进行加密?分享给你
  • 回归预测|基于NGO-TCN-BiGRU-Attention的数据预测Matlab程序 多特征输入单输出 含基础模型
  • 知识竞赛答题设备及答题方式有哪些
  • 学习记录第二十八天
  • langchian 批次调用 prompt
  • python 面试指南
  • 何为数据专线和互联网专线?两者有什么区别?
  • 【算法基础实验】图论-最小生成树Kruskal实现
  • QT中通过TCP协议多线程的文件传输(客户端)
  • 【架构设计】-- aarch(ARM) and X86
  • [Meachines] [Easy] Active SMB未授权访问+GPP凭证泄露破解+Kerberos-管理员TGS票据破解
  • Django 后端架构开发:高效日志规范与实践