当前位置: 首页 > news >正文

pandas中基于范围条件进行表连接

pandas中基于范围条件进行表连接

来自:Python大数据分析 费弗里

表连接是我们日常开展数据分析过程中很常见的操作,在pandas中基于join()merge()等方法,可以根据左右表连接依赖字段之间对应值是否相等,来实现常规的表连接。

但在有些情况下,我们可能需要基于一些“特殊”的条件匹配,来完成左右表之间的表连接操作,譬如对于下面的示例数据框demo_leftdemo_right

假如我们需要基于demo_leftleft_id等于demo_rightright_id,且demo_leftdatetimedemo_rightdatetime之间相差不超过7天,这样的条件来进行表连接,「通常的做法」是先根据left_idright_id进行连接,再在初步连接的结果表中基于left_idright_id进行分组筛选运算,过滤掉时间差大于7天的记录:

而除了上面的方式以外,我们还可以基于之前的文章中给大家介绍过的pandas的功能拓展库pyjanitor中的「条件连接方法」,直接基于范围比较进行连接,且该方式还支持numba加速运算:


http://www.mrgr.cn/news/26207.html

相关文章:

  • HID用法ID与按键扫描码对照
  • (学习总结16)C++模版2
  • 【解决方案】双系统中修复ubuntu引导
  • 数据结构,栈,队列(线性表实现)
  • Python时间序列分析新技能,轻松掌握时间索引
  • 接口测试原理及Postman详解
  • python --生成pdf/插入图片;reportlab/fitz
  • 《PhysDiff: Physics-Guided Human Motion Diffusion Model》ICCV2023
  • Fake Location模拟定位,刷跑 “运动世界校园”
  • 【Obsidian】当笔记接入AI,Copilot插件推荐
  • sd不同角色融合在一起
  • OPENAIGC开发者大赛-拯救姬AI创意赛第三名 | 下一代虚拟拍摄-3D AIGC工具:赛博演猿
  • 在全表查找字符串
  • k8s的安装
  • inBuilder的业务领域划分
  • 游戏工作室搬砖多开怎么做
  • 软件工程进度管理
  • 代码随想录算法训练营第二十九天 | 134. 加油站,135. 分发糖果,860.柠檬水找零,406.根据身高重建队列
  • [python]使用OCRLiteOnnx几句代码实现ocr中英文数字识别
  • IBM 中国研发部裁员风暴,IT 行业何去何从?