当前位置: 首页 > news >正文

果蔬识别系统性能优化之路(四)

目录

    • 前情提要
      • 剩下问题
    • 问题排查
    • 解决方案
    • 下一步

前情提要

果蔬识别系统性能优化之路(三)

剩下问题

同步数据库数据并初始化ivf依然要8,9秒

问题排查

通过断点加时间打印,发生其实初始化ivf的时间很快,慢的是数据在网络间的传输,并在python端的数据解析,无语
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
本地调本地,都要十秒,这不合理,改!

解决方案

因为这里必须要查一次全量数据,然后存入redis并将特征值传给python端进行初始化,所以最快的方案就是舍弃数据传输,直接在python端进行查询并初始化,即在python端查全量数据+设置redis+初始化ivf,虽然不想承认,但确实把python端做重在架构和设计层面可能都是最优解,改吧

  1. python端增加mysql查询
import mysql.connector
from mysql.connector import pooling# 配置数据库连接
db_config = {'host': 'localhost',  # 替换为你的 MySQL 主机地址'user': 'root',  # 替换为你的 MySQL 用户名'password': 'cmkkl407',  # 替换为你的 MySQL 密码'database': 'cnn'  # 替换为你的数据库名称
}
pool = pooling.MySQLConnectionPool(pool_name="mypool", pool_size=5, **db_config)def get_feature_by_store_code(store_code):query = "SELECT id, features FROM feature WHERE storeCode REGEXP %s"results = query_data(query, params=(f"(^|,){store_code}(,|$)",))return resultsdef query_data(query, params):connection = pool.get_connection()cursor = connection.cursor(dictionary=True)cursor.execute(query, params)results = cursor.fetchall()cursor.close()connection.close()  # 连接会被返回到池中return results
  1. 修改sync方法
  def sync(self, store_code):if store_code + '-featureDatabase' in self.ivfObj:del self.ivfObj[store_code + '-featureDatabase']data = get_feature_by_store_code(store_code)def parse_features(item):return orjson.loads(item['features'])with ThreadPoolExecutor() as executor:features_list = list(executor.map(parse_features, data))# 提取所有特征并转换为 NumPy 数组features = np.array(features_list, dtype=np.float32)self.ivfObj[store_code + '-featureDatabase'] = IVFPQ(features)ids = [item['id'] for item in data]return ids

由于python端查出来的json默认会给字符串格式,所以还需要转成json
一个优化小点:

并行处理:使用多线程或多进程并行处理数据。可以使用 concurrent.futures 库中的 ThreadPoolExecutor 或 ProcessPoolExecutor 来加快解析速度。

   def parse_features(item):return orjson.loads(item['features'])with ThreadPoolExecutor() as executor:features_list = list(executor.map(parse_features, data))

同时利用查出了所有id将ids进行返回给nestjs端直接进行redis存储
4. nestjs端修改

 /*** 同步redis* @param storeCode*/async syncRedis(storeCode: string) {const url = 'http://localhost:5000/sync'; // Python 服务的 URLconst s = Date.now();const response = await firstValueFrom(this.httpService.post(url, { storeCode }));const { ids } = response.data;await this.redisService.set(`${storeCode}-featureDatabase`, JSON.stringify(ids));const e = Date.now();console.log(`同步redis耗时:${e - s}ms`);}
  1. 优化后速度减少了一倍
    在这里插入图片描述

下一步

  1. 新建store_feature表,关联storeCode和featureId表,对数据库进行规范化,创建一个新的表来映射storeCode与feature的关系,从而可以使用简单的WHERE条件来充分利用索引
  2. 实现对特征向量ivf的增删改查

http://www.mrgr.cn/news/24645.html

相关文章:

  • Java面试题精选:分布式(二)
  • 基于Linux文件编程实现处理Excel表格的数据
  • 如何查看macos是x86还是arm
  • 建筑用能该如何统一管理?水电气集抄太麻烦?!看看这个吧!建筑能耗分析管理系统 您的运维“好帮手”
  • 2024/9/10 政治“回头看”之世界的物质性及其发展规律
  • 如何使用AIStarter启动器打包并发布AI应用项目【AI软件】
  • 彻底解决Linux-C++项目编译过程中的-fPIC问题
  • ConcurrentHashMap实现原理
  • 双指针-125. 验证回文串
  • 化工原料环保能源网站模板整站打包下载
  • QMT软件怎么申请开通?QMT软件到底是谁在用啊?QMT量化软件K线驱动介绍
  • LeetCode之常用函数
  • LINQ中的select
  • 5. 最长回文子串
  • 结构体的字节对齐方式(__attribute_pack(packed))#pragma pack())
  • 刀法依旧精准,iPhone 16 :4大遗憾,有点小失望
  • Linux编译器-gcc/g++使用
  • 分享面试题- DDD中事务处理放在哪一层?
  • 反馈的图形化-尝试建立图形化
  • 象过河仓库管理软件,轻松实现无纸化录入,自动化记账