技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

如何在MySQL中有效地找到重复的blob行？

时间：2019-05-14分类：MySQL作者：编程之家

我有一张表格

CREATE TABLE data
{
   pk INT PRIMARY KEY AUTO_INCREMENT,dt BLOB
};

它在blob列中有大约160,000行和大约2GB的数据(平均每个blob 14kb).另一个表在此表中有外键.

像3000个blob这样的东西是相同的.所以我想要的是一个查询,它将给我一个重新映射表,允许我删除重复项.

天真的方法在30-40k行上花了大约一个小时：

SELECT a.pk,MIN(b.pk) 
    FROM data AS a 
    JOIN data AS b
  ON a.dt=b.dt
  WHERE b.pk < a.pk
  GROUP BY a.pk;

出于其他原因,我碰巧有一个具有blob大小的表：

CREATE TABLE sizes
(
   fk INT,// note: non-unique
   sz INT
   // other cols
);

通过为sz构建fk和另一个的索引,直接查询需要大约24秒,每行50k行：

SELECT da.pk,MIN(db.pk) 
  FROM data AS da
  JOIN data AS db
  JOIN sizes AS sa
  JOIN sizes AS sb
  ON
        sa.size=sb.size
    AND da.pk=sa.fk
    AND db.pk=sb.fk
  WHERE
        sb.fk


然而,这是在da(数据表)上进行全表扫描.鉴于命中率应该相当低,我认为索引扫描会更好.考虑到这一点,添加了第三个数据副本作为第5个连接来获得它,并且丢失了大约3秒.
好的问题是：我会比第二次选择好得多吗？如果是这样,怎么样？
一个必然结果是：如果我有一个表,其中键列的使用非常繁重,但其余部分应该很少使用,我是否会更好地添加该表的另一个连接以鼓励索引扫描与完整表扫描？
#MysqL@irc.freenode.net上的Xgc指出,添加一个像size这样的实用程序表但在fk上有一个唯一约束可能会有很大帮助.一些有趣的触发器和什么不可能使它甚至不坏以保持最新.


最佳答案
您始终可以为数据使用散列函数(MD5或SHA1),然后比较散列.
问题是你是否可以在数据库中保存哈希值？

                
                                原文地址：https://www.jb51.cc/mysql/433307.html
                                 版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容， 请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

blob


                  上一篇：MySQL中的两列主键下一篇：无法在Windows 10上的MySQL 8.x中设


                
                    
                        
                            相关推荐
                            

                                 优化MySQL数据库发布系统存储的方法是什么
                                优化MySQL数据库发布系统存储的方法有：1.mysql库主从读写分离。2.适当的添加索引。3.选取最适用的字段属性。4.不经常改动的页面，生成静态页面。5.添加缓存机制。6.找规律分表，减少单表中的...
                  作者：编程之家 时间：2024-10-04
                                
                            

                                 怎么使用mysql
                                使用mysql的方法：在“我的电脑”→右键→“管理”→“服务”→启动和关闭MySQL服务，或者Win+R快捷键输入“cmd”打开窗口，再输入“net&nbsp; start&nbsp; MySQL服务...
                  作者：编程之家 时间：2024-10-04
                                
                            

                                 mysql怎么查看root权限
                                在mysql中查看root用户权限的方法：1.命令行启动mysql服务；2.登录mysql；3.选择数据库；4.执行“show grants for root;”命令查看权限；在mysql中查看roo...
                  作者：编程之家 时间：2024-10-04
                                
                            

                                 什么是Mysql主从复制
                                MySQL主从复制是用来备份一个与主数据库一样环境的从数据库，是MySQL最重要的功能之一，对于多级复制，数据库服务器即可充当主机，也可充当从机，而主从复制的基础是主服务器对数据库修改记录二进制日志，...
                  作者：编程之家 时间：2024-10-04
                                
                            

                                 怎么运行mysql
                                运行mysql的方法1.启动mysql服务，在“我的电脑”→右键→“管理”→“服务”→ 找到MySQL服务启动。2.然后下载Navicat Preminum、SQLyogEnt等管理工具。3.下载安装...
                  作者：编程之家 时间：2024-10-04
                                
                            

                                 如何开启mysql
                                开启mysql的方法1.可以通过快捷键win+r，输入cmd，打开窗口，接着输入命令“net start mysql”启动服务即可。2.可以通过“服务或者任务管理器查看mysql的启动状态”，步骤：右...
                  作者：编程之家 时间：2024-10-04
                                
                            

                                 如何管理mysql数据库
                                管理mysql数据库的方法可以打开mysql脚本，输入密码登录，通过以下命令进行管理：1.查看一下数据库列表：“# show databases;”2.进入某个数据库：“&nbsp;# use dat...
                  作者：编程之家 时间：2024-10-04
                                
                            

                                 psc怎么导入mysql
                                psc导入mysql的方法：1.安装Navicat软件，连接数据库。2.找到Navicat的备份目录。3.把psc备份文件复制进来。4.在恢复备份时，先在Navicat软件中建立相应的数据库名。5.建...
                  作者：编程之家 时间：2024-10-04
                                
                            

                                 mysql锁表怎么解决
                                mysql锁表的解决方法：在mysql执行以下sql语句解决。//查看进程id，然后用kill&nbsp;id杀掉进程show&nbsp;processlist;SELECT&nbsp;*&nbs...
                  作者：编程之家 时间：2024-10-04
                                
                            

                                 mysql中avg函数怎么用
                                在mysql中使用avg函数的方法：avg函数是用于计算一组值或表达式的平均值，语法：SELECT AVG(column_name) FROM &#39;table_name&#39;；avg函数作用...
                  作者：编程之家 时间：2024-10-04


            
              
          
            
              



              
            
          
          
           
          
            
              
                小编推荐苹果市值2025年有望达4万亿美元 
• 联想拯救者新一代Y700平板通过IMDA认证
• 最新AI生图模型Flux1.1刷屏！添加单反相
• 联发科天玑 9400 频率敲定，3.626GHz 最
• 苹果新品发布会来了！5款产品面临停产
• 佳能R5C Mark II配置曝光：双系统设计，
• AI应用的东风，奥特曼不想错过
• 为新品让路！苹果定制版Mac发货延期
              
            
          
          
          
          
            
              
                热门标签更多
                
                pythonJavaScriptjavaHTMLPHPreactjsC#AndroidCSSNode.jssqlrpython-3.xMysqLjQueryc++pandasFlutterangularIOSdjangolinuxswifttypescript路由器JSON路由器设置无线路由器h3c华三华三路由器设置华三路由器电脑软件教程arraysdocker软件图文教程Cvue.jslaravelspring-boot


    
    
        
            
                
                    友情链接:
ai导航
                
                    编程之家
-我要投稿
-广告合作
-联系我们
-免责声明
-网站地图
                
                版权所有 © 2018编程之家闽ICP备13020303号-8
                
            
            
                微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！