您的位置:论坛首页 >> 软件论坛论坛  

如何在SQL Server中快速删除重复记录

楼主: 2008-6-15 16:15:57
游客
 编辑  删除  回复  收藏  留言  好友   置顶   取消精华

原文:如何在SQL Server中快速删除重复记录

开发人员的噩梦——删除重复记录

想必每一位开发人员都有过类似的经历,在对数据库进行查询或统计的时候不时地会碰到由于表中存在重复的记录而导致查询和统计结果不准确。解决该问题的办法就是将这些重复的记录删除,只保留其中的一条。

在SQL Server中除了对拥有十几条记录的表进行人工删除外,实现删除重复记录一般都是写一段代码,用游标的方法一行一行检查,删除重复的记录。因为这种方法需要对整个表进行遍历,所以对于表中的记录数不是很大的时候还是可行的,如果一张表的数据达到上百万条,用游标的方法来删除简直是个噩梦,因为它会执行相当长的一段时间。

四板斧——轻松消除重复记录

殊不知在SQL Server中有一种更为简单的方法,它不需要用游标,只要写一句简单插入语句就能实现删除重复记录的功能。为了能清楚地表述,我们首先假设存在一个产品信息表Products,其表结构如下:

CREATE TABLE Products ( 
ProductID int, 
ProductName nvarchar (40), 
Unit char(2), 
UnitPrice money 
)

表中的数据如图1:

图1中可以看出,产品Chang和Tofu的记录在产品信息表中存在重复。现在要删除这些重复的记录,只保留其中的一条。步骤如下:

第一板斧——建立一张具有相同结构的临时表

CREATE TABLE Products_temp ( 
ProductID int, 
ProductName nvarchar (40), 
Unit char(2), 
UnitPrice money 
)

第二板斧——为该表加上索引,并使其忽略重复的值

方法是在企业管理器中找到上面建立的临时表Products _temp,单击鼠标右键,选择所有任务,选择管理索引,选择新建。如图2所示。

按照图2中圈出来的地方设置索引选项。

第三板斧——拷贝产品信息到临时表

insert into Products_temp Select * from Products

此时SQL Server会返回如下提示:

服务器: 消息 3604,级别 16,状态 1,行 1 
已忽略重复的键。

它表明在产品信息临时表Products_temp中不会有重复的行出现。

第四板斧——将新的数据导入原表

将原产品信息表Products清空,并将临时表Products_temp中数据导入,最后删除临时表

Products_temp。 
delete Products 
insert into Products select * from Products_temp 
drop table Products_temp

这样就完成了对表中重复记录的删除。无论表有多大,它的执行速度都是相当快的,而且因为几乎不用写语句,所以它也是很安全的。

小提示:上述方法中删除重复记录取决于创建唯一索引时选择的字段,在实际的操作过程中读者务必首先确认创建的唯一索引字段是否正确,以免将有用的数据删除。

(T114)

 

 1楼: 2008-6-15 16:15:57
游客
 删除  留言  好友

哈哈 
没看明白 呵呵

 


回复帖子 RE: 如何在SQL Server中快速删除重复记录

 1、第1个回帖者得3分,第2个回帖者得2分,其余得1个积分!

 2、如是求助帖,前10位有效回帖用户每人再各加10分!

 3、如果乱回求助帖,让原帖作者很不满意,他有权收回积分,系统也同时对您惩罚,扣除10个积分

帐号:
用户名 密码 (不填为游客)  注册新用户
内容:


撤消 恢复 粗体 斜体 下划线 左对齐 居中 右对齐 超级链接 取消超级链接 插入网上图片,支持格式为:gif、jpg、png、bmp 使用帮助 上传图片
表情符号:


附加码:
(附加码: 2896 )