在这种情况下是否需要规范化？

如何解决在这种情况下是否需要规范化？

| 假设我有一个带有这样的表的数据库：

id | fundraiser_id | donation_amount | name | sex | university

这是我的真实表的类似版本。该表跟踪了筹款期间的捐款。同一个人很可能会为每个筹款人多次捐款（他们非常慷慨）。用户将像电子表格一样输入此数据。他们不一定会在多行中输入相同的姓名，性别和大学。毕竟，他们没有为存储空间付费。我的问题是：我应该通过在表更新时尝试为name，sex，university的集合提取不同的值并将其保存在People表中来规范化此表。然后，我的新表将如下所示：

id | fundraiser_id | donation_amount | people_id

让用户预先定义将在表中使用的人员。我在上一个问题中讨论了这种情况，但是我觉得我没有提供足够的细节。以下是我（以及在上一个问题中帮助我的其他人）提出的利弊：优点：减少浪费的空间更多“正常” 更快地回答一些疑问缺点：占用资源以确保不将重复的人添加到“人”表中将执行Cron作业以杀死People表中的孤立条目无论我如何看都需要额外的查询感谢您的任何建议。再澄清一下：我完全不关心两个人的名字，性别和大学名称相同。该信息只是显示而没有作用，因此对于我的应用程序，两个不同的人仍然是同一个人。我只是建议将此规范化为通过创建查找表来节省空间的一种方法。

解决方法

让我们尝试整理一些合理的样本数据。假设“ id”列是主键，并且人们不会犯拼写错误。

Table: donations
id   fundraiser_id   donation_amount   name              sex   university
--
1    100             $100              Kim Stack         M     Rivier College
2    100             $150              Kim Stack         M     Rivier College
3    100             $45               Marguerite Meade  F     Rivier College
4    100             $100              Marie Dew         F     Rivier College
5    100             $100              Kim Stack         F     Midway College
6    100             $100              Kim Stack         F     Mars Hill College
...
98   200             $135              Kim Stack         M     Rivier College
99   200             $400              Kim Stack         M     Midway College

让我们尝试找到与人有关的传递依赖。 name-> sex：不，有男性和女性名为“ Kim Stack”。名称->大学：否。名称，性别->大学：否，两名名叫“ Kim Stack”的女性去了不同的大学。性别，大学名称：不，里维埃学院有两名女性。名称，大学->性别：不，中途学院有名叫“ Kim Stack”的男女学生。（您可以继续。）该表没有传递相关性，并且\“ id \”是唯一的候选键：该表已位于5NF中。用ID号替换名称或用ID号替换{name，sex，university}可能与标准化无关。 , 给您您的更新问题，一个更新的答案：我真的看不出拆分这张桌子有什么好处

id | some_unique_field | name | sex | university

您绝对应该拆分此表：

id | fundraiser_id | donation_amount | name | sex | university

变成这个：

donation
id | fundraiser_id | donation_amount | donator_id

fundraiser
id | charity | ....

donator
id | name | sex | university

这样可以更轻松地获得每人的捐款金额。如果您要导入电子表格，建议您执行以下操作：步骤1：创建黑洞表，如下所示：

DROP TABLE IF EXISTS `test`.`bh_donations`;
CREATE TABLE  `test`.`bh_donations` (
  `fundraiser_name` varchar(45) NOT NULL,`donation_amount` decimal(10,2) NOT NULL,`name` varchar(45) NOT NULL,`sex` char(1) NOT NULL,`university` varchar(45) NOT NULL
) ENGINE=BLACKHOLE DEFAULT CHARSET=latin1;

您不需要这里的ѭ10，但是如果它简化了您的代码，则一定要添加它。步骤2，将触发器添加到黑洞表中以对其进行处理。

DELIMITER $$

CREATE TRIGGER bi_bh_donations BEFORE INSERT ON bh_donations FOR EACH ROW
BEGIN
  DECLARE mydonater_id integer;
  DECLARE myfundraiser_id integer;

  SELECT f.id INTO myfundraiser_id FROM fundraiser f 
    WHERE f.name = new.fundraiser_name LIMIT 1;

  IF f.id IS NULL THEN BEGIN
    SELECT error_fundraiser_is_unknown FROM table_error;
  END; END IF;

  SELECT d.id INTO mydonator_id FROM donator d
    WHERE d.name = new.name AND d.sex = new.sex AND d.university = new.university
  LIMIT 1;

  IF mydonator_id IS NULL THEN BEGIN 
    INSERT INTO donator (name,sex,university)
    VALUES (new.name,new.sex,new,university);
  END; END IF;

  SELECT LAST_INSERT_ID() INTO mydonator_id;

  INSERT INTO donation (fundraiser_id,donation_amount,donator_id)
    VALUES (myfundraiser_id,new.amount,mydonater_id); 
END$$

DELIMITER ;

步骤3使用LOAD DATA INFILE导入数据

LOAD DATA INFILE \'data.csv\' INTO TABLE bh_donations
FIELDS TERMINATED BY \',\' OPTIONALLY ENCLOSED BY \'\"\'
LINES TERMINATED BY \'\\r\\n\'
IGNORE 1 LINES;

现在，您只需将Excel文件另存为CSV即可将excel行读入黑洞表。并使用LOAD DATA INFILE将数据读取到黑洞表中。看到：黑洞表：http://dev.mysql.com/doc/refman/5.0/en/blackhole-storage-engine.html 更多黑洞：黑洞引擎的创造性用途触发器：http://dev.mysql.com/doc/refman/5.5/zh-CN/triggers.html 加载文件中的数据：http://dev.mysql.com/doc/refman/5.5/en/load-data.html 希望这可以帮助。 , 您的设计违反了数据库规范化原则：非关键字段应仅取决于关键列您可以使用id列或some_unique_field列查询您的数据；实际上，您有两个关键列。在数据库设计中，如果自然数据可用作密钥，则应使用该数据（例如护照号码）。在您的情况下，不需要id列。但是，如果您必须拥有它（例如，出于性能原因，您想要一个较小的键，而不是一个很长的值，这样您就可以在每个I / O页面上获得更多索引条目，从而更快地进行索引查找），那么就可以这样做。您的“规范化”尝试实际上并没有解决具有“两个键”的根本问题-您的新表仍然存在此问题。 ,您应该始终尝试进行标准化。除非您这样做会带来重大收益，否则您将不会这样做。在这种情况下，您只需要执行一次检查即可检查数据是否已在数据库中，并且由于这些字段很可能已被索引，因此这将是一个非常便宜的查询。另外，在使用MySQL的情况下（不了解其他数据库atm），可以使用INSERT IGNORE来避免该查找。关于孤儿...您可以使用TRIGGER来确保您不留下任何孤儿条目，除非通常删除People表中的行。 , 您可以在（姓名，性别，大学）上创建UNIQUE索引。这样可以防止重复的条目进入数据库。但是，您可能要担心一个单独的问题：检测拼写差异（例如\“ My U. \”与\“ My Univ。\”与\“ My University \”）。

在这种情况下是否需要规范化？

如何解决在这种情况下是否需要规范化？

解决方法

相关推荐