MySQL的数据类型和建库策略

发布时间:2025-05-12 01:08:15 发布人:远客网络

MySQL的数据类型和建库策略

一、MySQL的数据类型和建库策略

无论是在小得可怜的免费数据库空间或是大型电子商务网站，合理的设计表结构、充分利用空间是十分必要的。这就要求我们对数据库系统的常用数据类型有充分的认识。下面我就将我的一点心得写出来跟大家分享。

数字类型按照我的分类方法分为三类：整数类、小数类和数字类。

我所谓的“数字类”，就是指 DECIMAL和 NUMERIC，它们是同一种类型。它严格的说不是一种数字类型，因为他们实际上是将数字以字符串形式保存的;他的值的每一位(包括小数点)占一个字节的存储空间，因此这种类型耗费空间比较大。但是它的一个突出的优点是小数的位数固定，在运算中不会“失真”，所以比较适合用于“价格”、“金额”这样对精度要求不高但准确度要求非常高的字段。

小数类，即浮点数类型，根据精度的不同，有 FLOAT和 DOUBLE两种。它们的优势是精确度，FLOAT可以表示绝对值非常小、小到约 1.17E-38(0.000...0117，小数点后面有 37个零)的小数，而 DOUBLE更是可以表示绝对值小到约 2.22E-308(0.000...0222，小数点后面有 307个零)的小数。FLOAT类型和 DOUBLE类型占用存储空间分别是 4字节和 8字节。如果需要用到小数的字段，精度要求不高的，当然用 FLOAT了。可是说句实在话，我们“民用”的数据，哪有要求精度那么高的呢?这两种类型至今我没有用过——我还没有遇到适合于使用它们的事例。

用的最多的，最值得精打细算的，是整数类型。从只占一个字节存储空间的 TINYINT到占 8个字节的 BIGINT，挑选一个“够用”并且占用存储空间最小的类型是设计数据库时应该考虑的。TINYINT、SMALLINT、MEDIUMINT、INT和 BIGINT占用存储空间分别为 1字节、2字节、3字节、4字节和 8字节，就无符号的整数而言，这些类型能表示的最大整数分别为 255、65535、16777215、4294967295和 18446744073709551615。如果用来保存用户的年龄(举例来说，数据库中保存年龄是不可取的)，用 TINYINT就够了;九城的《纵横》里，各项技能值，用 SMALLINT也够了;如果要用作一个肯定不会超过 16000000行的表的 AUTO_INCREMENT的 IDENTIFY字段，当然用 MEDIUMINT不用 INT，试想，每行节约一个字节，16000000行可以节约 10兆多呢。

日期和时间类型比较简单，无非是 DATE、TIME、DATETIME、TIMESTAMP和 YEAR等几个类型。只对日期敏感，而对时间没有要求的字段，就用 DATE而不用 DATETIME是不用说的了;单独使用时间的情况也时有发生——使用 TIME;但最多用到的还是用 DATETIME。在日期时间类型上没有什么文章可做，这里就不再详述。

不要以为字符类型就是 CHAR，CHAR和 VARCHAR的区别在于 CHAR是固定长度，只要你定义一个字段是 CHAR(10)，那么不论你存储的数据是否达到了 10个字节，它都要占去 10个字节的空间;而 VARCHAR则是可变长度的，如果一个字段可能的值是不固定长度的，我们只知道它不可能超过 10个字符，把它定义为 VARCHAR(10)是最合算的，VARCHAR类型的占用空间是它的值的实际长度+1。为什么要+1呢?这一个字节用于保存实际使用了多大的长度。从这个+1中也应该看到，如果一个字段，它的可能值最长是 10个字符，而多数情况下也就是用到了 10个字符时，用 VARCHAR就不合算了：因为在多数情况下，实际占用空间是 11个字节，比用 CHAR(10)还多占用一个字节。

举个例子，就是一个存储股票名称和代码的表，股票名称绝大部分是四个字的，即 8个字节;股票代码，上海的是六位数字，深圳的是四位数字。这些都是固定长度的，股票名称当然要用 CHAR(8);股票代码虽然是不固定长度，但如果使用 VARCHAR(6)，一个深圳的股票代码实际占用空间是 5个字节，而一个上海的股票代码要占用 7个字节!考虑到上海的股票数目比深圳的多，那么用 VARCHAR(6)就不如 CHAR(6)合算了。

虽然一个 CHAR或 VARCHAR的最大长度可以到 255，我认为大于 20的 CHAR是几乎用不到的——很少有大于 20个字节长度的固定长度的东东吧?不是固定长度的就用 VARCHAR。大于 100的 VARCHAR也是几乎用不到的——比这更大的用 TEXT就好了。TINYTEXT，最大长度为 255，占用空间也是实际长度+1;TEXT，最大长度 65535，占用空间是实际长度+2;MEDIUMTEXT，最大长度 16777215，占用空间是实际长度+3;LONGTEXT，最大长度 4294967295，占用空间是实际长度+4。为什么+1、+2、+3、+4?你要是还不知道就该打 PP了。这些可以用在论坛啊、新闻啊，什么的，用来保存文章的正文。根据实际情况的不同，选择从小到大的不同类型。

枚举(ENUM)类型，最多可以定义 65535种不同的字符串从中做出选择，只能并且必须选择其中一种，占用存储空间是一个或两个字节，由枚举值的数目决定;集合(SET)类型，最多可以有 64个成员，可以选择其中的零个到不限定的多个，占用存储空间是一个到八个字节，由集合可能的成员数目决定。

举个例子来说，在 SQLServer中，你可以节约到用一个 BIT类型来表示性别(男/女)，但 MySQL没有 BIT，用 TINTINT吗?不，可以用 ENUM('帅哥','美眉')，只有两种选择，所以只需一个字节——跟 TINYINT一样大，但却可以直接用字符串'帅哥'和'美眉'来存取。真是太方便啦!

好了，MySQL的数据类型介绍得差不多，我的建库策略也随着介绍数据类型介绍给大家一些。但这只是其中一部分，篇幅有限，不能再细说;其他的，就靠各人在对数据类型理解的基础上，多多实践、多多讨论。

二、mysql 如何备份和还原数据库

目前 MySQL支持的免费备份工具有：mysqldump、mysqlhotcopy，还可以用 SQL语法进行备份：BACKUP TABLE或者 SELECT INTO OUTFILE，又或者备份二进制日志（binlog），还可以是直接拷贝数据文件和相关的配置文件。MyISAM表是保存成文件的形式，因此相对比较容易备份，上面提到的几种方法都可以使用。Innodb所有的表都保存在同一个数据文件 ibdata1中（也可能是多个文件，或者是独立的表空间文件），相对来说比较不好备份，免费的方案可以是拷贝数据文件、备份 binlog，或者用 mysqldump。

mysqldump是采用SQL级别的备份机制，它将数据表导成 SQL脚本文件，在不同的 MySQL版本之间升级时相对比较合适，这也是最常用的备份方法。现在来讲一下 mysqldump的一些主要参数：

它告诉 mysqldump，导出的数据将和哪种数据库或哪个旧版本的 MySQL服务器相兼容。值可以为 ansi、mysql323、mysql40、postgresql、oracle、mssql、db2、maxdb、no_key_options、no_tables_options、no_field_options等，要使用几个值，用逗号将它们隔开。当然了，它并不保证能完全兼容，而是尽量兼容。

导出的数据采用包含字段名的完整 INSERT方式，也就是把所有的值都写在一行。这么做能提高插入效率，但是可能会受到 max_allowed_packet参数的影响而导致插入失败。因此，需要谨慎使用该参数，至少我不推荐。

•--default-character-set=charset

指定导出数据时采用何种字符集，如果数据表不是采用默认的 latin1字符集的话，那么导出时必须指定该选项，否则再次导入数据后将产生乱码问题。

告诉 mysqldump在 INSERT语句的开头和结尾增加/*!40000 ALTER TABLE table DISABLE KEYS*/;和/*!40000 ALTER TABLE table ENABLE KEYS*/;语句，这能大大提高插入语句的速度，因为它是在插入完所有数据后才重建索引的。该选项只适合 MyISAM表。

•--extended-insert= true|false

默认情况下，mysqldump开启--complete-insert模式，因此不想用它的的话，就使用本选项，设定它的值为 false即可。

使用十六进制格式导出二进制字符串字段。如果有二进制数据就必须使用本选项。影响到的字段类型有 BINARY、VARBINARY、BLOB。

在开始导出之前，提交请求锁定所有数据库中的所有表，以保证数据的一致性。这是一个全局读锁，并且自动关闭--single-transaction和--lock-tables选项。

它和--lock-all-tables类似，不过是锁定当前导出的数据表，而不是一下子锁定全部库下的表。本选项只适用于 MyISAM表，如果是 Innodb表可以用--single-transaction选项。

只导出数据，而不添加 CREATE TABLE语句。

不导出任何数据，只导出数据库表结构。

这只是一个快捷选项，等同于同时添加--add-drop-tables--add-locking--create-option--disable-keys--extended-insert--lock-tables--quick--set-charset选项。本选项能让 mysqldump很快的导出数据，并且导出的数据能很快导回。该选项默认开启，但可以用--skip-opt禁用。注意，如果运行 mysqldump没有指定--quick或--opt选项，则会将整个结果集放在内存中。如果导出大数据库的话可能会出现问题。

该选项在导出大表时很有用，它强制 mysqldump从服务器查询取得记录直接输出而不是取得所有记录后将它们缓存到内存中。

该选项在导出数据之前提交一个 BEGIN SQL语句，BEGIN不会阻塞任何应用程序且能保证导出时数据库的一致性状态。它只适用于事务表，例如 InnoDB和 BDB。本选项和--lock-tables选项是互斥的，因为 LOCK TABLES会使任何挂起的事务隐含提交。要想导出大表的话，应结合使用--quick选项。

同时导出触发器。该选项默认启用，用--skip-triggers禁用它。

其他参数详情请参考手册，我通常使用以下 SQL来备份 MyISAM表：

/usr/local/mysql/bin/mysqldump-uyejr-pyejr--default-character-set=utf8--opt--extended-insert=false\

--triggers-R--hex-blob-x db_name> db_name.sql

/usr/local/mysql/bin/mysqldump-uyejr-pyejr--default-character-set=utf8--opt--extended-insert=false\

--triggers-R--hex-blob--single-transaction db_name> db_name.sql

用 mysqldump备份出来的文件是一个可以直接倒入的 SQL脚本，有两种方法可以将数据导入。

/usr/local/mysql/bin/mysql-uyejr-pyejr db_name< db_name.sql

其实这不是标准的 SQL语法，而是 mysql客户端提供的功能，例如：

这里需要指定文件的绝对路径，并且必须是 mysqld运行用户(例如 nobody)有权限读取的文件。

mysqlhotcopy是一个 PERL程序，最初由Tim Bunce编写。它使用 LOCK TABLES、FLUSH TABLES和 cp或 scp来快速备份数据库。它是备份数据库或单个表的最快的途径，但它只能运行在数据库文件（包括数据表定义文件、数据文件、索引文件）所在的机器上。mysqlhotcopy只能用于备份 MyISAM，并且只能运行在类Unix和 NetWare系统上。

mysqlhotcopy支持一次性拷贝多个数据库，同时还支持正则表达。以下是几个例子：

root#/usr/local/mysql/bin/mysqlhotcopy-h=localhost-u=yejr-p=yejr db_name/tmp(把数据库目录 db_name拷贝到/tmp下)

root#/usr/local/mysql/bin/mysqlhotcopy-h=localhost-u=yejr-p=yejr db_name_1... db_name_n/tmp

root#/usr/local/mysql/bin/mysqlhotcopy-h=localhost-u=yejr-p=yejr db_name./regex//tmp

更详细的使用方法请查看手册，或者调用下面的命令来查看 mysqlhotcopy的帮助：

perldoc/usr/local/mysql/bin/mysqlhotcopy

注意，想要使用 mysqlhotcopy，必须要有 SELECT、RELOAD(要执行 FLUSH TABLES)权限，并且还必须要能够有读取 datadir/db_name目录的权限。

mysqlhotcopy备份出来的是整个数据库目录，使用时可以直接拷贝到 mysqld指定的 datadir(在这里是/usr/local/mysql/data/)目录下即可，同时要注意权限的问题，如下例：

root#cp-rf db_name/usr/local/mysql/data/

root#chown-R nobody:nobody/usr/local/mysql/data/(将 db_name目录的属主改成 mysqld运行用户)

BACKUP TABLE语法其实和 mysqlhotcopy的工作原理差不多，都是锁表，然后拷贝数据文件。它能实现在线备份，但是效果不理想，因此不推荐使用。它只拷贝表结构文件和数据文件，不同时拷贝索引文件，因此恢复时比较慢。例子：

BACK TABLE tbl_name TO'/tmp/db_name/';

注意，必须要有 FILE权限才能执行本SQL，并且目录/tmp/db_name/必须能被 mysqld用户可写，导出的文件不能覆盖已经存在的文件，以避免安全问题。

SELECT INTO OUTFILE则是把数据导出来成为普通的文本文件，可以自定义字段间隔的方式，方便处理这些数据。例子：

SELECT INTO OUTFILE'/tmp/db_name/tbl_name.txt' FROM tbl_name;

注意，必须要有 FILE权限才能执行本SQL，并且文件/tmp/db_name/tbl_name.txt必须能被 mysqld用户可写，导出的文件不能覆盖已经存在的文件，以避免安全问题。

用 BACKUP TABLE方法备份出来的文件，可以运行 RESTORE TABLE语句来恢复数据表。例子：

RESTORE TABLE FROM'/tmp/db_name/';

用 SELECT INTO OUTFILE方法备份出来的文件，可以运行 LOAD DATA INFILE语句来恢复数据表。例子：

LOAD DATA INFILE'/tmp/db_name/tbl_name.txt' INTO TABLE tbl_name;

权限要求类似上面所述。倒入数据之前，数据表要已经存在才行。如果担心数据会发生重复，可以增加 REPLACE关键字来替换已有记录或者用 IGNORE关键字来忽略他们。

shell> mysqldump--quick db_name| gzip> db_name.contents.gz(该例子中创建的文件是压缩格式）。

shell> gunzip< db_name.contents.gz| mysql db_name以上命令,适用于*nix操作系统的机器

采用 binlog的方法相对来说更灵活，省心省力，而且还可以支持增量备份。

启用 binlog时必须要重启 mysqld。首先，关闭 mysqld，打开 my.cnf，加入以下几行：

然后启动 mysqld就可以了。运行过程中会产生 binlog.000001以及 binlog.index，前面的文件是 mysqld记录所有对数据的更新操作，后面的文件则是所有 binlog的索引，都不能轻易删除。关于 binlog的信息请查看手册。

需要备份时，可以先执行一下 SQL语句，让 mysqld终止对当前 binlog的写入，就可以把文件直接备份，这样的话就能达到增量备份的目的了：

FLUSH LOGS;如果是备份复制系统中的从服务器，还应该备份 master.info和 relay-log.info文件。

备份出来的 binlog文件可以用 MySQL提供的工具 mysqlbinlog来查看，如：

/usr/local/mysql/bin/mysqlbinlog/tmp/binlog.000001

该工具允许你显示指定的数据库下的所有 SQL语句，并且还可以限定时间范围，相当的方便，详细的请查看手册。

恢复时，可以采用类似以下语句来做到：

/usr/local/mysql/bin/mysqlbinlog/tmp/binlog.000001| mysql-uyejr-pyejr db_name

把 mysqlbinlog输出的 SQL语句直接作为输入来执行它。

如果你有空闲的机器，不妨采用这种方式来备份。由于作为 slave的机器性能要求相对不是那么高，因此成本低，用低成本就能实现增量备份而且还能分担一部分数据查询压力，何乐而不为呢？

相较前几种方法，备份数据文件最为直接、快速、方便，缺点是基本上不能实现增量备份。为了保证数据的一致性，需要在靠背文件前，执行以下 SQL语句：

FLUSH TABLES WITH READ LOCK;也就是把内存中的数据都刷新到磁盘中，同时锁定数据表，以保证拷贝过程中不会有新的数据写入。这种方法备份出来的数据恢复也很简单，直接拷贝回原来的数据库目录下即可。

注意，对于 Innodb类型表来说，还需要备份其日志文件，即 ib_logfile*文件。因为当 Innodb表损坏时，就可以依靠这些日志文件来恢复。

对于中等级别业务量的系统来说，备份策略可以这么定：第一次全量备份，每天一次增量备份，每周再做一次全量备份，如此一直重复。而对于重要的且繁忙的系统来说，则可能需要每天一次全量备份，每小时一次增量备份，甚至更频繁。为了不影响线上业务，实现在线备份，并且能增量备份，最好的办法就是采用主从复制机制(replication)，在 slave机器上做备份。

作为一名DBA(我目前还不是，呵呵)，最重要的工作内容之一是保证数据表能安全、稳定、高速使用。因此，需要定期维护你的数据表。以下 SQL语句就很有用：

CHECK TABLE或 REPAIR TABLE，检查或维护 MyISAM表

当然了，上面这些命令起始都可以通过工具 myisamchk来完成，在这里不作详述。

Innodb表则可以通过执行以下语句来整理碎片，提高索引速度：

ALTER TABLE tbl_name ENGINE= Innodb;

这其实是一个 NULL操作，表面上看什么也不做，实际上重新整理碎片了。

通常使用的 MyISAM表可以用上面提到的恢复方法来完成。如果是索引坏了，可以用 myisamchk工具来重建索引。而对于 Innodb表来说，就没这么直接了，因为它把所有的表都保存在一个表空间了。不过 Innodb有一个检查机制叫模糊检查点，只要保存了日志文件，就能根据日志文件来修复错误。可以在 my.cnf文件中，增加以下参数，让 mysqld在启动时自动检查日志文件：