发新话题
打印

MySQL数据库学习手册之问题和常见错误

MySQL数据库学习手册之问题和常见错误

  18 问题和常见错误
18.1 如果MySQL总是崩溃怎么办

所有MySQL在发布它们之前,在许多平台上被测试。这并不意味着在MySQL中没有任何错误,但是如果有错误,它们是很少的并且很能难发现。如果你有一个问题并且如果你尝试找出究竟是什么摧毁了你的系统,它将总是有帮助的,因为你将有一个更好机会使得它被快速修复。

首先你应该试着找出问题mysqld守护进程是否死掉或你的问题是否与你的客户有关。你可以用mysqladmin version检查你的mysqld服务器正常执行了多长时间,如果mysqld死了,你可以在文件“mysql-data-directory/'hostname'.err”中找到其原因。

因为很难知道一些东西为什么崩溃,首先试着检查为其它人工作的东西是否使你崩溃。请尝试下列事情:

* 与mysqladmin shutdown停止mysqld守护进程,在所有表上运行myisamchk --silent --force */*.MYI并重启mysqld守护经进程。这将保证你从一个干净的状态运行。见13 维护MySQL安装。
* 使用mysqld --log并且试着从日志信息确定是否是某个特定的查询杀死了服务器。全部错误的95%与特定的查询有关!通常它是在日志文件中就在MySQL重启之前的最后查询之一。你也许可以使用下列过程验证它:
o 停止MySQL守护进程(用mysqladmin shutdown)。
o 在MySQL数据库目录下做文件的一个备份。
o 与myisamchk -s */*.MYI检查表以验证所有表是正确的。如果有任何表被损坏,用myisamchk -r path-to-table.MYI修复它。
o 从MySQL数据目录删除(或移走)任何旧的日志文件。
o 用safe_mysql --log启动服务器。
o 如果mysqld现在死掉,你可以通过恢复备份并执行mysql < mysql-log-file来测试问题是否是一个特定的查询引起的。当然你可以通过用safe_mysqld --data=path-to-backup-directory启动另一个MySQL服务器,在某个其他目录而不是标准MySQL数据库目录下做后面的测试。
* 你试用了基准测试吗?他们应该很好地测试MySQL。你也可以增加代码模拟你的应用程序!基准程序可在源代码分发的“bench”目录下找到,或对二进制分发,在你的MySQL安装目录下“sql-bench”目录。
* 试一下fork_test.pl和fork2_test.pl。
* 对任何错误检查文件“mysql-data-directory/'hostname'.err”。
* 如果你配置MySQL以便调试,如果出错,收集可能的错误信息将更容易。使用--with-debug选项的configure重新配置MySQL然后重新编译。见G.1 调试一个 MySQL 服务器。
* 为调试而配置MySQL使它包含一个安全的内存分配器以便能发现一些错误。它也提供关于正在发生什么的大量输出。
* 你为你的操作系统使用了最新的补丁吗?
* 使用mysql的--skip-locking选项.在一些系统上,lockd锁管理器不能正确工作;--skip-locking选项告诉mysqld不使用外部锁。(这意味着你不能在同一个数据上运行两个mysqld服务器而且如果你使用myisamchk,你一定要小心,但是它对为了测试试用选项可能有益。)
* 当mysqld好象正在运行但没有反应时,你尝试过mysqladmin -u root processlist吗?有时mysqld不是毫无反应,尽管你可能这样认为。问题可能是所有在用的连接,或可能用内部锁定问题。mysqladmin processlist甚至在这些情况下将通常可以进行一个连接,并且能提供有关当前连接数量及其状态的有用信息。
* 在你运行其他查询时,在一个单独窗口中运行命令mysqladmin -i 5 status,产生统计。
* 尝试下列步骤:
1. 通过gdb(或其他调试器)启动mysqld。
2. 运行你的测试脚本。
3. 当mysqld核心倾倒(core dump),做back(或你调试器中的回溯-backtrace命令)。
* 尝试用一个Perl脚本模拟你的应用程序以强制MySQL崩溃或表现不正确。
* 或发一份正式的错误报告。见2.3 如何报告错误或问题,但是要不平常更详细。因为MySQL为很多人的工作,导致崩溃的东西可能只存在于你的计算机上(例如,与你的特定系统库有关的一个错误)。
* 如果你的问题有具有动态长度行的表有关,并且你不使用BLOB/TEXT列(但是仅VARCHAR列),你可以用ALTER TABLE试着将全部VARCHAR改为CHAR,这将强制MySQL使用固定尺寸的行。固定尺寸的行占据很小的额外空间,但是更能容忍崩溃!当前动态行的代码在 TCX 至少使用3 年的时间,没有任何问题,但是从本质上讲,动态长度的行对错误更敏感,因此如果上述对你有帮助,尝试一下可能是一个好主意!

18.2 使用MySQL时的一些常见错误
18.2.1 MySQL server has gone away错误

本小节也涉及有关Lost connection to server during query的错误。

对MySQL server has gone away错误最常见的原因是服务器超时了并且关闭了连接。缺省地,如果没有事情发生,服务器在 8个小时后关闭连接。你可在启动mysqld时通过设置wait_timeout变量改变时间限制。

你可以通过执行mysqladmin version并且检验正常运行的时间来检查MySQL还没死掉。

如果你有一个脚本,你只须再发出查询让客护进行一次自动的重新连接。

在这种请下,你通常能获得下列错误代码(你得到的是OS相关的):
CR_SERVER_GONE_ERROR 客户不能发送一个问题给服务器。
CR_SERVER_LOST 当写服务器时,客户没有出错,但是它没有得到对问题的一个完整的答案(或任何答案)。

如果你向服务器发送不正确的或太大的查询,你也可能得到这些错误。如果mysqld得到一个太大或不正常的包,它认为客户出错了并关闭连接。如果你需要较大的查询(例如,如果你正在处理较大的BLOB列),你可以使用-O max_allowed_packet=#选项(缺省1M)启动mysqld以增加查询限制。多余的内存按需分配,这样mysqld只有在你发出较大差询时或mysqld必须返回较大的结果行时,才使用更多的内存!
18.2.2 Can't connect to [local] MySQL server错误

一个MySQL客户可以两种不同的方式连接mysqld服务器:Unix套接字,它通过在文件系统中的一个文件(缺省“/tmp/mysqld.sock”)进行连接;或TCP/IP,它通过一个端口号连接。Unix套接字比TCP/IP更快,但是只有用在连接同一台计算机上的服务器。如果你不指定主机名或如果你指定特殊的主机名localhost,使用Unix套接字。

错误(2002)Can't connect to ...通常意味着没有一个MySQL服务器运行在系统上或当试图连接mysqld服务器时,你正在使用一个错误的套接字文件或TCP/IP端口。

由检查(使用ps)在你的服务器上有一个名为mysqld的进程启动!如果没有任何mysqld过程,你应该启动一个。见4.15.2 启动MySQL服务器的问题。

如果一个mysqld过程正在运行,你可以通过尝试这些不同的连接来检查服务器(当然,端口号和套接字路径名可能在你的安装中是不同的):

shell> mysqladmin version
shell> mysqladmin variables
shell> mysqladmin -h `hostname` version variables
shell> mysqladmin -h `hostname` --port=3306 version
shell> mysqladmin -h 'ip for your host' version
shell> mysqladmin --socket=/tmp/mysql.sock version

注意hostname命令使用反引号“`”而非正引号“'”;这些导致hostname输出(即,当前主机名)被代替进mysqladmin命令中。

这是可能造成Can't connect to local MySQL server错误的一些原因:

* mysqld不在运行。
* 你正在使用MIT-pthreads的一个系统上运行。如果正在运行在一个没有原生线程的系统上,mysqld使用 MIT-pthreads 软件包。见4.2 由MySQL支持的操作系统。然而,MIT-pthreads不支持Unix套接字,因此当与服务器连接时,在这样一个系统上,你总是必须明确地指定主机名。试试使用这个命令检查到服务器的连接:

shell> mysqladmin -h `hostname` version

* 某人删除了mysqld使用的Unix套接字(缺省“/tmp/mysqld.sock”)。你可能有一个cron任务删除了MySQL套接字(例如,一个把旧文件从“/tmp”目录中删除的任务)。你总是可以运行mysqladmin version并且检查mysqladmin正在试图使用的套接字确实存在。在这种情况下,修复方法是删除cron任务而不删除“mysqld.sock 或将套接字放在其他地方。你能用这个命令在MySQL配置时指定一个不同的套接字地点:

shell> ./configure --with-unix-socket-path=/path/to/socket

你也可以使用--socket=/path/to/socket选项启动safe_mysqld和在启动你的MySQL客户前设置环境变量MYSQL_UNIX_PORT为套接字路径名。你可用--socket=/path/to/socket选项启动mysqld服务器。如果你改变了服务器的套接字路径名,你也必须通知MySQL客户关于新路径的情况。你可以通过设置环境变量MYSQL_UNIX_PORT为套接字路径名或由提供套接字路径名作为客户的参数做到。你可用这个命令测试套接字:

shell> mysqladmin --socket=/path/to/socket version

* 你正在使用 Linux和线程已经死了(核心倾倒了)。在这种情况中,你必须杀死其它mysqld线程(例如在启动一个新的MySQL服务器之前,可以用mysql_zap脚本)。见18.1 如果MySQL总是崩溃怎么办。

如果你得到错误Can't connect to MySQL server on some_hostname,你可以尝试下列步骤找出问题是什么:

* 通过执行telnet your-host-name tcp-ip-port-number并且按几次回车来检查服务器是否正常运行。如果有一个MySQL运行在这个端口上,你应该得到一个包含正在运行的MySQL服务器的版本号的应答。如果你得到类似于telnet: Unable to connect to remote host: Connection refused的一个错误,那么没有服务器在使用的端口上运行。
* 尝试连接本地机器上的mysqld守护进程,并用mysqladmin variables检查mysqld被配置使用的TCP/IP端口(变量port)。
* 检查你的mysqld服务器没有用--skip-networking选项启动。

18.2.3 Host '...' is blocked错误

如果你得到象这样的一个错误:

Host 'hostname' is blocked because of many connection errors.
Unblock with 'mysqladmin flush-hosts'

这意味着,mysqld已经得到了大量(max_connect_errors)的主机'hostname'的在中途被中断了的连接请求。在max_connect_errors次失败请求后,mysqld认定出错了(象来字一个黑客的攻击),并且阻止该站点进一步的连接,直到某人执行命令mysqladmin flush-hosts。

缺省地,mysqld在10个连接错误后阻塞一台主机。你可以通过象这样启动服务器很容易地调整它:

shell> safe_mysqld -O max_connect_errors=10000

TOP

发新话题