微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

PHP查询MySQL大量数据的时候内存占用分析

昨天,有同事在PHP讨论群里提到,他做的一个项目由于MySQL查询返回的结果太多(达10万条),从而导致PHP内存不够用. 所以,他问,在执行下面的代码遍历返回的MysqL结果之前,数据是否已经在内存中了? -
<div class="codetitle"><a style="CURSOR: pointer" data="77689" class="copybut" id="copybut77689" onclick="doCopy('code77689')"> 代码如下:

<div class="codebody" id="code77689">
  while ($row = MysqL_fetch_assoc($result)) {
  // ...
  }

  当然,这种问题有许多优化的方法. 不过,就这个问题来讲,我首先想到,MysqL是经典的C/S(Client/Server,客户端/服务器)模型,在遍历结果集之前,底层的实现可能已经把所有的数据通过网络(假设使用TCP/IP)读到了Client的缓冲区,也有另一种可能,就是数据还在Server端的发送缓冲区里,并没有传给Client.
  在查看PHPMysqL的源码之前,我注意到PHP手册里有两个功能相近的函数:
<div class="codetitle"><a style="CURSOR: pointer" data="69403" class="copybut" id="copybut69403" onclick="doCopy('code69403')"> 代码如下:
<div class="codebody" id="code69403">
  MysqL_query()
  MysqL_unbuffered_query()

  两个函数的字面意思和说明证实了我的想法,前一个函数执行时,会把所有的结果集从Server端读到Client端的缓冲区中,而后一个则没有,这就是”unbuffered(未缓冲)”的意思.
  那就是说,如果用MysqL_unbuffered_query()执行了一条返回大量结果集的sql语句,在遍历结果之前,PHP的内存是没有被结果集占用的. 而用MysqL_query()来执行同样的语句的话,函数返回时,PHP的内存占用便会急剧增加,立即耗光内存.
  如果阅读PHP的相关代码,可以看到这两个函数的实现上的异同:
<div class="codetitle"><a style="CURSOR: pointer" data="47377" class="copybut" id="copybut47377" onclick="doCopy('code47377')"> 代码如下:
<div class="codebody" id="code47377">
  / {{{ proto resource MysqL_query(string query [,int link_identifier])
  Sends an sql query to MysqL
/
  PHP_FUNCTION(MysqL_query)
  {
  PHP_MysqL_do_query(INTERNAL_FUNCTION_ParaM_PAsstHRU,MysqL_STORE_RESULT);
  }
  / }}} /
  / {{{ proto resource MysqL_unbuffered_query(string query [,int link_identifier])
  Sends an sql query to MysqL,without fetching and buffering the result rows
/
  PHP_FUNCTION(MysqL_unbuffered_query)
  {
  PHP_MysqL_do_query(INTERNAL_FUNCTION_ParaM_PAsstHRU,MysqL_USE_RESULT);
  }
  / }}} /

  两个函数调用PHP_MysqL_do_query(),只差了第2个参数的不同,MysqL_STORE_RESULT和MysqL_USE_RESULT. 再看PHP_MysqL_do_query()的实现:
<div class="codetitle"><a style="CURSOR: pointer" data="86898" class="copybut" id="copybut86898" onclick="doCopy('code86898')"> 代码如下:
<div class="codebody" id="code86898">
  if(use_store == MysqL_USE_RESULT) {
  MysqL_result=MysqL_use_result(&MysqL->conn);
  } else {
  MysqL_result=MysqL_store_result(&MysqL->conn);
  }

  MysqL_use_result()和MysqL_store_result()是MysqL的C API函数,这两个C API函数的区别就是后者把结果集从MysqL Server端全部读取到了Client端,前者只是读取了结果集的元信息.
  回到PHP,使用MysqL_unbuffered_query(),可以避免内存的立即占用. 如果在遍历的过程不对结果进行”PHP缓存”(如放到某数组中),则整个执行过程虽然操作了十万条或者百万条或者更多的数据,但PHP占用的内存始终是非常小的.

原文地址:https://www.jb51.cc/php/27731.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

MySQL大量数据

相关推荐