微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

PHP实现的带超时功能get_headers函数

代码比较多,但是比较简单,一眼就看穿的,so,文字尽量少写了。 因为众所周知的网络原因,gavatar也开始越来越慢,写了一个小东西来解决这个问题,过程中遇到了get_headers这个函数,甚是忧伤,记录下来,以免后来人踩坑。 更新记录,函数稍微改了一下,返回值基本和之前序列化后的结果一致,暂时没考虑支持子项也支持数组等(考虑细节性能,还想把没用的http头砍掉….) 需求很简单:获取图片的head信息。 调试程序的时候发现这个函数调用很缓慢,即使绑定ip,有时候都能蹦到20多秒。 寻思这个事情还是该加个超时吧,但是看官方文档,给出的导出函数接口如下:

代码如下:
你没有看错,这个东西没有超时接口… 上github翻看源码,期望可以用他的底层实现来重新实现一套: 地址

代码如下:
PHP_FUNCTION(get_headers) { char*url; size_t url_len; PHP_stream_context*context; PHP_stream*stream; zval*prev_val,*hdr=NULL,*h; HashTable*hashT; zend_long format=0;

if(zend_parse_parameters(ZEND_NUM_ARGS()TSrmlS_CC,"s|l",&url,&url_len,&format)==FAILURE){
return;
}

/ 省略其他一堆... /
}
/ }}} /

但是很不幸的是,zend_parse_parameters 和 ZEND_NUM_ARGS也都没有PHP版的导出函数。 于是造轮子开始:

代码如下:
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch,CURLOPT_HEADER,true);
curl_setopt($ch,CURLOPT_NOBODY,CURLOPT_RETURNTRANSFER,CURLOPT_TIMEOUT,$timeout);

$data=curl_exec($ch);
$data=preg_split('/\n/',$data);

$data=array_filter(array_map(function($data){
$data=trim($data);
if($data){
$data=preg_split('/:\s/',trim($data),2);
$length=count($data);
switch($length){
case2:
returnarray($data[0]=>$data[1]);
break;
case1:
return$data;
break;
default:
break;
}
}
},$data));

sort($data);

foreach($dataas$key=>$value){
$itemKey=array_keys($value)[0];
if(is_int($itemKey)){
$data[$key]=$value[$itemKey];
}elseif(is_string($itemKey)){
$data[$itemKey]=$value[$itemKey];
unset($data[$key]);
}
}

return$data;
}

对比最后结果: 原版又是蛮长的等待,不知道校验啥去了(没继续追代码了,有兴趣的童鞋可以去跟下玩):

代码如下:
HTTP/1.0302Found [Accept-Ranges]=>bytes [Cache-Control]=>max-age=300 [Content-Type]=>Array ( [0]=>text/html;charset=utf-8 [1]=>text/html;charset=utf-8 )

[Date]=>Array
(
[0]=>Fri,12Dec201415:35:40GMT
[1]=>Fri,12Dec201415:35:43GMT
)

[Expires]=>Fri,12Dec201415:40:40GMT
[Last-Modified]=>Wed,11Jan198408:00:00GMT
[Link]=><<a href="http://www.gravatar.com/avatar/"&gt;http://www.gravatar.com/avatar/[省略...]?s=42&d=http%3A%2F%2F[省略...]&r=G>; rel="canonical"
[Location]=>http://i2.wp.com/[省略...]
[Server]=>Array
(
[0]=>ECS(oxr/838B)
[1]=>nginx
)

[Source-Age]=>85
[Via]=>1.1varnish
[X-Cache]=>302-HIT
[X-Varnish]=>14702550881470006304
[Content-Length]=>0
[Connection]=>Array
(
[0]=>close
[1]=>close
)

[1]=>HTTP/1.1504Gateway Timeout
)

轮子版返回(瞬间返回,两者内容略有不同,你仔细看就能发现一些有趣的地方了):

代码如下:
HTTP/1.1302Found [Accept-Ranges]=>bytes [Via]=>1.1varnish [Cache-Control]=>max-age=300 [Server]=>ECS(oxr/838B) [Content-Type]=>text/html;charset=utf-8 [X-Varnish]=>14702550881470006304 [Date]=>Fri,12Dec201420:31:02GMT [Location]=>http://i2.wp.com/[省略...] [Expires]=>Fri,12Dec201420:36:02GMT [Source-Age]=>85 [Last-Modified]=>Wed,11Jan198408:00:00GMT [X-Cache]=>302-HIT [Link]=><[省略...]?s=42&d=http%3A%2F%2F[省略...]&r=G>; rel="canonical" [Content-Length]=>0 )

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐