节点PHP二叉堆是什么

php是什么  时间:2021-02-28  阅读:()

PHP二叉堆是什么

堆可以视为一棵完全的二叉树,完全二叉树的一个“优秀”的性质是,除了最底层之外,每一层都是满的,这使得堆可以利用数组来表示,每一个结点对应数组中的一个元素.大家知道PHP二叉堆是什么吗?下面就跟随小编一起来看看吧!

在以往工作或者面试的时候常会碰到一个问题如何实现海量TopN就是在一个非常大的结果集里面快速找到最大的前10或前100个数 同时要保证内存和速度的效率我们可能第一个想法就是利用排序然后截取前10或前100而排序对于量不是特别大的时候没有任何问题但只要量特别大是根本不可能完成这个任务的 比如在一个数组或者文本文件里有几亿个数这样是根本无法全部读入内存的所以利用排序解决这个问题并不是最好的所以我们这里就用php去实现一个小顶堆来解决这个问题.

二叉堆

二叉堆是一种特殊的堆二叉堆是完全二叉树或者是近似完全二叉树二叉堆有两种最大堆和最小堆最大堆父结点的键值总是大于或等于任何一个子节点的键值;最小堆父结点的键值总是小于或等于任何一个子节点的键

小顶堆-(图片来自网络)

二叉堆一般用数组来表示(看上图)例如根节点在数组中的位置是0第n个位置的子节点分别在2n+1和2n+2因此第0个位置的子节点在1和2 1的子节点在3和4以此类推这种存储方式便于寻找父节点和子节点。

具体概念问题这里就不在多说了如果对二叉堆有疑问的可以在好好了解下这个数据结构下面我们就针对上述topN问题来用php代码实现并解决为了看出区别这里先用排序的方式去实现下看下效果如何。

利用快速排序算法来实现TopN

//为 了 测试运行 内存调大一点ini_set('memory_limit','2024M');//实现一个快速排序函数function quick_sort(array$array){ $length=count($array); $left_array= array(); $right_array= array();if($length = 1){ return $array; } $key = $array[0];for($i=1;$i$length;$i++){ $key){ $right_arr ay[] =$array[$i]; }else{ $left_array[] =$array[$i]; } } $left_array=quick_sort($left_array);$ri ght_array=quick_sort($right_array);return array_merge($right_array,array($key),$left_array); }//构造500w不重复数for($i=0;$i5000000;$i++){ $numArr[] =

$i; }//打乱它们shuffle($numArr);//现在我们从里面找到top 10最 大 的 数var_dump(time());print_r(array_slic e(qui ck_sort($all),0,10));var_dump(time());

运行之后结果

可以看到上面打印出了top10的结果并输出了下运行时间大概99s左右但这只是500w个数且全部能装入内存的情况如果我们有一个文件里面有5 kw或5亿个数肯定就会有些问题了.

利用二叉堆算法来实现TopN

实现流程是

1、先读取10个或100个数到数组里面这就是我们的topN数.

2、调用生成小顶堆函数把这个数组生成一个小顶堆结构这个时候堆顶一定是最小的.

3、从文件或者数组依次遍历剩余的所有数.

4、每遍历出来一个则跟堆顶的元素进行大小比较如果小于堆顶元素则抛弃如果大于堆顶元素则替换之.

5、跟堆顶元素替换完毕之后在调用生成小顶堆函数继续生成小顶堆 因为需要再找出来一个最小的.

6、重复以上4~5步骤这样当全部遍历完毕之后我

们这个小顶堆里面的就是最大的topN因为我们的小顶堆永远都是排除最小的留下最大的而且这个调整小顶堆速度也很快只是相对调整下只要保证根节点小于左右节点就可以.

7、算法复杂度的话按top10最坏的情况下就是每遍历一个数如果跟堆顶进行替换需要调整10次的情况也要比排序速度快而且也不是把所有的内容全部读入内存可以理解成就是一次线性遍历.

//生成小顶堆函数function Heap(&$arr,$idx){ $left=($idx 1)+1 ;$right=($idx 1)+2; if(!$arr[$left]){ return; }if($arr[$right] && $arr[$ri ght] $arr[$left]){ $l =$right; }else{ $l= $left; } if ($arr[$idx] $arr[$l]){ $tmp=$arr[$i dx]; $arr[$i dx] = $arr[$l]; $arr[$l] = $tmp;Heap($arr,$l); }}//这里为了保证跟上面一致也构造500w不重复数/*当然这个数据集并不一定全放在内存也可以在文件里面 因为我们并不是全部加载到内存去进行排序

*/for($i=0;$i5000000;$i++){ toparr="array_slice($numArr,0,10);//获取最后一个有子节点的索引位置//因为在构造小顶堆的时候是从最后一个有左或右节点的位置//开始从下往上不断的进行移动构造(具体可看上面的图去理解)$idx-="i="$idx;$i"=0;$i--){Heap($topArr,$i);}var_dump(time());//这里可以看到就是开始遍历剩下的

所有元素for($i = count($topArr); $i count($numArr);$i++){ //每遍历一个则跟堆顶元素进行比较大小 if($numArr[$i] $topArr[0]){ //如果大于堆顶元素则替换$topArr[0] = $numArr[$i]; /*重新调用生成小顶堆函数进行维护只不过这次是从堆顶的索引位置开始自上往下进行维护 因为我们只是把堆顶的元素给替换掉了而其余的还是按照根节点小于左右节点的顺序摆放这也就是我们上面说的 只是相对调整下 并 不是全部调整一遍 */Heap($topArr,0); }}var_dump(time());

运行之后结果

可以看到最终的结果也是top10只不过时间只用了1s左右而且无论是内存还是时间效率都满足我们的要求而且跟排序比最好的一点就是不用把所有的数据集都读如到内存里面来 因为我们不需要排序而上面是为了演示所以直接在内存构造了500w元素然而我们可以把这个全部转移到文件里面去然后一行一行读取进行比较 因为我们这个数据结构的核心点就是线性遍历跟内存里面很小的小顶堆结构进行比较最终得到TopN.

搬瓦工(季付46.7美元)新增荷兰(联通线路)VPS,2.5-10Gbps

搬瓦工最近新增了荷兰机房中国联通(AS9929、AS4837)线路的VPS产品,选项为NL - China Unicom Amsterdam(ENUL_9),与日本软银和洛杉矶(DC06)CN2 GIA配置一致可以互换,属于高端系列,2.5Gbps-10Gbps大带宽,最低季付46.7美元起。搬瓦工VPS隶属于老牌IT7公司旗下,主要提供基于KVM架构VPS主机,数据中心包括美国洛杉矶、凤凰城、纽...

cyun29元/月,香港CN2 GIA云服务器低至起;香港多ip站群云服务器4核4G

cyun怎么样?cyun蓝米数据是一家(香港)藍米數據有限公司旗下品牌,蓝米云、蓝米主机等同属于该公司品牌。CYUN全系列云产品采用KVM架构,SSD磁盘阵列,优化线路,低延迟,高稳定。目前,cyun推出的香港云服务器性价比超高,香港cn2 gia云服务器,1核1G1M/系统盘+20G数据盘,低至29元/月起;香港多ip站群云服务器,16个ip/4核4G仅220元/月起,希望买香港站群服务器的站长...

tmhhost(100元/季)自带windows系统,香港(三网)cn2 gia、日本cn2、韩国cn2、美国(三网)cn2 gia、美国cn2gia200G高防

tmhhost可谓是相当熟悉国内网络情况(资质方面:ISP\ICP\工商齐备),专业售卖海外高端优质线路的云服务器和独立服务器,包括了:香港的三网cn2 gia、日本 cn2、日本软银云服务器、韩国CN2、美国三网cn2 gia 云服务器、美国 cn2 gia +200G高防的。另外还有国内云服务器:镇江BGP 大连BGP数据盘和系统盘分开,自带windows系统,支持支付宝付款和微信,简直就是专...

php是什么为你推荐
根目录到底什么是根目录,根文件夹回收站在哪回收站在哪?湖南商标注册在湖南搞商标注册是代理好还是自己去好一点?湖南商标注册的流程又是什么样的呢?真正免费的网络电话有没有真正免费的网络电话?而且是好用的?万网核心代理哪里可以注册免费代理?中国论坛大全天涯论坛的网址?在线代理网站最好的免费在线代理网站有哪些~急!安卓应用平台有没有什么安卓游戏都能找到的应用商店或者游戏中心唱吧电脑版官方下载唱吧有电脑版的么? 在哪里下载啊?腾讯文章为什么最近腾讯网的文章评论都看不到
免费cn域名注册 免费cn域名 2019年感恩节 vps.net godaddy主机 免备案cdn 服务器怎么绑定域名 500m空间 个人空间申请 中国电信测网速 百度云1t 免费网页空间 上海服务器 支持外链的相册 in域名 免费mysql数据库 备案空间 什么是web服务器 godaddy空间 服务器硬件配置 更多