个人简介笨叔叔:沪上紫竹某小公司的小FAE.
工作之余写点Linux小段子.
2017年不小心出版了《奔跑吧Linux内核》一书.
Linux4.
x内核最新特性简介笨叔叔2017.
12AgendaLinux内核开发流程简介内存管理最新特性简介内存管理总览HMM特性页面回收基于node节点OOMKiller改进swap功能改进进程管理最新特性简介EAS调度器内核学习方法建议Linux内核开发模式现在最新的版本是Linux4.
14(2017.
12)由Linux内核社区开发主导总的maintainer是:LinusTorvalds每个子系统都有maintainer每2~3个月发布一个新版本创新的驱动力来源于各个公司:红帽,Suse,Intel,IMB,谷歌.
.
.
1.
平均60~70发布一个新版本2.
最新的Linux4.
13内核代码已经超过2千万行代码内存管理总览用户进程用户进程用户进程…用户空间malloc/mmap/mlock/madvise/mremap/…sys_madvisesys_mmapsys_brksys_.
.
.
vma管理缺页中断匿名页面pagecache页面回收slab伙伴系统(页面分配器)页表管理(内核页表和进程页表)MMUTLB物理内存cache反向映射KSMHugePage页迁移内存规整内核空间硬件层VMA4G3G01Gmmap空间用户空间物理内存堆空间代码段数据段VMApagepagepagepage进程页表进程task_structmm_structVMA内核空间…vma管理mmappgdmm…物理页面管理ZONEZONEZONEZONE管理高端映射线性映射mem_map[]pagemmvaddressvmaptepaddressfpnzonepgdatamem_map[]①②③④⑤⑥⑦⑧⑨异构内存管理传统访问方式GPU显存主存CPUGPU进程地址空间映射的显存malloc/mmap显卡驱动来做映射IOCTL+mmap被分离的进程地址空间(splitaddressspace)CPU通过malloc/mmap分配的常规的内存GPU通过显卡驱动管理和映射的进程地址空间这两个地址空间是分离的,访问需要相互来回拷贝用户空间内核空间相互拷贝:简单的数据类型比如数组、image等没有问题,但是复杂的数据模型就有问题了,比如链表、树等传统访问方式小例子mul_mat_on_gpu(float*r,float*a,float*b,unsignedm){gpu_buffer_tgpu_r,gpu_a,gpu_b;gpu_r=gpu_alloc(m*m*sizeof(float));gpu_a=gpu_alloc(m*m*sizeof(float));gpu_b=gpu_alloc(m*m*sizeof(float));gpu_copy_to(gpu_a,a,m*m*sizeof(float));gpu_copy_to(gpu_b,b,m*m*sizeof(float));gpu_mul_mat(gpu_r,gpu_a,gpu_b,m);gpu_copy_from(gpu_r,r,m*m*sizeof(float));}CPU分配的buffer,属于常规内存,比如通过malloc分配的.
这些数据作为input分配GPUbuffer,通过GPU驱动来分配的把CPU分配的buffer拷贝到GPUbuffer里在GPU中进行计算把GPU的结果拷贝回CPU的bufferHMM(heterogeneousMemoryManagement)建立一个统一的进程地址空间(shareaddressspace)HMMmirror镜像功能:CPU和GPU都可以同时访问这个统一的进程地址空间(虚拟地址),都能同时访问到相同的物理内存.
页面迁移:在一个进程里可以透明地使用device的内存.
已经合并到Linux4.
14内核中支持HMM的开源NV的显卡驱动nouveau正在开发中支持HMM的应用程序例子:mul_mat_on_gpu(float*r,float*a,float*b,unsignedm){gpu_mul_mat(r,a,b,m);}HMM来提供了一个统一的进程地址空间,用户编程变得简洁很多CPU进程地址空间CPU页表GPUGPU页表用户空间内核空间虚拟地址VA物理地址PACPU页表:VA->PAmirror:拷贝CPU页表到GPU页表,GPU也可以访问这个虚拟地址VA和对应的物理地址PA那么GPU可以访问这个PA①②③HMM的镜像功能HMM镜像功能保证:CPU和GPU访问同一个虚拟地址时都能指向相同的物理地址CPU进程地址空间CPU页表GPUGPU页表用户空间内核空间虚拟地址VA物理地址PACPU页表:VA->PAmirror:拷贝CPU页表到GPU页表,GPU也可以访问这个虚拟地址VA和对应的物理地址PA那么GPU可以访问这个PA①②③HMM的迁移功能CPU进程地址空间CPU页表GPUGPU页表用户空间内核空间虚拟地址VA物理地址PACPU页表:1.
支持CCIX协议,CPU页表也指向这个显存的物理地址GA2.
如不支持CCIX协议,CPU页表填充一个无效的特殊的页表项GPU的页表指向这个显存中的物理地址GA显卡驱动可以迁移这个PA的内容到GPU显存GA里,这样可以利用显存的高带宽如果支持CCIX协议,那么CPU和GPU的页表都能同时指向这个GA如果不支持CCIX协议,那么CPU的页表项要填充一个无效的特殊的页表项,当CPU访问这个虚拟地址时候,会触发一个缺页中断,然后把GA的内容迁移回主存⑥⑤④HMM的迁移功能显存的物理地址GA基于node节点的页面回收机制原来的页面回收机制都是基于ZONE(内存管理区域)在32位系统里,内核地址空间有限,所以高端内存分在了ZONE_HIGHMEM同一个node里不同的ZONE存在不同的页面老化速度(pageagespeed)不同的zone的页面扫描的速度和覆盖率不一致zone里的LRU链表扫描覆盖率也不一致页面回收内核线程kswapd和页面分配器之间复杂的逻辑关系,社区里增加了很多诡异的patchLinux4.
8里已经支持基于node节点的页面回收机制OOMKiller改进OOM检测机制Linux4.
7合并的新机制.
在直接回收机制分配内存失败时通常会直接调用OOM,有点鲁莽新机制,多了一下检测和尝试OOM收割机OOMKiller有时候不能回收进程的内存新机制:在杀死进程之前,先收割进程的匿名页面swap功能改进提高页面回收效率:优化LRU算法和页面回收机制优化SWAP性能随着SSD的普及,swap的性能可以随着优化解决思路:细化锁,减少锁的争用细化:swap_info_struct->spinlock细化:保护address_space的一个锁进程管理改进现有调度器的缺点现有的SMP调度器不支持大小核架构调度器和CPUfreq以及CPUidle等动态调频调压的驱动模块脱节没有考虑功耗场景PELT(Pre-entityLoadTracking)负载计算方法会导致负载反应比较迟钝,不太适应手机场景高通骁龙820处理器架构EAS调度器EAS(EnergyAwarenessScheduling)绿色节能调度器设计目标:保证系统性能的前提下尽可能减低功耗统一调度器、CPUfreq和CPUidle核心实现WALT(WindowAssistedLoadTracking)算法可量化的能效模型可量化的计算能力复用Linux内核的CPU调度域模型新增的CPUfrequencygovernmentEAS调度器架构图Linux内核学习方法介绍内核学习常见的疑惑内核代码太庞大,Linux4.
x内核代码超过了2000万行内核更新速度太快内核核心设计经常变化和优化缺乏最新的内核设计资料和文档市面上大部分Linux内核书籍停留在Linux2.
4和Linux2.
6内核笨式吊打法–带着问题去阅读内核代码深挖实际项目上遇到的问题阅读代码产生的疑问面试或者微信论坛上讨论的问题《奔跑吧Linux内核》中奔跑卷以及每一章的思考题可以从一个简单的驱动开始,比如简单的字符设备驱动"Qemu+gdb+eclipse+O0"调试跟踪内核选择感兴趣的内核模块进行调试或者修改动手实践数据结构关系图函数调用关系图归纳总结兴趣兴趣兴趣Linux内核学习资料推荐
我们先普及一下常识吧,每年9月的第一个星期一是美国劳工节。于是,有一些服务商会基于这些节日推出吸引用户的促销活动,比如RackNerd有推出四款洛杉矶和犹他州独立服务器,1G带宽、5个独立IP地址,可以配置Windows和Linux系统,如果有需要独立服务器的可以看看。第一、劳工节促销套餐这里有提供2个套餐。两个方案是选择犹他州的,有2个方案是可以选择洛杉矶机房的。CPU内存SSD硬盘配置流量价格...
Hostodo 算是比较小众的海外主机商,这次九月份开学季有提供促销活动。不过如果我们有熟悉的朋友应该知道,这个服务商家也是比较时间久的,而且商家推进活动比较稳,每个月都有部分活动。目前有提供机房可选斯波坎、拉斯维加斯和迈阿密。从机房的地理位置和实际的速度,中文业务速度应该不是优化直连的,但是有需要海外业务的话一般有人选择。以前一直也持有他们家的年付12美元的机器,后来用不到就取消未续约。第一、开...
wordpress公司网站模板,wordpresss简洁风格的高级通用自适应网站效果,完美自适应支持多终端移动屏幕设备功能,高级可视化后台自定义管理模块+规范高效的搜索优化。wordpress公司网站模板采用标准的HTML5+CSS3语言开发,兼容当下的各种主流浏览器: IE 6+(以及类似360、遨游等基于IE内核的)、Firefox、Google Chrome、Safari、Opera等;同时...
什么是32位系统为你推荐
云爆发云联惠是什么来的网红名字被抢注我想问这个网红 名字叫什么 讲一下谢谢了安徽汽车网安徽省各地车牌号简称是按照什么顺序排的留学生认证留学生回国学历认证 需要带什么材料巨星prince去世作者为什么把伏尔泰的逝世说成是巨星陨落蒋存祺蒋存祺的主要事迹haole018.com为啥进WWWhaole001)COM怎么提示域名出错?囡道是haole001换地了吗www.119mm.com看电影上什么网站??www.baitu.com谁有免费的动漫网站?抓站工具公司网站要备份,谁知道好用的网站抓取工具,能够抓取bbs论坛的。推荐一下,先谢过了!
便宜域名注册 黑龙江域名注册 香港vps 阿里云搜索 openv 老鹰主机 themeforest gitcafe ubuntu更新源 777te 京东商城0元抢购 帽子云 北京双线机房 hostker 傲盾官网 重庆双线服务器托管 免费蓝钻 主机返佣 乐视会员免费领取 googlevoice 更多