1人工智能加速器课程编号:课程中文名称:人工智能加速器课程英文名称:ArtificialIntelligenceAccelerators开课学期:秋季学分/学时:2/32先修课程:操作系统、编译原理、嵌入式系统、机器学习等建议后续课程:适用专业/开课对象:计算机学院、高等理工学院、软件学院等研究生团队负责人:杨建磊责任教授:执笔人:杨建磊核准院长:一、课程的性质、目的和任务本课程是面向计算机相关专业研究生开设的专业选修课程,为《操作系统》、《编译原理》、《嵌入式系统》与《机器学习》等课程的后续延伸,尝试将人工智能专用计算系统领域的最新研究前沿技术引入课堂.
本课程涉及到的理论基础较为广泛,包括智能计算领域(人工智能、机器学习、数据挖掘、图像处理、计算机视觉等)与计算机系统领域(计算机组成原理、操作系统、编译原理、嵌入式系统等)的基本知识.
同时,本课程亦需要较为扎实的系统工程技术实践能力(算法实现、系统设计、系统调试与优化等),因此是一门注重系统能力培养且重于研究探索的实践课程.
本课程以人工智能计算领域几个典型应用为研究对象,讲述智能计算系统从软件算法到专用架构实现所涉及的指令集、编译器与软件栈等基本原理与系统优化方法,使学生理解从系统的角度实现智能计算的整个工作过程,培养学生在专用的智能计算架构基础上设计和使用相关编译器和软件栈以及系统优化方法的基本技能.
本课程要求学生理解目前智能计算系统设计的基本思路,采用现有的智能计算架构、编译器与软件栈对主流的智能算法进行计算效率的量化分析、系统优化等,使其掌握智能计算系统设计与优化的工程化方法,并具备软硬件异构协同设计的基本素养和学术视野,为今后更深入的理论学习和研究实践奠定良好基础.
本课程是学院规划和建设的"本研一体前沿课程"之一,实践性较强,课程教学目标高,知识内容前沿、知识面宽、知识运用综合,实验体系具有很高的难度与强度.
本课程适合渴望学习前沿技术与敢于面对挑战的学生,选修本课程的学生应有充分心理准备.
具体的教学目标可分解为以下几点:(1)了解智能计算领域中包括机器学习、图计算、机器视觉等方向的几类基本模型和算法;2了解智能计算系统的工程问题、实验技术、工具资源以及该领域最新的研究前沿;(2)了解几类主流智能计算专用架构特征与原理,包括寒武纪架构、谷歌TPU架构、华为达芬奇架构、MITEeyriss架构等;(3)掌握智能计算系统软件栈的基本原理、使用过程和相关研究方法,注重工程思维与创新思维的培养,尤其是面向专用架构将智能算法从系统层面进行优化的思维能力,并通过现有软件栈进行系统层面的性能测试、分析及优化等;(4)具备利用寒武纪Bang语言等工具设计智能算法运行在专用平台系统上的能力,具备利用AutoTVM进行软件栈开发调试的能力,具备利用IntelDistiller进行模型轻量化的能力,具备NAS进行网络架构搜索的能力,具备利用SparkMLib进行分布式深度学习开发的能力,以及进行相关性能分析和系统优化等方面的能力;(5)具有获取和利用标准、规范、手册、图册等有关技术资料的能力;(6)掌握智能计算机系统设计与性能测试以及系统优化的工程化实验方法,获得实验技能的基本训练;(7)掌握智能计算系统模型建立、分析求解和设计方案论证的理论和方法,培养学生分析和解决智能计算系统应用等工程实践问题的创新设计能力.
课程目标对毕业要求的支撑关系毕业要求课程目标对毕业要求的支撑关系毕业要求1:工程知识能够将数学、自然科学、工程基础和专业知识用于解决复杂计算机工程问题.
课程目标:2、3、4、5毕业要求2:问题分析能够应用数学、自然科学基本原理,并通过文献研究,识别、表达、分析复杂计算机工程问题,以获得有效结论.
课程目标:3、4、63毕业要求课程目标对毕业要求的支撑关系毕业要求3:设计/开发解决方案能够设计针对复杂计算机工程问题的解决方案,设计满足特定需求的计算机系统,并能够在设计环节中体现创新意识,考虑法律、健康、安全、文化、社会以及环境等因素.
课程目标:3、4、6、7毕业要求4:研究能够基于科学原理并采用科学方法对复杂计算机工程问题进行研究,包括设计实验、分析与解释数据、并通过信息综合得到合理有效的结论.
课程目标:4、6、7毕业要求5:使用现代工具能够在计算机工程实践中开发、选择与使用合理有效的技术、资源、现代工程工具和信息技术工具,并了解其局限性.
课程目标:4、6毕业要求6:工程与社会具有追求创新的态度和意识,掌握基本的创新方法,以及综合运用理论和技术手段设计复杂计算机系统与过程的能力;设计过程中能够综合考虑社会、经济、文化、环境、法律、安全、健康、伦理等制约因素.
课程目标:1毕业要求7:环境和可持续发展了解与本专业相关的职业和行业的生产、设计、研究与开发、环境保护和可持续发展等方面的方针、政策和法津、法规;能够正确认识专业工程实践对环境和社会可持续发展的影响,合理评价专业工程实践和复杂工程问题解决方案对社会、健康、安全、法律及文化的影响.
课程目标:1毕业要求8:职业规范具有坚定正确的政治方向,良好的思想品德、社会公德和职业道德;具有人文社会科学素养、社会责任感;具有良好的身体素质和心理素质,能履行建设祖国和保卫祖国的神圣义务.
课程目标:5、6、74毕业要求课程目标对毕业要求的支撑关系毕业要求9:个人和团队具有在多学科团队中发挥重要作用的能力.
课程目标:4毕业要求10:沟通能够就复杂计算机工程问题与业界同行及社会公众进行有效沟通与交流,包括撰写报告和设计文稿、陈述发言、清晰表达个人见解等,并具备一定的国际视野,能够在跨文化背景下进行沟通和交流.
课程目标:4毕业要求11:项目管理具有一定的组织与工程管理能力、表达与人际交往能力以及在多学科背景下的团队中发挥作用的能力.
课程目标:4毕业要求12:终身学习具有自主学习和终身学习的意识,有不断学习和适应发展的能力.
课程目标:5、6、7二、课程内容、基本要求及学时分配本课程介绍智能计算系统领域的知识和工程实践方法,主要包括算法原理、硬件架构、软硬件协同、软件栈适配等问题.
序号教学内容基本要求及重点和难点学时教学方式对应的教学目标支持毕业要求指标点1智能计算前沿概述深度学习系统;硬件层基本架构;软件栈基本架构;计算效率优化原理等.
基本要求:了解智能计算系统所涉及到的软硬件架构.
重点:进行充分的文献调研和阅读,理解软硬件协同的原理与重要性.
难点:理解新型智能计算系统如何提高计算效率、解决系统性能瓶颈等问题.
2课堂讲授+课后调研+答疑16,75序号教学内容基本要求及重点和难点学时教学方式对应的教学目标支持毕业要求指标点2智能计算原理与算法深度学习、图计算、机器视觉等.
基本要求:掌握智能计算所涉及主流算法的数学模型和理论分析方法.
重点:理解并掌握深度学习领域等相关算法.
难点:编程实现及调试,理解如何从系统层面优化算法的效率.
4课堂讲授+课后作业+答疑1,31,2,3,43专用硬件架构基于GPU/FPGA/ASIC等架构的智能计算专用平台;架构特点与指令集;计算效率分析与优化途径;基本的设计与工程化开发方法等.
基本要求:了解目前主流基于GPU/FPGA/ASIC等平台的专用架构与指令集,掌握计算效率分析与优化的基本思路.
重点:理解如何通过专用的架构设计来提升智能算法运行的效率.
难点:采用量化分析方法对架构性能与效率进行评估.
6课堂讲授+课后作业+答疑2,4,51,2,3,44适配软件栈专用计算架构编译器;系统建模与分析工具;数据流映射、调度与优化工具;异构平台算法部署方法等.
基本要求:了解面向专用架构指令集的编译器基本原理和方法流程,并掌握目前主流成熟的软件栈使用方法.
重点:理解编译器与调度器的原理以及算子优化技巧.
难点:以智能计算专用架构平台为对象,采用专用编译器与软件栈优化智能算法计6课堂讲授+课后实践+答疑3,5,61,2,3,46序号教学内容基本要求及重点和难点学时教学方式对应的教学目标支持毕业要求指标点算效率,具有一定挑战性.
5模型轻量化方法智能计算模型(尤其是深度神经网络)压缩、稀疏化、量化等轻量化方法.
基本要求:掌握基本的模型压缩、量化方法,并在计算资源受限情况下对计算效率和精度进行折衷.
重点:掌握模型轻量化方法,在嵌入式移动平台上进行模型部署与优化.
难点:模型轻量化处理后在端侧进行实测,考查系统调试与优化等动手能力.
4课堂讲授+课后作业+答疑4,5,6,71,2,3,46模型架构搜索方法智能计算模型(尤其是深度神经网络)架构自动搜索方法;考虑硬件计算与软件调度开销的模型搜索方法等.
基本要求:了解模型架构搜索(NAS)基本原理,掌握主流的NAS方法.
重点:面向特定硬件平台,采用NAS方法对典型神经网络进行结构搜索与优化.
难点:如何量化建模硬件平台的约束是有效采用NAS优化网络结构的主要问题.
4课堂讲授+课后作业+答疑4,5,6,71,2,3,47序号教学内容基本要求及重点和难点学时教学方式对应的教学目标支持毕业要求指标点7分布式学习方法大规模高性能智能计算分布式平台部署方法;通信开销与模型同步代价优化;负载平衡与数据一致性问题等.
基本要求:了解分布式深度学习模型部署基本原理,掌握主流分布式学习框架.
重点:掌握分布式学习效率与系统优化思路.
难点:如何寻求分布式学习效率与成本的均衡方案,需要进行实践探索.
2课堂讲授+课后实践+答疑4,5,6,71,2,3,48实践驱动案例华为昇腾AI芯片全栈平台;寒武纪AI芯片平台;树莓派ARM计算平台;AutoTVM系统等.
基本要求:了解目前主流且相对成熟的AI专用计算平台与系统,包括软硬件与相关适配环境、工具.
重点:掌握一套完整的AI专用计算系统,并付诸实践.
难点:实践涉及诸多新架构思维、新平台环境等因素,需要不断探索、调试与优化.
4课堂讲授+课后实践+答疑3,4,5,6,75,6,7,8,9,10,11,12三、课内外教学环节及基本要求在教学过程中体现"学生主体、教师主导"的教学思想,提倡启发式、讨论式教学,突出对学生逻辑思维、工程创新及实践能力的培养.
在讲授过程中做到由浅入深、由表及里、循序渐进,同时注重举例和类比,并加入该领域最新研究进展,活跃课堂,使课堂讲授生动有趣.
特网云为您提供高速、稳定、安全、弹性的云计算服务计算、存储、监控、安全,完善的云产品满足您的一切所需,深耕云计算领域10余年;我们拥有前沿的核心技术,始终致力于为政府机构、企业组织和个人开发者提供稳定、安全、可靠、高性价比的云计算产品与服务。公司名:珠海市特网科技有限公司官方网站:https://www.56dr.com特网云为您提供高速、稳定、安全、弹性的云计算服务 计算、存储、监控、安全,完善...
妮妮云的来历妮妮云是 789 陈总 张总 三方共同投资建立的网站 本着“良心 便宜 稳定”的初衷 为小白用户避免被坑妮妮云的市场定位妮妮云主要代理市场稳定速度的云服务器产品,避免新手购买云服务器的时候众多商家不知道如何选择,妮妮云就帮你选择好了产品,无需承担购买风险,不用担心出现被跑路 被诈骗的情况。妮妮云的售后保证妮妮云退款 通过于合作商的友好协商,云服务器提供2天内全额退款到网站余额,超过2天...
RAKsmart怎么样?RAKsmart机房即日起开始针对洛杉矶机房的独立服务器进行特别促销活动:低至$76.77/月,最低100Mbps带宽,最高10Gbps带宽,优化线路,不限制流量,具体包括有:常规服务器、站群服务器、10G大带宽服务器、整机机柜托管。活动截止6月30日结束。RAKsmart,美国华人老牌机房,专注于圣何塞服务器,有VPS、独立服务器等。支持PayPal、支付宝付款。点击直达...