数据网站日志

网站日志时间:2021-04-12 阅读:()

政府采购招标文件项目编号:20A00570项目项目编号:ZJZB-2020-02711招标项目名称:重庆财经职业学院IT信息技术中心大数据教学实训平台采购人:重庆财经职业学院采购代理机构:中捷通信有限公司二〇二〇年五月目录第一篇投标邀请书-3-一、招标项目内容-3-二、资金来源-3-三、投标人资格要求-3-四、投标、开标有关说明-3-五、投标保证金-4-六、采购项目需落实的政府采购政策-5-七、投标有关规定-5-八、联系方式-6-第二篇项目技术规格、数量及质量要求-7-一、招标项目一览表-7-二、招标项目技术需求-7-第三篇项目商务要求-11-一、交货期、交货地点及验收方式-11-二、报价要求-11-三、质量保证及售后服务-11-四、付款方式-12-五、知识产权-13-六、培训-13-七、、图纸及包装要求-13-八、其他商务要求内容-13-第四篇资格审查及评标办法-14-一、资格审查-14-二、评标方法-15-三、评标标准-16-四、无效投标条款-18-五、废标条款-18-第五篇投标人须知-19-一、投标人-19-二、招标文件-19-三、投标文件-19-四、开标-21-五、评标-21-六、定标-22-七、中标通知书-22-八、询问、质疑和投诉-22-九、采购代理服务费-24-十、交易服务费-24-十一、签订合同-24-十二、政府采购信用融资-25-第六篇合同主要条款和格式合同(样本)-26-一、合同主要条款-26-二、政府采购合同(格式)-29-第七篇投标文件格式-31-一、经济文件-33-二、技术文件-35-三、商务文件-37-四、其他-40-五、资格文件-45-第一篇投标邀请书中捷通信有限公司(以下简称:采购代理机构)受重庆财经职业学院(以下简称:采购人)的委托,对重庆财经职业学院IT信息技术中心大数据教学实训平台项目进行公开招标,欢迎有资格的投标人参加投标.

一、招标项目内容项目名称最高限价(万元)投标保证金(万元)中标人数量(名)备注重庆财经职业学院IT信息技术中心大数据教学实训平台项目5311二、资金来源财政预算资金,预算金额为53万元.
三、投标人资格要求合格投标人应首先符合政府采购法第二十二条规定的基本条件,同时符合根据该项目特点设置的特定资格条件.
(一)基本资格条件1.
具有独立承担民事责任的能力;2.
具有良好的商业信誉和健全的财务会计制度;3.
具有履行合同所必需的设备和专业技术能力;4.
有依法缴纳税收和社会保障资金的良好记录;5.
参加政府采购活动前三年内,在经营活动中没有重大违法记录;6.
法律、行政法规规定的其他条件.
(二)特定资格条件无.
四、投标、开标有关说明(一)根据《重庆市财政局关于印发〈重庆市政府采购供应商注册及诚信管理暂行办法〉的通知》(渝财采购〔2015〕45号)规定,投标人应按要求进行注册,通过重庆市政府采购网(www.
ccgp-chongqing.
gov.
cn),登记加入"重庆市政府采购供应商库".

(二)凡有意参加投标的投标人,请到采购代理机构领取或在"重庆市政府采购网"网上下载本项目招标文件、中捷通信有限公司采购文件发售登记表以及图纸、澄清等开标前公布的所有项目资料,无论投标人领取或下载与否,均视为已知晓所有招标内容.

(三)招标文件公告期限:自采购公告发布之日(2020年5月22日)起五个工作日.
(四)报名及招标文件发售1.
报名和招标文件发售期:2020年5月22日-2020年5月28日,每日上午9:00-12:00,下午14:00-17:00(法定节假日除外)2.
招标文件售价:人民币300元/份(售后不退)2.
1招标文件购买方式2.
1.
1现金购买在招标文件发售期内,投标人到重庆市渝北区黄山大道中段67号信达国际B栋801室,递交《采购文件发售登记表》(加盖投标人公章)并购买招标文件.
3.
在报名和招标文件发售期内购买了招标文件的投标人,其报名才被接收.
(五)投标地点:重庆市公共资源交易中心开标厅(地址:重庆市渝北区青枫北路6号渝兴广场B10栋2层,见当日一楼大厅指示牌)(六)投标截止时间:2020年6月16日北京时间10:00(七)开标时间:2020年6月16日北京时间10:00(八)开标地点:同投标地点五、投标保证金(一)投标保证金递交1.
投标人应当按照《重庆市政府采购集中交易监督管理暂行规定》、重庆市公共资源交易中心《关于投标单位银行基本账户登记的说明》和《重庆市公共资源交易中心关于开展公共资源交易市场主体信息登记工作的公告》的要求进行基本账户登记工作.

重庆市公共资源交易中心基本账户登记工作咨询电话:023-63625633.
查询网站:重庆市公共资源交易网(https://www.
cqggzy.
com/)2.
投标人应足额交纳投标保证金(保证金金额详见本篇,一、招标项目内容),并汇至以下任一账户,投标保证金的到账截止时间同投标截止时间.
投标保证金账户:户名:重庆联合产权交易所集团股份有限公司银行信息账号1开户行建设银行重庆中山路支行(行号:105653005006)账号50050100414100000286007052账号2开户行招商银行上清寺支行(行号:308653018067)账号123904808710306051007账号3开户行中国农业银行重庆自由贸易试验区分行(行号:103653026011)账号6228400477033621068账号4开户行交通银行重庆东和春天支行(行号:301653000746)账号500124026018000016986011473账号5开户行光大银行重庆分行营业部(行号:303653000015)账号39410188000747323030701账号6开户行中信银行重庆冉家坝支行(行号:302653042296)账号31112300024735782623.
各投标人在银行转账(电汇)时,须充分考虑银行转账(电汇)的时间差风险,如同城转账、异地转账或汇款、跨行转账或电汇的时间要求.
(二)保证金退还方式1.
未中标投标人的保证金,在中标通知书发放后,重庆市公共资源交易中心在五个工作日内按来款渠道直接退还.
2.
中标人的投标保证金,在中标人与采购人签订合同后,重庆市公共资源交易中心在五个工作日内按资金来款渠道直接退还.
重庆市公共资源交易中心咨询电话:023-63625633六、采购项目需落实的政府采购政策(一)按照《财政部生态环境部关于印发环境标志产品政府采购品目清单的通知》(财库〔2019〕18号)和《财政部发展改革委关于印发节能产品政府采购品目清单的通知》(财库〔2019〕19号)的规定,落实国家节能环保政策.
(二)按照《财政部工业和信息化部关于印发的通知》(财库〔2011〕181号)的规定,落实促进中小企业发展政策.
(三)按照《财政部、司法部关于政府采购支持监狱企业发展有关问题的通知》(财库〔2014〕68号)的规定,落实支持监狱企业发展政策.
(四)按照《三部门联合发布关于促进残疾人就业政府采购政策的通知》(财库〔2017〕141号)的规定,落实支持残疾人福利性单位发展政策.
七、投标有关规定(一)单位负责人为同一人或者存在直接控股、管理关系的不同投标人,不得参加同一合同项(分包)下的政府采购活动.
(二)为采购项目提供整体设计、规范编制或者项目管理、监理、检测等服务的投标人,不得再参加该采购项目的其他采购活动.
(三)本项目若有澄清文件一律在重庆市政府采购网(http://www.
ccgp-chongqing.
gov.
cn)上发布,请各投标人注意下载或到采购代理机构领取;无论投标人下载或领取与否,均视同投标人已知晓本项目澄清文件的内容.

(四)超过投标截止时间递交的投标文件,恕不接收.
(五)投标费用:无论投标结果如何,投标人参与本项目投标的所有费用均应由投标人自行承担.
(六)本项目不接受联合体参与投标.
(七)按照《财政部关于在政府采购活动中查询及使用信用记录有关问题的通知》财库〔2016〕125号,投标人列入失信被执行人、重大税收违法案件当事人名单、政府采购严重违法失信行为记录名单及其他不符合《中华人民共和国政府采购法》第二十二条规定条件的投标人,将拒绝其参与政府采购活动.

八、联系方式(一)采购人:重庆财经职业学院联系人:陈老师,宋老师电话:49523466,49875289地址:重庆市永川区昌州大道西段2号(二)采购代理机构:中捷通信有限公司联系人:曾徐欧豪夺邮编:400000电话:1502334489213628386654地址:重庆市渝北区黄山大道中段67号信达国际B栋801室第二篇项目技术规格、数量及质量要求一、招标项目技术需求说明:""标注的技术需求为符合性审查中的实质性要求,若不满足按无效投标处理.
(一)大数据教学实训平台清单序号软件名称单位数量单价(元)总限价(元)备注1大数据教学平台套1200000.
00530,000.
001、授权点150个.
2、其他要求详见技术参数.
2编程式大数据平台套180000.
003图形式大数据平台套180000.
004大数据思维课及实验案例包套170000.
005大数据工具课程套150000.
006大数据教学商业案例课程套150000.
007合计(大写):伍拾叁万元整530,000.
00(二)大数据教学实训平台招标技术参数序号项目名称招标功能要求及技术参数单位数量1大数据教学平台授权点:150个;包含课程管理、班级管理、教学(测试、问答等)管理等内容如下:1.
1大数据教学科研平台软件采用CS架构,客户端和服务端可以分开部署.
1.
2服务端可以运行在主流linux操作系统之下,包括CentOS、RedHat等.
1.
3客户端软件可以运行在windows操作系统之下,包括windows7以上版本.
1.
4平台支持三类用户:管理员、老师和学生,分别有不同的权限.
1.
5管理员可以添加新课程,每一门课程可以上传封面图片,并加入课程名称,描述,作者等信息.
管理员可以对已有的课程进行维护,编辑课程的教学目录结构,可以设置章和节.
1.
6管理员可以对课程添加电子教材,教材内容支持图文混排的富文本格式,并且以文档目录结构来组织.
1.
7管理员可以对课程小节的内容添加不同类型的课件,包括教案PPT,PDF,视频课件.
管理员可以对课程小节添加对应的实验,实验内容包括图文混排的实验指导书,实验建议时长(课时),实验数据,示例模型(程序代码/数据工作流)等.

1.
8实验指导书可以支持直接上传markdown文件.
可以对markdown文件进行在线编辑.
1.
9对于平台里的所有课程,可以通过输入课程编号、课程名称、课程描述、作者、联系方式等进行快速检索.
1.
10可以通过Excel文件格式批量导入教师用户、学生用户,也可以单个添加教师/学生用户.
1.
11可以通过工号、姓名、性别、职称、联系方式对老师用户进行快速检索.
1.
12可以通过学号、姓名、性别、年级、联系方式对学生用户进行快速检索.
可以对老师和学生设置院系和班级.
可以以班级为单位指定课程.
1.
13一个学生可以同时选修不同老师所教的同一门课.
支持对每门课程实验所需数据的统一配置和管理.
老师可以播放教案PPT,可以设置学生客户端同步播放.
1.
14学生启动实验后,可以方便的查看实验指导书,同时进行试验步骤操作.
实验指导书窗口和实验操作台窗口可以分别最大化以方便浏览.
1.
15客户端软件同时支持启动编程式大数据实验和图形式大数据实验.
编程式实验允许学生以手工编写代码的方式进行大数据实验操作,支持Java、Python、R、Hadoop、Spark等编程环境.

1.
16图形式实验允许学生在不需要写代码的前提下通过鼠标拖拽进行大数据实验操作.
图形式实验中通过鼠标拖拽出的大数据工作流可以通过平台功能生成Spark大数据作业,并进行调度.
讲课时,老师和学生可以通过大数据教学模块播放ppt,和视频.
老师播放PPT时,可以强制学生端同步播放.

1.
17每个用户(老师/学生)分配有独立的数据湖存储空间,可以对私有数据湖的数据下载、移动、重命名、删除等操作.
1.
18用户可以对数据湖的结构化数据设置是否允许可视化.
允许可视化的数据,可以通过大数据平台客户端模块生成可视化报表.
1.
19老师和管理员可以对学生实验机集群管理,包含实验机创建、停止、销毁等.
系统对集群内所有实验机进行监控,包含编号、所属服务器、创建时间、运行状态、开放端口.
1.
20学生在实验过程中可以编写和提交实验报告,可以添加实验截屏,和实验过程视频.
1.
21学生登录系统,即可进行实验任务在线操作;包含实训课程在线学习、实验机在线操作、实验报告在线提交、实验机界面截图、记录课程学习时长等;1.
22老师可以对自己班级的学生的实验报告进行审阅,评语和评分.
1.
23提供在线考试系统,包含考试习题的组卷、在线答题、在线提交、教师后台查询考试成绩,系统植入主观题和客观题,系统对客观题自动评分;1.
24提供课程开课计划,开课计划的字段内容包含计划名称、授课讲师、授课时间段、开通状态、允许申请周期,允许申请人数、实训平台、授课助教、云实验机绑定、实验任务绑定等;1.
25学生在实验过程中可以向老师或其他同学发起远程协助,被接受后,其他人可以远程操作学生的实验环境.
提供产品截图证明.
1.
26支持实验过程中录制屏幕操作,可以把录制的视频保存并附加到实验报告中.
1.
27支持实验过程中截屏操作,可以把截屏图片保存并附加到实验报告中.
1.
28平台可以对学生学习行为进行记录和统计分析,可以显示至少3张独立完整的统计报表:1、个人统计报表:统计开始时间、统计结束时间、登录次数、学习总时长、所学课程清单;2、班级:统计开始时间、统计结束时间、平均每个学生登录次数、平均学习时长、所学课程清单;全体:平均每个学生登录次数、平均学习时长、所学课程清单.
上述三张统计报表要求每张报表包含规定的所有统计数据,能在一个界面展示.

1.
29平台支持学习情况智能分析:平台提供基于课程学习情况的综合分析,为课程教学提供重要的参考评估依据.
支持基于定制时间区间的数据智能统计和分析.
包括课程访问总计次数,课程学习总时长,课程被学习的学生人数等.
提供可视化的条状图,柱状图等形式的可视化结果展示;提供基于实验内容学习情况的综合分析,为基础知识点教学提供重要的参考评估依据.
支持基于定制时间区间的数据智能统计和分析.
包括实验访问总计次数,实验学习总时长,实验学习的学生人数,实验等级分布等.
提供可视化的条状图,饼图等形式的可视化结果展示.

平台提供全栈式开发实训环境.
(实境编程环境).
1.
30全栈式开发实训环境内嵌IDE系统,免于编程环境本地控制.
全栈式开发实训环境基于服务器对用户编写的代码进行云编译和运行.
全栈式开发实训环境支持Html、CSS、JavaScript、C、C++、PHP、Java、Python、R等主流编程语言.
全栈式开发实训环境支持编程代码的实时编写与编译运行.
全栈式开发实训环境在学生点击启动后系统会根据管理员预置的开发环境进行自动代码的编写,在系统自动编写代码的过程中学生可以随时暂停进行参考学习同时还可以基于系统已经编写的代码进行修改和续写等开发工作以及编译运行.
学生进行任意的修改和学习后点击【继续】后系统会自动恢复到停止之前的环境根据预设继续进行开发.
每个学生的全栈式开发实训环境相互独立隔离全栈式开发实训环境中学生可以通过编程方式直接读取平台为当前课程配置的数据全栈式开发实训环境中学生可以通过编程方式直接读取学生的编程类实验数据,并可以向其目录中写入数据.
套12编程式大数据平台2.
1平台基础功能支持Linux虚拟桌面实验台、支持兼容JupyterNotebook的在线实验台、支持兼容RStudio的在线实验台,包括Hadoop、Hive、Spark、Python、R及Ubuntu等;提供实验过程中需要学习和使用的多种软件.
2.
2编程式大数据平台支持x86服务器组成的计算集群.
2.
3可以根据需要,通过增加服务器节点的方式进行水平扩展,以提高用户支撑的数量和性能.
2.
4系统可以运行在CentOS等主流linux系统.
2.
5采用业界先进的Docker轻量级虚拟化技术,支持大量用户高并发实验.
2.
6实验用户之间环境隔离、互不干扰、单个用户启动或关闭实验环境不影响其他用户的操作.
2.
7用户可以完全关闭实验环境,下次需要重启;也可以关闭并保存当前实验状态,下次无需重启直接进入当前的实验步骤.
2.
8实验环境支持业界流行的hadoop/spark框架,支持Hadoop、Spark、R、Python、MongoDB、Kafka、HBase、MySQL、Impala等.
支持用户自主添加新类型的实验环境.

2.
9通过编程,用户可以开发ApacheSpark大数据处理作业,可以支持大数据全链路的功能,包括数据源定义、数据汇集、数据加工、分析挖掘、数据可视化.
2.
10大数据平台支持编码式读写常见的关系型数据库包括DB2,Oracle,SQLServer,MySQL,Hana,Teradata.
2.
11大数据平台支持编码式读取非关系数据库/数据源包括MongoDB、HDFS、FTP、共享文件夹、Hbase、Cassendra、Kafaka.
2.
12大数据平台支持编码式把实验的中间结果和最终结果写入到关系型数据库包括DB2,Oracle,SQLServer,Hana,TeraData,RedShift;也可以写入到非关系型数据库:ElasticSearch、HDFS、Impala、Hive、Cassandra.
2.
13支持用户通过编程实现常见的数据聚合功能,包括平均值、最大值、最小值、数值求和(sum)、字符串求和(stringsum)、计数等.
2.
14支持用户通过编程实现缓慢变化维(SCD2)功能.
2.
15支持用户通过编程实现主流统计和数据挖掘算法,包括回归、支持向量机、朴素贝叶斯、关联规则、主成份分析、PLS、层次聚类、逐步回归、随机森林、Lasso回归、神经网络、决策树、标准差,峰度,百分位数、移动平均、相关系数、单因素方差分析等.

2.
16支持用户通过编程实现xml,csv,word,excel,pdf,weblog等文件类型数据的模板化解析.
2.
17支持用户通过编程实现自然语言处理,分词功能.
2.
18支持用户通过编程实现流式和批式大数据工作流的调试,调度,包括设置断点、数据查看器、运行目的地.
支持工作流的启动、停止、暂停.
2.
19支持用户通过编程实现定义不同类型的变量.
2.
20学生进入编程式大数据实验后,软件界面的左边显示实验指导书,右边显示实验操作台.
在实验操作台的右侧通过可以隐藏和显示的工具栏显示试验机的服务器节点列表,通过鼠标点击可以自动切换到不同服务器节点的桌面环境.
支持实验环境内外代码和文本的复制粘贴.

套13图形式大数据平台1.
平台至少提供四类图形式工作流节点组件方便用户设计大数据工作流,包括:数据源类型的13个组件(关系数据库、MongoDB、HDFS、FTP、文件夹、Hbase、系统Hive、Cassandra、流、云文件、云数据库、课程文件、课程数据库)、转换类型的6个组件(转换、流转换、自定义、分组标签、抽样、行转列)、算法类型的20个组件(包括逻辑回归、朴素贝叶斯、支持向量机分类、ALS推荐、PLS回归、线性回归、岭回归、量化、离散化、Lasso回归、决策树回归、决策树分类、随机森林回归、随机森林分类、关联规则、多层感知机分类、K-Means聚类、二分K-Means聚类、统计分析、标准化),和落地类型的6个组件(ES落地、HDFS落地、Impala落地、Hive落地、Cassandra落地、云文件落地).
要求每种类型的组件在工具栏上分组显示,可以通过鼠标拖拽来使用,可以设置工具栏的隐藏和关闭.
对于用户经常使用的数据组件,在客户端的主界面上显示快捷操作,可以在不进入数据组件面板的情况下直接拖拽使用.

2.
数据工作流设计器提供编辑功能,可以对数据工作流的各个节点进行布局排版,提供至少13种排版功能,包括:左对齐、右对齐、左右居中、上对齐、下对齐、上下居中、水平均布、垂直均布、水平增加间距、水平减少间距、垂直增加间距、垂直减少间距、树布局.
提供全选、反选、复制、粘贴、删除工作流节点组件的功能.
数据工作流的每个数据节点可以在底部显示其名字,太长的名字能够自动换行以保证名字文本的长度始终不超过节点图标的宽度.
可以通过鼠标拖拽图标的四个角改变尺寸.
两个相匹配的数据节点可以通过鼠标右键创建连接线.

3.
提供调试运行功能,包括设置断点、设置目的地、校验元数据、设置查看器、设置落地的功能.
启动调试任务后,可以推送相匹配的调试日志.
调试日志以三类图标显示:错误信息红色图标、警告信息黄色图标、一般信息黑色图标.
双击一条日志信息,自动焦点相关的数据组件(如果适用的话)如果被焦点的组件不在当前的可视区,则自动以该组件居中视图(仅仅居中,不改变缩放比例).

4.
系统需要用户密码才能登录使用.
一个用户成功登录后,显示有权限的repository.
Repository以树的形式显示,其下级对象为project,project下级对象为数据工作流.
工作流下级可以显示各个数据节点,数据节点下级可以显示数据节点的数据结构.

5.
可以对数据工作流设置调度任务.
支持工作流调度的启动、暂停、停止、删除.
调度规则支持cron表达式,可以设置邮箱发送调度信息,可以查看历史调度日志.
可以对流式的数据工作流单独设置作业调度.

6.
关系数据库抽取类的数据工作流节点可以设置是否增量抽取、是否数据落地、处理前是否先清空落地数据、是否全量变换.
这4个属性的设置状态可以直接在该节点的图标上有对应的标志位显示.
用户可以手工设置分片控制列和分片数目,可以设置是否合表操作.

7.
关系型数据组件支持直接输入IP:端口号,用户名、密码、数据库类型可以下拉框选择、数据库、以及筛选条件.
连接成功关系型数据库后,显示数据库的表,选择一个表,可以显示表的结构.
支持'搜索'中输入字符串时,提供2种在中搜索方式,回车之前,按全字符串首字符开始匹配,回车后按全字符串任意位置匹配.
用户鼠标点击选中的一个表,则在右边窗体中显示属性:PK,Name,Type,Length,Precision,Scale,Nullable,Unique,Collation.
8.
文件夹类型的数据节点包含以下属性:Name、Description、Host、Username、Password、FilePath、Encoding、IncludingSubFolders、Filter.

9.
FTP类型的数据节点包含以下属性:Name、Description、Host、Port、Username、Password、FilePath、Encoding、IncludingSubFolders、Filter、Protocol、encryption,AllowAnonymous、maxconnections、TransferMode.
10.
文档抽取数据节点包括以下属性:RowFormat、Delimiter、FieldLength、HeaderRowNo、FirstDataRowNo、RowDelimiter、RowDelimiterPosition、PostProcess、UnionAll、postprocess.

11.
Xml文档抽取数据节点包括以下属性:xsd_dtd_file、UnionAll、xsd_dtd_path、、postprocess.
12.
Web日志抽取数据节点包括以下属性:LogFormat日志格式,下拉框【CommonLogFormat,Extendedlogformat,ApacheCombined,IISLogFileFormat】.
默认为CommonLogFormat.
该属性决定了解析的逻辑.
PostProcess,枚举【Delete,Move,DoNothing】.
Delete:完成抽取一个文件后,删除它;Move:移到另外一个文件夹,要求是同一host上,移动时,如果重名,自动改名,比如可以把当前系统时间标记打上去.
DoNothing:啥都不做,下次job运行时,会再次抽取该file.
UnionAll,bool.
True:union目标文件夹下符合设置条件的所有文件,导入到该extractsquid,这要求所有的文件结构必须一致,这样,从该fileSquid出来的文件都流入一个extractSquid.
引擎在一次抽取job完成后,下一次job有2种方式可以抽取新数据(约束外部系统):源系统把新数据导入新创建的符合Filter的新文件,然后复制文件到该fileFolderConnection所代表的文件路径下.
比如第一次的数据文件是SalesExtcsv,第二次为SalesExtcsv等.
源系统每次用同样的文件名生成新数据导出.
此时,要求源系统有能力在PostProcess=DoNothing时,自动覆盖老文件.
如果UnionAll=false,该extract只抽取它所对应的connection中的一个源文件.
13.
转换Stage数据节点包括属性CDC:追踪历史,bool,checkbox类型.
当勾选该属性时,自动生成4个CDC控制column.
生成之后,如果用户改CDC=false,则自动删除这4个CDC控制column.
start_date,datetime,该条记录有效的开始日期时间;end_date,datetime,该条记录有效的结束日期时间;active_flag,char(1),该条记录是否有效(最新)标记;version,int,该BK所代表的实体的变换历史版本,1,2,3,等.
14.
数据挖掘节点的元数据包括:id:int,identity,total_dataset,int,总样本记录数,模型训练完成后的统计值.
training_percentage,float,训练集所占比例,等同于用户对dmsquid的training_percentage的设置.
model,varbinary,训练得到的modelprecision,float,模型精度.
训练完成得到model后,系统自动使用余下的所有样本数据测试model精度.
creation_date,datetime,模型训练完成的日期时间version,int,模型版本.

15.
提供GroupTagging转换组件,基于Extract或者其他DataSquid导入数据.
其功能是根据设定的分组条件、排序条件和打标签条件,对流入数据的每一行给一个标签.
GroupTaggingSquid不包含有对数据进一步变换逻辑.
GroupTagging的设置选项包括以下列属性:GroupColumn、SortingColumn、TaggingColumn、Name、Type、Length、Precision、Scale、Nullable、Description.

16.
支持组件join操作:多个源数据组件汇入一个目标数据组件,在目标数据组件中形成joins.
Joins的定义显示在joins窗体.
基于第1个源数据组件的join类型为Base,其Condition为空(控件为禁止状态).
基于其他数据组件的join类型可以为INNERJOIN,LEFTJOIN,RIGHTJOIN,FULLJOIN,UNION和unionall.
17.
支持表达式编辑器,用ANSISQL脚本书写,在filter、incrementalExpression、join的condition属性中可以呼出.
支持以下功能:智能输入提示,用户手工输入一个对象的前几个字符,则自动弹出下拉列表,在当前repository中搜索并列出以其打头的相关对象,用户可以从列表中选择一个,直接完成输入.
提供产品截图证明.

18.
大数据平台支持图形式读取非关系数据库/数据源包括MongoDB、HDFS、FTP、共享文件夹、Hbase、Cassendra、Kafaka.
19.
大数据平台同时支持图形式把实验的中间结果和最终结果写入到关系型数据库包括DB2,Oracle,SQLServer,Hana,TeraData,RedShift;也可以写入到非关系型数据库:ElasticSearch、HDFS、Impala、Hive、Cassandra.
20.
图形式支持xml,csv,word,excel,pdf,weblog等文件类型数据的模板化解析.
21.
大数据平台提供至少89种图形化封装好的数据加工转换器组件(函数),可以分别针对文本、数值、集合、日期数据类型的数据进行加工处理.
可以通过图形式使用这些函数.
支持通过鼠标右键创建数据加工组件之间的输入输出连线.

22.
可以设置隐藏/显示非变换column.
提供下列文本类型的数据加工转换器组件:TERMEXTRACT、ARRAYTERMEXTRACT、ARRAYSPLIT、ASCII、UNICODE、SIMILARITY、CHAR、PATTERNINDEX、REPLICATE、NUMERICTOSTRING、STRINGTONUMERIC、REPLACE、LEFT、RIGHT、SUBSTRING、LENGTH、REVERSE、LOWER、UPPER、LEFTTRIM、RIGHTTRIM、TRIM、CONCATENATE、CSNTOSTRING、COUNTRY、PROVINCE、CITY、DISTRICT、STREET、BINARYTOSTRING.
提供产品截图证明.

23.
提供下列数值类型的数据加工转换器组件:ABS、RANDOM、ACOS、EXP、ROUND、ASIN、FLOOR、SIGN、ATAN、LN、SIN、LG、SQRT、CEILING、PI、SQUARE、COS、POWER、TAN、COT、RADIANS、CALCULATION、MOD、NUMERICCAST、CONSTANT.

24.
提供下列集合类型的数据加工转换器组件:MAPPUT、MAPGET、MAPREMOVE、ARRAYPUT、ARRAYGET、ARRAYREMOVE.
提供产品截图证明.
25.
提供下列日期类型的数据加工转换器组件:SYSTEMDATETIME、STRINGTODATETIME、DATETIMETOSTRING、DATETOSTRING、DATEDIFF、FORMATDATE、DATEFORMAT、DATEPART、DATETOUNIXTIME、UNIXTIMETODATE、DATEINC.

26.
提供下列算法类型的数据加工转换器组件:TOKENIZATION、TRAIN、PREDICT、INVERSEQUANTIFY、NUMASSEMBLE、RULESQUERY、CSVASSEMBLE、INVERSENORMALIZER.

提供现场演示.
27.
图形式大数据平台支持x86服务器组成的计算集群.
可以根据需要,通过增加服务器节点的方式进行水平扩展,以提高用户支撑的数量和性能.
28.
图形式大数据平台是自主知识产权产品.
29.
大数据平台的服务端模块采用跨平台的java语言开发,计算框架采用业界流行的hadoop/spark开发,支持Cloudera和Apache版本的Hadoop/spark.
大数据平台的服务端模支持CentOS,RedHat等主流linux系统.
30.
大数据平台的客户端模块采用支持复杂用户交互体验的微软WPF技术开发,支持windows7,8,10,支持.
net0以上版本.
31.
大数据平台支持图形化(鼠标拖拽)的方式进行教学/科研的大数据实验.
32.
在不需要编程序的基础上,用户可以采用鼠标拖拽设计开发ApacheSpark大数据批式(非实时)处理作业,可以支持大数据全链路的功能,包括数据源定义、数据汇集、数据加工、分析挖掘、数据可视化.
提供产品截图证明.
33.
在不需要编程序的基础上,用户可以采用鼠标拖拽设计开发ApacheSpark大数据流式(实时)处理作业,可以支持大数据全链路的功能,包括数据源定义、数据汇集、数据加工、分析挖掘、数据可视化.
提供产品截图证明.
34.
大数据平台支持通过用户通过java语言自定义开发数据处理功能模块和数据挖掘模块.
自定义模块可以集成到用户通过鼠标拖拽方式开发的数据工作流之中.
35.
支持异常数据处理,可以在数据工作流的主节点上通过鼠标右键弹出菜单的方式快速创建异常捕获节点,当出现数据异常时,数据自动分流,以方便排错和差异化处理.
要求异常数据处理节点的列属性包括所对应数据节点的所有上游数据节点的列,同时自动创建一个ERROR列,用于捕获具体的错误信息.

36.
图形式分别支持流式和批式大数据工作流的调度.
调度策略支持Cron表达式.
调度策略中可以设置发送邮件,查看历史运行日志等.
37.
支持对数据工作流调式,包括设置断点、数据查看器、运行目的地.
支持工作流的启动、停止、暂停.
38.
支持多人同时登录,团队协作开发.
39.
支持数据工作流以标准的xml格式导入导出、复制粘贴、版本控制.
可以根据数据工作流的历史版本生成新的数据工作流.
40.
大数据平台的图形化大数据工具模块支持常见的数据聚合功能,包括平均值、最大值、最小值、数值求和(sum)、字符串求和(stringsum)、计数等.
提供产品截图证明.
41.
支持图形化调用主流统计和数据挖掘算法,包括回归、支持向量机、朴素贝叶斯、关联规则、主成份分析、PLS、层次聚类、逐步回归、随机森林、Lasso回归、神经网络、决策树、标准差,峰度,百分位数、移动平均、相关系数、单因素方差分析.
提供产品截图证明.
42.
图形式支持自然语言处理,内置分词功能.
投标人必须提供软件制造商针对该项目的授权原件套14大数据思维课及实验案例包每一门课程要求提供理论教学所需要的PPT,以及配套的实验.
每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型.
提供实验高清视频.
其中课程单独说明,或者带-py或-python的表示是python编程版本的实验,其他的为图形式版本实验.
大于240个实验案例1.
《数据科学与工程导论》包括:数字化组织与数据思维、数据分析方法基础、数据分析实训、计算基础设施、数据存储、大数据计算框架、算法设计与编程、数据工程-数据加工、数据挖掘与机器学习、数据工程-可视化、Pyhton语言基础、Python语言统计建模与分析基础、商业案例.
实验清单:Wordcount例子、孙悟空的WordCount、《红楼梦》究竟是不是曹雪芹写的、水浒传人物重要程度分析1、水浒传人物重要程度分析2、水浒传可视化、相关系数、单因素方差分析、主成分分析、峰度、聚合函数、分位值、标准差、移动平均算法、线性回归误差分析、线性回归模型比较、用python计算数据特征、用python计算相关系数、字符串处理、初等函数、文本处理1、文本处理2、用朴素贝叶斯对鸢尾花进行分类、鸢尾花数据标准化、用支持向量机对鸢尾花进行分类、用逻辑回归对鸢尾花进行分类、用ALS推荐电影、用岭回归预测房价、用Lasso回归测房价、离散化、量化、用随机森林回归预测房价、用随机森林对鸢尾花进行分类、用二分K-Means对鸢尾花进行聚类、对杂货店销售数据进行关联规则分析、用K均值对鸢尾花进行聚类、用神经网络对鸢尾花进行分类、用决策树对鸢尾花进行分类、用决策树预测房价、《水浒传》的可视化、数据源、数据汇集、数猎云概况、数据类型和变量、使用dict和set、切片、迭代、列表生成式、生成器、使用list和tuple、输入与输出、字符串和编码、条件判断和循环语句、函数、使用文本编辑器、可视化处理、用python计算相关系数、用python计算数据特征、数据导入、数据切片、连接数据源、数据结构、Scipy库操作、描述性统计、Numpy库操作、Pandas库操作、Sciki-learn库操作、车联网大数据、互联网日志分析、搜狗数据分析(一)、搜狗数据分析(二)、搜狗数据分析(三)、搜狗数据分析(四)、自行车销售公司BI项目.

2.
《数据源与数据湖》包括:概述、关系型数据库、关系型数据库简介、关系型数据库应用场景、关系型数据库运行环境、关系型数据库数据存储结构和约束、关系型数据库写入数据、关系型数据库读取数据、关系型数据库删除和修改、小结NoSQL、NoSQL简介、应用场景、运行环境、数据存储结构、写入数据、读取数据、删除和修改、优缺点、消息、简介、应用场景、运行环境、数据存储结构和约束、写入数据、读取数据、优缺点、网页数据、简介、应用场景、运行环境、数据存储结构和约束、读取数据、优缺点、应用系统、简介、应用场景、运行环境、数据存储结构、数据操作、优缺点.
实验清单:Ubuntu安装MySQL、关系型数据库MySQL数据库运行环境、MySQL插入带约束的学生信息、Java使用MySQL事务写入学生信息、MYSQL导出导入学生数据、MySQL创建学生信息表、用Java语言读取学生信息表元数据、MYSQL查询学生信息、MySQL更新与删除学生信息-Java、MySQL分区写入销售数据、MySQL删除和修改学生表约束、MySQL更新与删除学生信息、MYSQL从视图查询学生信息、MYSQL多表联合操作实验、用MYSQL语言读取学生信息表元数据、MySQL使用事务语言写入学生信息、关系型数据库运行环境、mongodb安装、mongodb写入、mongodb创建索引、mongodb普通查询、mongodb高级查询、mongodb的修改与删除、ActiveMQ安装及环境配置、ActiveMQ点对点传输模式、ActiveMQ发布订阅模式、安装kafka、kafka消息读写、Tomacat部署及发布、通过爬虫抓取网络图片、通过TCPIP协议实现客户端与服务端通信、java实现http通信、html_数猎云产品功能界面实验指导书、获取12306火车车票信息、通过API获取天气信息.

3.
《数据加工》包括:选择,变换,条件判断,关联,聚合,排序,窗口,标签,旋转,缺值处理,数据冲突处理,数据探索,数据画像,数据抽样,数据统计描述,数据相似性,数据异常,数据去重,维规约,数值规约,噪音数据,数据量化,数据离散化.
实验清单:获取语文成绩至少100分的学生、获取语文成绩至少100分的学生-py、从网络日志中提取用户访问页面、从身份证号中获取用户信息、从天气数据中获取地区和温度、通过用户身份证号判断用户性别、对学生英语成绩进行分类、从网络日志中提取用户访问页面-py、从身份证号中获取用户信息-py、从天气数据中获取地区和温度-py、通过用户身份证号判断用户性别-py、对学生英语成绩进行分类-py、通过用户身份证号获取户口所在地、通过用户身份证号获取户口所在地-py、各班成绩聚合查询、用户访问所有页面汇总、各班成绩聚合查询-py、用户访问所有页面汇总-py、航班飞行数据打标签、学生成绩表格行转列、学生成绩缺值替换、数据缺值删除、单值个数统计、数据冲突处理之计算非空值百分比、房屋价格标准差、城镇人均犯罪率与业主自用房价因素方差分析、业主自用房价格中位数(MEDV)的分位值、房价峰度计算、城镇人均犯罪率与业主自用房价相关系数分析、业主自用房价的移动平均值、用户年收入数据画像、搜狗用户查询词数据画像、鸢尾花抽样、数据相似性计算、年龄中异常数据的检测、去除年龄中的异常数据、鸢尾花种类去重、鸢尾花特征主成分分析、鸢尾花特征线性回归、鸢尾花特征主成分分析-py、鸢尾花特征线性回归-py、量化用户上班距离、量化用户上班距离-py、年龄离散化、年龄离散化-py.

4.
《数据统计分析与挖掘》包括:数据分析与挖掘、描述性统计分析、描述性统计分析、时间序列分析、时间序列分析、单因素方差分析、单因素方差分析、数据正规化、数据正规化、主成分分析、主成分分析、线性回归、线性回归、逐步回归、偏最小二乘回归、偏最小二乘回归、逻辑回归分析、逻辑回归分析、聚类、聚类、朴素贝叶斯、朴素贝叶斯、支持向量机、支持向量机、神经网络、神经网络、关联规则、关联规则、决策树、决策树、随机森林、随机森林.
实验清单:鸢尾花的描述性统计分析、鸢尾花的统计综合指数分析、鸢尾花的统计平均指数分析、鸢尾花的众数统计分析、鸢尾花的中位数统计分析、鸢尾花的方差统计分析、鸢尾花的标准差统计分析、计算鸢尾花的峰度、计算鸢尾花的相关系数、计算上海房价的百分位数、鸢尾花的描述性统计分析-python、鸢尾花的众数统计分析-python、鸢尾花的中位数统计分析-python、计算鸢尾花的相关系数-python、计算鸢尾花的峰度与偏度-python、计算上海房价的百分位数-python、用移动平均法预测房价、用移动平均法预测人均GDP、用移动平均法预测房价-python、用移动平均法预测人均GDP-python、水稻不同品种亩产量的单因素方差分析、水稻不同品种亩产量的单因素方差分析-py、鸢尾花数据的正规化、鸢尾花数据的正规化-python、青蛙叫声数据的主成分分析、青蛙叫声数据的主成分分析-python、用线性回归预测足球运动员身价、用线性回归预测发电站电力输出、用线性回归预估商品的销售额、对工资水平进行逐步回归、用岭回归预测街道上公共自行车使用量、用Lasso回归预测房价、用线性回归预测足球运动员身价-py、用线性回归预测发电站电力输出-py、用线性回归预估商品的销售额-py、用岭回归预测街道上公共自行车使用量-py、用Lasso回归预测房价-py、用偏最小二乘预测楼房的能源效率、用偏最小二乘预测楼房的能源效率-py、用逻辑回归对鸢尾花进行分类、用逻辑回归对鸢尾花进行分类-py、用层次聚类分析电信用户信用、用K-Means细分青少年兴趣、用层次聚类分析电信用户信用-py、用K-Means细分青少年兴趣-py、用朴素贝叶斯判断是否接受贷款申请、用朴素贝叶斯判断是否接受贷款申请-py、用支持向量机判别是否是矿石、用支持向量机判别是否是矿石-py、用神经网络判别小麦种子等级、用神经网络诊断是否是乳腺癌、用神经网络判别人体活动、用神经网络判别小麦种子等级-py、用神经网络诊断是否是乳腺癌-py、用神经网络判别人体活动-py、互联网日志关联分析、互联网日志关联分析-py、用决策树判断电离层的好坏、用决策树审核交通事故是否理赔、用决策树发现银行即将流失的客户、用决策树评估个人信贷信用好坏、用决策树判断电离层的好坏-py、用决策树审核交通事故是否理赔-py、用决策树发现银行即将流失的客户-py、用决策树评估个人信贷信用好坏-py、用随机森林预测鲍鱼环的数量、用随机森林判断青少年运动障碍、用随机森林判别红酒品质、用随机森林建议地震损毁建筑的修复方案、用随机森林预测鲍鱼环的数量-py、用随机森林判断青少年运动障碍-py、用随机森林判别红酒品质-py、用随机森林建议地震损毁建筑修复方案-py.

5.
《数据可视化》包括:数据可视化、数据可视化简介、可视化的释义、可视化简史、数据可视化基础、数据可视化基础框架、可视化中的数据、可视化设计原则、可视化理论发展、数据可视化图表及实现、DEEP的可视化模块——DEEPBI、表视图、分布条形图、直方图、饼图、气泡图、盒须图、折线图、日历热力图、树状图、力导向图、词云图、透视表、平行坐标、大数、桑基图、旭日图、子弹图、弦图、时序图、事件流图、热力图、可视化中的交互、交互准则、交互分类、交互技术、可视化评测、评测流程、影响评测效度的因素、评测方法、评测实例分析.
实验清单:可视化数据准备基本流程、班级男生身高、体重、腰围统计-表视图、城市居民受教育程度统计-饼图、公司月销售额、月同比增长率统计-折线图、3名员工与其他员工聊天记录统计-力导向图、星座统计-数据透视表、商品销售关联统计-桑基图、8个班级测验结果人数统计-弦图、2016年全国31省市GDP统计-国家热、人口top20国家人口统计-世界热力地图、学生测验成绩统计-盒须图、17年人口top60国家人口统计-树图、文本高频词汇出现次数统计-词云图、深圳A股总量统计(大数)、城市日高温、低温统计-时间序列曲线图、城市日高温、低温统计-时间序列条形图、投资账户日资产统计-时序百分比变化图、商店15天利润统计-时序面积图、班级测验成绩表-直方图、城市自行车租用量-地平线时间序列图、事件流图模拟项目管理、公司年度销售额统计-条形图、班级学生性别、星座统计-旭日图、15个市人口、城市人口比例、受过高等教育、当前汽车行驶速度-子弹图、2017年上海全年温度统计-日历热力图、年级学生测验成绩统计-平行坐标图.

套15大数据工具课程每一门课程要求提供理论教学所需要的PPT,以及配套的实验.
每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型.
随堂实验案例及课程设计案例数量大于300个.

1.
《Python程序设计与数据分析》Spyder开发Python环境、PythonWordcount、输入输出操作、数据类型和变量、字符串和编码使用list和tuple、dict和set、切片迭代列表生成式生成器、条件判断和循环语句函数、数据导入、数据结构、数据切片、描述性统计、可视化、Numpy库操作、Scipy库操作Pandas库操作、Sciki-learn库操作、Python可视化、Sklearn机器学习入门实践用决策树判断是否接受贷款申请、用随机森林判别红酒品质、用决策树评估个人的信用卡信用好坏、使用K近邻诊断乳腺癌、航班乘客时间序列分析、用K-Means细分青少年兴趣、用SVC进行人脸识别、用用神经网络判断是否推荐衣服、用决策树发现银行即将流失的客户用K-Means聚类分析电信用户信用、商店购物关联规则、泰坦尼克号沉船生存率分析、用关联则预测用户访问网站、用神经网络判断小麦种子等级、用随机森林判断青少年运动障碍用神经网络预测人体活动、用随机森林通过青蛙叫声判断类别、用线性回归预估商品的销售额用随机森林预测自行车需求量、用神经网络机预测网络新闻流行度、判别是否是矿石用偏最小二乘预测楼房的能源效率、用线性回归模型预测发电站电力输出、MNIST手写数字图片集降维、用Tesorflow识别手写数字基础、用Tesorflow识别手写数字进阶2.
《Hadoop基础》安装JDK、设置无密码登陆、安装并配置Hadoop、运行Hadoop的wordcount、查看Hadoop集群的基本信息、查询与中断MapReduce任务、统计文件中所有单词的平均长度、HDFS基本操作-命令行方式、HDFS基础操作--API接口方式、Eclipse搭建Hadoop开发环境、计算学生平均成绩的MapReduce、搜狗的搜索词排序、对两个文件中的数据进行合并与去重、筛选日志文件并生成序列化文件、编程实现按日期统计访问次数3.
《Hadoop中级课程》用拟蒙特卡洛方法计算PI值、KMeans算法MapReduce实现、NBA球队风格聚类、蓄水池抽样算法的MapReduce实现、TF-IDF算法MapReduce实现、倒排索引的MapReduce好友推荐、获取股票最大值信息、温度统计、手机流量统计《Hadoop高级课程》HBase安装、Hbase命令行操作、搭建Eclipse开发Hbase环境、Java操作HBaseZookeeper安装、Zookeeper命令行、搭建Zookeeper开发环境、ZookeeperJavaAPI使用、Pig的单机安装、访问统计信息数据处理、Kafka安装、Kafka命令行操作IDEA搭建Java操作Kafka开发环、Java操作Kafka、Redis安装、Redis数据类型、Redis命令行、搭建IDEA开发redis环境、Redis的Java操作、搭建IDEA开发Storm环境、Storm安装IDEA开发StormWordcount、Flume的安装与配置、Flume收集模拟日志到HDFS《Spark基础》Spark2.
3.
1安装配置、Sparkwordcount、定义函数识别号码类型、统计号码段数量根据归属地对手机号码段分组、手机号码归属地信息查询、过滤文本中的回文单词使用Scala编程输出杨辉三角、Scala安装、统计文本中性别为男性的用户数、以学生成绩创建RDD、查询学生成绩表中的前5名、输出单科成绩为100分的学生ID、输出每位学生所有科目的总成绩、输出每位学生的平均成绩、将汇总后的学生成绩存储为文本文件、IDEA配置spark开发环境、IDEA中的sparkwordcount、统计分析某公司每年的产品销售量及销售额统计分析航空公司客户数据的空值以及异常值、将汇总后的学生成绩保存到HDFS、Streaming实时更新热门博文、使用PageRank算法完成网页排名、用神经网络识别青蛙类型、相关系数分位数、峰度、标准差、移动平均、决策树分类、决策树回归、Lasso回归、用随机森林判断青少年是否有运动障碍、主成分分析、二分K-Means聚类、关联规则、朴素贝叶斯、逻辑回归用支持向量机判别是否是矿石、单因素方差分析、PLS回归、逐步回归《HBase》开发快速预览、HBase介绍、HBase架构、HBase安装单机模式、HBase概念视图、HBase物理视图、HBase命名空间、HBase表、行与列族、HBase的核心模块介绍、客户端Client、HBase表格模式经验法则、HBaseShell、启动HBaseShell、HBase创建表、HBase列出表、HBase禁用表HBaseAdminAPI、HBase模式创建、使用JavaAPI创建一个表、使用JavaAPI列出表、使用JavaAPI禁用表、利用MR批量读写hbase数据、从MySQL导入数据到HBase、Hbase高级特性Bloomfilter《人工智能与机器学习》1Tensorflow基础Tensorflow简介、Tensorflow计算图、Tensorflow张量、Tensorflow运算符、Tensorflow会话、一个简单的神经网络、TensorBoard2卷积神经网络神经网络、卷积神经网络/AlexNet网络/VGG网络、GoogleNet网络、残差网络3循环神经网络循环神经网络、长短时记忆网络、GRU网络、Seq2Seq模型、注意力机制4生成对抗网络简单生成对抗网络、深度卷积生成对抗网络、条件生成对抗网络、WGAN5迁移学习迁移学习简介、图像风格迁移6强化学习强化学习简介、Q-Learning算法、SARSA算法、深度Q网络、深度确定性策略梯度算法(DDPG)7计算机视觉图像分类、目标检测、图像分割、目标追踪、人脸识别、图像生成描述、文字识别8自然语言处理自然语言处理简介、中文分词、词向量、情感分类、命名实体识别、文本分类、语言模型、机器翻译9语音识别语音基础知识、语音识别、语音合成套16大数据教学商业案例课程1.
典型行业分析案例至少包含以下实验:(1)海量网站日志分析案例.
要求用Python的关联规则分析互联网日志,该日志记录了用户查询不同的关键词,实验目的是分析用户查询关键词之间的关联关系(2)搜索引擎关键词分析算法案例.
要求用Pandas模块统计每个用户搜索的关键词和搜索时间2.
大据平台建设案例至少包含以下实验:(1)集群搭建(2)Hadoop伪分布模式安装(3)Hadoop完全分布模式安装(4)Hadoop开发插件安装.
3.
电子商务实战案例至少包含以下实验:采集电商网站交易及评论数据.
要求用Python的requests、json包采集京东电商平台的商品价格、交易量、评论等数据(评论时间、用户昵称、评论内容).
4.
电商网站评论数据清洗.
要求用Python清除异常记录,删除stopword、删除特殊字符、删除标点符号、删除数字等5.
离线分析评论数据.
要求用Python统计每个评论词出现的次数.
把分析结果写入Mysql数据库.
数据图表展示.
把评论的关键词制作成词云图.
使用分析数据训练模型.
要求在实验《电商评论数据清洗》结果的基础上,用评论的关键词训练朴素贝叶斯和随机森林模型.
用训练完成的模型对实时爬取的评论数据进行情感分类.
6.
客户价值分析方法的实战案例至少包含以下实验:发现自行车潜在购买客户.
要求用客户信息数据训练一个逻辑回归模型,并用该模型预测新的数据判断是否购买自行车,因而发现潜在的购买自行车的客户.
实施步骤至少包含:数据探索性分析、数据清洗、属性规约、数据变换、模型构建.
7.
分类预测方案至少包含以下实验:用逻辑回归对鸢尾花进行分类.
要求要求通过用逻辑回归算法对鸢尾花数据进行分类,用Sklearn模块的LogisticRegression类对鸢尾花数据集训练一个逻辑回归模型.
实施步骤至少包含:导入数据、特征预处理、训练集和验证集、建立模型、评估模型、优化模型;8.
基础模型数据预测方案至少包含以下实验:用随机森林预测鲍鱼环的数量.
要求用Sklearn模块RandomForestRegressor类的对数据建立随机森林回归模型.
实施步骤至少包含:导入数据及预处理数据、模型训练、模型评估、模型优化、可视化9.
行为预测案例方案至少包含以下实验:用神经网络判别人体活动.
要求通过Sklearn模块的MLPClassifier类对人体活动数据数据训练一个神经网络分类模型,然后用训练完成的模型测试一部分数据.
实施步骤至少包含:、数据探索分析、数据预处理,数据集划分为训练集与测试集,构建神经网络模型、并对神经网络模型构建混淆矩阵可视图,构建决策树模型、并对决策树模型构建混淆矩阵可视图;10.
模型预测方案至少包含以下实验用逻辑回归预测红酒品质.
要求用Sklearn模块的LogisticRegression类对红酒品质数据训练一个逻辑回归模型并用之测试部分数据,实施步骤至少包含:数据探索分析,数据预处理,训练集和验证集,建立逻辑回归模型,模型评估,用模型对测试数据进行预测,并将预测结果保存;11.
影响因素分析及预测方案至少包含以下实验:财政收入影响因素分析及预测模型.
实施步骤至少包含:描述分析,相关性分析,建立灰色预测模型,建立神经网络预测模型,对影响因素建立灰色预测模型、得出后验差比值、预测精度等级,对影响因素建立神经网络预测模型;通过用神经网络算法对财政收入数据进行预测.

地方财政收入灰色预测模型.
要求过程至少要完成:特征选择、建立灰色预测模型、地方财政收入神经网络预测模型12.
情感判定大数据分析方法至少完成以下实验空调购买顾客情感分析.
要求用评论的关键词训练朴素贝叶斯和随机森林模型.
实施步骤至少包含:数据预处理,特征工程,建立朴素贝叶斯、并计算求交叉验证的平均得分,建立逻辑回归模型、并计算求交叉验证的平均得分;13.
金融风控大数据案例至少完成以下实验:导入原始业务数据.
要求把原始的历史贷款记录数据导入到大数据平台,并保存到大数据平台的数据湖之中以备后继加工处理.
.
理解原始数据.
要求进行原始数据的探索和画像,以寻找具体的数据质量问题.
丢失属性的处理.
要求练习通过业务上关联的属性解决数据丢失问题的方法.
分析关联属性缺值弥补方法的优缺点.
挖据预处理.
要求通过业务上关联的属性解决数据丢失问题的方法.
分析关联属性缺值弥补方法的优缺点.
建立风控预测模型以前期数据加工的结果为基础,通过分类型的数据挖掘算法,建立基于分类的金融风控模型.
模型预测评价通过精确率(precision)、准确率(accuracy)和召回率(recall)对模型进行评价.
数据可视化:贷款审批结果输出通过表视图和柱状图对贷款审批结果进行可视化显示.
14.
决策树算法分析影响至少包含以下实验:用决策树判断个人信贷信用好坏.
要求用Sklearn模块的DecisionTreeClassifier类对德国贷款数据建立决策树模型,用训练完成的模型测试数据,对训练的模型用graphviz进行可视化.
实施步骤至少包含:导入数据、数据预处理、建立决策树模型、模型可视化;15.
向量机算法的数据分析方法至少包含以下实验:用支持向量机判断银行是否流失客户.
要求用客户数据建立SVM模型.
然后用训练完成的模型测试一部分数据.
利用连个特征训练一个SVM模型.
预测结果可视化.
实施步骤至少包含:导入数据,特征提取,建立SVM分类模型,模型预测及评估,预测结果可视化;16.
关联规则至少包含以下实验:商品订单关联规则.
要求分析商店购物的关联规则,找到经常被一起购买的物品.
实施步骤至少包含:自行编写Apriori算法,导入数据,数据预处理,使用Apriori算法挖掘商品订单关联规则,保存关联规则数据;17.
模型评估的数据可视化方案至少包含以下实验:构建DenseNet网络模型.
要求构建由一个卷积层和3个dense_block块组成的Densnet模型,其中每个dense_block块由8个卷积层组成.
训练DenseNet网络模型.
要求在实验《构建DenseNet网络模型》构建的模型的基础上,用文字图片来训练该模型.
把模型训练结果可视化.
用训练的DenseNet模型识别文字.
要求用实验《训练DenseNet深度卷积网络模型》训练的模型来识别文字.

训练DenseNet网络模型实施步骤至少包含:提取数据、数据划分为训练集与验证集、数据预处理、建立字体识别模型、模型评估、评估模型准确率与训练时间、数据可视化.
套1备注说明:1、本项目要求投标人现场提供不超过20分钟的系统功能演示.
2、要求:各投标人需自行搭建演示环境进行系统真实演示,用Demo或PPT演示视为演示不成功,提前准备系统功能演示所需的条件(费用自理),主要演示功能详见评分标准.
第三篇项目商务要求说明:""标注的商务要求为符合性审查中的实质性要求,若不满足按无效投标处理.
一、交货期、交货地点及验收方式(一)交货期中标人应在采购合同签订后60个工作日内交货并完成安装调试.
(二)交货地点交货地点:重庆财经职业学院(重庆市永川区昌州大道西段2号).
(三)验收方式1.
货物到达现场后,中标人应在使用单位人员在场情况下当面开箱,共同清点、检查外观,作出开箱记录,双方签字确认.
2.
中标人应保证货物到达采购人所在地完好无损,如有缺漏、损坏,由投标人负责调换、补齐或赔偿.
3.
中标人应提供完备的技术资料、装箱单和合格证等,并派遣专业技术人员进行现场安装调试.
验收合格条件如下:3.
1设备技术参数与采购合同一致,性能指标达到规定的标准.
3.
2货物技术资料、装箱单、合格证等资料齐全.
3.
3在系统试运行期间所出现的问题得到解决,并运行正常.
3.
4在规定时间内完成交货并验收,并经采购人确认.
4.
产品在安装调试并试运行符合要求后,才作为最终验收.
5.
投标人提供的货物未达到招标文件规定要求,且对采购人造成损失的,由投标人承担一切责任,并赔偿所造成的损失.
6.
大型或者复杂的政府采购项目,采购人应当邀请国家认可的质量检测机构参加验收工作.
7.
采购人需要制造商对中标人交付的产品(包括质量、技术参数等)进行确认的,制造商应予以配合,并出具书面意见.
8.
产品包装材料归采购人所有.
二、报价要求本次报价须为人民币报价,包含:产品价、运输费(含装卸费)、保险费、安装调试费、税费、培训费等货到采购人指定地点的所有费用.
三、质量保证及售后服务(一)产品质量保证期1.
投标人应明确承诺:其所投标所有产品质量保证期达到3年.
2.
投标产品属于国家规定"三包"范围的,其产品质量保证期不得低于"三包"规定.
3.
投标人的质量保证期承诺优于国家"三包"规定的,按投标人实际承诺执行.
4.
投标产品由制造商(指产品生产制造商,或其负责销售、售后服务机构,以下同)负责标准售后服务的,应当在投标文件中予以明确说明,并附制造商售后服务承诺.
(二)售后服务内容1.
投标人和制造商在质量保证期内应当为采购人提供以下技术支持和服务:1.
1电话咨询中标人和制造商应当为采购人提供技术援助电话,解答采购人在使用中遇到的问题,及时为采购人提出解决问题的建议.
1.
2现场响应采购人遇到使用及技术问题,电话咨询不能解决的,中标人和制造商应在2小时内到达现场(远郊区8小时内到达现场)进行处理,确保产品正常工作;无法在12小时内解决的,应在48小时内提供备用产品,使采购人能够正常使用.

1.
3技术升级在质保期内,如果中标人和制造商的产品技术升级,投标人应及时通知采购人,如采购人有相应要求,中标人和制造商应对采购人购买的产品进行升级服务.
2.
质保期外服务要求2.
1质量保证期过后,投标人和制造商应同样提供免费电话咨询服务,并应承诺提供产品上门维护服务.
2.
2质量保证期过后,采购人需要继续由原投标人和制造商提供售后服务的,该投标人和制造商应以优惠价格提供售后服务.
(三)备品备件及易损件中标人和制造商售后服务中,维修使用的备品备件及易损件应为原厂配件,未经采购人同意不得使用非原厂配件,常用的、容易损坏的备品备件及易损件的价格清单须在投标文件中列出.
四、付款方式1.
合同签订后中标人向采购人缴纳合同金额5%的履约保证金,履约保证金在验收合格后质保期满后无任何问题后无息退还;2.
无预付款,中标人按采购合同交货并安装调试完成,经验收合格后采购人出具项目验收报告;中标人提供合格票据,采购人以转账方式向中标人支付结算全款的100%.
五、知识产权采购人在中华人民共和国境内使用投标人提供的货物及服务时免受第三方提出的侵犯其专利权或其它知识产权的起诉.
如果第三方提出侵权指控,中标人应承担由此而引起的一切法律责任和费用.
六、培训投标人对其提供产品的使用和操作应尽培训义务.
投标人应提供对采购人的基本免费培训,使采购人使用人员能够正常操作.
七、、图纸及包装要求所有设备按照制造商规定的产品包装和随机标准为准.
八、其他商务要求内容(一)投标人必须在投标文件中对以上条款和服务承诺明确列出,承诺内容必须达到本篇及招标文件其他条款的要求.
(二)其他未尽事宜由供需双方在采购合同中详细约定.
第四篇资格审查及评标办法一、资格审查依据政府采购相关法律法规规定,由采购人或采购代理机构对投标文件中的资格证明文件进行审查.
资格审查资料表如下:序号检查因素检查内容1投标人应符合的基本资格条件(1)具有独立承担民事责任的能力投标人法人营业执照(副本)或事业单位法人证书(副本)或个体工商户营业执照或有效的自然人身份证明;投标人法定代表人身份证明和法定代表人授权代表委托书.
(2)具有良好的商业信誉和健全的财务会计制度提供2018或2019年度财务状况报告(表)或其基本开户银行出具的资信证明复印件,本年度新成立或成立不满一年的组织和自然人无法提供财务状况报告(表)的,可提供银行出具的资信证明复印件.

展开全文

数据网站日志相关文档

采用360 支持ipad filezillaserver怎么用FileZilla Server 0.9.27 绿色汉化版软件?全国企业信息查询全国企业信用信息公示系统查询入口及操作说明哪里有？dell服务器bios设置戴尔服务器主板怎么设置U盘启动人人视频总部基地落户重庆迁户口入重庆文档下载怎样在手机上建立word的文档？需要下载什么软件？泉州商标注册泉州注册一个商标具体要怎么弄？具体流程是什么？什么是seo小红妹 seo是什么意思？seo网站优化该怎随机阅读 seo是什么意思站点管理工行网点现场管理人员主要职责是什么服务器租用托管播放vps上的视频 liquidweb 163网 174.127.195.202 parseerror 长沙服务器免费全能空间 admit的用法百度云1t 免费asp空间 winds 最新优惠标准机柜 qq空间打开很慢服务器是什么意思 so域名 symantec 傲盾代理连连支付更多

数据网站日志

DogYun（300元/月），韩国独立服务器,E5/SSD+NVMe

物语云-VPS-美国洛杉矶VPS无限流量云windows大带宽100M不限流量 26/月起

亚州云-美国Care云服务器，618大带宽美国Care年付云活动服务器，采用KVM架构，支持3天免费无理由退款！