久久久久久久99久久久毒国产-久久久久久久99精品免费观看-久久久久久久99精品免费-久久久久久久97-午夜寂寞剧场-午夜激情影院

2021考研大綱:西南財經大學817數據挖掘綜合2021年碩士研究生入學考試自命題科目考試大綱及參考書目

考試大綱不僅能給你一個復習的方向,還能幫助你梳理整個知識脈絡,方便記憶。今天,小編為大家整理了“2021考研大綱:西南財經大學817數據挖掘綜合2021年碩士研究生入學考試自命題科目考試大綱及參考書目”的相關內容,希望對大家有所幫助!

西南財經大學招收碩士生考試說明及考試大綱
 
適用專業:大數據管理
考試科目:《數據挖掘綜合》
第一部分:考試內容及要求
一. 數據挖掘概述
考試內容
數據挖掘的概念 知識發現過程 數據挖掘數據類型 數據挖掘功能和模式 數據挖掘可利用的技術 數據挖掘應用 數據挖掘的主要問題
考試要求
1.了解數據庫系統技術的演變過程;理解數據挖掘的概念;掌握知識發現過程的7個步驟。
2.掌握數據挖掘的數據類型;掌握數據挖掘功能和模式;理解數據挖掘與統計學、機器學習的聯系和區別;了解數據挖掘的應用領域;了解數據挖掘的主要問題。
 
二. 數據預處理
考試內容
數據屬性 數據基本描述統計 數據預處理概述 數據質量  數據預處理的主要步驟  數據清理 數據集成 數據變換 數據規約 數據離散化
考試要求
1.了解數據對象與屬性類型。
2.理解數據的基本統計描述,掌握均值、中位數、眾數、極差、四分位數、方差、標準差和四分位數極差的概念和計算方法;了解數據基本統計描述的圖形顯示;了解度量數據的相似性和相異性。
3.了解進行數據預處理的原因及其重要性;了解數據質量涉及的因素;掌握數據預處理的主要步驟。
4.了解數據清理的概念;了解處理數據缺失值的方法;了解處理噪音數據的方法。
5.理解數據集成的概念;掌握冗余和相關性分析的方法(檢驗,Pearson積矩系數)。
6.了解數據變換的策略;掌握數據規范化的計算方法(最小-最大規范化、z分數規范化、按小數定標規范化)。
7.理解數據歸約的概念;了解數據歸約的策略;了解線性回歸、對數線性模型、直方圖、聚類、抽樣等數據歸約方法。
8.理解數據離散化和概念分層的概念;了解數據離散化的方法(分箱、直方圖分析、聚類分析、相關分析)。
三.數據倉庫和聯機分析處理
考試內容
數據倉庫基本概念  OLTP和OLAP 數據立方體 數據倉庫的數據模型 概念分層 典型的OLAP操作 數據倉庫的設計 數據倉庫的實現 數據倉庫和數據挖掘
考試要求
1.理解數據倉庫的概念和關鍵特征;了解OLTP和OLAP的概念和主要區別。
2.了解數據倉庫模型的種類;了解元數據庫的概念以及與其他數據的區別。
3.理解數據立方體的概念;了解數據倉庫的數據模型(星型模式、雪花模式、事實星座模式);了解典型的OLAP操作方法。
4.了解數據倉庫設計的四種視圖, 了解數據倉庫的設計過程和步驟;了解OLAP查詢處理的步驟。
5.了解三類數據倉庫應用;了解多維數據挖掘的重要性。
 
四. 挖掘頻繁模式、關聯和相關性
考試內容
頻繁項集概念  頻繁項集挖掘方法  Apriori算法  FP-growth算法  
考試要求
1.理解項集、閉項集、頻繁項集和關聯規則的概念 ;了解規則興趣度的兩種度量(支持度和置信度)。
2.了解關聯規則挖掘的步驟。
3.了解Apriori算法的步驟;了解FP-growth算法的步驟和優缺點;掌握相關性度量提升度(lift)的計算方法。
 
五. 分類和預測
考試內容
數據分類和預測的概念 判定樹歸類算法 信息增益 樹剪枝 回歸分析 分類法的準確性 組合分類器 類不平衡問題
考試要求
1.理解數據分類的概念;了解分類的兩個過程;理解監督學習和非監督學習的區別;了解分類和預測的數據預處理方法;掌握評估分類和預測方法的標準。
2.了解決策樹的概念和優缺點;了解決策樹歸分類的主要步驟;了解常用的屬性選擇度量,掌握信息增益度量的求法;理解兩種常用的樹剪枝方法。
3.了解評估分類器性能的度量;了解評估分類和預測準確率的方法(混淆矩陣、靈敏度和特小型、F度量)。
4.了解K-折交叉驗證和自助法的基本思想;了解ROC曲線的概念和特點。
5.了解組合分類器的概念和常用的組合分類方法;了解裝袋和提升的基本思想以及兩者的區別;了解隨機森林的基本思想。
6.了解類不平衡問題的概念;了解提高類不平衡數據分類準確率的一般方法。
 
六. 聚類分析
考試內容
聚類分析的概念 聚類方法的分類 算法方法的距離度量 劃分方法 層次方法 基于密度的方法 基于網格的方法 聚類評估
考試要求
1.理解聚類分析的概念;了解聚類分析的應用領域;了解比較聚類方法的標準;了解數據挖掘對聚類的典型要求;了解比較聚類方法的各個方面。
2.理解劃分方法的概念和一般特點,以及典型算法;理解層次方法的概念和一般特點,以及典型算法;理解基于密度的聚類方法的概念和一般特點,以及典型算法;理解基于網格的聚類方法的概念和一般特點,以及典型算法;
3.理解K-均值算法的步驟和優缺點;
4.了解算法方法的距離度量。
5.了解聚類評估概念和主要任務;了解測定聚類質量的方法。
 
第二部分:考試方法和考試時間
數據挖掘綜合考試采用閉卷、筆試形式,考試時間為180分鐘。
 
第三部分:試卷結構參考書目
(一)題分:試卷滿分為150分
(二)題型比例:
選擇題與判斷題  約40% 
簡答題和計算題  約60% 
(三)參考書目:
《數據挖掘 概念與技術》(原書第3版),作者:Jiawei Han(韓家煒),出版社:機械工業出版社。
      
原文標題:2021年碩士研究生入學考試自命題科目考試大綱

原文鏈接:http://yz.swufe.edu.cn/web/2020-09/16/202009161510146840.html


以上就是“2021考研大綱:西南財經大學817數據挖掘綜合2021年碩士研究生入學考試自命題科目考試大綱及參考書目”的全部內容,更多考研大綱信息,請多多關注!

X

掃碼添加獲取各院校復試名單及錄取名單

【版權與免責聲明】本站所提供的內容除非來源注明研線網,否則內容均為網絡轉載及整理,并不代表本站贊同其觀點和對其真實性負責。文章由本站編輯整理發出,僅供個人交流學習使用。如本站稿件涉及版權等問題,請聯系本站管理員予以更改或刪除。

責任編輯:禹靜
主站蜘蛛池模板: 日本在线日本中文字幕日本在线视频播放 | 午夜国产福利在线观看 | 日韩深夜福利视频 | 欧美在线播放 | 四虎影视在线影院4hutv | 日产一区二区三区 | 午夜影库| 色五月激情五月 | 午夜影院在线免费观看 | 色综合久久天天综合绕观看 | 在线免费h | 亚洲宅男天堂a在线 | 四虎免费最新在线永久 | 四虎影院在线播放 | 午夜日本理论 | 伊人影视 | 图片区 日韩 欧美 亚洲 | 全部毛片 | 四虎影视在线影院在线观看 | 青娱乐在线视频盛宴 | 亚洲第一男人网站 | 日韩在线视频在线观看 | 午夜在线播放视频在线观看视频 | 日本欧美一区二区三区视频麻豆 | 四虎在线视频 | 日韩精品中文字幕一区三区 | 四虎永久免费最新在线 | 欧美视频黄色 | 天天干天天草天天射 | 天天色天天操综合网 | 四虎www免费人成 | 天天狠天天天天透在线 | 日韩三级在线观看 | 日韩欧美在线综合网高清 | 欧美一区日韩精品 | 亚洲视频网站在线观看 | 伊人亚洲综合网成人 | 天堂网在线新版www 天堂网在线网站成人午夜网站 | 亚洲欧美自拍另类图片色 | 欧美视频久久 | 天天躁夜夜躁狠狠躁2018a |