大數據對未來產生深刻的影響,目前可以預見的發展趨勢,大數據對與統計學的好處有以下兩點:
1.數據科學和數據聯盟的成立.數據科學將成為一門專門的學科,數據的重要性不言而喻,統計學也會借此契機迎來新的發展.基于數據基礎平臺,還建立起跨領域的數據共享平臺,之后,數據共享將擴展到企業層面,并且成為未來產業的核心一環.
2.數據管理成為核心競爭力.數據管理成為核心競爭力后,直接影響財務表現.當數據資產是企業核心資產的概念深入人心后,企業對于數據管理便有了更清晰的界定,將數據管理作為企業核心競爭力,持續發展,戰略性規劃與運用數據資產,成為企業數據管理的核心.數據資產管理效率與主營業業務收入增長率,銷售收入增長率顯著正相關.到那時,統計學的相關知識將被廣泛的應用在生產生活的各個方面,全面深入的融入人們的生活.
學生端基本功能
- 查看實驗
- 閱讀指導書
- 提交報告
- 查看成績
- 修改個人信息
教師端基本功能
- 開始試驗
- 管理班級
- 設置實驗
- 批閱報告
管理員端基本功能
- 查看虛擬機
- 創建、啟動、停止虛擬機
29套案例庫
| 序號 | 案例庫名稱 | 案例庫簡介 |
|---|---|---|
| 1 | 車輛GPS位置信息大數據案例庫 | 該數據為江蘇省南京市出租車從2010年9月1日到2日的GPS位置數據,包含了7,7267輛出租車的共33,042,225條位置記錄 |
| 2 | 超市零售大數據案例庫 | 該據為國內某超市從2012年8月1日到2013年8月1日共一年的交易數據,包含了812,847條交易、2,893,385件單個商品以及20,154名顧客。 |
| 3 | 微博消息大數據案例庫 | 該據為新浪微博數據,包含了從2013年6月1日到14日期間的12,102,7441條微博 |
| 4 | 用戶上網行為大數據案例庫 | 該據為谷歌(Google)和亞馬遜(Amazon)的產品數據 |
| 5 | 電影評分大戶及案例庫 | 數據為美國在線影片提供商 |
| 6 | 加速度測量大數據案例庫 | 該數據集為大量的加速度測量數據。數據集包含訓練集、測試集和問題集。實驗任務是通過訓練,讓機器來檢測測試集中的加速度是否是由問題集中所聲稱的設備記錄的。 |
| 7 | 車輛保險大數據案例庫 | 通過車輛特征來準確預測保險索賠支付。該數據集包含一系列車輛信息。 |
| 8 | 單詞拼寫腦電圖大數據案例庫 | 該數據集為腦電圖記錄。人類思考時,發出腦電波,這些腦電波對應實際意圖。我們讓測試者只注意視覺刺激來拼寫單詞,并且記錄他們的腦電波數據 |
| 9 | 債券交易大數據案例庫 | 數據集包含美國公司債券交易數據。每行包括交易信息,以及已交易的債券和有關過去10次交易信息的一些基本信息 |
| 10 | 腦磁圖大數據案例庫 | 該數據集為大量腦磁圖記錄。訓練集共16個主題包括9414個實驗,腦磁圖和類標簽。測試集共7個主題包括4058個腦磁圖記錄,沒有類標簽 |
| 11 | 黑盒子學習大數據案例庫 | 數據集的每個實例都有1875個輸入特征,并且每個例子都屬于9個類型中的一個。訓練集包括1000個有標簽的例子。測試 集包括10000個例子,分為5000個公共測試和5000個私人測試。我們還提供了額外的135735個無標簽的例子,可以用于無監督學習。 |
| 12 | 點擊流大數據案例庫 | 十天的click—through數據 |
| 13 | 豆瓣大數據案例庫 | 本數據集為豆瓣數據。豆瓣數據主要是社區數據,基于豆瓣的小組功能,我們選了約1.5萬不同規模的小組,然后首先抓取他們的小組成員,然后抓取小組成員的粉絲 |
| 14 | 網站內容大數據案例庫 | 該數據集包含了來自不同的堆棧交換網站的內容 |
| 15 | 問答網站提問大數據案例庫 | 該數據集包含問答網站 |
| 16 | 文本分類大數據案例庫 | 該數據集為 |
| 17 | 工作廣告大數據案例庫 | 該數據集為大量的個人工作廣告,以及每個工作廣告相關的一系列字段 |
| 18 | 惡意文件大數據案例庫 | 該數據集包含一系列惡意文件,這些惡意文件屬于9個不同的家族。已知的惡意文件集合中,每個惡意文件包含一個Id(一個20字符的唯一hash值),以及一個類型(整數) |
| 19 | 網絡安全日志大數據案例庫 | 所用數據為某企業一周的網絡日志數據,包含了46,138,310條網絡流數據和3,407,967條狀態監控消息 |
| 20 | 廣告攔截大數據案例庫 | 預測一段 |
| 21 | GAL腦電圖大數據案例庫 | 該數據集為“抓取和提起”(簡稱GAL)動作的腦電圖記錄 |
| 22 | 粒子碰撞大數據案例庫 | 數據包含碰撞事件及參數,需要預測是否在碰撞中發生了τ→3μ衰變 |
| 23 | 人口普查大數據案例庫 | 美國社區調查是美國人口普查局從事的一個持續的調查。每年約有350萬戶家庭參與這個調查,他們被詳細詢問關于他們是誰和他們如何生活。調查也涉及了很多話題,包括祖先、教育、工作、交通、互聯網使用和居住 |
| 24 | 大學計分卡大數據案例庫 | 數據集為美國某大學記分卡原始數據 |
| 25 | 旅程大數據案例庫 | 數據對應的文件夾下有許多的文件夾,每個文件夾代表一個司機。每個文件夾內部有200個csv文件,每個文件代表一段旅程 |
| 26 | 帶有情感表情的微博大數據案例庫 | 數據為新浪微博帶有情感表情的微博數據,包含了從2010年4月到9月期間1萬活躍用戶的6,193,7036,193,703條 微博以及相應的情感標簽(憤怒、厭惡、高興和低落) |
| 27 | 出租車運行軌跡大數據案例庫 | 葡萄牙波爾圖的442輛出租車的運行軌跡。這些出租車上安裝了移動數據終端,由出租車運營中心調控。旅途分為三種:(1)由出租車運營中心指派;(2)由出租車站直接要求搭乘;(3)在隨機的街道上要求搭乘。數據集可用于出租車運行路線預測實驗和出租車運行平均時間預測實驗。 |
| 28 | 農業大數據案例庫 | 該數據是2010年至2016年,全國各地每日發布的小麥出售或求購信息,數據類型包括日期、省市、各個收廠商及價格信息。近20萬條數據信息。 |
| 29 | 電子商務大數據案例庫 | 近6萬條數據,包括行業,地區,評價,發貨信息,信用等級,商品信息,用戶信息等。 |