工業(yè)大數(shù)據(jù)是工業(yè)領(lǐng)域相關(guān)數(shù)據(jù)集的總稱,是工業(yè)互聯(lián)網(wǎng)的核心,是智能制造的關(guān)鍵。工業(yè)大數(shù)據(jù)分析技術(shù)作為工業(yè)大數(shù)據(jù)的核心技術(shù)之一,是工業(yè)智能化發(fā)展的重要基礎(chǔ)和關(guān)鍵支撐。為此,在工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟的指導(dǎo)下,工業(yè)大數(shù)據(jù)特設(shè)組主持編寫了這本《工業(yè)大數(shù)據(jù)分析指南》。
本書旨在對通用的工業(yè)大數(shù)據(jù)分析方法和分析流程進(jìn)行歸納總結(jié),對其關(guān)鍵共性進(jìn)行辨識(shí)、抽象和提升,而非針對某一特定行業(yè)、企業(yè)或產(chǎn)品進(jìn)行闡述。本書更加關(guān)注于方法論而非某些具體的技術(shù),因此具有更加廣泛的通用性和相對普遍的指導(dǎo)意義。
本書共分為9章,第1章首先論述了工業(yè)大數(shù)據(jù)分析的概念、特殊性以及常見的問題;第2章提出了工業(yè)大數(shù)據(jù)分析框架,簡要介紹了CRISP-DM模型,并針對模型落地的難點(diǎn)和模型使用的指導(dǎo)思想展開討論;從第3章到第8章,依次對業(yè)務(wù)理解、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)建模、模型驗(yàn)證與評估、模型部署這6個(gè)CRISP-DM模型的基本步驟進(jìn)行了詳細(xì)的闡述,從需求分析到目標(biāo)評估,從數(shù)據(jù)來源到數(shù)據(jù)分類,從數(shù)據(jù)預(yù)處理到建模過程,從模型驗(yàn)證到部署問題處理,對每一個(gè)步驟中的原理方法、分析過程、處理方式、問題排除等都一一進(jìn)行了講解和說明;最后,第9章對工業(yè)大數(shù)據(jù)分析的未來發(fā)展進(jìn)行了展望。
本書由工業(yè)大數(shù)據(jù)特設(shè)組組長單位清華大學(xué)牽頭編寫,在編寫過程中得到了工信部領(lǐng)導(dǎo)的悉心指導(dǎo)和相關(guān)單位的有力支撐。特別感謝清華大學(xué)孫家廣院士、工信部信軟司謝少鋒司長等給予的全面指導(dǎo)。同時(shí),北京工業(yè)大數(shù)據(jù)創(chuàng)新中心的李三華、田春華,清華大學(xué)的任艮全、徐哲、強(qiáng)逍等在本書的編寫階段也給予了無私的幫助,在此表示誠摯的謝意。
工業(yè)大數(shù)據(jù)作為新興概念,其數(shù)據(jù)分析的原則、手段、方法和流程還很模糊,對海量數(shù)據(jù)的挖掘、分析和處理等技術(shù)仍在不斷的發(fā)展和進(jìn)步,由于作者自身的能力和水平有限,本書不可避免的存在諸多的缺點(diǎn)和不足,期待各位讀者能夠積極發(fā)現(xiàn)問題,并予以批評指正。