習(xí)近平總書記指出,數(shù)據(jù)作為新型生產(chǎn)要素,對傳統(tǒng)生產(chǎn)方式變革具有重大影響,要構(gòu)建以數(shù)據(jù)為關(guān)鍵要素的數(shù)字經(jīng)濟。2019年10月,黨的十九屆四中全會首次將數(shù)據(jù)納入生產(chǎn)要素范疇;2022年12月,黨中央、國務(wù)院印發(fā)《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》(下稱“數(shù)據(jù)二十條”),這是我國首部從生產(chǎn)要素高度系統(tǒng)部署數(shù)據(jù)要素價值釋放的國家級專項政策文件。
隨著“數(shù)據(jù)二十條”等一系列政策措施相繼出臺,數(shù)據(jù)要素市場培育進(jìn)展加速,暢通數(shù)據(jù)資源大循環(huán)的方向愈加明確。尤其是在人工智能快速迭代、大模型與大數(shù)據(jù)相得益彰的發(fā)展態(tài)勢中,數(shù)據(jù)要素戰(zhàn)略地位進(jìn)一步凸顯。各地方、各部門、各大企業(yè)紛紛加快數(shù)據(jù)要素領(lǐng)域布局,從體制機制、市場流通、產(chǎn)品研發(fā)、標(biāo)準(zhǔn)規(guī)范等多層次、多角度開展落地方案的深度探索,涌現(xiàn)出數(shù)據(jù)要素價值釋放新熱潮。
工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟組織產(chǎn)業(yè)界系統(tǒng)梳理了相關(guān)內(nèi)容,展開數(shù)據(jù)要素系列科普活動。
數(shù)據(jù)要素Q&A
—— 小盟科普 ——
問:數(shù)據(jù)要素時代,有哪些新的數(shù)據(jù)處理技術(shù)?
答:以云原生、軟硬協(xié)同以及湖倉一體等技術(shù)為代表的數(shù)據(jù)處理技術(shù)持續(xù)助力用戶降本增效。
云原生技術(shù)通過存儲計算分離架構(gòu),實現(xiàn)資源池化和極致彈性,具備高擴展性、高可用性、跨地域規(guī)模、低成本等優(yōu)勢,可為用戶提供真正具備秒級智能彈性擴容能力、隨需而動。
軟硬協(xié)同技術(shù)為軟件技術(shù)帶來了新的機遇,一些企業(yè)陸續(xù)發(fā)布GPU數(shù)據(jù)庫、數(shù)據(jù)庫一體機等產(chǎn)品,以滿足業(yè)務(wù)規(guī)模不斷擴張的需求。硬件技術(shù)的發(fā)展一方面促進(jìn)了數(shù)據(jù)處理技術(shù)性能提升,另一方面也推動了數(shù)據(jù)處理技術(shù)與其他新興技術(shù)的融合,使得技術(shù)體系的安全性和智能性得到提升。
在湖倉一體方面,數(shù)據(jù)倉庫(Data Warehouse)和數(shù)據(jù)湖(Data Lake)兩項技術(shù)在不斷演進(jìn)過程中逐漸融合形成湖倉一體(Data Lakehouse)技術(shù)架構(gòu)。湖倉一體集數(shù)據(jù)湖的靈活性、可擴展性優(yōu)勢以及數(shù)據(jù)倉庫的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)管理功能于一體,能夠降低數(shù)據(jù)冗余、減少存儲成本,提升數(shù)據(jù)處理時效性。當(dāng)前,湖倉一體技術(shù)落地應(yīng)用速度持續(xù)加快,應(yīng)用領(lǐng)域主要集中在互聯(lián)網(wǎng)、電信運營商以及金融等國內(nèi)數(shù)字化程度較高行業(yè)。
問:數(shù)據(jù)要素時代,有哪些新的技術(shù)能保障數(shù)據(jù)要素安全流通?
答:以人工智能、隱私計算、區(qū)塊鏈及圖技術(shù)等為代表的新興技術(shù)持續(xù)護航數(shù)據(jù)要素安全流通。
AI技術(shù)與數(shù)據(jù)處理技術(shù)相結(jié)合降低技術(shù)使用門檻,2023 年 AIGC 技術(shù)的跨越式突破發(fā)展,不僅使大語言模型進(jìn)入公眾視野,更擴展了數(shù)據(jù)基礎(chǔ)設(shè)施與AI融合的發(fā)展空間。以數(shù)據(jù)庫為例,生成式AI在數(shù)據(jù)庫結(jié)構(gòu)設(shè)計、架構(gòu)設(shè)計、數(shù)據(jù)分析挖掘等方面可以不同程度簡化人員操作,提高開發(fā)、運維、分析的效率,降低用戶使用門檻,更好助力數(shù)據(jù)流通。
數(shù)據(jù)庫與隱私計算相結(jié)合落地的全密態(tài)數(shù)據(jù)庫能夠解決數(shù)據(jù)全生命周期的隱私保護問題,使得無論在何種系統(tǒng)環(huán)境下,數(shù)據(jù)在傳輸、運算以及存儲的各個環(huán)節(jié)始終都處于密文狀態(tài)。
數(shù)據(jù)庫與區(qū)塊鏈技術(shù)相結(jié)合形成的防篡改數(shù)據(jù)庫能夠很好地保障云上數(shù)據(jù)可信運維。防篡改數(shù)據(jù)庫可以內(nèi)部構(gòu)建可信索引結(jié)構(gòu),確保數(shù)據(jù)庫數(shù)據(jù)的整體完整性,與區(qū)塊鏈相結(jié)合形成的解決方案,能夠形成鏈上鏈下鏈路數(shù)據(jù)安全可信,解決多方業(yè)務(wù)間數(shù)據(jù)安全可信流通難題。
隱私計算與區(qū)塊鏈相結(jié)合實現(xiàn)數(shù)據(jù)密態(tài)流轉(zhuǎn)。在控制面以區(qū)塊鏈為核心構(gòu)建數(shù)據(jù)流通管控層;在數(shù)據(jù)面以隱私計算為核心構(gòu)建密態(tài)數(shù)聯(lián)網(wǎng)。數(shù)據(jù)流轉(zhuǎn)過程中以密態(tài)形式流通,保障其流轉(zhuǎn)計算、融合直到銷毀的全鏈路安全可控,同時將數(shù)據(jù)要素持有權(quán)和使用權(quán)分離,實現(xiàn)數(shù)據(jù)可用不可見、使用可控可計量、以及使用權(quán)跨域管控。
圖聯(lián)邦技術(shù)能夠打破數(shù)據(jù)孤島,圖聯(lián)邦技術(shù)是為了解決數(shù)據(jù)孤島、隱私保護和數(shù)據(jù)安全問題提出的概念,在保護用戶隱私和公司數(shù)據(jù)的前提下,更好地發(fā)揮數(shù)據(jù)價值。
問:數(shù)據(jù)要素時代,有哪些新的技術(shù)能支撐新興業(yè)務(wù)場景?
答:向量數(shù)據(jù)庫、圖分析技術(shù)、時空大數(shù)據(jù)平臺以及時空數(shù)據(jù)庫等技術(shù)有效支持新興業(yè)務(wù)場景下的數(shù)據(jù)要素價值釋放。
向量數(shù)據(jù)庫能夠支撐AI技術(shù)賦能數(shù)據(jù)要素價值釋放。一些非結(jié)構(gòu)化數(shù)據(jù)需要通過機器學(xué)習(xí)算法從中提取出以向量為表示形式的“特征”,向量數(shù)據(jù)庫的興起便是為了解決對這些向量進(jìn)行存儲與計算的問題。
圖分析技術(shù)助力洞察數(shù)據(jù)連接新價值。數(shù)據(jù)要素時代,數(shù)據(jù)規(guī)模將會不斷增大,數(shù)據(jù)量及數(shù)據(jù)自身豐富度不斷增加,圖分析技術(shù)能夠有效分析數(shù)據(jù)之間的關(guān)聯(lián)性以及處理數(shù)據(jù)之間的復(fù)雜關(guān)系。
時空大數(shù)據(jù)平臺或時空數(shù)據(jù)庫能夠?qū)崿F(xiàn)海量時空數(shù)據(jù)管理、查詢、統(tǒng)計與分析。在現(xiàn)實世界中有超過80%的數(shù)據(jù)都和地理位置(空間)相關(guān),而所有數(shù)據(jù)均含有時間屬性。因此,實際業(yè)務(wù)場景中許多數(shù)據(jù)需要通過時空大數(shù)據(jù)平臺或時空數(shù)據(jù)庫來處理。近年來,時空大數(shù)據(jù)平臺以及時空數(shù)據(jù)庫等技術(shù)的發(fā)展有效應(yīng)對北斗時空大數(shù)據(jù)服務(wù)、數(shù)字李生、智慧城市等新興數(shù)據(jù)應(yīng)用業(yè)務(wù)場景下對于時空數(shù)據(jù)處理的需求。