引言/導讀
中國聯通研究院作為中國聯通集團的直屬二級機構,承擔著國家戰略、行業發展和企業生產的戰略決策咨詢、技術發展引領和產業發展推動的重任。不僅是原創技術發展的主力軍,也是數字經濟和實體經濟融合創新的排頭兵。在工業大模型領域,聯通研究院依托中國聯通元景大模型底座,面向工業領域對工業大模型的迫切需求,致力于關鍵技術的研究與開發,旨在創建并推廣適用于垂直行業的工業大模型。
當前,新一輪科技革命和產業變革加速演進,以大模型為代表的新一代人工智能技術在能力通用性上大幅提升,大大擴展了人工智能落地的場景/行業范圍、降低了人工智能落地到多種行業/場景的再定制成本。但是目前工業領域對大模型的應用主要局限在研發設計和經營管理等環節,作為工業生產的核心場景,由于生產制造環節對安全性和穩定性的要求較高,大模型在該環節的滲透率不高。作為賦能新型工業化的重要支撐,大模型要與制造業深度融合,就必須將從其單一環節賦能向垂直行業多場景、全流程覆蓋拓展。
在紡織業的智能化浪潮中,我們基于聯通元景大模型底座,深度融合紡織業的特定數據和行業知識,進行微調與優化構建紡織業大模型。這一行業大模型將探索實現紡織業全鏈條智能管理,為紡織產品的全生命周期管理提供強大的技術支持。通過紡織業大模型,切實解決大模型在生產制造領域的應用難題,打破技術與實際生產之間的壁壘,完成行業大模型落地的“最后一公里”。這一探索將不僅提升紡織企業的生產效率和產品質量,更為紡織業的數字化轉型和智能化升級注入新的活力。未來可逐步在更多紡織企業中推廣應用,幫助更多的企業實現智能化轉型,提升整體競爭力,利用大模型為紡織業迎來更加廣闊的發展前景。
一、關鍵詞
紡織業全鏈條智能 紡織業大模型 元景大模型
二、測試床項目承接主體
發起公司和主要聯系人聯系方式
中國聯通研究院
通信地址: 北京市大興區亦莊經濟開發區北環東路1號 100176
三、測試床項目目標
紡織業以其產業鏈長且復雜著稱,從原料生產至最終產品,涵蓋纖維、紡紗、織造、印染等多個環節,遠超一般制造業的復雜度,數據互通困難,需高度協調與管理。該行業為勞動密集型產業,減少勞動成本支出對提升競爭力至關重要,而紡織品的疵點檢測、質量控制等方面較多依賴傳統的人工方式,效率低下且質量難以保證,需要采用計算機視覺檢測技術快速識別瑕疵和問題,提高質檢效率和準確性。同時,紡織業高度市場化和國際化,出口導向顯著,受國際市場波動和貿易政策影響大,需要及時對市場政策進行分析給出相應對策。在技術層面,紡織業展現技術創新與傳統工藝并存的獨特風貌,既采用先進自動化控制和新材料,又保留傳統技藝。然而,紡織業也是高污染行業,面臨水污染、高能耗及固體廢棄物等環境問題,環保轉型壓力大,需要采用人工智能技術優化生產參數和工藝流程,降低能耗和排放。此外,紡織業產品極具多樣性和時尚性,快速響應市場需求,這要求企業不斷適應市場變化,進行柔性生產。綜上所述,紡織業以其獨特的產業鏈結構、勞動密集性、國際化程度、技術創新與傳統融合、環境壓力及市場時尚性,與其他行業形成鮮明對比,亟需引入工業智能的新技術來解決這些問題。
紡織業大模型測試床是專為推動紡織業智能化、高效化發展而精心打造的解決方案。與通用大模型不同,該測試床基于聯通大模型底座,充分利用紡織業的專業數進行微調,以確保其在紡織領域的知識具備高度的專業性和針對性。通過集成大模型技術與紡織生產流程,實現了紡織品全生命周期的智能化管理,例如,該測試床可在原材料生產階段,使用大模型收集并分析各種纖維材料的市場趨勢、性能和成本;在織布階段,根據纖維特性和市場需求,利用大模型推薦最優的織法;在染整階段,利用大模型進行顏色匹配和預測,確保染色效果符合設計要求;在銷售與分銷階段,利用大模型分析市場趨勢和消費者需求,為銷售策略提供支持;在市場與服務階段,基于大模型制定個性化的營銷策略和促銷活動,利用大模型進行客戶服務預測和自動化應答,提升客戶滿意度等。總之,通過在通用大模型的基礎上構建紡織業大模型測試床,可以實現對紡織業全生產流程的智能化管理,提高生產效率、降低成本、優化產品質量,并推動紡織業的可持續發展。這一舉措不僅能夠對紡織業產生技術升級,也為紡織業與人工智能的融合發展奠定了堅實的基礎。
四、測試床方案架構
1、測試床應用場景
本測試床應用領域為紡織業,涉及原材料生產、紡紗、織布、染整、后整理與精加工、輔料生產、服裝設計與制衣、檢測與質控、包裝與物流、銷售與分銷、市場與服務、回收與再利用等產品全生命周期的應用場景。
2、測試床架構
本測試床以聯通元景大模型底座為基礎,利用紡織業特定數據,針對紡織業原材料生產、紡紗、織布、染整、后整理與精加工、輔料生產、服裝設計與制衣、檢測與質控、包裝與物流、銷售與分銷、市場與服務、回收與再利用等步驟,進行紡織品全生命周期的智能化管理。本測試床架構如圖1所示:
圖1. 測試床總體架構
元景大模型底座:包括元景語言大模型、視覺大模型、多模態大模型等基礎模型。其中語言大模型具備文本提取、文本召回、意圖識別、參數解析、安全合規等能力;視覺大模型完成開放式目標檢測和多任務視覺模型,具備場景自動適配和基于少量數據微調能力;多模態大模型具備圖文理解、文生圖(擴展對中文專有名詞支持)、視頻生成能力;語音音大模型具備普通話及部分方言識別能力,可用5句話克隆人聲等。
行業數據:使用場景數據集,融合專家規則、商品手冊、操作流程、故障診斷書內容進行微調。
模型部署:具備模型量化、模型裁剪、模型編譯、模型部署能力。
模型訓練:基于不同的訓練策略、優化策略和提示庫對模型進行訓練。
大模型賦能產品全生命周期:紡織業大模型賦能原材料生產、紡紗、織布、染整、后整理與精加工、輔料生產、服裝設計與制衣、檢測與質控、包裝與物流、銷售與分銷、市場與服務、回收與再利用等紡織品全生命周期的步驟。
模型測試:利用基礎功能驗證測試、多樣性和覆蓋性測試、魯棒性測試、效率和可擴展性測試、用戶反饋和改進測試和安全性測試評估測試床性能。
3、測試床方案
1、基礎功能驗證
工序驗證:模擬紡紗、織布、染整、制衣等不同紡織工序,測試模型在這些環節中的表現,確保模型能夠準確回答各個環節的操作問題。
行業標準驗證:收集紡織業的相關標準和規范,將模型輸出與行業標準和規范進行對比,確保模型的回答符合行業標準和規范。
生產設備驗證:收集不同類型和品牌的紡織生產設備信息,測試模型是否能夠提供準確的設備信息,包括設備性能、參數、使用說明等。
2、多樣性和覆蓋性驗證
任務多樣性測試:設計不同的任務場景,如質量檢測、生產優化、庫存管理等,測試模型在不同任務中的表現,評估其適應性和泛化性。
數據多樣性測試:使用不同類型的數據,如原材料數據、生產過程數據、市場反饋數據等,測試模型在處理這些數據時的表現,評估其數據兼容性和處理能力。
3、魯棒性驗證
設計包含錯誤信息的測試用例,如輸入錯誤的數據、不完整的指令等,測試模型對這些錯誤信息的識別能力和處理能力,評估其容錯性和穩定性。
4、效率和可擴展性驗證
效率測試:通過測量運行模型的內存占用和推理速度,評估模型的運行效率。
可擴展性測試:測試模型在新任務、新數據時的性能表現,評估其可擴展性和靈活性。同時,測試模型在不同硬件和軟件環境下的表現,確保其在各種環境下都能穩定運行。
5、用戶反饋和改進驗證
收集用戶在使用模型過程中的反饋信息,包括模型表現、用戶滿意度、改進建議等。針對用戶反饋的問題和建議,對模型進行改進并重新測試,確保模型能夠不斷優化并滿足用戶需求。
6、安全性驗證
設計包含違法、違規等不安全信息的測試用例,測試模型對這些信息的識別能力。同時,評估模型在面臨惡意攻擊和數據泄露等情況下的安全性表現,確保模型能夠保障用戶數據和隱私的安全。
4、方案重點技術
1、常見性能評估指標
本測試床在設計時充分考慮了如何準確評估模型的性能,因此采用了多種業內廣泛認可的指標來衡量模型的準確性和可靠性。其中,使用準確率(Accuracy)表示模型預測正確的樣本占總樣本的比例。然而,在某些不平衡數據集上,準確率可能不夠全面,作為補充引入了召回率(Recall),在紡織業中表示模型在檢測質量問題時,能夠準確識別出存在缺陷產品的能力。為了進一步綜合評估模型的性能,采用了F1分數(F1 Score)權衡準確率和召回率,給出更全面的評估。F1分數越高,說明模型在準確率和召回率上表現越均衡,性能越好。使用ROC-AUC評估模型的分類能力。ROC-AUC的值越高,表明模型在各種閾值下都具有較好的分類性能,對于紡織業中需要靈活調整閾值的場景尤為重要。
在實際使用過程中,首先運行待評估的模型,收集模型在測試數據集上的預測結果。然后,根據真實標簽和預測結果計算上述指標的值。通過對比不同模型在同一測試數據集上的指標值,可以對模型的性能進行客觀的比較和評估,從而選擇出性能最優的模型。
2、基準測試
本測試床為了確保模型的性能達到行業領先水平,采取了對比評估的方法。具體而言,將待評估的模型在標準數據集上進行測試,以獲取模型在該數據集上的表現數據。這些標準數據集不僅代表了行業的普遍情況,還涵蓋了各種復雜場景和變化因素,確保測試的全面性和準確性。獲得模型在標準數據集上的表現數據后,將其與已有的多種方法進行對比。這些已有方法可能包括傳統的經驗法則,以及其他先進的機器學習或深度學習模型。通過對比不同方法在相同數據集上的性能表現,評估模型的相對優勢。通過對常見性能評估指標的對比,可以發掘模型的優勢和不足,進而為模型的優化和改進提供有力的指導。
根據用例評估檢索增強生成文本質量
本測試床利用具體的用例,對模型在尋找和提取給定文檔內目標信息的能力進行評測。具體來說,首先準備一系列包含不同難度和復雜度的文檔樣本,并在其中標注出目標信息的位置和類型。然后將這些文檔輸入到待評估的模型中,觀察模型是否能夠準確地找到并提取出目標信息。評估過程中不僅關注模型是否能找到目標信息,還會進一步評估模型找到的信息的準確性和完整性,以全面評估模型在檢索和生成方面的性能。
此外,還會考慮模型在處理不同文檔類型時的表現,例如,行業標準、設備信息、維保手冊等,以檢驗模型在不同場景下的適應能力。通過這樣全面而細致的評估,能夠更準確地了解待評估模型的質量,并為后續的模型優化和改進提供有力的依據。
5、方案自主研發性、創新性及先進性
1、創新性
紡織業大模型測試床經過微調,融合了紡織業的專業數據,確保了其在紡織領域的知識和應用上具備高度的專業性和針對性。這種針對特定行業的深度優化,使得模型能夠更精準地理解和解決紡織產業中的具體問題。通過集成大模型技術與紡織生產流程,探索實現從原材料檢測到生產過程控制,再到成品質量檢測的全面智能化管理。
國產自主研發性
本測試床采用國產大模型聯通元景大模型底座,該基礎大模型底座在15個主流榜單中7個維度能力超GPT3.5,通過網信辦備案、安全測試通過工信部軟件測評中心A級認證,具備先進性。該大模型底座自主研發,不依賴于外部技術保障了國家技術安全,也能夠更好地保護紡織業數據的安全,防止敏感信息泄露。
五、測試床實施部署
1、測試床實施規劃
時間 | 任務 | 具體工作 |
2024年6月-2024年9月 | 需求分析,架構設計 | 確認需求和設計架構方案 |
2024年9月-2024年12月 | 搭建紡織業大模型測試床環境 | 開展測試床實施方案設計、數據采集、清洗與大模型微調訓練驗證 |
2024年12月-2025年3月 | 測試驗證 | 開展測試床部署、典型應用場景驗證 |
2025年3月-2025年5月 | 解決方案驗證 | 針對紡織行業形成特定解決方案并驗證,梳理并總結測試床 |
2、測試床實施的技術支撐及保障措施
中國聯通研究院提供技術支撐,負責測試床的設計、部署和驗證方案,并聯合行業客戶進行應用場景落地及驗證。
3、測試床實施的自主可控性
本測試床所涉及的軟硬件設施均由參與單位自主生產和提供,具有自主可控性。
六、測試床預期成果
1、測試床的預期可量化實施結果
完成基于聯通元景大模型+紡織業數據微調的紡織業大模型測試床建設,并在多個紡織企業落地應用。
2、測試床的商業價值、經濟效益
本測試床在商業價值方面,通過整合大模型技術與紡織生產流程實現從原材料到成品的全鏈條智能管理,為企業提供了實時的數據分析和預測能力,幫助管理層做出更加精準和快速的決策;通過大數據的收集和分析,企業可以深入了解市場趨勢、消費者需求,從滿足市場需求;通過監控生產過程中的各項參數和指標,測試床能夠確保產品質量符合標準,還可以分析產品質量問題的根源,幫助企業制定改進措施,提高產品質量和穩定性。
3、測試床的社會價值
1、基于國家政策,推動紡織行業智能化發展
深入貫徹總書記關于網絡強國的重要思想和數字中國、新型工業化等重要論述,落實全國新型工業化推進大會會議精神,大力推進人工智能全方位、深層次賦能新型工業化。持續探索人工智能等新科技在工業領域應用的新模式、新路徑,推動數字技術與實體經濟深度融合,強化科技創新主體地位。紡織業大模型測試床為紡織業帶來了全新的智能化生產和管理模式,不僅提高了生產效率和產品質量,還有助于推動整個紡織業向智能化、高效化方向發展。
2、促進產業鏈協同與區域經濟發展
紡織業大模型測試床的建設將促進紡織產業鏈上下游企業之間的協同合作,形成緊密的產業鏈生態圈。同時,大模型技術的應用將帶動相關產業的發展,如大數據、人工智能等,促進區域經濟的繁榮和發展。
3、基于國產聯通元景大模型底座,實現工業大模型自主化供給
通過采用國產大模型底座,紡織業大模型在技術上實現了自主性,不依賴于外部技術,從而保障了國家技術安全。國產大模型底座能夠更好地保護紡織業數據的安全,防止敏感信息泄露,對維護國家信息安全具有重要意義。
4、測試床初步推廣應用案例
選擇具有代表性的紡織企業作為試點單位,進行紡織業大模型測試床的示范應用。收集試點單位的反饋意見和數據,對測試床進行持續優化和改進。通過行業會議、展覽等渠道,向紡織企業展示紡織業大模型測試床的優勢和應用效果。與行業協會、科研機構等建立合作關系,共同推動紡織業的智能化轉型。
七、測試床成果驗證
測試床成果驗證計劃
本測試床對基于聯通元景大模型+紡織業數據微調的紡織業產品全生命周期智能化管控大模型進行測試驗證。
測試床成果驗證方案
編號 | 應用 | 驗證內容 |
1 | 功能驗證測試 | 驗證模型在紡織工序、行業標準文檔檢索、生產設備信息輸出等基本能力 |
2 | 多樣性和覆蓋性測試 | 驗證模型在不同任務(如質量檢測、生產優化、庫存管理等)和處理不同類型數據(如原材料數據、生產過程數據、市場反饋數據)時的能力 |
3 | 魯棒性測試 | 驗證模型對錯誤信息的識別能力 |
4 | 效率和可擴展性測試 | 驗證模型的評估內存占用,推理速度,擴展性 |
5 | 用戶反饋和改進測試 | 針對用戶的反饋信息,模型改進的效果 |
6 | 安全性測試 | 模型針對違法等不安全的信息識別能力 |
八、與已存在AII測試床的關系
本測試床和之前已經審批的測試床無關聯。
九、測試床成果交付
測試床成果交付件
最終交付成果應包含:
1、1套基于聯通元景大模型的紡織業大模型,驗證成功的標準是可以在該模型上實現紡織業全流程智能化管理并通過測試來驗證各項指標;
2、1份測試報告,包括整體及各種關鍵技術的測試報告;
3、1項紡織業大模型實際應用相關專利;
4、1項以上紡織行業解決方案。
測試床可復制性
本測試床可以應用于紡織業生產全流程,能夠顯著提升生產的穩定性和可靠性,提升生產效率。本測試床的解決方案和相關技術能夠適用于紡織業不同的生產工序和需求,是大模型賦能紡織業商品全流程的案例,為紡織業相關應用場景提供參考依據,可廣泛用于紡織企業的商品全流程品質把控。
測試床開放性
本測試床是對紡織業賦能全流程大模型的一種測試驗證,與現有的工業生產獨立。后續將繼續開放給更多紡織企業共同參與測試床的驗證和推廣工作。
十、其他信息
測試床使用者
中國聯通研究院負責具體測試床方案設計與部署、后續運維等技術支持工作。歡迎AII成員企業參與和使用本測試床項目,參加單位需要對測試床的建設提供必要的驗證設備或必要的驗證場景。在初始階段,本測試床將僅限于現有的成員單位。之后,逐步開放給更多的AII成員企業使用。
測試床知識產權說明
中國聯通研究院對測試床的建設、運營以及使用擁有產權。
測試床運營及訪問使用
本測試床將部署于中國聯通研究院內,由中國聯通研究院運營,并提供相關技術支持。對測試床的訪問使用需經過申請使用,并通過付費、知識產權共享等多種方式有條件使用。
測試床資金
測試床的資金來源于測試床參與單位。
測試床時間軸
任務描述 | 時間進度 | 詳情 |
溝通交流、行業調研 | 2024年6月-2024年7月 | 調研當前紡織行業的市場需求、技術趨勢和競爭態勢,掌握具體需求,評估大模型技術在紡織業的應用潛力和優勢,形成調研文檔。 |
需求分析、可行性分析、架構設計 | 2024年7月-2024年9月 | 根據調研結果,設計紡織業大模型測試床的系統架構,進行可行性分析。 |
模型搭建、企業應用 | 2024年9月-2025年2月 | 選擇元景大模型底座作為技術基礎,根據紡織業的特點和需求,對大模型進行定制化設計,面向示范企業進行測試。 |
應用效果評估 | 2025年2月-2025年4月 | 針對紡織業形成特定解決方案并驗證,梳理并總結應用效果。 |
宣傳推廣 | 2025年4月-2025年5月 | 宣傳推廣,擴大應用范圍,形成國際領先、可推廣的應用。 |
本報告所載的材料和信息,包括但不限于文本、圖片、數據、觀點、建議,不構成法律建議,也不應替代律師意見。本報告所有材料或內容的知識產權歸工業互聯網產業聯盟所有(注明是引自其他方的內容除外),并受法律保護。如需轉載,需聯系本聯盟并獲得授權許可。未經授權許可,任何人不得將報告的全部或部分內容以發布、轉載、匯編、轉讓、出售等方式使用,不得將報告的全部或部分內容通過網絡方式傳播,不得在任何公開場合使用報告內相關描述及相關數據圖表。違反上述聲明者,本聯盟將追究其相關法律責任。