• / 10
  • 下載費用:30 金幣  

多來源業務大數據的建模、分析、自我優化的方法.pdf

摘要
申請專利號:

CN201510657534.6

申請日:

2015.10.13

公開號:

CN105260835A

公開日:

2016.01.20

當前法律狀態:

實審

有效性:

審中

法律詳情: 實質審查的生效IPC(主分類):G06Q 10/06申請日:20151013|||公開
IPC分類號: G06Q10/06(2012.01)I; G06F17/30 主分類號: G06Q10/06
申請人: 北京凱行同創科技有限公司
發明人: 張健; 董恒
地址: 100000北京市海淀區清河安寧莊東路18號23號樓2128
優先權:
專利代理機構: 北京中企鴻陽知識產權代理事務所(普通合伙)11487 代理人: 劉葛; 郭鴻雁
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510657534.6

授權公告號:

|||

法律狀態公告日:

2016.03.30|||2016.01.20

法律狀態類型:

實質審查的生效|||公開

摘要

本發明提出了一種多來源業務大數據的建模、分析、自我優化的方法,包括:接收來自企業系統的內部數據和來自互聯網的外部數據;對內部數據和外部數據進行分析以分類為結構數據和非結構數據;對非結構數據進行轉換以轉換為對應的文本內容,對數據進行抽取和清洗;根據企業的內部需求建立多個業務模型,業務模型根據數據流入自我學習和優化,自動生成主數據中心;對主數據中心中的數據進行處理分析以得到業務分析結果;將業務分析結果通過數字化和圖形化界面進行展示。本發明在保證數據真實性下進行準確分析業務數據、使得業務數據模型進行自動化建立、優化、擴展,針對個性化需求進行相關性分析和展示得到解決。

權利要求書

1.一種多來源業務大數據的建模、分析、自我優化的方法,其特征在于,包括如下步
驟:
步驟S1,接收來自企業系統的內部數據和來自互聯網的外部數據;
步驟S2,對所述內部數據和外部數據進行分析以分類為結構數據和非結構數據;
步驟S3,對所述非結構數據進行轉換以轉換為對應的文本內容,對轉換后的非結構數
據和所述結構數據進行抽取和清洗;
步驟S4,根據企業的內部需求建立多個業務模型,其中,所述多個業務模型通過機器
與步驟S3中抽取和清洗后的非結構數據和結構數據進行結合,所述業務模型根據數據流入
自我學習和優化,自動生成主數據中心;
步驟S5,對所述主數據中心中的數據進行處理分析以得到業務分析結果,所述業務分
析結果包括不同業務之間的聯系信息、業務與外部因素的聯系信息和業務與時間的聯系信
息;
步驟S6,將所述業務分析結果通過數字化和圖形化界面進行展示。
2.如權利要求1所述的多來源業務大數據的建模、分析、自我優化的方法,其特征在
于,所述內部數據為企業系統的業務數據,所述業務數據包括:管理數據、營銷數據、采
購數據、庫存數據、質量數據、成本數據、財務數據、流程控制數據和工業鏈數據。
3.如權利要求1所述的多來源業務大數據的建模、分析、自我優化的方法,其特征在
于,所述結構數據為文本格式數據,所述非結構數據包括:PDF文件、WORD文檔、XML庫
和語音文件。
4.如權利要求3所述的多來源業務大數據的建模、分析、自我優化的方法,其特征在
于,在所述步驟S3中,對所述非結構數據進行轉換以轉換為對應的文本內容,包括如下步
驟:
建立語音模型,根據所述語音模型將所述語音文件轉換為文本內容;
建立內容抽取模型,根據所述內容抽取模型將所述PDF文件、WORD文檔和XML庫轉換
為文本內容。
5.如權利要求1所述的多來源業務大數據的建模、分析、自我優化的方法,其特征在
于,在所述步驟S3中,還包括如下步驟:對所述結構化數據建立數據質量指標。
6.如權利要求1所述的多來源業務大數據的建模、分析、自我優化的方法,其特征在
于,在所述步驟S5中,對所述主數據中心中的數據進行處理分析,包括如下步驟:對所述
主數據中心中的數據進行分類、聚類、回歸、關聯、神經網絡、數據預測和業務模型的擴
建。
7.如權利要求1所述的多來源業務大數據的建模、分析、自我優化的方法,其特征在
于,所述業務分析結果還包括:業務流程的關系信息、數據與數據之間的關系信息、外部
因素與內部因素的關系信息。
8.如權利要求1所述的多來源業務大數據的建模、分析、自我優化的方法,其特征在
于,在所述步驟S6中,所述業務分析結果以報表、靜態圖和動態圖的形式展現。

說明書

多來源業務大數據的建模、分析、自我優化的方法

技術領域

本發明涉及數據處理技術領域,特別涉及一種多來源業務大數據的建模、分析、自
我優化的方法。

背景技術

隨著機構日常運營結構化數據的積累,互聯網上發布的行業相關數據不斷的增加,業
務相關的數據激增。應用大數據技術提升業績對于機構來說是當下的緊急需求。

但是,激增數據存在結數據質量低、構差異性大、收集范圍廣泛、處理起來復雜度高,
數據模型擴展性差、數據分析算法結果不準確的問題,無法做到將采集到的數據完整的匯
集到主數據中心,從而無法實現對數據進行全面的分析和展示。

發明內容

本發明的目的旨在至少解決所述技術缺陷之一。

為此,本發明的目的在于提出一種多來源業務大數據的建模、分析、自我優化的方
法,在保證數據真實性下進行準確分析業務數據、使得業務數據模型進行自動化建立、優
化、擴展,針對個性化需求進行相關性分析和展示得到解決。

為了實現上述目的,本發明的實施例提供一種多來源業務數據的管理方法,包括如下
步驟:

步驟S1,接收來自企業系統的內部數據和來自互聯網的外部數據;

步驟S2,對所述內部數據和外部數據進行分析以分類為結構數據和非結構數據;

步驟S3,對所述非結構數據進行轉換以轉換為對應的文本內容,對轉換后的非結構數
據和所述結構數據進行抽取和清洗;

步驟S4,根據企業的內部需求建立多個業務模型,其中,所述多個業務模型通過機器
與步驟S3中抽取和清洗后的非結構數據和結構數據進行結合,所述業務模型根據數據流入
自我學習和優化,自動生成主數據中心;

步驟S5,對所述主數據中心中的數據進行處理分析以得到業務分析結果,所述業務分
析結果包括不同業務之間的聯系信息、業務與外部因素的聯系信息和業務與時間的聯系信
息;

步驟S6,將所述業務分析結果通過數字化和圖形化界面進行展示。

進一步,所述內部數據為企業系統的業務數據,所述業務數據包括:管理數據、營銷
數據、采購數據、庫存數據、質量數據、成本數據、財務數據、流程控制數據和工業鏈數
據。

進一步,所述結構數據為文本格式數據,所述非結構數據包括:PDF文件、WORD文檔、
XML庫和語音文件。

進一步,在所述步驟S3中,對所述非結構數據進行轉換以轉換為對應的文本內容,包
括如下步驟:

建立語音模型,根據所述語音模型將所述語音文件轉換為文本內容;

建立內容抽取模型,根據所述內容抽取模型將所述PDF文件、WORD文檔和XML庫轉換
為文本內容。

進一步,在所述步驟S3中,還包括如下步驟:對所述結構化數據建立數據質量指標。

進一步,在所述步驟S5中,對所述主數據中心中的數據進行處理分析,包括如下步驟:
對所述主數據中心中的數據進行分類、聚類、回歸、關聯、神經網絡、數據預測和業務模
型的擴建。

進一步,所述業務分析結果還包括:業務流程的關系信息、數據與數據之間的關系信
息、外部因素與內部因素的關系信息。

進一步,在所述步驟S6中,所述業務分析結果以報表、靜態圖和動態圖的形式展現。

根據本發明實施例的多來源業務大數據的建模、分析、自我優化的方法,在導入內部
的業務數據和外部的互聯網數據的同時,對結構數據和非結構數據進行抽取、清洗,對非
結構數據進行人工轉義、合并、分類,并對業務數據和互聯網數據建立數據質量指標后,
采用多臺機器分布式計算和存儲,這樣很大的提高了數據收集能力。本發明基于所關注的
業務模型,自動化的分析和展示,能夠快速發現與業務相關性的問題。在保證數據真實性
下進行準確分析業務數據、使得業務數據模型進行自動化建立、優化、擴展,針對個性化
需求進行相關性分析和展示得到解決,并且解決了現有業務數據的收集、處理、匯集、分
析、展現方法的不足,能夠查找出隱藏在機構運營的誤區,對運營過程加深監控和管理。

本發明附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變
得明顯,或通過本發明的實踐了解到。

附圖說明

本發明的上述和/或附加的方面和優點從結合下面附圖對實施例的描述中將變得明顯
和容易理解,其中:

圖1為根據本發明實施例的多來源業務大數據的建模、分析、自我優化的方法的流程
框圖;

圖2為根據本發明實施例的多來源業務大數據的建模、分析、自我優化的方法的框架
圖;

圖3為根據本發明實施例的多來源業務大數據的建模、分析、自我優化的方法的示意
圖。

具體實施方式

下面詳細描述本發明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同
或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描
述的實施例是示例性的,旨在用于解釋本發明,而不能理解為對本發明的限制。

本發明提供了一種多來源業務大數據的建模、分析、自我優化的方法,該方法提供對
業務數據的收集、處理、匯集、分析、展現的功能,可以在收集數據和處理多樣性業務數
據來源過程中建立流程規范性,并和業務需求相互結合,通過機器學習自動構建業務模型,
將有效數據匯集到主數據中心。主數據中心的數據通過分析后的結果進行數據展示。

下面參考圖1至圖3對本發明實施例的多來源業務大數據的建模、分析、自我優化的
方法進行說明。

如圖1所示,本發明實施例的多來源業務大數據的建模、分析、自我優化的方法,包
括如下步驟:

步驟S1,接收來自企業系統的內部數據和來自互聯網的外部數據。

在本發明的一個實施例中,內部數據為企業系統的業務數據,包括來自ERP
(EnterpriseResourcePlanning,企業資源計劃)系統、CRM(CustomerRelationship
Management,客戶關系管理)系統、OA(OfficeAutomation,辦公自動化)系統。

其中,業務數據包括:管理數據、營銷數據、采購數據、庫存數據、質量數據、成本
數據、財務數據、流程控制數據和供應鏈數據。

需要說明的是,因每個機構業務類型的差異,內部數據來源的數據類型也可以是多樣
的。

步驟S2,對內部數據和外部數據進行分析以分類為結構數據和非結構數據。

具體地,根據內部數據和外部數據的文件格式進行分析,將數據劃分為結構數據和非
結構數據。其中,結構數據為文本格式數據。非結構數據包括:PDF文件、WORD文檔、XML
庫和語音文件。

步驟S3,對非結構數據進行轉換以轉換為對應的文本內容,對轉換后的非結構數據和
結構數據進行抽取和清洗。

在本步驟中,對非結構數據進行轉換以轉換為對應的文本內容,包括如下步驟:

(1)針對語音文件:

建立語音模型,根據語音模型將語音文件轉換為文本內容進行輸出。

(2)針對PDF文件、WORD文檔和XML庫文件:

建立內容抽取模型,根據內容抽取模型將PDF文件、WORD文檔和XML庫轉換為文本內
容進行輸出。

需要說明的是,在本步驟中,還需要對結構化數據建立數據質量指標。

具體地,結構化數據需要建立數據質量指標,其中數據質量指標包括:數據的準確性、
完整性、一致性、完備性、唯一性、可訪問性、精確性、及時性、相關性、可使用性、明
確性、客觀性等。其中,數據質量指標的內容可以根據用戶的需要進行設置,添加或刪除,
在此不再贅述。

然后,參考圖2,由核心處理器對上述結構數據和非結構數據進行抽取和清洗。

步驟S4,根據企業的內部需求建立多個業務模型,其中,多個業務模型通過機器與步
驟S3中抽取和清洗后的非結構數據和結構數據進行結合,業務模型根據數據流入自我學習
和優化,自動生成主數據中心。

在本發明的一個實施例中,建立多個業務模型包括如下步驟:首先構建模型、然后部
署模型、評估模型及模型測試。

針對每個機構不同的業務需求,每個機構結合自身業務特點,通過主數據中心對數據
的構建、評估、部署、測試等一系列流程,形成精準的業務模型。業務模型在機器學習中
通過算法不斷自我完善,從而達到業務模型的最優,達到全生命周期管理業務模型化效果。

由核心處理器對使業務模型與抽取及清洗處理后的數據進行整合通過一系列的正確性
校驗和評估,業務模型就能夠在測試后進行部署,通過數據的不斷流入,使得業務模型也
會發生改變。

業務模型與處理后的數據相互結合,并通過機器自我學習和優化,自動形成主數據中
心。具體地,結構化數據和非結構化數據經過數據清洗后結合業務模型及核心處理器進行
處理,在達到可讀性強、易用性高、數據唯一的要求后,最終轉到主數據中心。

步驟S5,對主數據中心中的數據進行處理分析以得到業務分析結果,業務分析結果包
括不同業務之間的聯系信息、業務與外部因素的聯系信息和業務與時間的聯系信息。

在本步驟中,參考圖3,對主數據中心中的數據進行處理分析,包括如下步驟:對主數
據中心中的數據進行分類、聚類、回歸、關聯、神經網絡、數據預測和業務模型的擴建,
由此,可以得到業務分析結果。

其中,業務分析結果為業務領域內之間的關系,包括:不同業務之間(業務與業務之
間)的關系(例如:生產業務與營銷之間的關系)、業務流程的關系(例如:影響生產業務
的有哪些)、數據與數據間的關系(例如:上個月的銷售額的差值的原因)、外部因素與內
部因素的關系(例如:政策的調整對內部戰略的影響)、業務與外部因素的聯系信息和業務
與時間的聯系信息。

主數據中心的數據進行聚合、分類等綜合分析后計算的結果可以拖拽計算,讓數據自
我演繹、表達業務自我觀點。主數據中心提供的數據能夠更好的體現業務層次和結構,數
據更加集中,質量更加精確。主數據中心的數據分析可以根據業務的需求進行擴展,進行
數據算法的集成,從而可以分析多種應用場景,提升現有業務對未知領域的分析結果。

步驟S6,將業務分析結果通過數字化和圖形化界面進行展示。

具體地,步驟S5得到的業務分析結果可以通過數字化和圖形化進行展示,例如報表、
靜態圖和動態圖的形式展現。將業務分析結果進行數據展示,通過Stroage(M):shap數CURD
管理、Painter(V):canvase元素生命周期管理、視圖渲染、繪畫、更新控制、Handler(C):
事件交互處理,創建業務參數坐標系、圖例、提示、工具箱等基礎組件,并在此上構建出
多樣性的表現形式。例如:折線圖、柱狀圖、散點圖、K線圖、餅圖、雷達圖、地圖、和
弦圖、力導向布局圖、時間圖、儀表盤以及漏斗圖,同時支持任意維度的堆積和多圖表混
合展現。

用戶可以通過業務的需求,對這些圖表進行標線輔助、事件交互、動態添加數據等用
戶交互行為。通過分析結果的可視化展示,快速的表明數據的級聯性和涌動性,更直接、
更高效的反應了業務的狀態和趨勢。

根據本發明實施例的多來源業務大數據的建模、分析、自我優化的方法,在導入內部
的業務數據和外部的互聯網數據的同時,對結構數據和非結構數據進行抽取、清洗,對非
結構數據進行人工轉義、合并、分類,并對業務數據和互聯網數據建立數據質量指標后,
采用多臺機器分布式計算和存儲,這樣很大的提高了數據收集能力。本發明基于所關注的
業務模型,自動化的分析和展示,能夠快速發現與業務相關性的問題。在保證數據真實性
下進行準確分析業務數據、使得業務數據模型進行自動化建立、優化、擴展,針對個性化
需求進行相關性分析和展示得到解決,并且解決了現有業務數據的收集、處理、匯集、分
析、展現方法的不足,能夠查找出隱藏在機構運營的誤區,對運營過程加深監控和管理。

在本說明書的描述中,參考術語“一個實施例”、“一些實施例”、“示例”、“具體示
例”、或“一些示例”等的描述意指結合該實施例或示例描述的具體特征、結構、材料或者
特點包含于本發明的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述
不一定指的是相同的實施例或示例。而且,描述的具體特征、結構、材料或者特點可以在
任何的一個或多個實施例或示例中以合適的方式結合。

盡管上面已經示出和描述了本發明的實施例,可以理解的是,上述實施例是示例性的,
不能理解為對本發明的限制,本領域的普通技術人員在不脫離本發明的原理和宗旨的情況
下在本發明的范圍內可以對上述實施例進行變化、修改、替換和變型。本發明的范圍由所
附權利要求極其等同限定。

關 鍵 詞:
來源 業務 數據 建模 分析 自我 優化 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:多來源業務大數據的建模、分析、自我優化的方法.pdf
鏈接地址:http://www.rgyfuv.icu/p-6345554.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图