圖模型由節(jié)點和邊組成。
節(jié)點代表實體或概念,而邊由屬性或關(guān)系組成。
實體是指可區(qū)分且獨立的事物,例如某個人,某個城市,某種植物,某種商品等。
它是圖模型中最基本的元素;概念是特征組合形成的知識單元主要是指集合,類別,對象類型和事物的類型,例如人,地理等。
屬性主要是指實體或概念的特征或特性,例如一個人的國籍和生日。
我們采用“哲學(xué)家”的觀點。
以設(shè)計圖形模型為例,如圖5-13所示。
▲圖5-13邏輯示意圖模型示例邏輯示意圖模型的構(gòu)建包括幾個關(guān)鍵步驟,如圖5-14所示。
▲圖5-14建立企業(yè)圖模型的步驟。
第一步:業(yè)務(wù)場景定義業(yè)務(wù)場景確定信息覆蓋范圍和信息粒度的表示形式。
以支持業(yè)務(wù)連續(xù)性為例。
由于不可抗力的影響,某些地區(qū)的供應(yīng)商工廠無法正常生產(chǎn)和運輸。
涉及的信息包括供應(yīng)商信息,產(chǎn)能,組件和內(nèi)部材料,合同和客戶信息。
根據(jù)用戶輸入的當(dāng)前物料儲備和合同狀態(tài),獲取影響內(nèi)部物料,產(chǎn)品,合同交付和客戶的清單和范圍。
這種應(yīng)用涉及產(chǎn)品目錄和配置的解釋,并且需要從收集的信息中提取最少的購買組件。
信息粒度是圖模型構(gòu)建中不可忽視的問題。
根據(jù)應(yīng)用場景確定信息的粒度以及圖模型的準確性和有效性。
例如,手機包括品牌,型號,批次和整個手機。
在相同的信息范圍內(nèi),粒度越細,圖模型的應(yīng)用范圍越廣,關(guān)系越豐富,但是冗余度越高,知識消耗的效率就越低。
信息粒度的原理是“可以滿足業(yè)務(wù)應(yīng)用程序的最粗粒度”。
第二步:信息收集信息的選擇應(yīng)考慮兩個方面。
與應(yīng)用場景直接相關(guān)的信息。
例如,為了確定不可抗力供應(yīng)中斷的影響范圍,直接相關(guān)的信息包括物料信息,產(chǎn)品配置,合同信息等。
它與應(yīng)用場景間接相關(guān),但可以幫助理解問題的信息。
這包括公司信息,專業(yè)領(lǐng)域信息,行業(yè)信息和開放域信息。
第三步:圖建模中的相同數(shù)據(jù)可以用幾種模式定義。
好的模型可以減少數(shù)據(jù)冗余并提高實體識別的準確性。
在建模過程中,有必要結(jié)合數(shù)據(jù)特征和應(yīng)用場景來完成。
相同的數(shù)據(jù)可以從不同的角度繪制不同的圖形模型。
步驟4:注釋實體,概念,屬性和關(guān)系。
公司圖模型中涉及的實體和概念可以分為三類:公共類別,例如人名,組織名稱,地名,公司名稱,時間等;公司類別,例如業(yè)務(wù)術(shù)語,公司部門等;行業(yè)類別,例如金融業(yè),通信業(yè)等。
步驟5:實體和概念的識別。
公司圖模型中實體和概念的識別可以使用業(yè)務(wù)輸入和數(shù)據(jù)資產(chǎn)中的現(xiàn)有信息作為種子,并使用命名實體識別(NER)的方法來擴展新的實體概念。
確認后,它將包含在實體和概念庫中。
步驟6:屬性識別和關(guān)系識別。
通常,基于業(yè)務(wù)知識在模式級別定義公司圖模型中的屬性和關(guān)系。
屬性和關(guān)系相對穩(wěn)定,并且沒有很多擴展方案。
企業(yè)圖模型的存儲技術(shù)必須全面考慮應(yīng)用場景,圖模型中節(jié)點和連接的數(shù)量,邏輯的復(fù)雜性,屬性的復(fù)雜性以及性能要求。
通常建議使用混合存儲方法,使用圖形數(shù)據(jù)庫存儲關(guān)系,使用關(guān)系數(shù)據(jù)庫或鍵值對存儲屬性。
強調(diào)邏輯推理的應(yīng)用場景使用RDF存儲方法,而強調(diào)圖計算的應(yīng)用場景