公務員期刊網 精選范文 信息分類標準范文

信息分類標準精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的信息分類標準主題范文,僅供參考,歡迎閱讀并收藏。

信息分類標準

第1篇:信息分類標準范文

眾所周知,新品牌要在競爭激烈的市場中迅速崛起,快速實現從“0”到“1”的轉變,在原有產品基礎上尋找到合適的新品類是一個非常有效的策略。那么,一個有效的新品類至少應該滿足哪些標準呢?遠卓機構認為,成功開創的新品類至少要滿足五個標準:站得穩,展得開,收得攏,伸得遠,傳得快。

其一,站得穩。新品類不僅要有產品質量做根基,而且要能夠找到其潛在的消費者需求基礎。滿足這兩個條件后,新品類仍然要有渠道基礎,唯有如此,新品類才可能在市場上站得穩。例如,我們在服務潮峰鋼構集團時,開創了精品鋼構這一新品類,滿足了大量客戶對于鋼結構建筑質量的高要求,有效推動了該品牌在全國范圍內的迅速崛起,品牌知名度和美譽度火線飆升,很快位居行業前列。

其二,展得開。新品類必須有足夠的支點來支撐,通俗地說就是,圍繞新品類要能展得開,為新品類找到形式新穎、內容相異、主題鮮明的支點。例如,山葉電動車根據社會現狀和發展趨勢、行業現狀和發展趨勢、企業現狀和發展趨勢以及消費者需求現狀和發展趨勢,提出人文電動車這一新品類,然后圍繞人文電動車這一新品類,在處理經銷商關系時大膽創新,將經銷商全部視為“事業元素”,獲得了經銷商的大力支持,影響了整個電動車行業。此外,山葉針對大量電動車由于廠家倒閉而維修難的現狀,全力展開“領養電動車孤兒”活動,掀起震驚行業的電動車“收孤風暴”,感動了無數電動車用戶。實際上,山葉這些活動都是“人文電動車”這一新品類的有效拓展,直接向社會展示了人文電動車的具體內涵。

其三,收得攏。新品類的命名必須具有“高度”和“廣度”,換句話說就是能夠“海納百川”,或者說是“一覽眾山小”,能夠將品牌未來發展過程中的各種有利資源聚集“麾下”,形成一股合力,有效推動品牌的良性發展。

第2篇:信息分類標準范文

【摘要題】信息資源建設與管理

【關鍵詞】網絡信息分類法/網絡信息組織/分類法構建

【正文】

根據網絡信息和用戶檢索需求的特點,依據網絡環境構建科學、實用的網絡信息分類法,是信息資源組織管理研究的重點之一。本文主要以1999年—2005年的中國學術期刊網數據為信息源,從構建方法、原則、語言、大綱、信息技術應用等6個方面回顧了近年來網絡信息分類法構建的研究進展。

1構建網絡信息分類法的依據或方法

目前,網絡信息分類法主要是指網絡搜索引擎分類體系。基于“分類工具通常是根據分類對象的特點和用戶需求,結合一定的技術環境建立的”認識,馬張華在《分類搜索引擎類目體系研究》一文中論述了分類搜索引擎類目結構的編制依據:(1)從分類對象來看,網絡資源的特點是數量、種類多,動態性強,新興科學、商業、娛樂的資源數量較多,傳統知識門類的資源相對較少,要求有新的、適合處理對象的分類架構。(2)從用戶需求來看,網絡的使用對象涉及所有的終端用戶。(3)從技術環境來看,網絡信息分類體系應充分利用計算機操作環境與超文本技術,在體系構建、類目設置等方面發展不同于傳統分類法的技術特色。[1]

陳樹年提出建構網上知識分類體系的(基本結構)編制方法,即:①有一個涵蓋各知識領域、結構清晰、層次簡明、能滿足網上信息組織需要的分類體系;②采用等級結構展示知識的系統聯系,構成枝干分明的主題樹或脈絡清晰的知識地圖;③類目的排列和檢索結果的排列方法應采用對用戶最有用的排列次序;④分類體系的標記應適當保留。[2]石曉華等在分析了網絡信息分類法與傳統分類法的優劣之后,首次提出了建構《中國網絡信息分類法》的建議,并列舉了具體的編制方法,即:①以傳統分類主題體系為基礎,建構多維的分類體系;②欄目因需而設,突出重點;③控制分級,減少欄目層次;④根據用戶確定欄目名稱的規范程度。[3]張琪玉則提出了一整套設計方針,即:①為不同類型的需求提供不同特性的分類體系;②在統一框架下設置分散獨立、各自完整的分類體系;③分類體系的類目設置不以網羅全部網絡信息資源為目標;④分類體系應具有開放性和可變性,并應有反映新穎信息的措施。他也設計了一個供普通用戶使用的分類體系框架。[4]王知津贊同石曉華的第①、②、③建議,認為可以借鑒傳統分類體系,構建《網絡信息分類法》,實現網絡信息分類法與主題詞表的結合,即分類主題一體化。實現分類主題一體化,需要做好三個方面的工作:①建立一個結構簡明的知識分類體系,通過對信息資源的系統分類,實現對網絡信息的宏觀控制;②建立一個智能化的控制詞表,實現作者語言與用戶檢索語言的控制和轉換;③建立分類體系與控制詞表的系統聯系,即將標引語言納入分類體系,這樣既可以用自然語言直接檢索,也可以在任何類下進行語詞檢索,從而較好實現分類與主題的兼容。[5]董琳提出的思路是設計一個融知識分類、行業分類、網站信息分類于一體的綜合性中文網站分類體系。[6]該體系把一級大類分為5大模塊:較豐富信息的模塊、高查詢率模塊、學科專業模塊、查詢入口模塊、綜合網站模塊。常設20個一級類目,把主題作為主要聚類標準,學科和專業作為輔助聚類標準。

另外,陸寶益提出編制的具體步驟,即建立專門機構,配備專業人員;開展深入調研,制定可行計劃;廣泛征求意見,不斷修改完善。[7]其他學者,如陳代春、趙培云、劉穎、許磊等也從不同角度論述了如何構建統一的網絡信息分類法的問題。

2網絡信息分類法構建的原則

構建新的網絡信息分類體系,需要吸收現有搜索引擎分類體系優勢,借鑒傳統分類法的部分長處,并遵循基本的設計指導原則。有的學者[8]認為,強調類表的科學性和專業性,而忽略了最終用戶——信息需求者的利益,是傳統文獻分類法無法適應網絡信息分類的基本原因之一,所以建立中文網絡信息分類體系應以實用性為主。持相同觀點的學者,如,史學斌提出“實用性、自然性、系統性和技術性、針對性”原則[9]。鄭慶勝指出“實用性、全面性、規律性、統一性和特殊性”原則[10]等。

持相反觀點的學者認為,首要的原則是科學性原則。吳丹認為,與傳統分類法一樣,網絡信息分類也必須具備科學性原則,分類體系仍必須以科學的知識分類為基礎,即科學性原則、易用性原則、針對性原則、動態性原則[11]。其他學者,如陸寶益提出“科學性、自然性、實用性、同一性、通用性、兼容性、發展性”原則[12]、朱蓓玲提出“科學性、實用性、易用性、自然性、針對性、快捷性、系統技術性”原則[13]。敬卿、吳靜提出的“科學性、實用性、易用性、自然性、通用性”原則[14]。鄧香蓮提出的“科學性、簡潔性、直接性、實用性、動態性、自然性”原則[15]也應歸屬此類。

關于網絡信息分類體系的原則,研究者智者見智,較多學者都提到了應遵循“科學性、實用性、自然性”原則。主要分歧是強調科學性優先還是實用性優先。筆者認為,網絡信息分類法要適應組織網絡信息動態變化的需要,滿足用戶復雜的信息查詢需求,對于綜合性、大眾性的中文網絡信息分類體系,必須以實用性原則為主,兼顧科學性的原則。

3網絡信息分類法構建的語言

從實踐來看,傳統的文獻分類法使用的是典型的人工語言,而網絡信息分類法使用的主要是自然語言。因為人工語言嚴格的規范性使用戶喪失了檢索中的自主性和能動性,背離了以人為本的原則,自然語言是檢索語言發展的必然。[16]張琪玉教授則指出由于自然語言有其固有的缺陷,網絡信息檢索不可能僅僅使用自然語言,也必須使用人工語言。情報檢索用語發展的大趨勢,是情報檢索語言的自然語言化和自然語言的情報檢索語言化,是兩者的初級結合到完全融合的過程。[17]所以有的學者認為需要對網絡受控語言進行適合于網民大眾習慣用語的改造,提出了“受控語言網民化”的思想。[18]陳晶也指出:“改進受控語言的易用化是網絡環境下的大勢所趨,而對自然語言進行必要的控制也是網絡環境下勢在必行的,兩者的相互滲透、有機結合是情報檢索語言發展的大趨勢。”[19]

有的學者認為分類主題一體化語言,實質是受控語言內部的一體化,它不能適應網絡檢索的發展,應當建立更適合于網絡信息檢索的自然語言與受控語言結合的一體化語言。[20]有的學者通過分析受控語言和自然語言各自在網絡中的應用,分析其優缺點,指出無論受控語言還是自然語言都有各自獨特的優點和缺陷,不能彼此取代,可以相互補充。而“它們在網絡中的應用研究也表明兩者之間呈現出明顯的相互交織兼容的趨勢”。[21]

筆者認為,任何一種語言都有長處和短處,都不能完全滿足網絡用戶多樣化需求,分類語言和主題語言相結合、自然語言和人工語言相結合才是建構網絡信息分類法的發展趨勢。

4網絡信息分類法的大綱設計

對網絡信息分類法進行深入研究并提出大綱或框架的代表作有文獻[22]、[23]、[24]。陳樹年闡述了構建網上分類體系的原則與技術后,提出了一個適用于一般用戶的綜合性中文搜索引擎的信息分類大綱,該大綱包括22個大類,即哲學與宗教、人文與社會科學、社會文化、文學與藝術、教育與人才、體育與健身、休閑與生活娛樂、旅游與服務業、醫學與健康、經濟與金融、政治、法律、軍事、歷史與地理、自然科學、農業科學、工程技術、計算機與網絡、新聞與媒體、圖書館與參考資料、國家與地區、綜合網站。并指出以學術和技術為主的搜索引擎、專業搜索引擎最好以權威分類法(或其中的某些類)為基礎,經過一定的改造后用于網上信息的組織和檢索,因為其科學的體系和嚴密的結構是非專業人員所不能獨立完成的。[22]吳丹采取學科分類與事物分類兼顧的方式,也設計了一個包含有18個大類和若干二級類目的網絡信息分類體系設計方案。18個大類,即政治法律與軍事、新聞與媒體、商業與經濟、自然科學、農業與工程技術、計算機與網絡、教育、哲學與宗教、人文社會科學、文化藝術、歷史與地理、國家與地區、旅游與交通、醫學與健康、生活服務、體育與健身、娛樂休閑、圖書館與參考資料。[23]許培揚提出了中文網絡信息分類法應由簡表、主表、索引和使用指南四部分組成。簡表一般由1-4級類目構成,主表由全部類目構成。索引包括:①本表與其他分類體系的對應,用于不同分類體系的轉換;②英譯名稱索引,從英查漢或從漢查英。使用指南是分類體系的詳細說明。[24]

5現代技術在網絡信息分類法構建中的應用

由于網絡信息分類法必須能適應網絡技術環境,這就要求在編制過程中適當采用許多現代信息技術,如自動分類技術、人工智能技術、網格技術等等,以適應網絡技術環境的發展特點。馬張華專文闡述了超文本技術在網絡信息分類法編制中的應用。[25]他指出:超文本技術可以改進主題之間多維關系的揭示;可以從多個角度組織信息資源;可以進行輪排,亦即多表列類;可以設置鏡像類目,根據需要對某些重點類目或熱點類目突出反映;可以動態設置類目和動態揭示類目之間的關系,根據需要及時增添類目或刪改類目;可用于聯結不同的檢索系統,增加檢索入口;可以聯結分類體系與相應的說明文字與規則系統。

陳旭論述了分面分類在網絡信息分類法編制中的應用。[26]文章首先論述了在編制網絡信息分類法時,可根據需要利用仿分技術編制各種類型的通用復分表、專用復分表及規定必要的仿分。其次論述了分面敘詞表的應用。最后論述了分面分類在可視化檢索中的應用。即在檢索界面上設置主題分面、書目形式分面、時間分面和地域分面,然后再按等級列舉的方式分別展開,既便于類表的修訂與維護,又便于用戶檢索更為專指的信息。

周淑云在《分類主題一體化構建網絡信息分類體系》[27]一文中指出,理想的網絡分類法應是分類法和主題法的結合使用,理想的模式是以“分類一主題”的方式對知識進行組織,形成一種兼具分類、主題兩種標引和查找功能的新型檢索語言,從而為不同層次和不同需求的用戶分別提供不同的信息查詢功能。分類主題一體化的網絡分類體系既突破了傳統分類法層層劃分、層層隸屬的等級結構又克服了主題法系統性差,將同類信息分類的特點。對此問題進行論述的還有郭麗芳、梅伯平、蘇瑞竹等。

6構建中微觀層面的具體問題

對網絡信息分類法編制的一些具體問題,許多學者都予以了詳細的探討。

陳樹年在《網絡信息分類法研究》中研究了聚類標準、大類設置、展開層次、類目種類、類目名稱、多分類體系、分類標準與使用次序、類目設置的均衡性和規律性、重點類目、交叉關系的處理、類目的排列、類目的注釋和說明、用戶界面的設計等,并給出了相應的改進意見。[28]他認為,關于聚類標準,綜合性網絡信息分類法聚類的主要標準應當是“主題和專題”,專業搜索引擎可以學科或專業為主要聚類標準,或結合主題聚類運用;關于大類的設置數量通常以10-20個為宜;關于類目的名稱要做到準確、通用和精練;關于類目種類包括“子類”與“網站”兩種,“在每一類下,把內容寬泛,各個下位類不能容納的信息歸納為‘綜合網站’集中收錄是網絡分婁法實用的作法”。

其它方面,人們觀點大致雷同。如,關于分類體系展開層次,陳樹年提出基本應控制在3-6級之間;趙培云認為根據目前網絡信息的實際情況和用戶瀏覽查詢心理,綜合性網絡信息分類標準,類目應控制在三、四層為宜,專業搜索引擎和網站可適當延伸。[29]張琪玉提出類目細分應控制在五級左右。[30]

總之,由于網絡信息、網絡信息用戶、網絡信息技術環境等特點,這就決定了網絡信息分類法的編制原則和技術方法,有別于傳統分類法的編制原則和技術方法,但是傳統文獻分類法和現有網絡信息分類體系的成功經驗可以給網絡信息分類法提供有益的借鑒。我們建議,應當由國家信息產業部牽頭,組織圖書情報界專家、計算機專家、網絡公司等相關專家,廣泛征求意見,盡早編制出一部用戶滿意、質量較高的網絡信息分類法。

【參考文獻】

[1]馬張華.分類搜索引擎類目體系研究.圖書情報工作,2001(2):36-40

[2][22]陳樹年.搜索引擎及網絡信息資源的分類組織.圖書情報工作,2000(4):31-37

[3]石曉華,王春芳。網絡信息分類與傳統分類法的優劣分析——兼談構建《中國網絡信息分類法》.圖書館理論與實踐,2001(1):43-45

[4][30]張琪玉.網絡信息檢索工具的分類體系.江蘇圖書館學報,2002(4):7-11

[5]王知津,肖洪.網絡信息組織對傳統信息組織的借鑒.圖書館工作與研究,2003(4):2-7

[6]董琳.網絡信息分類組織的發展趨勢與標準化.圖書情報知識,2004(2):65-67

[7][12]陸寶益.論創建我國統一的網絡信息分類法.中國圖書館學報,2004(6):44-47

[8]千忠紅.網絡信息環境下的傳統分類法.圖書情報工作,1999(2):37-39

[9]史學斌.網絡信息分類體系.圖書館,2002(1):33-35,20

[10]鄭慶勝,易曉陽.從新浪等網站看網絡信息分類體系的建立.圖書館建設,2003(1):69-71

[11][23]吳丹.網絡信息分類體系設計.圖書情報知識,2002(5):37-39

[13]朱蓓玲.淺析構建網絡信息分類體系.情報雜志,2004(8):110-111,114

[14]敬卿,吳靜.網絡分類目錄規范化初探.圖書館,2002(1):49-50

[15]鄧香蓮.文獻信息分類與網絡信息分類之比較研究.情報資料工作,2002(6):43-45

[16]粟慧.以人為本的必然:人工檢索語言向自然語言的轉變.圖書館,2000(2):9-10

[17]張琪玉.網絡信息檢索用語言的發展趨勢.圖書館雜志,2001(3):5-7

[18]梁樹柏,高夕果.受控語言網民化的思考.情報雜志,2002(8):69-71

[19]陳晶.論網絡環境下情報檢索語言的發展.情報雜志,2002(6):54-55

[20]呂娟,袁相琴.論第四種情報檢索語言系統.中國圖書館學報,2002(1):87-92

[21]焦玉英,李法運.網絡環境下信息檢索語言的優化研究.情報學報,2003(3):291-296

[24]許培揚,張玢.網絡信息分類標準研究進展.醫學情報工作,2002(6):324-326

[25]馬張華,李玲.超文本技術在分類法編制中的應用.大學圖書館學報,2001(1):60-62,66

[26]陳旭.分面分類在網絡資源組織中的應用.圖書情報工作,2002(1):59-61

[27]周淑云.分類主題一體化構建網絡信息分類體系.現代情報,2003(4):113-114

第3篇:信息分類標準范文

關鍵詞:環境信息 信息分類 多維樹狀信息結構 球形網狀信息結構

中圖分類號:X5 文獻標識碼:A 文章編號:1674-098X(2015)10(b)-0192-02

環境信息,顧名思義是與環境有關的信息,但在學術上至今為止還沒有統一的國際一致認可的定義。環境信息分類是環境信息標準化的重要基礎,是環境信息化的關鍵環節之一。建立一個科學、規范、精簡、高效、實用的環境信息體系,能夠支持信息使用者用最簡單、最短的時間獲取最有價值的環境信息[1]。我國對環境信息分類已有一定的研究基礎。當前環境信息分類方法比較直觀、易于理解,便于內容的組織與歸納。然而,隨著“智慧環保”“環保物聯網”“移動互聯網”的發展,環境信息內容不斷擴大,此環境信息分類法忽略了各個類目點的數據內容交叉性,又切割了各個類目點之間的內在客觀聯系。該文在充分分析環境信息分類現狀和環境信息的概念及發展特征的基礎上,提出新型環境信息分類方法,為環境信息的高效利用提供新思路[2]。

1 研究方法

目前,環境信息分類采用的線分類法和面分類法;線分類法屬于一維分類法,體現的是垂直方向上的概念邏輯關聯;面分類法為二維分類法,體現的是水平方向上的概念邏輯關聯。然而,環境是多因素的復雜系統,是一個多學科交叉融合的開放體系,環境系統內部體現的是交叉融合的多維邏輯關聯[3]。

(1)多維樹狀信息結構。

該分類方法需滿足以下條件:所有維度的總和所涵蓋的內容能夠構成完整的系統范疇和領域,每一個分類維度內涵必須是互相獨立、無重復的。同時,需預留足夠的類目,以保證新事物出現時不至于打亂已建立的分類體系和結構[4]。

系統中的每個子系統映射為信息空間的一個信息維,每一個信息維包括一顆以維度為根級的分類樹,分類樹包括若干子樹,子樹由相互獨立的域構成,域是葉級分類。樹、子樹和域構成了該數據維下的二維分類結構[5]。

(2)球形網狀信息結構。

球形網狀信息結構則是結合樹形數據結構基礎上演變而來。構建步驟:

一是將信息按照樹形結構分類。

二是調整每一個信息樹及其分類的位置并旋轉一定的角度、形成一個有邊界的多邊形整體效果,將所有的信息單元數據對象放在全集空間中考察。

三是對于實踐中所生產的每一個信息單元,先根據信息的主要功能與價值確定其直接歸屬的欄目,用實線連接該信息單元和其宿主欄目。并考察信息單元與其他欄目的關聯性,關聯性強的用虛線連接,關聯性弱的則不連接。

四是當所有的信息樹分類和信息單元都在這個全集空間中標示出來時,再把該模型放到立體空間去觀察,最后得到一個球形網狀的結構模型。

2 結果與討論

2.1 多維樹狀環境信息分類

環境信息除了要體現環境系統的豐富內涵,同時也要表達信息特征和時空特征。因此,環境信息的三個基本維度可視為:環境屬性維、信息屬性維和時空定位屬性維。

(1)環境屬性維。

環境是多因素的復雜系統,信息包括豐富的內涵。通過對環境政治活動和環境自然因素分析,結合我國用戶對環境信息的需求,該文將環境屬性維分為活動行為和環境要素。

活動行為,是按政府對環境監管進行分類,主要有環境管理、生態保護、污染防治、環境科研、公眾參與和環境產業發展等。

環境要素,是按人類對環境的一般認識進行分類,主要有水、大氣、生物、土壤、輻射、聲和社會環境等。

(2)信息屬性維。

信息屬性說明環境信息的來源、信息內容及信息表現形式,該維度服務于信息的標準化技術操作。

環境信息來源,通過具體分析環境信息來源,采用相應的數據集成技術,可方便信息的自動化接收和存儲。該文將環境信息來源分為:環保系統內部信息、跨部門共享信息、公共網絡資源、公共科技資源等。

環境信息內容,根據對環境內涵的分析,環境信息內容可以分為科普知識、監測預警、行政審批、法律政策、新聞公告和科研成果等。

環境信息表現形式,根據信息表現的一般分類,該文環境信息表現形式分為文本、圖表、聲音、視頻、地圖等。

(3)時空定位屬性維。

環境具有明顯的時空特征,環境信息也需要反映時空特性,該文將時空定位維分為時間特征、時效特征和空間范圍。

時間特征,按照環境信息關聯的自然時間進行定位,該文將時間特征信息分為預測信息、當前信息和歷史信息。

時效特征,按照環境信息接收到的時間效力進行定位,該文將時效特征分為實時信息、準實時信息、延遲信息等。

空間范圍,按照環境信息關聯的空間位置實現空間定位,該文將空間范圍分為世界、全國、區域、流域、地方等。

2.2 球形網狀環境信息分類

根據以上分類,環境信息樹包括8類:活動行為、環境要素、信息來源、信息內容、表現形式、時間特征、時效特征和空間范圍,將每個信息樹按其分類旋轉一定角度形成空間效果,將實踐中的每一個信息單元與各個環境信息樹進行關聯,形成一個環境信息的球形網狀結構。

2.3 結果討論

該文所采用的多維樹狀信息分類法和球形網狀結構的信息分類法,具有以下特點:

(1)多維樹狀信息分類法從環境屬性維、信息屬性維和時空定位屬性維對環境信息進行分類,基本涵蓋了環境及信息的所有內涵和特征,克服了現在以線、面混合分類法對于數據內容交叉性不強的缺陷,為環境信息分類提出新方向。

(2)球形網狀結構的信息分類法是在多維樹狀信息結構的基礎演變形成,增強了環境信息類別間的內存聯系,使環境信息分類體系更富有組織性、有機性。

(3)同時,環境信息的多維分類及網狀聯結也為信息的存儲和查詢效率提出了更高的要求,要求更高性能的物理存儲、更合理的數據庫結構,以及更加高效的搜索技術。

3 結語

多維樹狀環境信息分類和球形網狀環境信息分類是以環境信息的特征為基礎,以信息高效利用需求為導向,提出的現代化新型環境信息分類方法,它克服了傳統環境分類數據內容交叉性弱、內在客觀聯系不強等缺陷,是科學、規范、精簡、高效、實用的環境信息體系構建的基礎理論,為現代環境信息資源目錄體系和環境信息資源中心的建設提供了新思路。該研究旨在拋磚引玉,希望更多學者進行探討,為推動環境信息的綜合有效利用以及環境信息化發展做出努力。

參考文獻

[1] 關于在環境事物中獲取信息、公眾參與決策和司法救濟的公約(奧胡斯公約).歐洲經濟委員會環境政策委員會于1998年在“歐洲環境”第四次部長級會議[Z].

[2] 尹榮樓,李愛榮.環境信息分類編碼標準化[J].環境科學研究,1994,7(2):39-43.

[3] 王健,甘國輝.多維農業信息分類體系[J].農業工程學報,2004,20(4):152-155.

第4篇:信息分類標準范文

關鍵詞:知識管理 知識化監理 知識結構

信息工程監理是最近幾年興起的保障信息化建設質量的一種約束機制。它采用“五控兩管一協調”的控制模式,對業主、承建單位的項目行為實施監督,保障信息化建設的質量,避免“豆腐渣”工程,起著不可或缺的重要作用。

一、信息化建設與知識管理

信息化建設是以知識管理為核心,信息資源為基礎,提高組織核心競爭力為目的的全面整合或再造組織業務流程的過程。知識管理是獲取、儲存、學習、共享、創新知識的管理控制過程。在信息化建設中,企業、政府等組織通過知識管理,從現有的業務流程和數據中,挖掘、獲取并確定各類知識資源,定位擁有專業知識、經驗的個體,將個體的知識、經驗、信息提升為組織的知識資源,有序傳遞、整合、規劃和有效利用知識資源,有助于提高組織的整體業務、技術和管理水平。

在承建單位實施信息化建設中,知識管理是通過公司內雇員、部門、可能的跨國公司合作、與業主的溝通協調,傳遞、整合、有效利用本單位的知識資源,運用信息技術,通過設計最優技術方案、控制施工質量,共享和創造知識價值。

在信息化建設中,對組織內各種各類知識進行評估,挖掘、獲取真正有用的知識。知識不僅僅是信息,是顯性知識和隱性知識的集合。通過評估,區分知識和信息、知識管理和信息管理,以實現資源的充分開發與應用。

整合或再造業務流程,是與知識管理密切相關的。1990年美國管理專家Michael Hammer提出了“業務流程重組”(Business Process ReengineeringBPR)的概念,它是以用戶需求為導向,信息化、知識化為基礎,對用戶的業務流程進行再思考、關鍵性的重新設計和根本的變革,從而獲得在成本、質量、服務和速度等方面業績的持續改善。在業務流程重組中,信息(知識)的獲取、分類、存儲、利用,只有與知識管理結合,才能夠發揮更有效的作用。

知識管理技術貫穿于信息化建設始終,它與信息技術相輔相成。在知識獲取、學習、共享、創新的過程中,整合各種信息技術,構建完整的知識管理體系,是知識經濟時代信息技術的新發展。

二、信息資源規劃和整合

信息資源整合(Information Resource Integrating, IRI)的前提是進行統一的信息資源規劃(Information Resource Planning, IRP),消除“信息孤島”,共享信息資源。信息資源的規劃是實施信息化工程的基礎,IRP的基礎是建立信息資源管理基礎標準,IRI的實質是通過信息技術改造、重建或重構數據環境。信息產業部的《信息系統工程監理暫行規定》中定義信息資源系統為“以信息技術為主要手段建立的信息資源采集、儲存、處理的資源系統”。

在信息化建設中,信息資源規劃是很重要的一環。在組織的生產、經營、服務活動中,會產生大量的數據、資料、指標、圖紙、報表及其它顯性資源,也存在各種各類的知識、擁有專業知識和經驗的個體等隱性資源。信息資源規劃是對實施信息化后產生、控制、使用這些資源進行識別和分類;評估、挖掘、獲取、共享各類知識;對承載信息資源的信息基礎設施進行分析、設計和指導。

(一)信息資源規劃的主要任務

信息資源規劃的任務是對支撐業務流程的邏輯相關的數據進行分類,建立具有結構化、標準化、一致性的共享數據庫。分析業務流程重組后產生、控制和使用的數據,了解各種數據的內容、范圍、可靠性等,理解數據的共享要求和應用策略以及數據使用中的問題,使信息資源規劃能夠滿足數據資源的管理要求。

(二)信息資源管理標準

信息資源管理標準是指決定信息系統質量的、進行信息資源開發利用的基本標準。威廉·德雷爾1985年在其《數據管理》專著中總結了信息資源管理的基礎標準———數據管理五項標準,內容如下:

1.數據元素標準。數據元素(Data Elements)是信息資源中最小的信息單位,是抽象的數據對象。它的質量是構建穩定的數據結構基礎的關鍵。數據元素標準包括數據元素命名標準、標數據元素識標準和數據元素一致性標準。

2.信息分類編碼標準。是信息標準中的基礎標準。信息分類編碼(Information Classifying and Coding)的對象,是一些最重要的數據元素,自動處理、檢索、存儲和傳輸信息的質量及效率與這些元素緊密相關。信息分類是根據信息內容的屬性或特征,將信息按一定的原則和方法進行區分和歸類,并建立一定的分類系統和排列順序,便于管理和使用信息。信息編碼就是在信息分類的基礎上,將編碼對象賦予有一定規律性的、易于計算機和人識別和處理的符號。信息分類編碼工作要確定每個編碼對象的編碼規則、碼表結構和代碼表。

3.用戶視圖標準。用戶視圖(User View)是一些數據元素的集合,表示用戶對信息需求和數據實體的最終解釋。用戶視圖是數據的系統外在表現形式,是系統的輸入、輸出媒介和手段。用戶視圖與外部數據流是同一詞,來自某個數據源或流向某個數據接收端的數據流。常用的用戶視圖有紙面的,如圖紙、單證、表單、報表、賬冊等;有電子的,如屏幕格式等。

4.概念數據庫標準。概念數據庫(Conceptual Database)是用戶對數據存儲的最終解釋。用戶的信息需求,應首先界定概念數據庫。概念數據庫是綜合信息資源用戶的數據要求構成的全局數據庫,表示數據庫的整體數據組織狀況和邏輯結構。

5.邏輯數據庫標準。邏輯數據庫(Logical Database)是系統分析設計人員的解釋。在關系數據庫模型中,邏輯數據庫是一組規范化的基本表(Base Table),是從概念數據庫中映射出的所需信息。邏輯數據庫表示的是局部數據的數據庫邏輯結構。

(三)信息資源規劃方案

在定義數據管理標準的基礎上,制定信息資源規劃方案,為業務流程重組提供依據,為系統設計提供基礎。

在信息資源規劃中,將隱性資源轉變為顯性資源,有序傳遞、整合、規劃和有效利用各類知識資源。因此,信息資源規劃是資源的知識管理規劃。信息技術的投資,可能不會給企業帶來明顯的效益,因為基于信息的競爭優勢正在逐漸轉變為基于知識管理的競爭優勢,以信息資源規劃為核心的信息系統規劃,如果不實施知識管理,將不會產生顯著的信息化效益。

(四)資源整合

第5篇:信息分類標準范文

我國政府信息化進程從20世紀80年代開始到現在已有20多年的時間。政府部門的信息資源建設和政府內網信息門戶建設已具較大規模,但由于缺乏統一規劃,造成了各部門應用系統的開發平臺不同、操作系統不同,特別是數據庫管理系統千差萬別,各系統之間“不聯不通”,從而形成了一個個“信息孤島”。因此當前電子政務建設面臨著兩項任務,一項是政府信息資源整合、流程優化,建立有效的領導決策支持系統;另一項是提供周到、方便的公共服務能力,即構建電子服務型政府。

一、信息資源整合

在短期內建設完成電子服務型政府的困難是:我國目前電子政務物理網的基礎設施和單項應用雖然很豐富,但是信息資源共享與交換能力不足,因此重視數據流分析和辦公流程整合,搞好軟件系統的頂層設計是電子政務建設必須經歷的重要階段。信息資源整合的三項內容:內容整合、數據整合、應用整合。

從總體上看,內容整合包括對分散異構信息資源體系的整合。首先,原則上是在兼顧信息資源現有配置與管理狀況的條件下,實現無縫整合;其次,在新的信息交換與共享平臺上,開發新的應用,實現信息資源的最大增值。

數據整合的關鍵是構建基礎數據庫和建立數據中心。基礎數據庫包括人口數據庫、法人單位數據庫、自然資源和空間地理數據庫、宏觀經濟數據庫和各地方特殊資源數據庫等。其中數據中心的建立是電子政務的基石,是政府信息化的基礎設施。

應用整合包括包含G2G、G2B、G2C和G2E(政府對公務員)等模式下的政務應用系統及協同工作與決策支持系統。

此外,電子政務標準規范體系和電子政務安全體系作為電子政務建設的核心內容,也不容忽視。

二、信息資源整合的難點

電子政務工程建設經過多年的開發和積累,政府各部門存在了大量的數據庫,對這些現有數據庫系統進行整合中遇到的難題主要有:

1.對現有分散異構的信息資源如何無縫接入。包括結構化數據資源的接入、非結構化數據的接入和應用軟件系統的接入。

2.整合后信息系統的管理問題。現有信息資源的管理分為自上而下的管理、集中式管理、可控性自主管理、個性化管理和實時性管理等多種管理模式。信息資源整合后將實行分布式信息資源管理。如何實現物理上分散、邏輯上集中、應用上分散、管理與服務集中將是面臨的主要難題。

3.如何滿足新的需求。包括共享需求、交換需求、協同需求等。

4.支持不同用戶的訪問需求。包括支持不用授權的可控性訪問、不同用戶的個性化服務、支持單一性訪問、支持實時性的應用需求。

三、信息資源整合方案

整合后的管理架構體系分5層,如圖1所示。

該管理架構的優勢是:

1.視圖管理層中所有管理模塊都提供與WebService的接口,易于實現分布部屬,統一管理。

2.統一的資源目錄層PKI和PMI中心層中的授權管理可以靈活定義用戶類型和用戶屬性,從而可以方便地定義信息欄目下的不同條目或應用下的不同操作,靈活定制授權策略。支持第三方CA認證及其資源目錄系統和第三方應用系統的集成。

3.組件封裝層:涵蓋了日常工作中用到的各種文件模版,并提供舊文件查詢等功能。

4.軟件層:提供各種辦公應用軟件及專用軟件。

四、信息資源整合的成功案例

2005年全國電子政務建設步入新的發展階段。以河北省電子政務“112”工程為例,該工程的重點是構建了統一的電子政務平臺和12個應用系統。

1.統一的電子政務平臺:公務內網、公務外網和信息交換系統

2.12個重點應用系統:辦公及網上審批系統、財稅和審計監管系統、社會保障信息系統、宏觀經濟信息系統、農業信息及服務系統、自然資源和基礎地理信息系統、社區綜合管理服務系統、人口基本信息管理系統、應急聯動信息系統、公共衛生信息系統、信用信息服務系統、綜合教育信息系統。

系統建設分三個階段進行:

第一階段(需求分析階段):主要任務是業務梳理和用戶視圖及數據流分析。通過業務梳理和分析,按照信息工程方法論,建立起由職能域、業務過程、業務活動構成的業務模型;通過對報表、單證、帳冊等用戶視圖的登記和拆分,得到所涉及的數據項及其分布情況;通過對數據流也就是用戶視圖流動的分析,得到業務與數據的關聯關系,形成數據流程圖。通過對輸入、輸出、存儲等數據流的量化分析,得到對網絡通信和數據存儲設備的量化需求。

第二階段(系統建模階段):系統建模是需求分析的繼續和定型,這一階段的主要任務是建立系統的功能模型、數據模型和體系結構模型。在對需求分析階段得到的業務過程、業務活動能否計算機化進行分析的基礎上,將可計算機化的業務過程、業務活動用功能模塊和程序模塊表達出來,建立起功能模型,解決系統做什么的問題;通過對需求階段得到的數據流程圖、用戶視圖、數據項及其分布情況的進一步分析、分類和規范化,按業務主題和業務需要建立起由主題數據庫、基本表、數據元素集構成的數據模型,解決系統信息如何組織的問題;通過對功能模型和數據模型關聯關系的分析,建立起系統的體系結構模型,表達出子系統與主題數據庫的關聯情況以及各子系統的程序模塊與基本表的關聯情況,為共享數據庫的創建與使用、數據分布分析和制定開發計劃提供決策依據。

第三階段(信息分類編碼階段):主要任務是數據元素規范化、信息分類編碼和專項報告編制。利用數據元素規范化理論和方法,對基本表中的每一個數據元素進行分析、規范和一致性控制,數據模型也得到進一步完善;通過對數據元素內涵的分析,識別信息分類編碼對象并進行適當分類,按照國際、國家、地方、企業的順序,進行信息分類編碼標準調研,對確需自己進行編碼的對象,要制定編碼規則、編制相應的代碼表,并通過收集已有的編碼標準,最終形成系統所需的完整的信息分類編碼標準;在完成信息資源規劃方案的基礎上,通過對整個過程和成果的總結與提煉,分別形成流程優化、信息資源管理基礎標準、數據交換標準、數據環境建設、投資分析等五個專項報告。

2005年4月29日,河北省電子政務“112”工程順利通過國家信息化專家組的評審,開始在電子政務建設中發揮效用。

第6篇:信息分類標準范文

關鍵詞:知識庫;農業信息分類;mysql

中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2014)32-7560-02

Abstract: Through the research on database technology and techniques for classification of agricultural information, designing the structure of agricultural technology database and developing the agricultural information acquisition system, provides the input interface for the agricultural knowledge acquisition. The design of agricultural database building a foundation for the developing of agricultural knowledge retrieval system. The practical application proves that, the agricultural knowledge database providing a good support for the development of agricultural information retrieval system.

Key word: knowledge database; agricultural information classification; mysql

新疆地域遼闊,農業、牧業生產較分散,特別是牧民生產生活地點不固定,農業科技人員很難進行定點科技服務。通過農業知識庫建設,建立農業信息話務咨詢中心,農牧民在田間地頭通過為農服務熱線即可咨詢生產過程中遇到的各種問題,這將大大提高我區為農服務水平,及時幫助農戶快速解決生產中遇到的各種問題,提高為農服務質量,促進我區農、林、牧、副、漁業快速發展。因此農業知識庫的構建與實現是建立農業信息話務中心的迫切需求。

1 農業信息分類

農業知識庫需要儲存大量的農業數據,為了合理的構建農業知識庫,需要研究農業信息科學的分類方法。經過調查研究、咨詢相關專家以及查閱相關書籍,依據“農業信息分類標準草案”,我們將農業信息分為種植業及制品、漁業、畜牧業、農業生產資料、園林、農機械、植物病理、動物病理類,每個大類下面又分二級類別、三級類別、四級類別。以種植業及其制品為例,其二級類別又可分為糧食作物、經濟作物、蔬菜、瓜果類、油類。二級類別下又設三級類別,以糧食作物為例其三級類別又可分為谷物,三級類別下又設四級類別,以谷物為例,其四級類別包括大麥、燕麥、蕎麥、青稞等具體植物;經濟作物的三級級類別又可分為油料、豆類、棉麻、糖類作物。油料的四級類別又分為花生、油菜、芥菜等植物;豆類的四級類別包括大豆、蠶豆、豌豆、等植物;棉、麻的四級類別包括棉花、細絨棉、木棉、野麻、劍麻等植物;糖類作物的四級類別包括甘蔗、甜菜。蔬菜的三級類別又可分為根菜類、莖菜類、葉菜類、花菜類、果菜類、種子類。根菜的四級類別分為蘿卜、大頭菜、牛蒡等植物;莖菜類的四級類別又分為馬鈴薯、菊芋、藕等植物;葉菜類的四級類別包括小白菜、菠菜、芹菜等植物;花菜類下面有花椰菜、青花菜、金針菜等植物;果菜類四級類別包括黃瓜、南瓜、苦瓜等植物;種菜類四級類別包括籽用西瓜、蓮子、芡實;瓜果類三級類別包括瓜類、果類、堅果、干果。瓜類四級類別包括西瓜、甜瓜、哈密瓜等植物;果類下面有蘋果、桃、石榴等植物;堅果、干果下面有按巴旦木、核桃、葡萄干等植物。油類又可分為食用油。食用油下面有花生油、豆油、菜籽油等。按照這樣的方法將其余七類由大至小細分。

3 知識錄入系統的設計與實現

知識庫數據的獲取主要包括三種途徑,第一種途徑是通過網絡爬蟲從相關農業網站抓取信息,然后分類導入知識庫,第二種途徑為人工錄入已掌握的大量農業科技信息,第三種途徑為用戶檢索過程中查詢不到的關鍵詞經客服人員搜索再次錄入知識庫,通過這三種途徑不斷豐富農業知識庫,為方便人工錄入,開發了農業知識庫錄入接口,開發技術采用jsp+servlet+strus,服務器使用fedora14.農業知識錄入界面如圖2。

在知識錄入過程中,首先要選擇所錄農業科技知識所屬一級類別、二級類別、三級類別和四級類別,然后在標題欄中輸入農業知識標題,在內容欄中輸入農業知識內容,點擊提交即可。農業信息的分類不但利于數據的存儲,而且為后期開發農業科技知識檢索系統及用戶個性信息定制提供了基礎。

4 結束語

目前該知識庫已設計完畢,數據錄入工作正在進行,已錄入農業科技知識3000余條,網絡爬蟲采集數據經分類入庫350多萬條,為農業知識檢索系統提供了數據支持,起到了為農服務的目的。

參考文獻:

[1] 李永可,李悅,陳燕紅,等.農業知識檢索系統的設計與實現[J].電腦知識與技術,2014,10(23):5449-5452.

[2] 李永可,張太紅,馮向萍.中文農業網站多元線性回歸識別研究[J].新疆農業大學學報,2011,34(5):442-446.

[3] 胡毅,劉波,方逵.農業知識庫知識檢索系統研究與實現[J].農機化研究,2013(6):13-18.

[4] 王玉娟.農業知識文本庫檢索系統關鍵技術研究[D].長沙:湖南農業大學,2012.

[5] 王斌.信息檢索導論[M].北京:人民郵電出版社,2010.

[6] 王玉娟,方逵.農業知識庫檢索系統探索[J].寧夏農林科技.2012(4):24-27

[7] 羅武.農業知識庫知識錄入系統關鍵技術研究與實現[D].長沙:湖南農業大學,2011.

第7篇:信息分類標準范文

P鍵詞:工程項目 WBS 計算機

一、WBS簡介

Work Breakdown Structure(WBS)是一種全面系統的工程項目分析法,是項目管理的基礎性工作。[1]它可以將龐大的工程分解為方便管理的工作包,這樣可以增加對工程的費用、進度和質量控制的準確度。早在在上世紀七八十年代,就成為國際上進行工程項目管理的基本方法。

WBS是一個由軟件、硬件、服務以及資料組成的以產品為中心的層次體系,它確定了整個項目工程的走向,對項目工程起到了決定作用。[2]WBS可以對需要進行研制或者生產的產品進行顯示并且在最終的產品與工作單元之間建立起一座橋梁,在確定產品單元時起著至關重要的作用。WBS具體可以分為四類,分別為:綱要性WBS、項目綱要性WBS,合同WBS和項目WBS,它的建立必須遵守整體性、系統性和可追溯性的原則,這是WBS作為工程項目管理的要求。那么,為了實現這三項原則,在針對WBS進行設計時要特別注意結構、代碼和報告這三要素的設計。

二、工作包模型

工作包是工作包模型的基本構成單元,而工作包又是在對項目進行分解后的結果上形成的。工作包模型的思路就是將工作包作為整個項目的具體控制對象,實現高效化管理。工期控制、費用控制等在項目進行中對各個單元的控制都可以成為工作包的控制對象,這樣一來可以為整個工程提供一個完整準確的的信息。由于工作包的上述屬性導致由其組成的層次結構體系在反映工程項目生產過程的同時還可以反映項目的內部聯系和目標要求,進而支持項目控制的整個過程。

在工作包模型建立后,可以利用計算機數據庫技術對整個工程項目進行集成化管理。工程項目的分類與編碼關系到計算機在工程項目中充分發揮自身的功能,因此工作包的建立尤其重要。

如圖一所示工作包模型:

圖一:工作包模型

三、工程項目信息的分類體系

工程項目信息分類體系始于西方國家,經過幾十年的發展演變已經形成了多個體系,其分類領域也逐漸擴大。[3]這一演變正是工程項目信息管理內容增加的寫照。信息分類是建立WBS 的基礎,因為不同的項目參與者有不同的理解,他們各自按照自身從事的行業來制定信息分類體系,這些體系勢必會與信息分類體系對應的編碼體系有所差別。這大大影響了項目參與者與各方的信息交流,為計算機技術在建筑業中的應用帶來了不便。

在眾多工程項目信息分類體系中,ISO集眾家之所長提出了按照空間和工種的特性、設施種類、建筑材料等逐層分解的方法。這種方法目前應用最為廣泛,具體分類標準如下:

1.設施:按照用途劃分,比如房屋、道路、車站、廠房、大壩等。

2.空間:按照范圍構成劃分,比如招待所、公寓樓、娛樂區、辦公樓、道路區等。

3.分部:按照設施的物理構成部分以及一定的功能性劃分。比如外墻、供熱系統、電力系統等。

4.工作段:按照工種特性來分,且必須小于分部。比如結構工程電氣工程等。

5.建筑配件和材料:工程項目永久性的一部分,按照不同用途來進行分類。比如用于大壩觀測、用于觀測自動化系統信號傳遞等。

6.建筑輔助:在工程項目中國其臨時作用且不構成永久性的部分,比如梯子、腳手架、設備等。

這個ISO技術報告框架是多國專家學者在對本國具體工程項目進行研究后得出的工程項目分類和編碼體系。這種分類體系是在ISO技術報告上進行細分后產生的,使得層次更加清晰結構更見簡單明了,更好的突出了重點,有利于對工程項目的整體控制且包括了所有的土木工程,適合WBS的編制。

四、工程項目信息編碼的內容與方式

對項目分解體系進行編碼是項目信息編碼的主要內容,包括時間上、參與者(建設方、設計方、承包商等)建筑材料、建筑設備等有型資源的編碼和項目文檔的編碼等。

編碼可以采用字母和符號等多種方式來進行。比較常見的簡單編碼結構主要是樹狀結構,這種結構主要是指將下一級的編碼進行匯總后形成上一級,是一個如樹狀的包含關系。這種編碼方式雖然有利于信息的匯總但是這種分類方法缺陷很多,比如在擴展性上就受到了本身結構的限制。而比較復雜的編碼方式有分面結構,就是指將編碼分為不同的部分,然后對其進行結合形成完整的意義。這種結構相對于上述的樹狀結構擴展性更強。第三種編碼方式是結合了前兩種方式產生的,是指在保持樹狀結構的同時改善匯總方式,采取不同組合的方法增強擴展力度。

以上三種編碼方式已經被廣泛應用于各個國家或者地區的項目編碼體系中,但是隨著計算機應用技術水平的逐步提高,國際上比較認可的是第二種方式即分面結構。綜上所述,不同的編碼方式有不同的優點與缺點,應該根據具體情況具體分析,選擇最佳的編碼方式,保證項目的穩定性與兼容性。

五、結語

工程項目的建設必定會產生大量的數據,那么對數據進行有效的分析與整理就成為了項目管理的重點。為了滿足工作包模型及數據結構建立的需要,應當對工程項目中產生的數據進行重點統計分析,利用計算機技術,綜合整體的工程項目進行取舍,建立起工作包的關系模型。隨后透過關系模型建立數據庫模型就大大的降低了難度,更加快捷簡單。計算據數據庫是整個工程項目中應用計算機技術最為重要的部分,只有將工作包與計算機緊密結合才可能實現管理手段的飛躍。而將其結合的方式就是建立工作包,這樣可以極大的提高項目管理效率,實現高效管理。這樣可以使管理者更加靈活有效的組織調控項目計劃,對整個項目在宏觀上有足夠的認識。除此之外,WBS的運用還可以對項目實施中的進度、費用等進行嚴格的控制,保證項目按照計在控制中實施,實現效率與質量的雙贏。

參考文獻:

[1]劉金星.改進的WBS方法在工程項目管理中的應用[J].建筑經濟,2011(6):18-21

[2]王俊軍.WBS方法在工程項目管理中的應用探討[J].工程技術,2016(9):283-283

[3]張波.工程項目管理中WBS分解及實現的探討[J].中國西部科技,2014(6):4-6

第8篇:信息分類標準范文

[關鍵詞]Web3.0分眾分類標簽

[分類號]TP393 G254

隨著互聯網技術的迅猛發展,Web2.0以應用的開放性、信息傳播的交互性、讀寫并存的表達方式、社會化的聯合方式和便捷化的體驗方式,使得越來越多的網民參與到互聯網信息的創造及中。然而,隨著信息量的快速增長,由此衍生的信息雜亂無章、信息的純凈度和可信度大大降低、搜索引擎精準度下降等問題相繼出現在互聯網用戶面前,網民越來越期待及時準確地獲得切合自身需求的信息和知識,以及便捷的互動交流和信息的協同共享。面對這一問題,網絡模式急需更新換代,能夠為用戶提供一種更加高效、精確和個性化的互聯網平臺的Web3.0模式成為首選的解決方案。

1 Web3.0及其特征

Web3.0是新一代互聯網應用的統稱,它是建立在Web2.0的基礎上,包含了Web2.0的所有特點,但同時為了讓人們更好地利用網絡資源,Web3.0提供了一種方便管理、方便查找信息資料,能夠自己控制一切的全新的服務:網站內的信息可以直接和其他網站相關信息進行交互,能夠對多家網站的信息進行整合使用,并能根據用戶需求,智能化處理互聯網海量信息的整合,最終聚合用戶個性化的需求,同時實現真正意義上的互聯互通。總之,相對于Web1.0的“瀏覽和下載”、Web2.0的“參與、展示和互動”,Web3.0的核心理念是“個性、精準和智能”。其主要特征表現如下:

1.1個性化信息聚合

Web3.0最大的特點在于信息的聚合以及提供個性化的信息服務,真正的Web3.0時代不僅僅是按照用戶需求提供綜合化服務,創建綜合化服務平臺,更關鍵的是,把散布在互聯網上的各種信息點以及用戶的需求點聚合和對接起來,提供基于用戶偏好的個性化聚合服務。

1.2信息檢索的高精準度

Web3.0在對于UGC(用戶生產內容)篩選性過濾的基礎上同時引入偏好信息處理與個性化引擎技術,對用戶的行為特征進行分析,既尋找可信度高的UGC源,同時對互聯網用戶的搜索習慣進行整理、挖掘,得出最佳的設計方案,幫助互聯網用戶快速、準確地搜索到自己想要感興趣的信息內容,避免了大量信息帶來的搜索疲勞。

1.3搜索引擎的智能化

Web3.0時代的網絡是智能網絡,這是一個以整個互聯網為基礎,聚合了所有知識的智能平臺。在這樣的平臺上,用戶可用自然語言表達自己的查詢意圖,搜索引擎能夠對查詢進行解析,提取相關概念,組合查詢表達式,從而返回準確的結果;甚至,用戶可以提出完整的問題,通過搜索獲得一些問題的解決方案。

1.4多種終端平臺、跨網站和跨語言信息交互

Web3.0不僅能夠實現不同網站間的信息交互,而且還能實現不同終端的兼容。通過互聯網與通信的融合,用戶可以用所有智能終端(固定電話、移動電話、PC、IPTV以及其他智能終端)輕松享受看得見、聽得到、用得好、即時交互的信息服務。另外,Web3.0的智能翻譯引擎突破了國家、語言的限制,使用戶用自己的母語可以與全世界所有人進行交流,實現了更大范圍內的信息交流與共享。

2 分眾分類及其特征

分眾分類(Folksonomy)是隨著Web2.0而產生的新型網絡信息分類法,也叫大眾分類、社會分類、自由分類等,它就是由網絡信息用戶自發地為某類信息定義一組標簽(Tag)進行描述,并最終根據標簽被使用的頻次選用高頻標簽作為該類信息類名的一種為網絡信息分類的方法。其實質就是以詞為類,但其類目卻是平面的、非等級的,它是用戶用標簽對感興趣的資料進行分類,并與他人共享標簽的過程和結果。

2.1分眾分類的優勢

與傳統網絡信息分類方法相比,分眾分類最大的不同之處在于,它并不采用嚴格的分類標準,其分類全部由用戶直接提交,分類的形成過程完全是自發的。分眾分類的主要機制基于“開放性元數據標準”和“自然語言社群聚類”。其優勢主要表現在:首先,分眾分類的標簽形成過程充分體現了其自由性,任何用戶都可以自由選擇自然語言語詞來對感興趣的資源進行標注,從而可以從多個維度來揭示信息內容;其次,分眾分類具備實時性與適應性,用戶可以隨時對其閱讀或創建的內容和主題創建標簽,并立即保存下來,并被允許即時快速的進行標簽用語的修改;第三,分眾分類為用戶提供了共享標簽的功能,任何人對內容進行標注后,他人可立刻看到這些標簽,也可以點擊這些標簽,進而看到更多使用這個標簽的信息內容,或是與此相近的內容。

2.2分眾分類的局限

作為使用非控詞匯的分眾分類目前還存在一定的局限性,具體表現如下:

2.2.1標簽的多樣性 由于用戶認知程度不同,對同一事物的揭示程度也存在很大的差異,導致不同用戶在標注同一信息時使用了不同的標簽,但是系統卻無法創建這些標簽之間的聯系。標簽的多樣性極大的影響系統的檢全率。

2.2.2標簽的模糊性 分眾分類是一種基于標簽語法層次的簡單聚合分類,因此,同一標簽可能映射出不同語義的資源,而系統卻不能識別出各個語義的不同。標簽的模糊性使用戶不得不花更多的時間和精力找到與檢索標簽相關的記錄,因而影響到系統的檢準率。

2.2.3標簽的扁平化組織 分眾分類的組織方式與傳統的等級體系分類法組織方式不同,它是扁平化的,沒有等級層次的劃分。因此,系統無法識別各個標簽之間的等級層次聯系。一方面,這種由于標簽缺乏等級控制造成的信息分散也必然影響了信息的檢全率;另一方面,類目的平面非等級顯示同樣會隱藏一些有價值的信息。同時,信息越多利用標簽直接找到相關信息就越困難。

2.2.4系統間的交互性很低 很多網絡系統都具有標注資源和分享標簽的能力,但是目前各個分眾分類系統在語義表達和格式規范上并不一致,這不僅阻礙了各個系統之間的信息交互和軟件的自動化處理,同時也引發了一系列檢索方面的問題。另外,受語言、文化背景等因素的影響,跨國界、跨文化的分眾分類系統之間的交互性更低。

2.2.5標簽問語義關系缺乏 分眾分類是以高頻標簽作為類目的一種信息分類方法,其分類結構是平面的,標簽間是平等關系,缺乏對標簽間的層次體系關系、屬性關系和其他的復雜語義關系的描述,而標簽間語義關系的缺乏不僅影響到檢索的精準度,更重要的是對智能化搜索帶來諸多障礙。

3 Web3.0對分眾分類的需求

Web3.0的基礎是Web2.0,因而,分眾分類也是Web3.0的一種主要的信息組織方式。但是目前分眾分類所具有的上述局限性顯然阻礙了Web3.0的核心理念――“精準、個性和智能”的真正實現,Web3.0的發展需求決定了分眾分類的發展方向,因而,未來的分眾分類還需要在以下幾個方面進一步拓展。

3.1微內容的自由整合與過濾研究

微內容是Web3.0的基本信息單元,由于Web3.0同樣具有草根性,其內容良莠不齊,有價值的專業分析討論與各種雜談閑聊摻雜在一起,因而首先需要對微內容進行篩選性的過濾研究。這部分的研究主要包括:研究分析用戶的行為特征,尋找可信度高的微內容源;對微內容的價值進行判定,并按價值量的高低作不同處理;對垃圾信息進行有效過濾等等;其次,研究如何應用Mashup技術對用戶生成的微內容進行整合,如何利用ONTO/RSS基礎聚合技術對微內容進行有效聚合,從而使信息的特征性更加明顯,為實現Web3.0的“個性化”打下基礎。

3.2微內容的標準化與結構化研究

要實現Web3.0的跨平臺、跨社區、跨語言的信息共享,需要對微內容進行標準化與結構化研究,提出一個通用的數據標準。這方面的研究主要包括微內容的拆分標準、屬性選擇、結構化表征、數據邏輯結構標準以及數據的存儲結構標準等,其目的是使微信息之間實現互動,讓Web完全可編程,從而滿足復雜程序的需求,為信息在不同的應用平臺之間的整合和傳播提供支撐。目前,有關微內容的標準化和結構化的研究則僅限于企業網站的構建,如紅門資訊在微內容的拆分、詞義標準化和結構化等方面進行了深入的研究,其推出的公用信息平臺已經實現了廠家信息、商家信息、品牌信息、文章信息等160多類信息平臺間的自由互動。但目前整個IT行業中并沒有一套完善的有關微內容的拆分、屬性選擇、結構化表示等方面的標準,這對實現整個互聯網信息的無縫連接帶來障礙。

3.3標注的規范控制研究

Web3.0核心理念之一是“精準”,而因為網絡用戶標注行為缺乏控制,導致標簽的多樣性、模糊性和隨意性等缺點,進而影響到檢索的精準度,因而需要對用戶的標注行為進行規范性控制。主要研究包括:如何利用受控詞表等對同義詞、近義詞、專有名詞等進行限定,并構建規范的標引詞庫推薦用戶使用;如何確定標簽的含義以及標簽間的關聯,以幫助用戶在創建標簽時進行選擇;如何利用后控手段對不斷產生的大量標簽進行篩選、融合和規范化處理,并將其與核心標簽關聯等等。其目的避免網絡用戶生產出各種錯誤的、無意義的、不規則的標簽,從而提高標簽系統的準確性、兼容性和開放性,以實現標簽集合的移植與共享,促進不同網絡信息系統對信息資源的協同組織。目前,國內外學者都對標簽的規范控制研究顯示出極大的興趣,紛紛提出了多種規范標注行為,從而提高標簽質量的解決措施,如有些網站在用戶標注時提供一些規范詞供用戶選擇,或對用戶的標注結果進行詞義轉換等,但總的來說研究的系統性不夠,其深度和廣度都有待加深與拓寬,從而提高檢索的“精準度”。

3.4標簽的基本屬性研究

標簽是分眾分類形成和使用的基礎,也是分眾分類類目體系的基本構成單元。標簽指代并標示Web3.0環境中的各種微內容,通過查找標簽能夠檢索到關聯的微內容。因而,標簽本身的相關屬性決著信息檢索的質量和效率,所以,需要對標簽的特征、標簽的價值判定(包括垃圾標簽的處理)、標簽使用量的分布規律、標簽的賦予權、標簽的翻譯、標簽庫的構建等展開進一步的研究;同時,因為目前的標簽比較側重于橫向關系的表達,而專業性、學術性信息的表達則需要縱向和橫向兩個方面的參照系,因而,如何加強縱向關系的表達,仍然有待于進一步研究。目前,對標簽的特征、標簽價值判定的相關研究比較多,而對標簽使用量的分布規律、標簽的賦予權、標簽的翻譯、標簽庫的構建等方面的研究相對較少。

3.5傳統分類法與大眾分類法的融合研究

分眾分類是由網絡用戶的自發標引行為產生,盡管這在一定程度上體現了用戶對知識分類的共性,但由于不同使用目的對信息的類分會使得相同的信息被劃分在不同的類別中。這種平面勝的分類體系,既無法準確地表達出相關標簽的層次,也難揭示出信息之間復雜的關系;另外,受大眾淺層信息需求的誤導,很多有價值的信息也容易被淹沒。因而,分眾分類的質量無法滿足Web3.0檢索精準度的需求。而傳統分類法特別是文獻分類法歷史悠久,在一定程度上體現了知識分類的科學性。為此,應該將分眾分類與傳統分類法進行融合,以提高信息分類的質量和效率,如可先對選定范圍內全部信息劃分大類的基礎上允許網絡用戶再進行知識細分。把眾多的標簽先按人為大類存放,既增強了標引一致性,又降低了平面非等級結構的標簽所帶來的檢索難度。

3.6標簽的聚類研究

由于分眾分類允許用戶使用不同的標簽來標記相似的資源,但并不了解這些標簽之間的關系,因而其內容檢索機制受到嚴重的阻礙。為克服這一局限,有必要針對標簽的統計學規律、標簽間的共現分析、層次分析、標簽與特定人和物的相關度、標簽間的相似度比較等問題進行聚類分析,其目的是尋找相關標簽群,從而形成立體的分類體系,并在此基礎上展開標簽關系庫的構建研究。顯然,這部分的研究有助于實現Web3.0的“精準”和“個性化信息聚合”。

3.7標簽間的關聯研究

Web3.0的特征之一是要讓用戶跨越不同的應用平臺,并共享不同社區的信息資源,而這種信息的共享除了需要相關內容的標準化、結構化和規范化研究外,更重要的是通過標簽的方式進行相互鏈接,現有的標簽只能做到對站內的關鍵詞進行關聯,不同網站之間站信息沒有形成真正的網絡和關聯,往往存在信息“孤島”,常常要借助其他的搜索引擎,因而未來的研究應該著重予標簽間關聯的深化研究。一方面,研究同一網站中同一文本和不同文本間的所有標簽之間的自動鏈接技術;另一方面,研究不同網站間標簽的關聯,從而在更大范圍、更高層次上建立起詞間關系網絡,為實現Web3.0的“跨平臺”信息交互打下基礎。

3.8標簽與本體的結合研究

本體是在語義網環境下為解決語義歧義、實現信息智能處理而提出的一種形式化描述的、共享的概念認知模型,它是對某一領域知識的規范化描述,不僅提供了概念明確的定義,而且揭示了概念問豐富的語義關系,使知識能夠在人與人之間、人和系統之間以及各種異構系統之間進行廣泛的共享和交流。顯然,本體所具備的特性正好彌補了分眾分類的許多不足,因而,需要充分挖掘標簽間的語義關系,將標簽與本體進行結合研究。具體研究包括:分析分眾分類中用戶、網絡資源和標簽三者之間的同現關系,對分眾分類中的各種標簽進行語義分析,研究標簽之間的主題相關性,并給出這些標簽間相互關系的明確定義,同時探討如何基于標簽的語義關系構建被標注對象之間的聯系,并在標簽中建立起概念層次,構建大眾標注中各類標簽詞的本體,從而構成語義Web的基礎,真正實現web3.0的“智能化”。目前,這方面的研究多集中在標簽語義的提取、標簽本體的構建等方面,并推出了多種語義標注平臺。但是目前在大多數語義標注的過程中仍需要大量人工的輔助,標注平臺的可用性、互用性、重用性和擴展性較差,需要進一步提高。

3.9用戶興趣模型構建研究

第9篇:信息分類標準范文

概念模型的作用

概念模型是對某一領域信息高度抽象化的靜態描述,它包括類、類關聯和類屬性等模型基本元素的定義,是進一步細化應用系統模型的基礎。

1994年,國際標準化組織第215技術委員會提出了“衛生信息建模框架”。該框架說明了信息模型應當是由概念模型到邏輯模型,最后細化到物理模型。2002年美國CDC在“公共衛生概念數據模型”一文中提出信息模型可劃分為主題域模型、類關系模型、概念數據模型、邏輯數據模型、數據庫設計模型和物理數據庫模型,它們分別處于上、中、下三個層級,這種層級關系與ISO提出的層級結構一致,只是美國CDC的層級劃分更加細致。

因此,概念模型是連接高層模型和低層模型的橋梁和紐帶。對于一個具體信息的開發過程而言,上層模型在某個領域內是高度抽象和概括的,它們不涉及過多的細節,獨立于具體的信息系統; 對整個領域的信息化建設都具有指導意義,它是信息標準化的基礎。

公共衛生信息領域具有多領域跨學科的特點。概念模型提供了一個易于理解的公共衛生信息的整體框架,是公共衛生數據字典的基礎框架。在概念模型的指導下,對公共衛生數據元的理解和應用變得更加方便和容易。因此,概念模型將為公共衛生信息系統的開發提供一個整體框架和數據應用指南。

在公共衛生信息領域內,該概念模型可以支持多個信息系統的開發,減少重復性工作,降低開發成本,加快系統的開發速度。在同一個概念模型指導下開發的多個系統間具有良好的一致性,同時也為系統間的數據交換與共享奠定良好基礎。

概念模型的構建方法

對于一個具體系統而言,建立一個模型不是很困難,但建立一個抽象的元模型――概念模型則要困難得多。建立國家公共衛生概念模型需要經歷從具體到抽象這樣一個反復的過程。HL7(Health Level 7)推薦的建立概念模型的技術路線與方法是從用例分析到信息分析,最后到建立概念信息模型。

類、類關聯、類屬性和數據類型是概念模型的重要組成部分。概念模型中的類屬性同樣具有較高的抽象性和一般性,發現這些屬性也需要經過從具體實例分析――領域信息分析――概念信息模型分析這樣一個抽象與泛化的過程。

我國公共衛生信息概念模型的構建主要是通過以下步驟實現的:

1. 主題域的確定

信息是對于活動、活動關聯方以及它們之間關系的抽象與描述。在公共衛生領域,參照美國CDC提出的公共衛生概念數據模型(PHCDM),將我國公共衛生劃分為衛生相關活動、參與者、材料和位置4個主題域。其中衛生相關活動是衛生信息來源的主體,是四個主題域中最重要、最活躍的一個,而其余三個均為活動的關聯方,位置說明活動發生的地點,參與者為活動的參與方如衛生服務的提供方或接受方,材料是活動中所涉及的物質,比如標本、菌株等等。這些構成了公共衛生信息概念模型的四個主題域。

2. 類

具有相同屬性的同類事物、概念組成類。以上四個主題域各為一類,每個主題域下又可以分成若干主類。以衛生相關活動為例,結合我國公共衛生信息的分類框架,可以將衛生相關活動抽象為四個主類――疾病預防控制、公共衛生服務、公共衛生管理及衛生監督。

3. 類關聯與屬性設置

類之間存在一定的聯系,稱為類關聯,其作用在于使不同的類形成一個完整、聯系的結構。在公共衛生信息概念模型的建模中,主要涉及父子類關聯,關系關聯和參與關聯三種類關聯。

父子類關聯指的是每個類(主類或子類)下面還可以根據實際劃分為若干更小的類。上位類(通稱為父類)與下位類(通稱為子類)關聯稱為父子類關聯。很顯然,子類對于父類的屬性有繼承的關系。

關系關聯描述的是在同一主類內部各個類或者是實例之間的關聯關系,如疾病預防控制主類的不同活動之間(疫情暴發與檢測之間)的關系。

參與關聯則是指不同主類的類之間發生的關系。例如疫情監測類(屬于衛生相關活動主題域的某個類)與調查者(屬于參與者主題域的某個類),或者與標本(屬于材料主題域中的某個類)之間存在參與的關系等。

屬性是對類以及類關聯所具有的特性的描述,是描述類的特征的元數據,改變屬性的值可以改變類的行為和外觀。概念模型類屬性設置應遵循HL7 RIM所規范的屬性格式及內容,在此基礎上按照自身的需求精化、修飾屬性,形成模型獨特的屬性。

4. 概念模型的建模技術與方法

首先是應用UML的用例分析方法進行業務分析。這是指對業務過程中所有參與元素的拆解、對比、描述、再定義與組合。然后在用例分析的基礎上,進行泛化分析。即對各組成元素進行分析、判別、抽象,并歸納成不同的類。下圖1為在衛生檢測中的幾個用例分析過程。圖2為泛化與抽象過程。經過泛化與抽象,對衛生檢測相關活動,可提煉出5個子類: 申請、受理、檢測、報告、質量控制。用例分析與泛化是公共衛生信息概念模型建模的重要階段和技術,要應用于公共衛生信息概念模型建模的全過程中。

公共衛生概念模型框架與內容

我國公共衛生信息的概念模型包括了4個主題域及35個類。其核心為4個主題域(衛生相關活動,參與者、材料及位置)。在模型的建立中,公共衛生相關活動主題域及各級子類的確定采用了公共衛生信息分類框架的結果。作為模型,還對其他3個主題域進行了詳細的分類,并增加了關聯類的內容及對于類屬性描述的要求。在這里要區分信息分類與模型之間的關系及區別。信息分類框架關心的是對信息的分類,確定信息所在的位置以便用戶存放、查找及使用,因此并不涉及對于主題域、類之間的關聯以及類屬性的描述。而建立模型的目的是為了理解信息,描述信息。理解信息包括了解信息的來源(借助于信息框架)及關聯,描述信息包括對數據元這個信息的基本單元屬性及關聯的描述,以便在統一的規范下查詢、使用信息。

概念模型的應用

概念模型可以輔助系統設計者分析所需要采集的數據及屬性,建立相應的邏輯數據模型(Logical Data Model),從而規范信息系統的建設。下面以傷害監測為例說明模型的應用。

主站蜘蛛池模板: 久久久91精品国产一区二区三区 | 国语自产偷拍精品视频偷| 冲田杏梨AV一区二区三区| japanmilkhdxxxxxmature| 波多野结衣教室| 国产精品99久久精品爆乳| 丁香花免费高清视频完整版 | 国产精品无码专区在线观看| 么公的又大又深又硬又爽视频| 精品欧美一区二区在线观看 | 亚洲综合综合在线| 免费观看激色视频网站(性色)| 富女玩鸭子一级毛片| 亚洲国产精品网| 精品欧美一区二区在线观看| 国产真实乱子伦视频播放| eeuss影院130020部| 最近免费中文字幕视频高清在线看 | 久久综合九色欧美综合狠狠| 看全色黄大色黄大片视| 国产在线播放你懂的| 91精品国产91久久久久久青草| 成人黄页网站免费观看大全 | 无码av大香线蕉伊人久久| 亚洲伊人久久大香线蕉影院| 精品久久久久久无码专区| 国产又粗又猛又爽又黄的免费视频| 一级一片一a一片| 欧美性活一级视频| 国产乱码精品一区二区三区中 | 人妻aⅴ无码一区二区三区| 蜜桃成熟时1997在线看免费看| 女人18片毛片60分钟| 久久精品国内一区二区三区| 毛片视频网站在线观看| 午夜阳光电影在线观看| 天堂资源中文在线| 天天干视频网站| 久久精品国产2020| 玩物无删减版180分钟| 国产一区二区三区日韩精品|