- 相關(guān)推薦
復(fù)雜網(wǎng)絡(luò)交疊團(tuán)模糊分析與信息挖掘論文(精選8篇)
在學(xué)習(xí)、工作生活中,說(shuō)到論文,大家肯定都不陌生吧,借助論文可以有效提高我們的寫(xiě)作水平。為了讓您在寫(xiě)論文時(shí)更加簡(jiǎn)單方便,以下是小編收集整理的復(fù)雜網(wǎng)絡(luò)交疊團(tuán)模糊分析與信息挖掘論文,歡迎大家分享。
復(fù)雜網(wǎng)絡(luò)交疊團(tuán)模糊分析與信息挖掘論文 篇1
摘 要:針對(duì)復(fù)雜網(wǎng)絡(luò)交疊團(tuán)的聚類(lèi)與模糊分析方法設(shè)計(jì)問(wèn)題,給出一種新的模糊度量及相應(yīng)的模糊聚類(lèi)方法,并以新度量為基礎(chǔ),設(shè)計(jì)出兩種挖掘網(wǎng)絡(luò)模糊拓?fù)涮卣鞯男轮笜?biāo):團(tuán)間連接緊密程度和模糊點(diǎn)對(duì)交疊團(tuán)的連接貢獻(xiàn)度,并將其用于網(wǎng)絡(luò)交疊模塊拓?fù)浣Y(jié)構(gòu)宏觀分析和團(tuán)間關(guān)鍵點(diǎn)提取。實(shí)驗(yàn)結(jié)果表明,使用該聚類(lèi)與分析方法不僅可以獲得模糊團(tuán)結(jié)構(gòu),而且能夠揭示出新的網(wǎng)絡(luò)特征。該方法為復(fù)雜網(wǎng)絡(luò)聚類(lèi)后分析提供了新的視角。
針對(duì)復(fù)雜網(wǎng)絡(luò)交疊團(tuán)的聚類(lèi)與模糊剖析辦法設(shè)計(jì)Issue(問(wèn)題),給出一種新的模糊度量及對(duì)應(yīng)的模糊聚類(lèi)辦法,并以新度量為根底,設(shè)計(jì)出兩種發(fā)掘網(wǎng)絡(luò)模糊拓?fù)涮卣鞯男履繕?biāo):團(tuán)間銜接嚴(yán)密水平和模糊點(diǎn)對(duì)交疊團(tuán)的銜接奉獻(xiàn)度,并將其用于網(wǎng)絡(luò)交疊模塊拓?fù)錁?gòu)造微觀剖析和團(tuán)間關(guān)鍵點(diǎn)提取。實(shí)驗(yàn)后果標(biāo)明,運(yùn)用該聚類(lèi)與剖析辦法不只能夠取得模糊勾結(jié)構(gòu),并且可以提醒出新的網(wǎng)絡(luò)特征。該辦法為復(fù)雜網(wǎng)絡(luò)聚類(lèi)后剖析提供了新的視角。
關(guān)鍵詞:網(wǎng)絡(luò)模糊聚類(lèi);團(tuán)—點(diǎn)相似度;團(tuán)間連接緊密度;團(tuán)間連接貢獻(xiàn)度;對(duì)稱(chēng)非負(fù)矩陣分解;
網(wǎng)絡(luò)宏觀拓?fù)鋱F(tuán)結(jié)構(gòu)是復(fù)雜網(wǎng)絡(luò)普遍而又重要的拓?fù)鋵傩灾,具有團(tuán)內(nèi)連接緊密、團(tuán)間連接稀疏的特點(diǎn)。網(wǎng)絡(luò)團(tuán)結(jié)構(gòu)提取是復(fù)雜網(wǎng)絡(luò)分析中的一個(gè)基本步驟。揭示網(wǎng)絡(luò)團(tuán)結(jié)構(gòu)的復(fù)雜網(wǎng)絡(luò)聚類(lèi)方法[1~5]對(duì)分析復(fù)雜網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、理解其功能、發(fā)現(xiàn)其隱含模式以及預(yù)測(cè)網(wǎng)絡(luò)行為都具有十分重要的理論意義和廣泛的應(yīng)用前景。目前,大多數(shù)提取方法不考慮重疊網(wǎng)絡(luò)團(tuán)結(jié)構(gòu),但在多數(shù)網(wǎng)絡(luò)應(yīng)用中,重疊團(tuán)結(jié)構(gòu)更為普遍,也更具有實(shí)際意義。
現(xiàn)有的網(wǎng)絡(luò)重疊團(tuán)結(jié)構(gòu)提取方法[6~10]多數(shù)只對(duì)團(tuán)間模糊點(diǎn)進(jìn)行初步分析,如Nepusz等人[9,10]的模糊點(diǎn)提取。針對(duì)網(wǎng)絡(luò)交疊團(tuán)結(jié)構(gòu)的深入拓?fù)浞治,本文介紹一種新的團(tuán)—點(diǎn)相似度模糊度量。由于含有確定的.物理含意和更為豐富的拓?fù)湫畔,用這種模糊度量可進(jìn)一步導(dǎo)出團(tuán)與團(tuán)的連接緊密程度,以及模糊節(jié)點(diǎn)對(duì)兩團(tuán)聯(lián)系的貢獻(xiàn)程度,并設(shè)計(jì)出新指標(biāo)和定量關(guān)系來(lái)深度分析網(wǎng)絡(luò)宏觀拓?fù)溥B接模式和提取關(guān)鍵連接節(jié)點(diǎn)。本文在三個(gè)實(shí)際網(wǎng)絡(luò)上作了實(shí)驗(yàn)分析,其結(jié)果表明,本方法所挖掘出的網(wǎng)絡(luò)拓?fù)涮卣餍畔榫W(wǎng)絡(luò)的模糊聚類(lèi)后分析提供了新的視角。
1、新模糊度量和最優(yōu)化逼近方法
設(shè)A=[Aij]n×n(Aij≥0)為n點(diǎn)權(quán)重?zé)o向網(wǎng)絡(luò)G(V,E)的鄰接矩陣,Y是由A產(chǎn)生的特征矩陣,表征點(diǎn)—點(diǎn)距離,Yij>0。假設(shè)圖G的n個(gè)節(jié)點(diǎn)劃分到r個(gè)交疊團(tuán)中,用非負(fù)r×n維矩陣W=[Wki]r×n來(lái)表示團(tuán)—點(diǎn)關(guān)系,Wki為節(jié)點(diǎn)i與第k個(gè)團(tuán)的關(guān)系緊密程度或相似度。W稱(chēng)為團(tuán)—點(diǎn)相似度矩陣。
Mij=rk=1WkiWkj(1)
若Wki能精確反映點(diǎn)i與團(tuán)k的緊密度,則Mij可視為對(duì)點(diǎn)i、j間相似度Yij的一個(gè)近似。所以可用矩陣W來(lái)重構(gòu)Y,視為用團(tuán)—點(diǎn)相似度W對(duì)點(diǎn)—點(diǎn)相似度Y的估計(jì):
W TW→Y(2)
用歐式距離構(gòu)造如下目標(biāo)函數(shù):
minW≥0 FG(Y,W)=‖Y—W TW‖F(xiàn)=12ij[(Y—W TW)。(Y—W TW)]ij(3)
其中:‖‖F(xiàn)為歐氏距離;A。B表示矩陣A、B的Hadamard 矩陣乘法。由此,模糊度量W的實(shí)現(xiàn)問(wèn)題轉(zhuǎn)換為一個(gè)最優(yōu)化問(wèn)題,即尋找合適的W使式(3)定義的目標(biāo)函數(shù)達(dá)到最小值。
式(3)本質(zhì)上是一種矩陣分解,被稱(chēng)為對(duì)稱(chēng)非負(fù)矩陣分解,或s—NMF (symmetrical non—negative matrix factorization)。s—NMF的求解與非負(fù)矩陣分解NMF[11,12]的求解方法非常類(lèi)似。非負(fù)矩陣分解將數(shù)據(jù)分解為兩個(gè)非負(fù)矩陣的乘積,得到對(duì)原數(shù)據(jù)的簡(jiǎn)化描述,被廣泛應(yīng)用于各種數(shù)據(jù)分析領(lǐng)域。類(lèi)似NMF的求解,s—NMF可視為加入限制條件(H=W)下的NMF。給出s—NMF的迭代式如下:
Wk+1=Wk。[WkY]/[WkW TkWk](4)
其中:[A]/[B]為矩陣A和B的Hadamard矩陣除法。
由于在NMF中引入了限制條件,s—NMF的解集是NMF的子集,即式(4)的迭代結(jié)果必落入NMF的穩(wěn)定點(diǎn)集合中符合附加條件(H=W)的部分,由此決定s—NMF的收斂性。
在求解W之前還需要確定特征矩陣。本文選擴(kuò)散核[13]為被逼近的特征矩陣。擴(kuò)散核有明確的物理含義,它通過(guò)計(jì)算節(jié)點(diǎn)間的路徑數(shù)給出任意兩節(jié)點(diǎn)間的相似度,能描述網(wǎng)絡(luò)節(jié)點(diǎn)間的大尺度范圍關(guān)系,當(dāng)兩點(diǎn)間路徑數(shù)增加時(shí),其相似度也增大。擴(kuò)散核矩陣被定義為
K=exp(—βL)(5)
其中:參數(shù)β用于控制相似度的擴(kuò)散程度,本文取β=0.1;L是網(wǎng)絡(luò)G的拉普拉斯矩陣:
Lij=—Aiji≠j
kAiki=j(6)
作為相似度的特征矩陣應(yīng)該是擴(kuò)散核矩陣K的歸一化形式:
Yij=Kij/(KiiKjj)1/2(7)
基于擴(kuò)散核的物理含義,團(tuán)—點(diǎn)相似度W也具有了物理含義:團(tuán)到點(diǎn)的路徑數(shù)。實(shí)際上,W就是聚類(lèi)結(jié)果,對(duì)其列歸一化即可得模糊隸屬度,需要硬聚類(lèi)結(jié)果時(shí),則選取某點(diǎn)所對(duì)應(yīng)列中相似度值最大的團(tuán)為最終所屬團(tuán)。
2、團(tuán)—團(tuán)關(guān)系度量
團(tuán)—點(diǎn)相似度W使得定量刻畫(huà)網(wǎng)絡(luò)中的其他拓?fù)潢P(guān)系成為可能。正如W TW可被用來(lái)作為點(diǎn)與點(diǎn)的相似度的一個(gè)估計(jì),同樣可用W來(lái)估計(jì)團(tuán)—團(tuán)關(guān)系:
Z=WW T(8)
其物理含義是團(tuán)與團(tuán)間的路徑條數(shù)。很明顯,Z的非對(duì)角元ZJK刻畫(huà)團(tuán)J與團(tuán)K之間的緊密程度,或團(tuán)間重疊度,對(duì)角元ZJJ則刻畫(huà)團(tuán)J的團(tuán)內(nèi)密度。
以圖1中的對(duì)稱(chēng)網(wǎng)絡(luò)為例,二分團(tuán)時(shí)算得
Z=WW T=1.337 60.035 3
0.035 31.337 6
由于圖1中的網(wǎng)絡(luò)是對(duì)稱(chēng)網(wǎng)絡(luò),兩團(tuán)具有同樣的拓?fù)溥B接模式,它們有相同的團(tuán)內(nèi)密度1.337 6,而團(tuán)間重疊度為0.035 3。
復(fù)雜網(wǎng)絡(luò)交疊團(tuán)模糊分析與信息挖掘論文 篇2
[摘 要]目前,隨著現(xiàn)代科技的發(fā)展,互聯(lián)網(wǎng)已成為當(dāng)代主流,互聯(lián)網(wǎng)技術(shù)的應(yīng)用已經(jīng)是任何一個(gè)國(guó)家所不能脫離的,經(jīng)濟(jì)全球化已成為一個(gè)必然的趨勢(shì),在這樣的一個(gè)大數(shù)據(jù)時(shí)代,人民對(duì)信息的獲取需求呈直線(xiàn)上升的狀態(tài)。21世紀(jì)作為一個(gè)信息時(shí)代,網(wǎng)絡(luò)信息的安全防范也顯得尤為重要,而Web數(shù)據(jù)的數(shù)據(jù)技術(shù),對(duì)于網(wǎng)絡(luò)信息安全防范來(lái)說(shuō),是一個(gè)新的技術(shù)運(yùn)用。本文從Web數(shù)據(jù)挖掘技術(shù)的基本概述入手,分析我國(guó)企業(yè)在網(wǎng)絡(luò)信息安全方面存在的問(wèn)題,最后提出將網(wǎng)絡(luò)信息安全防范與Web數(shù)據(jù)挖掘技術(shù)進(jìn)行整合運(yùn)用。
[關(guān)鍵詞]Web數(shù)據(jù)挖掘技術(shù);網(wǎng)絡(luò)信息;安全防范
引 言
世界是發(fā)展的,事物是不斷變化的,21世紀(jì)是一個(gè)大數(shù)據(jù)時(shí)代,互聯(lián)網(wǎng)技術(shù)顯得越來(lái)越重要。在科技發(fā)展的同時(shí),互聯(lián)網(wǎng)也在家家戶(hù)戶(hù)普及,然而網(wǎng)絡(luò)安全問(wèn)題卻隨之而來(lái),人們?cè)谶\(yùn)用科技時(shí)也在擔(dān)心網(wǎng)絡(luò)技術(shù)的安全性。鑒于此,本文探討利用Web數(shù)據(jù)挖掘技術(shù)來(lái)控制網(wǎng)絡(luò)安全,以提高網(wǎng)絡(luò)信息安全度。
1、Web數(shù)據(jù)挖掘技術(shù)概述
Web使用記錄挖掘方式是挖掘網(wǎng)絡(luò)上的瀏覽記錄,然后進(jìn)行分析,同時(shí)還可以獲取其他企業(yè)的信息。通過(guò)使用Web數(shù)據(jù)挖掘技術(shù),企業(yè)可以進(jìn)行復(fù)雜的操作,然后從網(wǎng)頁(yè)瀏覽記錄分析出自身企業(yè)的受關(guān)注度,并了解同行競(jìng)爭(zhēng)企業(yè)的詳細(xì)信息,尋找自身的不足。
1.1 Web數(shù)據(jù)挖掘技術(shù)的含義
Web數(shù)據(jù)挖掘技術(shù),指的是通過(guò)自身的技術(shù),在獲取網(wǎng)上資源的同時(shí),尋找到企業(yè)感興趣的信息資料。圖1為Web數(shù)據(jù)發(fā)掘技術(shù)工作流程。
Web數(shù)據(jù)發(fā)掘技術(shù)可以涉及多個(gè)領(lǐng)域,通過(guò)多種數(shù)據(jù)挖掘方式,為企業(yè)找到有用的信息資源。整體來(lái)說(shuō),Web挖掘技術(shù)有兩種類(lèi)型,一是建立在人工智能模型的基礎(chǔ)上來(lái)實(shí)現(xiàn),類(lèi)似于決策樹(shù)、分類(lèi)等;二是建立在統(tǒng)計(jì)模型基礎(chǔ)上來(lái)實(shí)現(xiàn),類(lèi)似于神經(jīng)網(wǎng)絡(luò)、自然計(jì)算法等。
1.2 Web數(shù)據(jù)挖掘技術(shù)的兩種方式
Web數(shù)據(jù)挖掘技術(shù)整體上來(lái)說(shuō)有兩種方式,分別為內(nèi)容挖掘和使用記錄挖掘。Web內(nèi)容挖掘指的是企業(yè)可以通過(guò)Web挖掘技術(shù),自己從網(wǎng)上尋找對(duì)企業(yè)有用的信息資源,同時(shí)對(duì)后臺(tái)設(shè)置進(jìn)行監(jiān)控,減少某些重要交易內(nèi)容的丟失、泄露。企業(yè)還可以通過(guò)Web挖掘技術(shù),查詢(xún)某些用戶(hù)的操作記錄,對(duì)企業(yè)的網(wǎng)絡(luò)信息安全進(jìn)行檢查審核,從而降低企業(yè)信息被不法分子竊取的風(fēng)險(xiǎn)。由于其他企業(yè)也有同樣的Web數(shù)據(jù)挖掘技術(shù),因此,企業(yè)也不能深入地去探索同行企業(yè)的內(nèi)部信息,但其通過(guò)該技術(shù),可以分析其他企業(yè)的基本信息資源,然后整合出對(duì)自身有用的資源,從而制定企業(yè)市場(chǎng)戰(zhàn)略。
2、我國(guó)企業(yè)在網(wǎng)絡(luò)信息安全方面存在的問(wèn)題
目前,科技的發(fā)展,使全球的政治、經(jīng)濟(jì)一體化趨勢(shì)越來(lái)越明顯,互聯(lián)網(wǎng)的進(jìn)步也使國(guó)家企業(yè)面臨著更多的`挑戰(zhàn)。我國(guó)企業(yè)在網(wǎng)絡(luò)信息安全方面存在的問(wèn)題也逐步顯現(xiàn),而網(wǎng)絡(luò)信息安全技術(shù)人才緊缺是較為明顯的一個(gè)問(wèn)題。
2.1 人才緊缺問(wèn)題
21世紀(jì)是一個(gè)互聯(lián)網(wǎng)的世紀(jì),我國(guó)目前正在積極地吸收、引進(jìn)人才,同時(shí)也在不斷地走出去,各行各業(yè)面臨的壓力也在逐漸變大,要想在快速發(fā)展的世界潮流中占據(jù)一席之地,我國(guó)必須積極發(fā)展自己的科技產(chǎn)業(yè)。目前,我國(guó)的計(jì)算機(jī)信息技術(shù)水平,在總體上還落后于其他很多國(guó)家,而在該方面的人才緊缺問(wèn)題,是目前一個(gè)很明顯的現(xiàn)象。我國(guó)在該領(lǐng)域常常要引進(jìn)國(guó)外技術(shù),受制于人,這也就間接地將自己的弊端暴露于人前,因此,我國(guó)要積極培養(yǎng)具有計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的高端人員,從而促進(jìn)該領(lǐng)域不斷實(shí)現(xiàn)創(chuàng)新。
2.2 自身安全技術(shù)漏洞問(wèn)題
除了人才緊缺,我國(guó)的網(wǎng)絡(luò)產(chǎn)品自身還存在許多的安全技術(shù)漏洞。從近幾年的市場(chǎng)經(jīng)濟(jì)發(fā)展現(xiàn)狀來(lái)看,我國(guó)很多的電子產(chǎn)品被國(guó)外壟斷,如蘋(píng)果、微軟等高端電子產(chǎn)品,在我國(guó)占有很大的市場(chǎng)份額。我國(guó)要想重新將自己的電子產(chǎn)品推向市場(chǎng),就目前的形勢(shì)來(lái)看,還需要很大的努力,國(guó)民崇尚國(guó)外產(chǎn)品,不是為了標(biāo)榜自己的地位,更多的是國(guó)外產(chǎn)品的性能確實(shí)比我國(guó)的要好。因此,通過(guò)我國(guó)網(wǎng)絡(luò)產(chǎn)品自身存在的安全技術(shù)漏洞可以看出,我國(guó)在網(wǎng)絡(luò)安全技術(shù)方面存在許多的不足。
3、網(wǎng)絡(luò)信息安全防范與Web數(shù)據(jù)挖掘技術(shù)的整合
近幾年,網(wǎng)絡(luò)信息安全問(wèn)題一直是國(guó)民較為關(guān)注的一個(gè)話(huà)題,我國(guó)也在該方面加大了防范力度。國(guó)家在發(fā)展創(chuàng)新互聯(lián)網(wǎng)技術(shù)的同時(shí),也不能忽略其安全問(wèn)題。網(wǎng)絡(luò)信息安全,關(guān)乎我國(guó)企業(yè)的發(fā)展,是企業(yè)重要資料不外漏的重要保護(hù)屏障,本文將網(wǎng)絡(luò)信息安全防范與Web數(shù)據(jù)挖掘技術(shù)進(jìn)行整合(見(jiàn)圖2),旨在提高網(wǎng)絡(luò)信息環(huán)境的安全度,提高我國(guó)網(wǎng)絡(luò)信息安全防范能力。
本文初探Web數(shù)據(jù)挖掘技術(shù)與網(wǎng)絡(luò)信息安全防范的整合,將分別從4個(gè)方面來(lái)提高我國(guó)的網(wǎng)絡(luò)信息安全性能。
首先,將存在于網(wǎng)絡(luò)數(shù)據(jù)間的關(guān)聯(lián)尋找出來(lái),然后整合交給企業(yè)進(jìn)行分析,企業(yè)通過(guò)這些關(guān)聯(lián)數(shù)據(jù),分析提煉出對(duì)自己企業(yè)有用的信息,繼而制定企業(yè)戰(zhàn)略,防范風(fēng)險(xiǎn)。
其次,使用Web數(shù)據(jù)挖掘技術(shù)對(duì)網(wǎng)絡(luò)信息進(jìn)行分類(lèi)分析。企業(yè)應(yīng)將所有的信息進(jìn)行綜合,然后按照一定的指標(biāo)分出類(lèi)別,并對(duì)這些不同類(lèi)別的信息進(jìn)行整理,方便后續(xù)的檢索。該項(xiàng)功能主要依靠人工智能來(lái)完成,以保證資料能夠得到完整的利用。
再次,使用Web數(shù)據(jù)挖掘技術(shù)對(duì)網(wǎng)絡(luò)信息進(jìn)行聚類(lèi)分析。企業(yè)應(yīng)將這些具有共同點(diǎn)的信息進(jìn)行分類(lèi),將這些數(shù)據(jù)分成各個(gè)小組,但每一個(gè)小組都要有一個(gè)共同的類(lèi)似點(diǎn),以便于從整體對(duì)局部進(jìn)行分析。
最后,利用Web數(shù)據(jù)挖掘技術(shù),根據(jù)收集到的資源信息的不同點(diǎn)進(jìn)行分類(lèi),分類(lèi)后根據(jù)這些不同點(diǎn)的特征,分析出對(duì)自身企業(yè)有用的信息。從整體上說(shuō),Web數(shù)據(jù)挖掘技術(shù)通過(guò)運(yùn)用其強(qiáng)大的分析能力,可對(duì)網(wǎng)絡(luò)信息進(jìn)行篩選、整合,企業(yè)可再根據(jù)這些整合出來(lái)的資源信息,為自身制定戰(zhàn)略,為企業(yè)發(fā)展提供一個(gè)良好的網(wǎng)絡(luò)信息環(huán)境。
4、結(jié) 語(yǔ)
網(wǎng)絡(luò)技術(shù)在給用戶(hù)帶來(lái)便利的同時(shí),也給用戶(hù)的信息安全造成了極大的威脅,科技進(jìn)步,技術(shù)也在不斷進(jìn)步,為了使信息得到最大的保護(hù),網(wǎng)絡(luò)信息的安全技術(shù)要隨著科技的進(jìn)步不斷發(fā)展,為互聯(lián)網(wǎng)的運(yùn)用提供一個(gè)完善安全的網(wǎng)絡(luò)系統(tǒng)。本文通過(guò)Web數(shù)據(jù)挖掘技術(shù),將網(wǎng)絡(luò)信息安全防范與該技術(shù)進(jìn)行有效整合,提高了我國(guó)企業(yè)的網(wǎng)絡(luò)信息安全度,以為我國(guó)企業(yè)的發(fā)展提供一個(gè)良好的環(huán)境。
主要參考文獻(xiàn)
[1]劉波.淺談數(shù)據(jù)挖掘技術(shù)在臨床醫(yī)學(xué)領(lǐng)域中的應(yīng)用[J].電子世界,2017(12).
[2]趙炬紅,陳坤彥.基于數(shù)據(jù)挖掘技術(shù)的茶葉營(yíng)銷(xiāo)策略分析[J].福建茶葉,2017(5).
[3]崔道江,陳琳,李勇.智能檢索引擎中的網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)優(yōu)化研究[J].計(jì)算機(jī)測(cè)量與控制,2017(6).
[4]王珣.基于Spark平臺(tái)的大數(shù)據(jù)挖掘技術(shù)研究[J].微型電腦應(yīng)用,2017(6)
復(fù)雜網(wǎng)絡(luò)交疊團(tuán)模糊分析與信息挖掘論文 篇3
1、大數(shù)據(jù)概述
大數(shù)據(jù)用來(lái)描述和定義信息爆炸時(shí)代所產(chǎn)生的海量數(shù)據(jù),它是計(jì)算機(jī)和互聯(lián)網(wǎng)互相結(jié)合的產(chǎn)物,計(jì)算機(jī)實(shí)現(xiàn)了信息的數(shù)字化,互聯(lián)網(wǎng)實(shí)現(xiàn)了信息的網(wǎng)絡(luò)共享化。隨之興起的則是從海量數(shù)據(jù)中挖掘預(yù)測(cè)出對(duì)人類(lèi)行為有效的方法和結(jié)果,即數(shù)據(jù)挖掘技術(shù)[1]。數(shù)據(jù)挖掘(Datamining)指從大量的數(shù)據(jù)中通過(guò)算法搜索隱藏于其中的信息的過(guò)程,是一門(mén)跨多個(gè)領(lǐng)域的交叉學(xué)科,通常與人工智能、模式識(shí)別及計(jì)算機(jī)科學(xué)有關(guān),并通過(guò)統(tǒng)計(jì)、在線(xiàn)分析處理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專(zhuān)家系統(tǒng)(依靠過(guò)去的經(jīng)驗(yàn)法則)和模式識(shí)別等諸多方法來(lái)實(shí)現(xiàn)上述目標(biāo)。其特點(diǎn)為:海量數(shù)據(jù)尋知識(shí)、集成變換度量值、分析模式評(píng)效果、圖形界面來(lái)展示[2]。
2、大數(shù)據(jù)時(shí)代下的高校機(jī)房現(xiàn)狀
順應(yīng)時(shí)代潮流的發(fā)展,各高校都開(kāi)設(shè)有計(jì)算機(jī)專(zhuān)業(yè),非計(jì)算機(jī)專(zhuān)業(yè)也在大一或大二時(shí)期開(kāi)設(shè)公共計(jì)算機(jī)課程,計(jì)算機(jī)成為教育領(lǐng)域內(nèi)不可或缺的教學(xué)設(shè)備,隨著高校的進(jìn)一步擴(kuò)招,教育事業(yè)的不斷更新發(fā)展,學(xué)校的機(jī)房建設(shè)也隨之增多,其任務(wù)由原來(lái)的面向計(jì)算機(jī)專(zhuān)業(yè)發(fā)展到面向全校的所有專(zhuān)業(yè)開(kāi)設(shè)公共計(jì)算機(jī)教學(xué)、承擔(dān)各種計(jì)算機(jī)考試等多項(xiàng)任務(wù)。因此機(jī)房管理系統(tǒng)在日常教學(xué)和考試任務(wù)中積累了海量數(shù)據(jù),一般這些數(shù)據(jù)都保存在主服務(wù)器上僅供查詢(xún)使用[3]。利用數(shù)據(jù)挖掘技術(shù),對(duì)學(xué)校機(jī)房信息管理系統(tǒng)所積累的大量學(xué)生上機(jī)數(shù)據(jù)進(jìn)行深入分析與挖掘,將挖掘得到的預(yù)測(cè)結(jié)果輔助學(xué)生成績(jī)管理決策,能合理利用機(jī)房資源,提高學(xué)生成績(jī)管理質(zhì)量。本文利用關(guān)聯(lián)規(guī)則,從現(xiàn)有的機(jī)房信息管理系統(tǒng)中收集到的海量學(xué)生上機(jī)記錄數(shù)據(jù)中挖掘出隱藏在數(shù)據(jù)中的學(xué)生上機(jī)規(guī)律和上機(jī)效率,進(jìn)而預(yù)測(cè)學(xué)生的期末考試成績(jī),提前告知,學(xué)生可以在隨后的.學(xué)習(xí)中通過(guò)人為干預(yù)學(xué)習(xí)過(guò)程:比如挖掘預(yù)測(cè)出某生成績(jī)將會(huì)較差,則可以在其后的學(xué)習(xí)中調(diào)整學(xué)習(xí)方式和學(xué)習(xí)態(tài)度,以修正期末考試結(jié)果,提高學(xué)習(xí)效率和考試通過(guò)率,為以后的就業(yè)做好鋪墊,因此不管是對(duì)于當(dāng)前利益還是長(zhǎng)遠(yuǎn)利益,都有深遠(yuǎn)的意義。
3、數(shù)據(jù)挖掘階段
1)定義問(wèn)題:明確數(shù)據(jù)挖掘的預(yù)期目標(biāo)。本次挖掘目標(biāo)旨在從海量機(jī)房學(xué)生登錄信息中找出能預(yù)測(cè)成績(jī)的相關(guān)規(guī)則。
2)數(shù)據(jù)準(zhǔn)備:提取數(shù)據(jù)挖掘的目標(biāo)數(shù)據(jù)集,并進(jìn)行預(yù)處理[4]。本次挖掘數(shù)據(jù)對(duì)象為吉首大學(xué)設(shè)備中心六樓公共計(jì)算機(jī)機(jī)房的學(xué)生上機(jī)信息表,并檢查數(shù)據(jù)的有效性、一致性、完整性,并去除噪聲,進(jìn)行預(yù)處理。
3)數(shù)據(jù)挖掘:根據(jù)上個(gè)步驟所提取數(shù)據(jù)的特點(diǎn)和類(lèi)型選擇相應(yīng)合適的算法,并在預(yù)處理過(guò)的數(shù)據(jù)集上進(jìn)行數(shù)據(jù)挖掘。根據(jù)問(wèn)題定義,本次選擇關(guān)聯(lián)規(guī)則算法Apriori算法,進(jìn)行關(guān)聯(lián)規(guī)則發(fā)現(xiàn)并預(yù)測(cè)。
4)分析挖掘結(jié)果:解釋評(píng)價(jià)數(shù)據(jù)挖掘的結(jié)果,并將其轉(zhuǎn)換成能被用戶(hù)所理解的規(guī)則。
5)運(yùn)用規(guī)則:通過(guò)分析挖掘結(jié)果,可以適當(dāng)進(jìn)行人工干預(yù),修正學(xué)習(xí)行為,使得最終結(jié)果達(dá)到理想學(xué)習(xí)效率。
4、數(shù)據(jù)挖掘在機(jī)房管理系統(tǒng)中的應(yīng)用
4.1關(guān)聯(lián)規(guī)則算法
Apriori算法采用逐層搜索的迭代方法,不需要復(fù)雜的理論推導(dǎo),易于實(shí)現(xiàn),是利用挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的一種算法;舅枷胧牵菏紫日页鏊械念l集,這些項(xiàng)集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持度一樣。然后由頻集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,這些規(guī)則必須滿(mǎn)足最小支持度和最小可信度。然后使用第1步找到的頻集產(chǎn)生期望的規(guī)則,產(chǎn)生只包含集合的項(xiàng)的所有規(guī)則,其中每一條規(guī)則的右部只有一項(xiàng),這里采用的是中規(guī)則的定義。一旦這些規(guī)則被生成,那么只有那些大于用戶(hù)給定的最小可信度的規(guī)則才被留下來(lái)[5]。
4.2關(guān)聯(lián)結(jié)果分析
以吉首大學(xué)實(shí)驗(yàn)室與設(shè)備管理中心為例,吉首大學(xué)實(shí)驗(yàn)室與設(shè)備管理中心下設(shè)置的公共計(jì)算機(jī)實(shí)驗(yàn)教學(xué)中心,負(fù)責(zé)學(xué)校公共計(jì)算機(jī)實(shí)驗(yàn)室建設(shè)與管理,組織實(shí)施公共計(jì)算機(jī)實(shí)驗(yàn)教學(xué)與開(kāi)放,完成基于計(jì)算機(jī)平臺(tái)進(jìn)行的計(jì)算機(jī)等級(jí)考試、普通話(huà)測(cè)試、各類(lèi)社會(huì)化考試等測(cè)試工作。其中承擔(dān)公共計(jì)算機(jī)教學(xué)的機(jī)房共有7間,每個(gè)機(jī)房平均配置95臺(tái)學(xué)生用計(jì)算機(jī)和一臺(tái)教師教學(xué)用計(jì)算機(jī),每臺(tái)電腦上都安裝有奧易機(jī)房管理軟件,學(xué)生每次上機(jī)都必須通過(guò)奧易軟件登錄界面輸入自己的學(xué)號(hào)和密碼才能進(jìn)入系統(tǒng)使用計(jì)算機(jī),從而收集到學(xué)生的上機(jī)登錄時(shí)間、離開(kāi)時(shí)間,教師端可以利用奧易軟件對(duì)任意學(xué)生電腦端進(jìn)行調(diào)換、抓屏、控制屏幕、考試、答疑等操作,所有數(shù)據(jù)存儲(chǔ)在機(jī)房管理端的后臺(tái)數(shù)據(jù)庫(kù)中,通過(guò)調(diào)用后臺(tái)數(shù)據(jù)庫(kù)中的學(xué)生上機(jī)情況數(shù)據(jù),進(jìn)行挖掘分析。由于數(shù)據(jù)量龐大,所以采用從起始順序抽樣的方法,抽取出2015年11月5日的部分學(xué)生上機(jī)的相關(guān)數(shù)據(jù),去除不完整、不一致、有缺失的數(shù)據(jù),進(jìn)行預(yù)處理,為達(dá)到預(yù)測(cè)挖掘目標(biāo)提供正確的數(shù)據(jù)源。
表1中的數(shù)據(jù)前六列是從奧易軟件后臺(tái)數(shù)據(jù)庫(kù)中提取到的原始數(shù)據(jù),我們?cè)O(shè)置第二、三、五列數(shù)據(jù)與學(xué)習(xí)情況有關(guān)聯(lián)。將這些數(shù)據(jù)存在于整合表中,剔除學(xué)號(hào)異常的記錄,即只要是學(xué)號(hào)異常,強(qiáng)制設(shè)定其上機(jī)情況為較差(異常學(xué)號(hào)學(xué)生,應(yīng)為重修生,是學(xué)習(xí)重點(diǎn)關(guān)注對(duì)象),為了方便系統(tǒng)分析,將關(guān)聯(lián)整合后的數(shù)據(jù)轉(zhuǎn)化為布爾類(lèi)型。登錄時(shí)間:S1:10:00;S2:遲到五分鐘;S3:遲到十分鐘;S4:遲到十分鐘以上。學(xué)號(hào):N1:正常學(xué)號(hào);N2:異常學(xué)號(hào)。下課時(shí)間:E1:正常下課時(shí)間;E2:提前五分鐘下課;E3:提前五至十分鐘下課;E4:提前十分鐘以上下課。利用關(guān)聯(lián)算法產(chǎn)生頻繁項(xiàng)集情況分析Q:Q1:優(yōu)秀;Q2:良好;Q3:一般;Q4:較差。利用Apriori算法挖掘關(guān)聯(lián)規(guī)則,可以得到學(xué)生上機(jī)情況規(guī)律:S1,E1→Q1;(S2,E2)/(S1,E2)→Q2/Q3;S4,E4→Q4評(píng)價(jià)結(jié)果:按照正常上課時(shí)間上機(jī)并且堅(jiān)持不早退的同學(xué)學(xué)習(xí)情況為優(yōu)秀;上課準(zhǔn)時(shí)但是提前五分鐘之內(nèi)下課的同學(xué)學(xué)習(xí)情況為良好;上課遲到五分鐘以?xún)?nèi)且下課也提前五分鐘的同學(xué)學(xué)習(xí)情況為一般;上課遲到十分鐘以上并且下課早退十分鐘以上的同學(xué)學(xué)習(xí)評(píng)估為較差。如果利用關(guān)聯(lián)算法得出某個(gè)學(xué)生的學(xué)習(xí)情況有三次為較差,就啟動(dòng)成績(jī)預(yù)警,提示并干預(yù)該生以后的上機(jī)學(xué)習(xí),督促其學(xué)習(xí)態(tài)度,提高學(xué)習(xí)效率,以避免期末考試掛科現(xiàn)象。
5、結(jié)束語(yǔ)
借數(shù)據(jù)挖掘促進(jìn)治理主體多元化[6],借關(guān)聯(lián)分析實(shí)現(xiàn)決策科學(xué)化[7].,本文利用關(guān)聯(lián)規(guī)則思路和算法,將吉首大學(xué)設(shè)備中心機(jī)房中存在的大量學(xué)生上機(jī)情況數(shù)據(jù)進(jìn)行分析挖掘,嘗試從學(xué)生上機(jī)相關(guān)數(shù)據(jù)中預(yù)測(cè)其學(xué)習(xí)情況,并根據(jù)預(yù)測(cè)結(jié)果有效提示學(xué)生的期末考試成績(jī)走向,引導(dǎo)該生在隨后的學(xué)習(xí)應(yīng)該更加有效,以達(dá)到避免出現(xiàn)最壞結(jié)果,從而提高期末考試通過(guò)率。
參考文獻(xiàn):
[1]李濤,曾春秋,周武柏,等.大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘——從應(yīng)用的角度看大數(shù)據(jù)挖掘[J].大數(shù)據(jù),2015(4):57-80.
[2]王夢(mèng)雪.數(shù)據(jù)挖掘綜述[J].軟件導(dǎo)刊,2013(10):135-137.
[3]袁露,王映龍,楊珺.關(guān)于高校計(jì)算機(jī)機(jī)房管理與維護(hù)的探討[J].電腦知識(shí)與技術(shù),2013(18):4334-4335.
[4]李明江,唐穎,周力軍.數(shù)據(jù)挖掘技術(shù)及應(yīng)用[J].中國(guó)新通信,2012(22):66-67+74.
[5]胡文瑜,孫志揮,吳英杰.數(shù)據(jù)挖掘取樣方法研究[J].計(jì)算機(jī)研究與發(fā)展,2011(1):45-54.
[6]黃夢(mèng)橋,李杰.因素挖掘法在投資學(xué)課程中的教學(xué)實(shí)踐[J].吉首大學(xué)學(xué)報(bào):自然科學(xué)版,2015(4):80-83.
[7]尹鵬飛,歐云.基于決策樹(shù)算法的銀行客戶(hù)分類(lèi)模型[J].吉首大學(xué)學(xué)報(bào):自然科學(xué)版,2014(5):29-32.
復(fù)雜網(wǎng)絡(luò)交疊團(tuán)模糊分析與信息挖掘論文 篇4
摘要:隨著信息技術(shù)的發(fā)展與進(jìn)步,大數(shù)據(jù)時(shí)代已經(jīng)悄然走進(jìn)人們身邊,云計(jì)算技術(shù)的運(yùn)用已經(jīng)隨處可見(jiàn),并改變和影響著人們的生活。在此基礎(chǔ)上,數(shù)據(jù)挖掘技術(shù)產(chǎn)生并發(fā)展,其在信息安全系統(tǒng)開(kāi)發(fā)和建設(shè)方面產(chǎn)生重要影響和作用,以數(shù)據(jù)挖掘技術(shù)為依托構(gòu)建相應(yīng)的信息安全系統(tǒng)則更加能夠讓網(wǎng)絡(luò)信息建設(shè)可靠、安全。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);信息安全系統(tǒng);開(kāi)發(fā)研究
一、數(shù)據(jù)挖掘的主要任務(wù)
在數(shù)據(jù)挖掘的主要任務(wù)中,包含關(guān)聯(lián)分析、聚類(lèi)分析、異常檢測(cè)等任務(wù)。關(guān)聯(lián)分析也叫頻繁模式分析,其指的是就同一任務(wù)或者統(tǒng)一事件的查找過(guò)程中,另一事件也同樣會(huì)發(fā)生相同規(guī)律,兩者之間具有緊密聯(lián)系。聚類(lèi)分析主要是的是對(duì)各個(gè)數(shù)據(jù)內(nèi)在的規(guī)律摸索,以及特點(diǎn)分析,通過(guò)對(duì)特點(diǎn)和規(guī)律進(jìn)行對(duì)比,依照特點(diǎn)和規(guī)律進(jìn)行數(shù)據(jù)源分類(lèi),使其成為若干個(gè)數(shù)據(jù)庫(kù)。異常檢測(cè)指的是對(duì)數(shù)據(jù)樣本的范本進(jìn)行建設(shè),利用這一范本,與數(shù)據(jù)源中所存在的數(shù)據(jù)開(kāi)展對(duì)比分析工作,將數(shù)據(jù)中的異常樣本查找出來(lái)[1]。在監(jiān)督學(xué)習(xí)中,主要包含分類(lèi)與預(yù)測(cè)兩種形式,利用已知樣本的類(lèi)型與大小,對(duì)新到樣本開(kāi)展有關(guān)預(yù)測(cè)活動(dòng)。
二、基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)信息安全策略
1.安全的網(wǎng)絡(luò)環(huán)境
。1)對(duì)控制技術(shù)進(jìn)行隔離與訪(fǎng)問(wèn),包括物理隔離、可信網(wǎng)絡(luò)隔離、邏輯隔離與不可信網(wǎng)絡(luò)隔離,相關(guān)用戶(hù)如果需要進(jìn)行網(wǎng)絡(luò)資源搜集或者訪(fǎng)問(wèn),需要得到相關(guān)授權(quán)。
。2)對(duì)防病毒技術(shù)進(jìn)行運(yùn)用,由于網(wǎng)絡(luò)安全已受到病毒的嚴(yán)重威脅,應(yīng)當(dāng)對(duì)病毒預(yù)警、防護(hù)以及應(yīng)急機(jī)制進(jìn)行建設(shè),確保網(wǎng)絡(luò)的安全性;
。3)通過(guò)網(wǎng)絡(luò)入侵檢測(cè)技術(shù)的應(yīng)用,能夠?qū)Ψ欠ㄈ肭终叩钠茐男袨榧皶r(shí)發(fā)現(xiàn),并依照存在的隱患進(jìn)行預(yù)警機(jī)制的建設(shè)。網(wǎng)絡(luò)安全環(huán)境的建設(shè)還包括對(duì)系統(tǒng)安全性開(kāi)展定期分析,在第一時(shí)間對(duì)系統(tǒng)漏洞進(jìn)行查找,并制定有關(guān)解決措施;
。4)通過(guò)有關(guān)分析審計(jì)工作的開(kāi)展,可以對(duì)計(jì)算機(jī)網(wǎng)絡(luò)中的各種運(yùn)行活動(dòng)進(jìn)行記錄,不僅可以對(duì)網(wǎng)絡(luò)訪(fǎng)問(wèn)者予以確定,而且還能夠?qū)ο到y(tǒng)的使用情況進(jìn)行記錄;
。5)通過(guò)網(wǎng)絡(luò)備份與災(zāi)難恢復(fù)工作,能夠利用最短的時(shí)間回復(fù)已破壞的系統(tǒng)。
2.保證數(shù)據(jù)挖掘信息安全的策略。安全的數(shù)據(jù)挖掘信息指的是數(shù)據(jù)挖掘信息的儲(chǔ)存、傳送以及運(yùn)用工作的安全性。在數(shù)據(jù)挖掘信息的存儲(chǔ)安全中,主要包括其物理完整性、邏輯完整性以及保密性。利用數(shù)據(jù)完整性技術(shù)、數(shù)據(jù)傳輸加密技術(shù)以及防抵賴(lài)性技術(shù),使數(shù)據(jù)挖掘信息傳送的安全性得到充分保障。數(shù)據(jù)挖掘信息運(yùn)用的安全性指的是針對(duì)網(wǎng)絡(luò)中的主體,應(yīng)當(dāng)開(kāi)展有關(guān)驗(yàn)證工作,預(yù)防非授權(quán)主體對(duì)網(wǎng)絡(luò)資源進(jìn)行私自運(yùn)用。
3.基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)安全數(shù)據(jù)分析策略
。1)關(guān)聯(lián)性分析。在一次攻擊行為中,利用源地址、目的地址以及攻擊類(lèi)型這三要素,通過(guò)三要素之間的'隨意指定或組合,都能夠?qū)⒕邆湟欢ㄒ饬x的網(wǎng)絡(luò)攻擊態(tài)勢(shì)反映出來(lái)。
。2)事件預(yù)測(cè)機(jī)制。對(duì)某一事件的發(fā)展情況進(jìn)行跟蹤,通過(guò)數(shù)據(jù)聚類(lèi)算法的應(yīng)用,對(duì)依照網(wǎng)絡(luò)事件所構(gòu)建的模型進(jìn)行分析,進(jìn)而做出判定。一般來(lái)說(shuō),規(guī)模比較大的網(wǎng)絡(luò)事件中,擴(kuò)散一般是其所呈現(xiàn)的重要特征。
。3)可控?cái)?shù)量預(yù)測(cè)模型。利用對(duì)事件中受控主機(jī)狀態(tài)增長(zhǎng)數(shù)量進(jìn)行觀測(cè),判斷該事件的感染能力。所謂的受控主機(jī)狀態(tài)增長(zhǎng)指的是,先前未檢測(cè)出主機(jī)受到某類(lèi)攻擊,利用有關(guān)檢測(cè),對(duì)其狀態(tài)變化增長(zhǎng)情況予以發(fā)現(xiàn)[2]。
。4)分析處理模型。通過(guò)分析處理模型,能夠科學(xué)分析運(yùn)營(yíng)商事件處理反饋情況,并對(duì)其針對(duì)被控主機(jī)的處理能力進(jìn)行判定。利用對(duì)所有運(yùn)營(yíng)商所開(kāi)展的綜合評(píng)估,能夠?qū)ζ涔茌牱秶鷥?nèi)的主機(jī)處理能力予以綜合判斷。
。5)網(wǎng)絡(luò)安全數(shù)據(jù)分析模型。針對(duì)網(wǎng)絡(luò)事件進(jìn)行數(shù)據(jù)分析,通過(guò)分析構(gòu)建相應(yīng)模型,結(jié)合模型進(jìn)行異常情況的跟進(jìn)和跟蹤,從而為網(wǎng)絡(luò)安全環(huán)境的營(yíng)造創(chuàng)造條件。其運(yùn)行過(guò)程主要包括兩個(gè)階段:
、僭趯W(xué)習(xí)階段中,用戶(hù)主要是對(duì)事件進(jìn)行確定,并在計(jì)算機(jī)系統(tǒng)中進(jìn)行定義,對(duì)各個(gè)時(shí)間段所發(fā)生的安全事件數(shù)量進(jìn)行統(tǒng)計(jì)。一般來(lái)說(shuō),統(tǒng)計(jì)以小時(shí)為單位,單位時(shí)間內(nèi)的安全事件平均數(shù)為x,方差為σ。
、谠趯(shí)時(shí)檢測(cè)階段中,根據(jù)時(shí)間間隔各類(lèi)安全事件的數(shù)量ix對(duì)安全事件數(shù)量是否出現(xiàn)異常情況進(jìn)行判定,正常的安全事件數(shù)量輕度異常的安全事件數(shù)量中度異常的安全事件數(shù)量重度異常的安全事件數(shù)量在建設(shè)模型的過(guò)程中開(kāi)展有關(guān)配置工作,依據(jù)不同的情形,對(duì)該參數(shù)進(jìn)行調(diào)整,各類(lèi)安全事件數(shù)量異常的最高值也就是安全事件數(shù)量指標(biāo)值。
三、結(jié)語(yǔ)
云計(jì)算和大數(shù)據(jù)時(shí)代都對(duì)信息技術(shù)提出了更高的安全要求和標(biāo)準(zhǔn),網(wǎng)絡(luò)安全系統(tǒng)的構(gòu)建影響著人們的生活和生產(chǎn),并對(duì)相關(guān)的數(shù)據(jù)起到重要保護(hù)作用。結(jié)合數(shù)據(jù)挖掘技術(shù)進(jìn)行信息安全系統(tǒng)的開(kāi)發(fā)和建設(shè),則能夠更好地促進(jìn)網(wǎng)絡(luò)安全性的提升,能夠有效抵制網(wǎng)絡(luò)不法分子的侵襲,讓網(wǎng)絡(luò)安全性真正為人們的生活工作提供幫助。
參考文獻(xiàn)
[1]趙悅品.網(wǎng)絡(luò)信息安全防范與Web數(shù)據(jù)挖掘系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代電子技術(shù),2017,40(04):61-65.
[2]梁雪霆.數(shù)據(jù)挖掘技術(shù)的計(jì)算機(jī)網(wǎng)絡(luò)病毒防御技術(shù)研究[J].科技經(jīng)濟(jì)市場(chǎng),2016(01):25.
復(fù)雜網(wǎng)絡(luò)交疊團(tuán)模糊分析與信息挖掘論文 篇5
摘要:隨著科學(xué)技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)也應(yīng)運(yùn)而生。為了高效有序的醫(yī)療信息管理,需要加強(qiáng)數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的實(shí)際應(yīng)用,從而提升醫(yī)院的管理水平,為醫(yī)院的管理工作及資源的合理配置提供多樣化發(fā)展的可能性。筆者將針對(duì)數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用這一課題進(jìn)行相應(yīng)的探究,從而提出合理的改進(jìn)建議。
關(guān)鍵詞:挖掘技術(shù);醫(yī)療信息管理;應(yīng)用方式
數(shù)據(jù)挖掘作為一種數(shù)據(jù)信息再利用的有效技術(shù),能夠有效地為醫(yī)院的管理決策提供重要信息。它以數(shù)據(jù)庫(kù)、人工智能以及數(shù)理統(tǒng)計(jì)為主要技術(shù)支柱進(jìn)行技術(shù)管理與決策。而在醫(yī)療信息管理過(guò)程之中應(yīng)用數(shù)據(jù)挖掘技術(shù)能夠較好地針對(duì)醫(yī)療衛(wèi)生信息進(jìn)行整理與歸類(lèi)來(lái)建立管理模型,形成有效的總結(jié)數(shù)據(jù)的同時(shí)能夠?yàn)獒t(yī)療工作的高效進(jìn)行提供有價(jià)值的信息。所以筆者將以數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用為著手點(diǎn),從而針對(duì)其應(yīng)用現(xiàn)狀進(jìn)行探究,以此提出加強(qiáng)數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中應(yīng)用的具體措施,希望能夠在理論層面上推動(dòng)醫(yī)療信息管理工作的飛躍。
1、在醫(yī)療信息管理中應(yīng)用數(shù)據(jù)挖掘技術(shù)的基本內(nèi)涵
數(shù)據(jù)挖掘是結(jié)合信息收集技術(shù)、人工智能處理技術(shù)以及分析檢測(cè)技術(shù)等所形成的功能強(qiáng)大的技術(shù)。它能夠?qū)崿F(xiàn)對(duì)于數(shù)據(jù)的收集、問(wèn)題的定義與處理,并且能夠較好地對(duì)于結(jié)果進(jìn)行解釋與評(píng)估。在醫(yī)療信息管理工作進(jìn)行的過(guò)程之中,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以較好地加強(qiáng)醫(yī)療信息數(shù)據(jù)模型的建立,同時(shí)以多種形式出現(xiàn),例如文字信息、基本信號(hào)信息、圖像收集等,也能夠用來(lái)進(jìn)行醫(yī)療信息的科普與宣傳。并且,數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息中所體現(xiàn)出的應(yīng)用方式有所不同,在數(shù)據(jù)挖掘技術(shù)應(yīng)用過(guò)程之中,既可以針對(duì)同一類(lèi)的實(shí)物反應(yīng)出共同性質(zhì)的基本特征,同時(shí)也能夠根據(jù)具有一定關(guān)聯(lián)性的事物信息來(lái)探究差異。這些功能不僅僅能夠在醫(yī)療信息的管理層面上給予醫(yī)療人員較大的信息管理指導(dǎo),同時(shí)在實(shí)際的醫(yī)療診斷過(guò)程之中,也可以向醫(yī)生提供患者的患病信息,并且輔助治療的進(jìn)行[1]。所以,在醫(yī)療信息管理中應(yīng)用數(shù)據(jù)挖掘技術(shù)不僅僅能夠推動(dòng)醫(yī)療信息管理水平的提升,也是醫(yī)院實(shí)現(xiàn)現(xiàn)代化、信息化建設(shè)的重要體現(xiàn),需要從根本上明確醫(yī)療信息管理應(yīng)用數(shù)據(jù)挖掘技術(shù)的必要性與基本內(nèi)涵,從而針對(duì)醫(yī)院的管理現(xiàn)狀實(shí)現(xiàn)其管理方式與技術(shù)應(yīng)用的轉(zhuǎn)變與優(yōu)化。
2、在醫(yī)療信息管理過(guò)程之中加強(qiáng)數(shù)據(jù)挖掘技術(shù)應(yīng)用的重要措施
2.1實(shí)現(xiàn)建模環(huán)節(jié)以及數(shù)據(jù)收集環(huán)節(jié)的優(yōu)化
在應(yīng)用數(shù)據(jù)挖掘技術(shù)的過(guò)程之中,必須基于數(shù)據(jù)庫(kù)信息的基礎(chǔ)之上,其數(shù)據(jù)挖掘技術(shù)才能夠進(jìn)行相應(yīng)的規(guī)律探究與信息分析,所以需要在源頭處加強(qiáng)數(shù)據(jù)收集環(huán)節(jié)以及建模環(huán)節(jié)的優(yōu)化。以醫(yī)院中醫(yī)部門(mén)為例,在對(duì)于中醫(yī)處方經(jīng)驗(yàn)的挖掘方法使用過(guò)程之中,需要針對(duì)不同的藥物進(jìn)行關(guān)聯(lián)性建模,比如數(shù)據(jù)庫(kù)中有基礎(chǔ)性藥物,針對(duì)藥物進(jìn)行頻數(shù)和次數(shù)的統(tǒng)計(jì),然后以此類(lèi)推,將所有藥物都按照出現(xiàn)的頻數(shù)進(jìn)行降數(shù)排列,從而探究參考價(jià)值。建模環(huán)節(jié)以及數(shù)據(jù)收集環(huán)節(jié)是醫(yī)療信息管理過(guò)程的根本,所以需要做好對(duì)于建模環(huán)節(jié)以及數(shù)據(jù)收集環(huán)節(jié)的優(yōu)化,才能夠?yàn)閿?shù)據(jù)挖掘技術(shù)的應(yīng)用奠定相應(yīng)的基礎(chǔ)[2]。
2.2細(xì)化數(shù)據(jù)挖掘技術(shù)應(yīng)用類(lèi)別
想要在醫(yī)療信息管理過(guò)程之中,加強(qiáng)對(duì)于數(shù)據(jù)挖掘技術(shù)的有效應(yīng)用,就需要從數(shù)據(jù)挖掘技術(shù)應(yīng)用類(lèi)別處進(jìn)行著手,從而提升技術(shù)應(yīng)用的針對(duì)性與有效性。常見(jiàn)的技術(shù)應(yīng)用類(lèi)別有:醫(yī)院資源配置方面、病患區(qū)域管理方面、醫(yī)療衛(wèi)生質(zhì)量管理方面、醫(yī)療急診管理方面、醫(yī)院經(jīng)濟(jì)管理方面以及醫(yī)療衛(wèi)生常見(jiàn)病宣傳方面等,數(shù)據(jù)挖掘技術(shù)都可以在這些類(lèi)別之中實(shí)現(xiàn)應(yīng)用,但是在應(yīng)用的過(guò)程之中也有所不同。以病房區(qū)域管理為例,在應(yīng)用數(shù)據(jù)挖掘技術(shù)之前,首先需要明確不同的科室狀況以及病房區(qū)域分配狀況等,加強(qiáng)病患區(qū)域的指標(biāo)分析,因?yàn)椴》抗芾聿粌H僅影響到科室的工作效率與工作效果,同時(shí)也是醫(yī)療物資分配與人員編制的主要參考標(biāo)準(zhǔn)。其次利用數(shù)據(jù)挖掘技術(shù)能夠較好地實(shí)現(xiàn)不同科室工作效率、質(zhì)量管理質(zhì)量以及經(jīng)濟(jì)收益等多種指標(biāo)的評(píng)估,建立其科室的運(yùn)營(yíng)模型,從而實(shí)現(xiàn)科室的又好又快發(fā)展。比如使用數(shù)據(jù)挖掘技術(shù)建立其病區(qū)管理的`標(biāo)準(zhǔn)模型以及統(tǒng)計(jì)指標(biāo),從而計(jì)算出科室動(dòng)態(tài)的工作模型以及病床動(dòng)態(tài)的周轉(zhuǎn)次數(shù)等[3]。
另外在醫(yī)療質(zhì)量管理過(guò)程之中,數(shù)據(jù)挖掘技術(shù)提供的不僅僅是資料數(shù)據(jù)的參考以及疾病的診斷,也能夠針對(duì)臨床的治療效果進(jìn)行分析與評(píng)價(jià),并且能夠預(yù)測(cè)治療狀況:可以利用醫(yī)院的醫(yī)療數(shù)據(jù)庫(kù),對(duì)于病人的基本患病信息進(jìn)行分類(lèi),從而比對(duì)死亡率、治愈率等多個(gè)數(shù)據(jù),實(shí)現(xiàn)治療方案的制訂。而在醫(yī)療質(zhì)量管理過(guò)程之中也有很多的影響因素,例如基礎(chǔ)醫(yī)療設(shè)備、病床周轉(zhuǎn)次數(shù)、病種治愈記錄等,所以也可以利用數(shù)據(jù)挖掘技術(shù)來(lái)進(jìn)一步加強(qiáng)其多種數(shù)據(jù)之間的關(guān)聯(lián)性,從而為提升醫(yī)院的社會(huì)效益與經(jīng)濟(jì)效益提出合理的參考性建議。
2.3明確數(shù)據(jù)挖掘技術(shù)的應(yīng)用方向
醫(yī)院加強(qiáng)數(shù)據(jù)挖掘技術(shù)應(yīng)用方向的探索上,可以從客戶(hù)拓展這個(gè)角度出發(fā)實(shí)現(xiàn)對(duì)于醫(yī)療信息管理。例如通過(guò)數(shù)據(jù)挖掘技術(shù)多方進(jìn)行患者信息比對(duì),同時(shí)制訂完善的醫(yī)療服務(wù)影響策略方式,加強(qiáng)對(duì)于客戶(hù)行為的分析;在數(shù)據(jù)挖掘的基礎(chǔ)之上,增強(qiáng)其技術(shù)應(yīng)用的實(shí)用性,在分析的基礎(chǔ)之上比對(duì)自身的競(jìng)爭(zhēng)優(yōu)勢(shì),實(shí)現(xiàn)醫(yī)院資源的合理規(guī)劃與合理配置,例如藥品、資金以及疾病診斷等,從而實(shí)現(xiàn)經(jīng)營(yíng)狀況的優(yōu)化。目前醫(yī)院也逐步向現(xiàn)代化、信息化方向發(fā)展,無(wú)論是信息管理還是醫(yī)療技術(shù)方面,醫(yī)院都已經(jīng)成為了一個(gè)信息化的綜合行業(yè)體系,所以在加強(qiáng)數(shù)據(jù)挖掘應(yīng)用的過(guò)程之中,還需要加強(qiáng)數(shù)據(jù)信息的管理,實(shí)現(xiàn)數(shù)據(jù)挖掘結(jié)果的維護(hù),從而提升醫(yī)院的決策能力,實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)的高效應(yīng)用。
3、結(jié)語(yǔ)
醫(yī)院在目前的醫(yī)療信息管理過(guò)程之中,還有很大的發(fā)展空間,需要綜合利用數(shù)據(jù)挖掘技術(shù),實(shí)現(xiàn)其信息管理水平的提升。通過(guò)明確數(shù)據(jù)挖掘技術(shù)的應(yīng)用方向、應(yīng)用類(lèi)別以及建模數(shù)據(jù)環(huán)節(jié)的優(yōu)化等,促進(jìn)醫(yī)院管理水平的提升,實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)應(yīng)用效果的提升.
參考文獻(xiàn):
[1]鄭勝前.數(shù)據(jù)挖掘技術(shù)在社區(qū)醫(yī)療服務(wù)系統(tǒng)中的應(yīng)用與研究[J].數(shù)字技術(shù)與應(yīng)用,2015(09):81-82.
[2]廖亮.數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用[J].中國(guó)科技信息,2016(11):54,56.
[3]牟勇.數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息化系統(tǒng)中應(yīng)用[J].電子測(cè)試,2015(11):23-24,22.
復(fù)雜網(wǎng)絡(luò)交疊團(tuán)模糊分析與信息挖掘論文 篇6
摘要:數(shù)據(jù)挖掘模型的設(shè)計(jì),對(duì)于整個(gè)挖掘過(guò)程起到了至關(guān)重要的作用,本文針對(duì)學(xué)前教育信息素養(yǎng)的調(diào)查表,圍繞著數(shù)據(jù)庫(kù)設(shè)計(jì)、數(shù)據(jù)準(zhǔn)備、挖掘方法的選用、模型建立四個(gè)方面進(jìn)行闡述,針對(duì)調(diào)查表中的若干重要的問(wèn)題進(jìn)行分析、研究,從而建立挖掘模型,為最終的數(shù)據(jù)挖掘做好準(zhǔn)備。
關(guān)鍵詞:學(xué)前教育;信息素養(yǎng);數(shù)據(jù)挖掘;模型設(shè)計(jì)
前言
圍繞著學(xué)前教育師資信息素養(yǎng)體系,國(guó)內(nèi)各個(gè)機(jī)構(gòu)對(duì)其研究較為缺乏,沒(méi)有一個(gè)現(xiàn)成的模式可以借鑒,本人參考《江蘇省東臺(tái)市幼兒園的信息素養(yǎng)調(diào)查研究報(bào)告》為參考,請(qǐng)教學(xué)院的學(xué)前教育領(lǐng)域?qū)<,與一線(xiàn)教師交流,根據(jù)自身多年信息技術(shù)教學(xué)的經(jīng)驗(yàn),形成了《學(xué)前教育師資信息素養(yǎng)調(diào)查表》,從教師基本信息、信息意識(shí)與態(tài)度、信息知識(shí)與技能、信息整合與創(chuàng)新、信息道德與安全、信息技術(shù)的培訓(xùn)等六個(gè)方面進(jìn)行研究,對(duì)廈、漳、泉、莆田等地公辦、民辦、私立幼兒園的教師展開(kāi)調(diào)查,希望通過(guò)數(shù)據(jù)挖掘技術(shù),發(fā)現(xiàn)幼兒園教師的信息素養(yǎng)現(xiàn)狀及其影響因素。
1、“學(xué)前教育師資信息素養(yǎng)”數(shù)據(jù)庫(kù)設(shè)計(jì)
首先,利用Access的建表功能,先建立“學(xué)前教育師資信息素養(yǎng)”數(shù)據(jù)庫(kù),根據(jù)調(diào)查表中設(shè)置的六大部分,分別創(chuàng)建6個(gè)表,分別為“教師基本信息”(grxx)、“關(guān)于信息意識(shí)和態(tài)度”(ystd)、“關(guān)于信息知識(shí)和技能”(zsjn)、“關(guān)于信息整合與應(yīng)用”(zhyy)、“關(guān)于信息道德與安全”(ddaq)、“信息技術(shù)培訓(xùn)”( jspx)。對(duì)各部分中的每個(gè)問(wèn)題設(shè)立一字段,以縮寫(xiě)形式為字段名,如“信息技術(shù)自評(píng)”的字段名為“Jszp”,“家庭上網(wǎng)條件”的字段名為“Jtswtj”。而每個(gè)問(wèn)題的答案都是以選項(xiàng)形式填寫(xiě),所以每個(gè)字段的數(shù)據(jù)類(lèi)型均設(shè)置為文本。為了便于管理,我們對(duì)每個(gè)教師都進(jìn)行了編號(hào),并將編號(hào)設(shè)為每個(gè)表的關(guān)鍵字。
2、數(shù)據(jù)準(zhǔn)備
2。 1 數(shù)據(jù)收集本文數(shù)據(jù)的來(lái)源主要通過(guò)兩種渠道:網(wǎng)上問(wèn)卷調(diào)查以及網(wǎng)下問(wèn)卷收集,研究對(duì)象為廈門(mén)、漳州、泉州、莆田、龍巖等五個(gè)地區(qū)的學(xué)前教育一線(xiàn)教師。
由于泉州兒童發(fā)展職業(yè)學(xué)院多年來(lái)都是面向廈門(mén)、漳州、泉州、莆田、龍巖等五地招生,畢業(yè)生也基本上分布在這五個(gè)地區(qū),因此本文收集的數(shù)據(jù)有一定的區(qū)域特點(diǎn),即調(diào)查對(duì)象具有較相似的教育教學(xué)背景,這樣給統(tǒng)計(jì)、分析提供了很大的方便,使得數(shù)據(jù)更加精確。
我們根據(jù)事先設(shè)置的《學(xué)前教育師資信息素養(yǎng)調(diào)查表》的內(nèi)容,將調(diào)查表以網(wǎng)頁(yè)的形式發(fā)布在網(wǎng)上,供教師填寫(xiě);有了網(wǎng)絡(luò)工具,我們能收集到更多的數(shù)據(jù),從而使調(diào)查結(jié)果更加準(zhǔn)確。在服務(wù)器端收集的數(shù)據(jù),直接以Access數(shù)據(jù)庫(kù)形式保存下來(lái),然后添加到SQL Server數(shù)據(jù)庫(kù)中。
2。 2 清洗數(shù)據(jù)
該過(guò)程用于提高數(shù)據(jù)質(zhì)量,使數(shù)據(jù)達(dá)到分析所要求的標(biāo)準(zhǔn)。數(shù)據(jù)清洗過(guò)程包括子數(shù)據(jù)集的選擇和缺失值的處理。
因?yàn)閿?shù)據(jù)質(zhì)量是決定挖掘成功與否的關(guān)程中對(duì)一些重要字段進(jìn)行數(shù)據(jù)質(zhì)量檢查是十分必要的。
缺失值是指數(shù)據(jù)集中無(wú)法知道、沒(méi)有搜集或者錯(cuò)誤錄入的值。一般來(lái)說(shuō)對(duì)于它們所屬的字段這些值是無(wú)效的。對(duì)于此類(lèi)問(wèn)題需要觀察缺失值情況,考慮舍去其后對(duì)預(yù)測(cè)的結(jié)果是否有較大的影響。
本文中,利用問(wèn)卷形式收集來(lái)的數(shù)據(jù),在手工錄入的過(guò)程中,發(fā)現(xiàn)了有許多字段存在缺失值問(wèn)題,表現(xiàn)為:有的題目中沒(méi)有“D”選項(xiàng),但老師的答案中卻出現(xiàn)了“D”的選擇;
有的題目答案為空;還有的選擇不合邏輯,比如“年齡”選擇為“20 ~ 30”,而“教師職稱(chēng)”卻選擇為“特級(jí)”。諸如最后一種選擇,在此我們先不做處理,本文主要針對(duì)前兩種缺失情況進(jìn)行研究。
第一種情形下,以“jjntff”字段(字段含義為“解決教育教學(xué)難題采用方法”)為例,選項(xiàng)中只有A、B、C三個(gè)選項(xiàng),但結(jié)果中出現(xiàn)了7個(gè)D的選項(xiàng),造成數(shù)據(jù)錯(cuò)誤有可能是教師填寫(xiě)錯(cuò)誤或者是錄入員錄入失誤,在這里我們將這些錯(cuò)誤值定義稱(chēng)缺失值,然后利用Excel工具,發(fā)現(xiàn)該題目中C出現(xiàn)頻率最高,因此將7個(gè)缺失值修改為C。
第二種情形,我們對(duì)于答案為空的題目先放空,然后在所有數(shù)據(jù)填寫(xiě)完整后,再采用類(lèi)似第一種情況代替方式,以出現(xiàn)頻率最高的選項(xiàng)填寫(xiě)之。
2。 3 選擇數(shù)據(jù)
利用Business Intelligence Development Studio工具,新建一名為“信息素養(yǎng)挖掘”的Analysis Services項(xiàng)目,導(dǎo)入數(shù)據(jù)源,然后將數(shù)據(jù)源轉(zhuǎn)化成數(shù)據(jù)源視圖,再進(jìn)行“選擇數(shù)據(jù)”。
“選擇數(shù)據(jù)”是用來(lái)決定用于分析的數(shù)據(jù)。在整合數(shù)據(jù)過(guò)程中、構(gòu)建數(shù)據(jù)庫(kù)之后,有一些字段會(huì)和分析無(wú)關(guān),這里就是要對(duì)字段進(jìn)行過(guò)濾。
選擇數(shù)據(jù)是指對(duì)一些變量的選擇取舍。選擇數(shù)據(jù)過(guò)程包括字段的選擇和記錄的選擇。我們這里主要針對(duì)字段進(jìn)行選擇。在調(diào)查表設(shè)置初期,由于對(duì)目標(biāo)問(wèn)題理解不夠細(xì)致,雖然有幼教專(zhuān)家的指點(diǎn),但在學(xué)前教育師資信息素養(yǎng)領(lǐng)域中,有關(guān)研究還是比較缺乏,因此我們?cè)谠O(shè)置數(shù)據(jù)表時(shí)考慮也不夠完善,有關(guān)字段設(shè)置可能是多余的,這也需要通過(guò)數(shù)據(jù)挖掘過(guò)程去發(fā)現(xiàn)。由于篇幅限制,本文只針對(duì)每部分中的典型項(xiàng)目進(jìn)行挖掘研究。
3、挖掘方法的選用
在學(xué)前教育領(lǐng)域中,問(wèn)題調(diào)查一般選項(xiàng)式、問(wèn)答式的題目來(lái)實(shí)現(xiàn),針對(duì)選項(xiàng)式的調(diào)查,以下我們將對(duì)本文涉及的問(wèn)題進(jìn)行研究。
3。 1 關(guān)聯(lián)規(guī)則的選用
挖掘關(guān)聯(lián)規(guī)則的過(guò)程,就是尋找具有內(nèi)在、隱性聯(lián)系信息的過(guò)程。隨著收集和存儲(chǔ)在數(shù)據(jù)庫(kù)中的數(shù)據(jù)規(guī)模越來(lái)越大,人們可以從中挖掘出更可靠、更有價(jià)值的關(guān)聯(lián)規(guī)則。參與關(guān)聯(lián)規(guī)則挖掘的數(shù)據(jù)項(xiàng)可以沒(méi)有顯性的關(guān)聯(lián)特征,正是要通過(guò)挖掘,探討它們之間的內(nèi)在聯(lián)系。
通過(guò)對(duì)調(diào)查表的`分析,我們發(fā)現(xiàn)各字段之間的關(guān)系可分為兩種情形。其中一種有著內(nèi)在或外在聯(lián)系,如在“教師職稱(chēng)結(jié)構(gòu)與自評(píng)”中,教師年齡與教師職稱(chēng)字段之間有著隱形的聯(lián)系,即不同年齡的教師具有不同的職稱(chēng),而教師年齡與信息技術(shù)自評(píng)、教師職稱(chēng)與信息技術(shù)自評(píng)之間的關(guān)系則是用戶(hù)所關(guān)心的問(wèn)題,這個(gè)關(guān)系需要通過(guò)研究得出。根據(jù)關(guān)聯(lián)規(guī)則的適用范圍及其目的,我們發(fā)現(xiàn)只有關(guān)聯(lián)規(guī)則最接近客戶(hù)的要求:通過(guò)挖掘,得出不同年齡、不同職稱(chēng)教師對(duì)自我信息技術(shù)的評(píng)價(jià),即相互間的制約、相互影響的規(guī)律。
我們這里可以設(shè)定教師信息技術(shù)自評(píng)為預(yù)測(cè)字段,將年齡和職稱(chēng)設(shè)置成輸入字段,這樣通過(guò)挖掘,便可以得到年齡與信息技術(shù)自評(píng)、職稱(chēng)與信息技術(shù)自評(píng)的關(guān)聯(lián)規(guī)則。
從上面的例子我們可以發(fā)現(xiàn),當(dāng)問(wèn)題相關(guān)的字段是不同范圍的,或者有一項(xiàng)是不同范圍的,則可以使用關(guān)聯(lián)。
3。 2 聚類(lèi)方法的選用
通過(guò)聚類(lèi),人們能夠自動(dòng)發(fā)現(xiàn)數(shù)據(jù)集中的數(shù)據(jù)由于其各自的相似性和相異性被分成不同的類(lèi),這些類(lèi)別具有明顯的特征,進(jìn)而發(fā)現(xiàn)全局?jǐn)?shù)據(jù)的分布模式,以及數(shù)據(jù)之間的有趣的、隱含的相互聯(lián)系[13]。
在調(diào)查表中,我們可以發(fā)現(xiàn)字段之間的另一種關(guān)系———各字段之間都是相對(duì)獨(dú)立,是同一個(gè)范圍的不同方面。這里以“教師多媒體軟件使用情況”問(wèn)題為例。
該問(wèn)題包含了四個(gè)字段,分別為“使用powerpoint情況”(Ppt)、“使用flash情況”(Flash)、“使用authorware情況”(Aw)、“Photoshop制作”(Psdzz)。這四個(gè)方面都是屬于教師使用多媒體軟件能力的調(diào)查,每種能力之間都是相對(duì)獨(dú)立的,而用戶(hù)關(guān)心的是發(fā)現(xiàn)哪些教師能夠使用哪些多媒體軟件,從而對(duì)不同教師設(shè)定進(jìn)行不同的培訓(xùn)內(nèi)容。根據(jù)聚類(lèi)方法的適用范圍及其方法特點(diǎn),我們發(fā)現(xiàn)只有聚類(lèi)方法最符合用戶(hù)的需要:通過(guò)挖掘,將教師分成若干類(lèi)別,每個(gè)類(lèi)別都有區(qū)別于其他類(lèi)別的顯著特征,這樣使得培訓(xùn)部門(mén)可以有的放矢的進(jìn)行針對(duì)性教學(xué)。
在此,我們將問(wèn)題中的每個(gè)字段都設(shè)置為輸入和預(yù)測(cè)字段。
從上面的例子我們可以發(fā)現(xiàn),當(dāng)問(wèn)題相關(guān)的字段是同范圍的不同方面,則可以選擇聚類(lèi)方法進(jìn)行挖掘,得到需要的結(jié)果。
4 數(shù)據(jù)用法的定義
在利用SQL Server 2005 Analysis Services進(jìn)行數(shù)據(jù)挖掘時(shí),需要先指定包含據(jù)以生成模型的定型數(shù)據(jù)的數(shù)據(jù)源視圖,設(shè)置表中的項(xiàng)目,并指定事例表中列的用法。
4·1 定義數(shù)據(jù)表的類(lèi)型
在SQL Server2005 Analysis Services中,數(shù)據(jù)必須作為包含在事例表中的一系列事例提供給數(shù)據(jù)挖掘算法。不是所有的事例都可以用一行數(shù)據(jù)就可以說(shuō)明。例如一個(gè)事例可能派生自?xún)蓚(gè)表,而一個(gè)表也可以派生出兩個(gè)事例,因此Analysis Services提供了數(shù)據(jù)集的解決方法,可以表示多種數(shù)據(jù)來(lái)源方式,并提供了嵌套表方式。
4·2 指定數(shù)據(jù)列的用法
指定了事例表后,就可以確定要包括在挖掘結(jié)構(gòu)中的表的每一列使用類(lèi)型。數(shù)據(jù)挖掘列可以為下列四種類(lèi)型之一:鍵列、輸入列、可預(yù)測(cè)列或輸入列和可預(yù)測(cè)列的組合。鍵列包含表中每個(gè)行的唯一標(biāo)識(shí)符。輸入列提供據(jù)以進(jìn)行預(yù)測(cè)的信息,而預(yù)測(cè)列包含要在挖掘模型中預(yù)測(cè)的信息。
5 建立模型
針對(duì)教師信息素養(yǎng)調(diào)查表設(shè)計(jì),我們將其分為三大部分:個(gè)人信息意識(shí)與態(tài)度、個(gè)人信息知識(shí)和技能水平、個(gè)人信息素養(yǎng)綜合因素以及學(xué)習(xí)目標(biāo),對(duì)于每個(gè)部分,我們僅提取每部分中的一個(gè)主要問(wèn)題進(jìn)行挖掘模型設(shè)計(jì)。
5。 1 個(gè)人信息意識(shí)與態(tài)度的挖掘模型設(shè)計(jì)“教師職稱(chēng)結(jié)構(gòu)與自評(píng)情況”挖掘模型設(shè)計(jì)
。1)指定“列”的用法根據(jù)調(diào)查表內(nèi)容,相關(guān)字段為“教師年齡”(Age)、“教師職稱(chēng)”(Zc)、“信息技術(shù)自評(píng)”(Jszp),我們通過(guò)“教師年齡”、“教師職稱(chēng)”這兩個(gè)字段來(lái)預(yù)測(cè)出教師“信息技術(shù)自評(píng)”的情況,從而了解不同層次教師的信息自我評(píng)價(jià)。
根據(jù)前面所述,在進(jìn)行挖掘時(shí),首先要指定數(shù)據(jù)源中“教師基本信息”(Grxx)為事例表,然后從中提取出“Age”、“Zc”、“Jszp”三個(gè)“列”(字段)組成挖掘結(jié)構(gòu),其中“Age”、“Zc”為“Input”屬性,“Jszp”為“Predict”屬性。
。2)挖掘算法的選擇及其參數(shù)設(shè)置根據(jù)挖掘方法的特點(diǎn),這里采用關(guān)聯(lián)規(guī)則挖掘方法,即研究不同年齡、職稱(chēng)的教師對(duì)自我信息技術(shù)的評(píng)價(jià)情況。
例如教師年齡=‘20 ~ 30’ 信息技術(shù)自評(píng)=‘良好’;
教師職稱(chēng)=‘二級(jí)’ 信息技術(shù)自評(píng)=‘良好’。
其中涉及到關(guān)聯(lián)規(guī)則挖掘算法的屬性設(shè)置,我們采用默認(rèn)設(shè)置。
5。 2 個(gè)人信息知識(shí)和技能水平的挖掘模型設(shè)計(jì)“教師多媒體軟件使用情況”挖掘模型設(shè)計(jì)
。1)指定“列”的用法根據(jù)調(diào)查表內(nèi)容,相關(guān)字段為“使用powerpoint情況”(Ppt)、“使用flash情況”(Flash)、“使用authorware情況”(Aw)、“Photoshop制作”(Psdzz),根據(jù)要求,我們指定數(shù)據(jù)源中“信息知識(shí)與技能”(Zsjn)為事例表,提取出“Ppt”、“Flash”、“Aw”、“Psdzz”四個(gè)“列”組成挖掘結(jié)構(gòu),列屬性均為“Input and Predict”。
(2)挖掘算法的選擇及其參數(shù)設(shè)置在此我們利用挖掘,了解教師對(duì)于四種多媒體軟件的了解、掌握程度,并自動(dòng)分成具有顯著特征的若干個(gè)類(lèi)別,然后找出每個(gè)類(lèi)別中的共性,也就是說(shuō)通過(guò)挖掘,希望能將教師進(jìn)行分類(lèi)。根據(jù)前面所述,我們認(rèn)為聚類(lèi)分析挖掘算法最為合適。
根據(jù)聚類(lèi)分析挖掘算法的屬性設(shè)置,我們同樣將CLUSTER_COUNT修改為0,為了最準(zhǔn)確地確定要生成的分類(lèi)數(shù)。
5。 3 個(gè)人信息素養(yǎng)綜合因素以及學(xué)習(xí)目標(biāo)的挖掘模型設(shè)計(jì)“信息化教學(xué)意識(shí)”挖掘模型設(shè)計(jì)
。1)指定“列”的用法根據(jù)調(diào)查表內(nèi)容,相關(guān)字段為“信息化教學(xué)設(shè)計(jì)重點(diǎn)”(Xxhjx)、“信息技術(shù)運(yùn)用教學(xué)”(Xxjsyy)、“多媒體教學(xué)方法的運(yùn)用”(Dmtjx)、“多媒體教學(xué)與傳統(tǒng)教學(xué)區(qū)別”(Dmtct)。
根據(jù)要求,我們指定數(shù)據(jù)源中“信息整合與應(yīng)用”(Zhyy)為事例表,表4—4所示,提取出“Xxhjx”、“Xxjsyy”、“Dmtjx”、“Dmtct”四個(gè)“列”組成挖掘結(jié)構(gòu),列屬性均為“In—put and Predict”。
。2)挖掘算法的選擇及其參數(shù)設(shè)置上述四個(gè)字段都是教師對(duì)于信息技術(shù)在教學(xué)中應(yīng)用的理解以及使用情況的不同方面,我們希望通過(guò)挖掘,了解不同類(lèi)別教師的共性。根據(jù)前面所述,我們認(rèn)為,聚類(lèi)分析挖掘算法最為合適。
根據(jù)聚類(lèi)分析挖掘算法的屬性設(shè)置,我們同樣將CLUSTER_COUNT修改為0,為了最準(zhǔn)確地確定要生成的分類(lèi)數(shù)。
5。 4 綜述
至此,我們已經(jīng)將整個(gè)數(shù)據(jù)挖掘模型的結(jié)構(gòu)建立起來(lái),對(duì)于其中典型問(wèn)題進(jìn)行了分析,選擇了適用的挖掘方法,為其他問(wèn)題的挖掘方法選擇提供了參考,為最終結(jié)論的產(chǎn)生起到了至關(guān)重要的作用。
復(fù)雜網(wǎng)絡(luò)交疊團(tuán)模糊分析與信息挖掘論文 篇7
文綜考試以來(lái),歷史和地理學(xué)科知識(shí)和能力的滲透穿插不斷加強(qiáng),這一趨勢(shì)提醒我們:要重視中學(xué)課本中歷史地圖內(nèi)容的挖掘,要培養(yǎng)分析比較地圖和提取有效信息的能力,進(jìn)而培養(yǎng)跨學(xué)科綜合的能力。以人教版2003年高中課本《中國(guó)古代史》(2002年審查通過(guò) 選修本)中第12頁(yè)《春秋大國(guó)爭(zhēng)霸圖》和第13頁(yè)《戰(zhàn)國(guó)兼并形勢(shì)圖》兩幅歷史地圖為例,我們從兩幅貌似不相關(guān)聯(lián)的地圖中可以得到許多有用的信息和結(jié)論。
變化一:中原和江南地區(qū)華夏族諸侯國(guó)的消亡和產(chǎn)生。春秋列國(guó)時(shí)期處于華北地區(qū)的晉國(guó)(大致今天山西、河北一帶)、宋國(guó)(河南一帶)、魯國(guó)(山東一帶)消失了。出現(xiàn)了三個(gè)新國(guó):韓、趙、魏。春秋時(shí)期長(zhǎng)江下游的吳國(guó)、越國(guó)也在戰(zhàn)國(guó)地圖上消失了。反映的相關(guān)史實(shí);戰(zhàn)國(guó)時(shí)期,韓、趙、魏三家分晉,晉國(guó)滅亡。春秋時(shí)期的宋國(guó)、魯國(guó)也滅亡了。這說(shuō)明從春秋的爭(zhēng)霸戰(zhàn)爭(zhēng)到戰(zhàn)國(guó)的兼并戰(zhàn)爭(zhēng),諸侯國(guó)的數(shù)量大大減少了。變化的意義在于:從各國(guó)并立走向局部統(tǒng)一,為秦統(tǒng)一六國(guó)奠定了基礎(chǔ),也反映出周王室衰微,無(wú)力阻止諸侯國(guó)之間的兼并戰(zhàn)爭(zhēng)。
變化二:春秋時(shí)期分布于秦晉兩國(guó)北部的白狄、晉國(guó)中北部的赤狄、北戎,分布在燕國(guó)東北方向的山戎在戰(zhàn)國(guó)時(shí)期的地圖上消失了,同時(shí)蒙古高原一帶和燕國(guó)東北方向分別出現(xiàn)了匈奴和東胡兩個(gè)少數(shù)民族。反映的相關(guān)史實(shí):通過(guò)中原地區(qū)的諸侯國(guó)之間的爭(zhēng)霸戰(zhàn)爭(zhēng),華夏族和其他各族頻繁接觸,民族融合加劇,主要是其他各族融合到文化先進(jìn)的華夏族中,改變了華夏族在春秋時(shí)期一度出現(xiàn)的“南夷與北狄交,中國(guó)不絕若線(xiàn)”的被動(dòng)局面。華夏族同化了華北地區(qū)的一些少數(shù)民族,增添了新的血液,文化先進(jìn)的`華夏族活動(dòng)的范圍和空間有所擴(kuò)大;同時(shí),蒙古高原一帶的草原游牧民族也有所發(fā)展,匈奴族逐漸強(qiáng)大。
變化三:在戰(zhàn)國(guó)時(shí)期的地圖上,
(1)北方沿燕國(guó)、趙國(guó)、秦國(guó)北方邊境一線(xiàn),出現(xiàn)了從遼東連綿到西北地區(qū)的長(zhǎng)城;
。2)在楚國(guó)、齊國(guó)等華夏族各諸侯國(guó)邊境之間,也出現(xiàn)了長(zhǎng)短不一的長(zhǎng)城。
反映的史實(shí):
(1)戰(zhàn)國(guó)時(shí)期,在北方,武力強(qiáng)大的游牧民族──匈奴族第一次統(tǒng)一了廣闊的蒙古草原地區(qū),開(kāi)始頻繁襲擾燕趙秦三國(guó)邊境,給這三個(gè)諸侯國(guó)造成很大壓力。
。2)華夏族各諸侯國(guó)之間出現(xiàn)的長(zhǎng)城則說(shuō)明戰(zhàn)國(guó)時(shí)期,華夏族各諸侯國(guó)的兼并戰(zhàn)爭(zhēng)更加猛烈,攻防水平均有提高,戰(zhàn)爭(zhēng)持續(xù)時(shí)間加長(zhǎng),統(tǒng)一速度加快。
變化三反映的地理信息:對(duì)春秋戰(zhàn)國(guó)時(shí)期的氣候研究證明:戰(zhàn)國(guó)至秦朝時(shí)期修筑的長(zhǎng)城和中國(guó)北方地區(qū)的400毫米等降水量線(xiàn)(大體上半濕潤(rùn)地區(qū)和半干旱地區(qū)的分界線(xiàn))基本重合,這說(shuō)明長(zhǎng)城的修建決非偶然:長(zhǎng)城以北,氣候多屬于溫帶大陸性氣候,比較干旱寒冷,適合游牧經(jīng)濟(jì);長(zhǎng)城以南,氣候多屬于溫帶季風(fēng)氣候,比較溫潤(rùn),適合農(nóng)耕定居生活。長(zhǎng)城的出現(xiàn)說(shuō)明:戰(zhàn)國(guó)時(shí)期,中原地區(qū)農(nóng)耕生產(chǎn)方式和北方游牧生產(chǎn)方式的差異和對(duì)峙已非常明顯,反映出自然地理氣候環(huán)境對(duì)古代民族的重要影響,這種影響貫穿了中國(guó)古代的整個(gè)歷史。
總之,通過(guò)《春秋大國(guó)爭(zhēng)霸圖》和《戰(zhàn)國(guó)兼并形勢(shì)圖》兩幅歷史地圖的比較,我們可以培養(yǎng)比較分析地圖和提取有效信息的能力,同時(shí)也可以得到許多有用的歷史、地理信息。類(lèi)似這樣的插圖在課本中還有很多,它們對(duì)于培養(yǎng)相關(guān)能力的價(jià)值,值得我們挖掘。
復(fù)雜網(wǎng)絡(luò)交疊團(tuán)模糊分析與信息挖掘論文 篇8
計(jì)算機(jī)技術(shù)的不斷發(fā)展,信息技術(shù)不斷加強(qiáng),在社會(huì)新的發(fā)展趨勢(shì)下,以往的傳統(tǒng)管理模式落后于現(xiàn)代化發(fā)展的管理水平。為了創(chuàng)新檔案管理的模式,提高檔案管理的質(zhì)量,在現(xiàn)代檔案信息管理系統(tǒng)中引入數(shù)據(jù)挖掘技術(shù)。
1、信息挖掘技術(shù)
1.1數(shù)據(jù)挖掘技術(shù)概述
數(shù)據(jù)挖掘技術(shù)是一種基于統(tǒng)計(jì)學(xué)、人工智能等等技術(shù)基礎(chǔ)上,能夠自動(dòng)分析原有數(shù)據(jù),從而做出歸納整理,并對(duì)其潛在的模式進(jìn)行挖掘的決策支持過(guò)程,簡(jiǎn)單來(lái)說(shuō)就是從一系列復(fù)雜的數(shù)據(jù)中提取人們需要的潛在性信息。
1.2數(shù)據(jù)挖掘技術(shù)的方法
二十世紀(jì)末,計(jì)算機(jī)挖掘技術(shù)產(chǎn)生。其一般用到的方法有:
(1)孤立點(diǎn)分析。孤立點(diǎn)分析法主要用于對(duì)于特殊信息的挖掘。
。2)聚類(lèi)分析。聚類(lèi)分析方法是在指定的對(duì)象中,對(duì)其價(jià)值聯(lián)系進(jìn)行搜索。
。3)分類(lèi)分析。分類(lèi)分析就是找出具有一定特點(diǎn)的數(shù)據(jù),對(duì)需要解讀的數(shù)據(jù)進(jìn)行識(shí)別。
。4)關(guān)聯(lián)性分析。關(guān)聯(lián)性分析方法是對(duì)指定數(shù)據(jù)中出現(xiàn)頻繁的數(shù)據(jù)進(jìn)行挖掘。
。5)序列分析。與關(guān)聯(lián)性分析法一樣,由數(shù)據(jù)之間內(nèi)在的聯(lián)系得出潛在的關(guān)聯(lián)。
1.3計(jì)算機(jī)挖掘技術(shù)的形式分析
計(jì)算機(jī)挖掘技術(shù)在使用過(guò)程中,收集到的數(shù)據(jù)不同,數(shù)據(jù)收集的方法也就不同。在對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行形式分析的時(shí)候,主要用到:分類(lèi)形式、粗糙集形式、相關(guān)規(guī)則形式。
2、計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)在檔案信息管理
系統(tǒng)中的應(yīng)用計(jì)算機(jī)挖掘技術(shù),能夠?qū)㈦[藏的信息挖掘出來(lái)并進(jìn)行總結(jié)和利用,運(yùn)用到檔案管理中來(lái),在充分發(fā)揮挖掘技術(shù)作用的同時(shí),極大的提高了檔案數(shù)據(jù)的利用價(jià)值。數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)中,一般用到的方法為:
2.1收集法
該方法在對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行分析的基礎(chǔ)上,建立對(duì)已知數(shù)據(jù)詳細(xì)描述的概念模型。然后將每個(gè)測(cè)試的樣本與此模型進(jìn)行比較,若有一個(gè)模型在測(cè)試中被認(rèn)可,就可以以此模型對(duì)管理的對(duì)象分類(lèi)。例如,檔案管理員就某事向客戶(hù)進(jìn)行問(wèn)卷調(diào)查并將答案輸入到數(shù)據(jù)庫(kù)中。在該數(shù)據(jù)庫(kù)中,對(duì)客戶(hù)的回答進(jìn)行具體屬性描述,當(dāng)有新的回答內(nèi)容輸入的時(shí)候,系統(tǒng)會(huì)自動(dòng)對(duì)該客戶(hù)需求分類(lèi),在減輕管理員工作壓力的同時(shí),提高了檔案管理的效率。
2.2保留法
該方法是防止老客戶(hù)檔案丟失并將客戶(hù)留住的過(guò)程。對(duì)于任何一個(gè)企業(yè)來(lái)說(shuō),發(fā)展一個(gè)新的客戶(hù)的成本要遠(yuǎn)遠(yuǎn)高于留住一個(gè)來(lái)客戶(hù)的成本。在客戶(hù)保留的過(guò)程中,對(duì)客戶(hù)檔案流失原因的分析至關(guān)重要,因此,采用挖掘技術(shù)對(duì)其進(jìn)行分析是必要的。
2.3分類(lèi)法
通過(guò)計(jì)算機(jī)挖掘技術(shù)對(duì)檔案進(jìn)行分類(lèi),按照不同的性質(zhì)進(jìn)行系統(tǒng)的劃分,將所有相似或相通的檔案進(jìn)行整理,在人們需要的時(shí)候,能夠快速的被提取出來(lái),提高了檢索的效率和分類(lèi)的專(zhuān)業(yè)性。
3、檔案管理引入計(jì)算機(jī)挖掘技術(shù)的必要性
計(jì)算機(jī)挖掘技術(shù)的應(yīng)用,對(duì)檔案管理方式的不斷完善有著極其重要的意義,其重要性主要體現(xiàn)在:
3.1對(duì)檔案的保護(hù)更全面
一部分具有歷史意義的檔案,隨著保存的時(shí)間不斷增加,其年代感加強(qiáng),意義和價(jià)值增大。相應(yīng)的,利用的頻率會(huì)隨著利用的價(jià)值增加,也更容易被損壞從而導(dǎo)致檔案信息壽命折損,此外,管理不當(dāng)造成泄密,使檔案失去了原本的利用價(jià)值,這種存在于檔案管理和利用之間的矛盾,使得檔案管理面臨著巨大的難題。挖掘技術(shù)的運(yùn)用,緩解了這種矛盾,在檔案管理工作中具有重要的意義。
3.2提升檔案管理的質(zhì)量
在檔案信息管理系統(tǒng)中引入計(jì)算機(jī)挖掘技術(shù),使得檔案信息管理打破了傳統(tǒng)的`模式,通過(guò)挖掘技術(shù),對(duì)管理的模式有了極大的創(chuàng)新,工作人員以往繁重的工作壓力得到釋放,時(shí)間和精力更加豐富,在對(duì)檔案管理的細(xì)節(jié)方面也就更加注意,同時(shí)也加快了對(duì)檔案的數(shù)據(jù)信息進(jìn)行處理的速度,提升檔案管理的整體質(zhì)量。
4、結(jié)語(yǔ)
綜上所述,計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)涉及的內(nèi)容很廣,對(duì)挖掘技術(shù)的運(yùn)用,使得各行各業(yè)的發(fā)展水平得到了很大的提高,推動(dòng)社會(huì)經(jīng)濟(jì)的發(fā)展,帶動(dòng)社會(huì)發(fā)展模式的創(chuàng)新。在檔案管理中使用計(jì)算機(jī)挖掘技術(shù),使得檔案信息保存的方法及安全性有了很大的提高。同時(shí),也需要檔案信息管理人員在進(jìn)行檔案信息管理的時(shí)候,能合理利用計(jì)算機(jī)信息挖掘技術(shù),在提高工作效率的同時(shí),促進(jìn)管理模式的不斷創(chuàng)新,以適應(yīng)時(shí)代發(fā)展的要求。
【復(fù)雜網(wǎng)絡(luò)交疊團(tuán)模糊分析與信息挖掘論文】相關(guān)文章:
水聲網(wǎng)絡(luò)信息安全保密風(fēng)險(xiǎn)論文(通用8篇)08-02
淺談網(wǎng)絡(luò)信息安全的重要性論文(通用10篇)05-08
案例分析論文11-07
旅游管理下數(shù)據(jù)挖掘運(yùn)用論文(精選11篇)09-22
案例分析論文15篇11-09
案例分析論文(15篇)11-10
計(jì)算機(jī)信息安全論文07-21
信息安全管理論文07-29