總結(jié)是成為更好的自己的必經(jīng)之路。在寫總結(jié)時,我們可以結(jié)合實際例子,具體描述我們在學(xué)習過程中的收獲和成長。在總結(jié)的過程中,我們不僅可以參考自己的經(jīng)驗教訓(xùn),還可以學(xué)習他人的總結(jié)成果。
數(shù)據(jù)挖掘論文摘要篇一
:中醫(yī)臨床理論多是由著名醫(yī)家的經(jīng)驗升華形成的,反映了臨床上不同學(xué)術(shù)派系以及不同學(xué)科的優(yōu)勢特征,但這其中不免摻雜了個人主觀經(jīng)驗,因此本文就中醫(yī)臨床理論研究中醫(yī)病案為基礎(chǔ),對應(yīng)用病案數(shù)據(jù)挖掘結(jié)果來總結(jié)和重建中醫(yī)臨床理論的方式進行了探討,認為該方法可為完善中醫(yī)臨床理論提供客觀的數(shù)據(jù)支持,使中醫(yī)臨床理論的來源更具有科學(xué)性。
科研一體化中醫(yī)臨床理論決定著中醫(yī)臨床學(xué)科的發(fā)展水平,是中醫(yī)臨床發(fā)展的動力。從古至今,中醫(yī)名醫(yī)名家輩出,他們的臨床經(jīng)驗和學(xué)術(shù)思想不斷提煉升華,逐步形成了傳統(tǒng)的中醫(yī)臨床理論。新中國成立以來,中醫(yī)不斷汲取最新的科技成果,進行了大量臨床實踐,而中醫(yī)臨床理論發(fā)展緩慢,己經(jīng)成為制約當代中醫(yī)學(xué)術(shù)發(fā)展的瓶頸,對如何開拓中醫(yī)臨床理論的研究,可謂見仁見智,但各種新的臨床理論常常裹挾著“各家學(xué)說”。在當今大數(shù)據(jù)和信息技術(shù)發(fā)達的背景下,運用數(shù)據(jù)挖掘技術(shù)對中醫(yī)病案進行大數(shù)據(jù)分析,客觀揭示當前中醫(yī)臨床理論的本來面目,盡可能減少個人見解的偏倚,對于推動中醫(yī)臨床理論發(fā)展具有重要的現(xiàn)實意義,本文就基于病案數(shù)據(jù)挖掘的中醫(yī)臨床理論重建進行探討如下。
1.1中醫(yī)古典文獻是傳統(tǒng)中醫(yī)臨床理論的基礎(chǔ)。
眾所周知,中醫(yī)之所以能夠屹立千年不倒,很大一部分原因是因為其有獨特的理論體系,而在這其中,中醫(yī)古典文獻做出的貢獻應(yīng)該是第一位的。因為這些古典文獻的記載和流傳,為后世的醫(yī)家提供了參考和借鑒,使得我們從前人的思維上不斷創(chuàng)新,與臨床進行有機結(jié)合,不斷研究出新的適合于當前時代的臨床理論。例如,中醫(yī)學(xué)無論在理論研究還是在臨床治療方面的豐富,許多根本性的理論都是源自于《內(nèi)經(jīng)》。該書創(chuàng)立了藏象、經(jīng)絡(luò)、診法等各方面的理論[1],勾畫了中醫(yī)理論的雛形,構(gòu)建了中醫(yī)理論體系的基本框架。到后期東漢時期張仲景的《傷寒論》則是創(chuàng)造了以六經(jīng)辨證和臟腑辨證為主的局面,其所倡導(dǎo)的“觀其脈證,知犯何逆,隨證治之”使得辨證論治登上新的高度。到了金元時期,就是百家爭鳴的時代,這期間以金元四大家為主的學(xué)派開始萌生,留下了許多可供后世醫(yī)家參考的古典文獻并創(chuàng)建了不同的臨床理論,而明清時期以葉天士和吳鞠通為首確立的衛(wèi)氣營血和三焦辨證,使溫病學(xué)的辨證理論逐步趨于完善,至今仍是指導(dǎo)臨床治療溫熱病的理論依據(jù)??傊?,傳統(tǒng)中醫(yī)臨床理論的構(gòu)建和完善,離不開前人的摸索與貢獻,也得益于著名醫(yī)學(xué)家創(chuàng)建的傳統(tǒng)中醫(yī)理論,使得我們現(xiàn)在的中醫(yī)體系不斷的飽滿和充實。
1.2當代著名中醫(yī)的臨床經(jīng)驗不斷提升為中醫(yī)臨床理論。
傳統(tǒng)中醫(yī)的臨床理論,在很大程度上展示著著名醫(yī)家的臨床經(jīng)驗。在中醫(yī)理論與實踐發(fā)展的相互促進過程中,當代醫(yī)家通過讀書、臨證、心悟?qū)嵺`經(jīng)驗不斷總結(jié)并升華為理論,又在實踐中不斷完善既有的理論,成為中醫(yī)理論發(fā)展的重要途徑和模式,而當代中醫(yī)理論的發(fā)展則需要將傳統(tǒng)理論與現(xiàn)代實踐相互融合起來。例如上世紀60年代時,面對中醫(yī)基礎(chǔ)理論中新的思想相對匱乏的這一局面,鄧鐵濤結(jié)合其治療的臨床經(jīng)驗,首次提出了“五臟相關(guān)學(xué)說”。盡管當時的理論準備并不完善,但是這一理論的提出,在很大程度上完善并且取代了“五行學(xué)說”中某些模糊性和不確定性,并且隨著時代的發(fā)展,逐漸驗證了鄧老的這一經(jīng)驗的正確性,也成為指導(dǎo)中醫(yī)臨床理論的一大重要體系[2]。又如,腦出血這一現(xiàn)代疾病在古代名為中風,多數(shù)是“從風而治”,認為肝臟與中風的關(guān)系最為密切。隨著時代的推進,自20世紀80年代以來,許多學(xué)者根據(jù)微觀辨證和中醫(yī)理論“離經(jīng)之血便是瘀”,提出急性出血中風屬中醫(yī)血證,瘀血阻滯是急性期腦出血的最基本病機,是治療的關(guān)鍵所在[3]。故現(xiàn)代中醫(yī)臨床治療上多以活血化瘀法治療腦出血、腦梗塞這一系列疾病。若是仔細研讀傳統(tǒng)中醫(yī)臨床理論后,我們不難得出其構(gòu)成和完善離不開當代著名醫(yī)家的臨床經(jīng)驗,它是在歷經(jīng)歲月的洗禮下不斷塑造成型的。
1.3傳統(tǒng)中醫(yī)臨床理論不斷將現(xiàn)代醫(yī)學(xué)相關(guān)內(nèi)容中醫(yī)化。
傳統(tǒng)中醫(yī)臨床理論不斷吸收現(xiàn)代醫(yī)學(xué)的理論,將其相關(guān)內(nèi)容不斷中醫(yī)化,將病人的各種證型通過五臟辨證、陰陽五行辨證以及八綱辨證劃分得越來越細化,以提供病人在中醫(yī)臨床上治療的理論依據(jù)。中醫(yī)吸取了現(xiàn)代醫(yī)學(xué)理論后正在不斷壯大其內(nèi)容,現(xiàn)代醫(yī)學(xué)相關(guān)內(nèi)容中醫(yī)化在許多難治疾病的辨證治療中都起到了良好的指導(dǎo)作用[4]。如艾滋病是古代傳統(tǒng)中醫(yī)辨證論治的空白,通過對艾滋病中醫(yī)病因病機、證候規(guī)律、治法方藥的系統(tǒng)研究,提出了“艾毒傷元”“脾為樞機”“氣虛為本”的病因病機學(xué)說,確立了艾滋病“培元解毒”“益氣健脾”的治療原則,為中醫(yī)藥防治艾滋病奠定了理論基礎(chǔ),為進一步提高艾滋病的中醫(yī)藥臨床診療效果提供理論依據(jù)[5]。
2.1中醫(yī)主流理論不突出且與時俱進力度不夠。
不可否認的是,當代的中醫(yī)臨床理論發(fā)展也是存在諸多不足的,中醫(yī)理論的完善和發(fā)展是中華五千年來集體智慧的結(jié)晶,個別醫(yī)家提出的臨床理論可能各有千秋,其所立的角度和思維也不盡相同。例如,同是治療輸卵管阻塞這一疾病時,朱南孫教授認為多是由于濕蘊沖任所致,其用自擬的清熱利濕方來進行治療;而李廣文教授則認為這一疾病多是由于瘀血阻絡(luò)為主,治療上以活血祛瘀為法,擬通任種子湯進行治療[6]。又如對于“和解法”這一治療方法的理解,當代名醫(yī)蒲輔周老先生認為“寒熱并用,補瀉合劑,表里雙解,苦辛分消,調(diào)和氣血,皆謂和解”。而方和謙教授則認為“在治法上扶正祛邪,表里兼顧,此法就為和解法”。不同的醫(yī)家在面對不同的疾病,甚至是不同的理法方藥時,所持的看法常常是“各家學(xué)說”,這就導(dǎo)致了當前中醫(yī)臨床理論發(fā)展比較混亂,不能全面地體現(xiàn)中國五千年來發(fā)展過程中的中醫(yī)主流理論。目前中醫(yī)基礎(chǔ)理論還存在一個缺陷就是它的與時俱進力度還不夠,很多古代經(jīng)典方藥的主治病癥,在當今時代已經(jīng)不再多見了。比如蛔蟲導(dǎo)致的蛔厥這一致病因素在現(xiàn)代已經(jīng)不再常見,對應(yīng)的烏梅丸的主要適應(yīng)病癥也不再是蛔厥;在針對沒有明顯臨床表現(xiàn)的疾病如乙肝時,按傳統(tǒng)中醫(yī)往往體現(xiàn)出“無證可治”的狀態(tài);傳統(tǒng)的診斷與現(xiàn)代檢查相結(jié)合的力度也不夠,中醫(yī)臨床基礎(chǔ)理論在某些程度上忽略了其與生化、b超、x光、ct等現(xiàn)代檢查結(jié)果的結(jié)合,并沒有用中醫(yī)理論對其做一合理的陳述;且現(xiàn)在臨床上很多中藥的藥理作用、性味歸經(jīng)的研究作用還不夠深入、細致,其作用不能在微觀上得以解釋。這些都導(dǎo)致了臨床上很多情況沒有從中醫(yī)理論來認識中醫(yī),不是“以中解中”,而是“以西解中”,形成了臨床拋棄中醫(yī)理論的狀態(tài)[7]。由于中醫(yī)學(xué)是一門實踐性很強的學(xué)科,它是在哲學(xué)辨證的思想指導(dǎo)下,與臨床經(jīng)驗不斷結(jié)合,這與西醫(yī)知識體系相比較,難免存在一定的滯后性,這都會使得中醫(yī)臨床理論發(fā)展相對的落后。
2.2部分中醫(yī)理論帶有權(quán)威專家的“個人學(xué)說”偏見。
傳統(tǒng)中醫(yī)強調(diào)個人經(jīng)驗和學(xué)說,以中醫(yī)內(nèi)科學(xué)為例,第八版中的腦系疾病在第九版中已經(jīng)刪除,其涉及到的各種腦系疾病大多數(shù)歸屬于心系疾病與肝系疾病。根據(jù)其版本的不同,我們可以明顯看出其凸顯的中心內(nèi)容及其思想不同,其多是體現(xiàn)編著者的理論思想,在一定程度上并沒有客觀地揭示疾病的本質(zhì),治療理論也不夠完善,一部分內(nèi)容與最新研究得出的論文理論不符,這使得當代中醫(yī)臨床理論在某些程度上,帶有權(quán)威專家的“個人學(xué)說”色彩。由于現(xiàn)代西方先進的科技文化流入,使得中醫(yī)在一定程度上備受質(zhì)疑,而正是因為人們對于中醫(yī)理論的一些偏見,才使得中醫(yī)長期讓人詬病。
3.1臨床理論應(yīng)具有真實性與系統(tǒng)性。
中醫(yī)臨床理論的發(fā)展方形應(yīng)當是建立在客觀并且真實的臨床實踐基礎(chǔ)上,從一次次臨床實踐中得出。由于歷史時代的原因以及假設(shè)推理、模式建設(shè)的廣泛使用,當代中醫(yī)臨床理論中理論與假說并存的現(xiàn)象較為普遍,如中醫(yī)的五運六氣學(xué)說對現(xiàn)代疫病預(yù)測和人體各經(jīng)絡(luò)臟腑在時間上對于人體治病效果的不同等,就需要我們在扎實的文獻與臨床實踐基礎(chǔ)上,對醫(yī)案進行認真總結(jié),利用科學(xué)的方法深入挖掘,開展中醫(yī)理論的去偽存真研究,以促進中醫(yī)理論的科學(xué)與健康發(fā)展。另外,傳統(tǒng)的中醫(yī)臨床治療上所用的理法方藥,多是根據(jù)個人經(jīng)驗所進行的。隨著科技的不斷發(fā)展與時代的不斷進步,當代的中醫(yī)臨床理論應(yīng)該在成功的中醫(yī)醫(yī)案上進行系統(tǒng)的總結(jié),不斷挖掘和研究其微觀的結(jié)構(gòu),并隨著年月的更迭不斷更新,不斷完善,使其具有科學(xué)性和理論依據(jù)。同時,對近年來興起的傳染性非典型肺炎、艾滋病、禽流感等古人所沒有經(jīng)歷過的疾病的診治,中醫(yī)就其病因病機的認識以及探究相應(yīng)的診療方法,無疑也是一種理論上的創(chuàng)新[8]。通過對其進行深一層次的研究和發(fā)現(xiàn),歸納出合適的治則治法,找到針對這一疾病的理法方藥,使其更具有系統(tǒng)性,使得臨床上中醫(yī)治病可以循序漸進,注重整體,也是當代臨床理論的一大發(fā)展方向。
3.2臨床理論具有信息化的特點并可持續(xù)拓展。
隨著時代的進步,當代的中醫(yī)臨床理論可以通過網(wǎng)絡(luò)等方式進行共享,在大數(shù)據(jù)的這一時代背景下,隨著病案的不斷報道與積累,可以將各類成功的中醫(yī)醫(yī)案進行統(tǒng)計和挖掘,其結(jié)果也會不斷進行更新和發(fā)展。不同的醫(yī)家對于某一疾病的認識角度可能不同,其表現(xiàn)在病位、病性、病勢和證候的判斷標準也不一樣,因此方藥規(guī)律也不一樣。而通過統(tǒng)計某一中醫(yī)或西醫(yī)疾病的較大樣本病例,并對其進行數(shù)據(jù)挖掘,可以得出整個中醫(yī)群體對于這一疾病診治的證候分布、治則治法、處方用藥等的規(guī)律,甚至可以根據(jù)統(tǒng)計的結(jié)果探索出新的方藥,分析他們的共同點和所在差異。將中醫(yī)臨床理論具有信息化的這一特點不斷地拓展下去,通過計算機等客觀科學(xué)的手段進行分析,與主觀的名老中醫(yī)傳承模式相比,更具客觀性,更容易被臨床醫(yī)生接受,對各種疾病的中醫(yī)臨床用藥也更具有指導(dǎo)價值。
4.1病案研究是中醫(yī)理論發(fā)展的重要基礎(chǔ)。
在當今大數(shù)據(jù)的時代背景下,中醫(yī)固有的傳統(tǒng)整體論科學(xué)特征有了越來越多的可供改變的空間。這種變化既為其按照自身特有的規(guī)律發(fā)展特點帶來了機遇,也給未來中醫(yī)理論的發(fā)展提出了挑戰(zhàn)。同時,學(xué)習醫(yī)案研究也是中醫(yī)學(xué)相關(guān)大學(xué)生們應(yīng)該學(xué)習的一項內(nèi)容。閱讀醫(yī)案是必要的訓(xùn)練,也是中醫(yī)入門的方法之一。醫(yī)案的故事性引人入勝,在自然而然中接受中醫(yī)思維方法和傳統(tǒng)文化知識,同時醫(yī)案中所呈現(xiàn)的名醫(yī)風范,醫(yī)德對學(xué)生起到潛移默化的影響,并培養(yǎng)對專業(yè)的熱愛[9]。病案客觀、真實地直接記錄疾病診斷和治療過程,醫(yī)案研究作為中醫(yī)理論發(fā)展過程中至關(guān)重要的一環(huán),是中醫(yī)理論發(fā)展的重要基礎(chǔ),以研究病案為基礎(chǔ),對于中醫(yī)理論的形成和臨床上中醫(yī)積累經(jīng)驗,都起到了一定的輔助提升作用。
利用多種數(shù)據(jù)挖掘技術(shù)對中醫(yī)病案中的有關(guān)信息行進行歸納、整理,是近年來傳承中醫(yī)臨床經(jīng)驗的重要方法之一[10]。通過對同一種疾病的病案進行數(shù)據(jù)挖掘以分析醫(yī)者的思路和探索其用藥的。方法,對中醫(yī)臨床病案進行規(guī)范化的整理,能夠深入總結(jié)其臨床經(jīng)驗,挖掘隱藏在大量病案背后的診治規(guī)律,甚至探索出新的方藥配伍,為中醫(yī)理論的發(fā)展提供一定的科學(xué)依據(jù)的同時,使得中醫(yī)理論的發(fā)展越來越現(xiàn)代化,不僅僅只是停留在以前的靠讀書和個人經(jīng)驗的結(jié)合,也為廣大的中醫(yī)在日后的臨床治療上提供了新的思路和方向。
4.3臨床實踐推動理論發(fā)展,賦予轉(zhuǎn)化醫(yī)學(xué)新的內(nèi)涵。
目前,我們通過并按數(shù)據(jù)挖掘來總結(jié)一些中醫(yī)對于治療同一種疾病所采取的診斷和用藥,可以獲得新的思路,并且為完善我們現(xiàn)有的中醫(yī)理論基礎(chǔ)可以提供可靠的理論支持。采用數(shù)據(jù)挖掘技術(shù)對中醫(yī)學(xué)術(shù)思想和臨證經(jīng)驗進行研究,可以全面解析其中的規(guī)律,分析中醫(yī)個體化診療信息特征,提煉出臨證經(jīng)驗中蘊藏的新理論、新力法,可以實現(xiàn)經(jīng)驗的有效總結(jié)與傳承[11]。與此同時,要求我們用發(fā)展的眼光將現(xiàn)代的科技手段整合加入到傳統(tǒng)的中醫(yī)學(xué)理論中去,推陳出新,通過臨床實踐與基礎(chǔ)理論的不斷結(jié)合,不斷完善,推動祖國醫(yī)學(xué)現(xiàn)代化,譜寫有關(guān)于中醫(yī)學(xué)在轉(zhuǎn)化醫(yī)學(xué)上新的篇章。
[2]邱仕君,吳玉生。在基礎(chǔ)理論與臨床醫(yī)學(xué)之間———對鄧鐵濤教授五臟相關(guān)學(xué)說的理論思考[j].湖北民族學(xué)院學(xué)報(醫(yī)學(xué)版),2005,22(2):36-39.
[3]顧寧,周仲英。通下法治療急性腦出血研究進展[j].中國中醫(yī)急診,2000,9(5):227.
[4]靳士英。鄧鐵濤教授學(xué)術(shù)成就管[j].現(xiàn)代醫(yī)院,2004(9):1-6.
[7]孟靜巖,應(yīng)森林。試論中醫(yī)基礎(chǔ)理論指導(dǎo)臨床研究的思考與途徑[j].上海中醫(yī)藥大學(xué)學(xué)報,2009(3):3-5.
數(shù)據(jù)挖掘論文摘要篇二
計算機技術(shù)的不斷發(fā)展,信息技術(shù)不斷加強,在社會新的發(fā)展趨勢下,以往的傳統(tǒng)管理模式落后于現(xiàn)代化發(fā)展的管理水平。為了創(chuàng)新檔案管理的模式,提高檔案管理的質(zhì)量,在現(xiàn)代檔案信息管理系統(tǒng)中引入數(shù)據(jù)挖掘技術(shù)。
數(shù)據(jù)挖掘技術(shù)是一種基于統(tǒng)計學(xué)、人工智能等等技術(shù)基礎(chǔ)上,能夠自動分析原有數(shù)據(jù),從而做出歸納整理,并對其潛在的模式進行挖掘的決策支持過程,簡單來說就是從一系列復(fù)雜的數(shù)據(jù)中提取人們需要的潛在性信息。
二十世紀末,計算機挖掘技術(shù)產(chǎn)生。其一般用到的方法有:
(1)孤立點分析。孤立點分析法主要用于對于特殊信息的挖掘。
(2)聚類分析。聚類分析方法是在指定的對象中,對其價值聯(lián)系進行搜索。
(3)分類分析。分類分析就是找出具有一定特點的數(shù)據(jù),對需要解讀的數(shù)據(jù)進行識別。
(4)關(guān)聯(lián)性分析。關(guān)聯(lián)性分析方法是對指定數(shù)據(jù)中出現(xiàn)頻繁的數(shù)據(jù)進行挖掘。
(5)序列分析。與關(guān)聯(lián)性分析法一樣,由數(shù)據(jù)之間內(nèi)在的聯(lián)系得出潛在的關(guān)聯(lián)。
1.3計算機挖掘技術(shù)的形式分析。
計算機挖掘技術(shù)在使用過程中,收集到的數(shù)據(jù)不同,數(shù)據(jù)收集的方法也就不同。在對數(shù)據(jù)挖掘技術(shù)進行形式分析的時候,主要用到:分類形式、粗糙集形式、相關(guān)規(guī)則形式。
系統(tǒng)中的應(yīng)用計算機挖掘技術(shù),能夠?qū)㈦[藏的信息挖掘出來并進行總結(jié)和利用,運用到檔案管理中來,在充分發(fā)揮挖掘技術(shù)作用的同時,極大的提高了檔案數(shù)據(jù)的利用價值。數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)中,一般用到的方法為:
2.1收集法。
該方法在對數(shù)據(jù)庫中的數(shù)據(jù)進行分析的基礎(chǔ)上,建立對已知數(shù)據(jù)詳細描述的概念模型。然后將每個測試的樣本與此模型進行比較,若有一個模型在測試中被認可,就可以以此模型對管理的對象分類。例如,檔案管理員就某事向客戶進行問卷調(diào)查并將答案輸入到數(shù)據(jù)庫中。在該數(shù)據(jù)庫中,對客戶的回答進行具體屬性描述,當有新的回答內(nèi)容輸入的時候,系統(tǒng)會自動對該客戶需求分類,在減輕管理員工作壓力的同時,提高了檔案管理的效率。
2.2保留法。
該方法是防止老客戶檔案丟失并將客戶留住的過程。對于任何一個企業(yè)來說,發(fā)展一個新的客戶的成本要遠遠高于留住一個來客戶的成本。在客戶保留的過程中,對客戶檔案流失原因的分析至關(guān)重要,因此,采用挖掘技術(shù)對其進行分析是必要的。
2.3分類法。
通過計算機挖掘技術(shù)對檔案進行分類,按照不同的性質(zhì)進行系統(tǒng)的劃分,將所有相似或相通的檔案進行整理,在人們需要的時候,能夠快速的被提取出來,提高了檢索的效率和分類的專業(yè)性。
計算機挖掘技術(shù)的應(yīng)用,對檔案管理方式的不斷完善有著極其重要的意義,其重要性主要體現(xiàn)在:
3.1對檔案的保護更全面。
一部分具有歷史意義的檔案,隨著保存的時間不斷增加,其年代感加強,意義和價值增大。相應(yīng)的,利用的頻率會隨著利用的價值增加,也更容易被損壞從而導(dǎo)致檔案信息壽命折損,此外,管理不當造成泄密,使檔案失去了原本的利用價值,這種存在于檔案管理和利用之間的矛盾,使得檔案管理面臨著巨大的難題。挖掘技術(shù)的運用,緩解了這種矛盾,在檔案管理工作中具有重要的意義。
3.2提升檔案管理的質(zhì)量。
在檔案信息管理系統(tǒng)中引入計算機挖掘技術(shù),使得檔案信息管理打破了傳統(tǒng)的模式,通過挖掘技術(shù),對管理的模式有了極大的創(chuàng)新,工作人員以往繁重的工作壓力得到釋放,時間和精力更加豐富,在對檔案管理的細節(jié)方面也就更加注意,同時也加快了對檔案的數(shù)據(jù)信息進行處理的速度,提升檔案管理的整體質(zhì)量。
綜上所述,計算機數(shù)據(jù)挖掘技術(shù)涉及的內(nèi)容很廣,對挖掘技術(shù)的運用,使得各行各業(yè)的發(fā)展水平得到了很大的提高,推動社會經(jīng)濟的發(fā)展,帶動社會發(fā)展模式的創(chuàng)新。在檔案管理中使用計算機挖掘技術(shù),使得檔案信息保存的方法及安全性有了很大的提高。同時,也需要檔案信息管理人員在進行檔案信息管理的時候,能合理利用計算機信息挖掘技術(shù),在提高工作效率的同時,促進管理模式的不斷創(chuàng)新,以適應(yīng)時代發(fā)展的要求。
數(shù)據(jù)挖掘論文摘要篇三
發(fā)現(xiàn)的是用戶感興趣的知識;發(fā)現(xiàn)的知識應(yīng)當能夠被接受、理解和運用。也就是發(fā)現(xiàn)全部相對的知識,是具有特定前提與條件,面向既定領(lǐng)域的,同時還容易被用戶接受。數(shù)據(jù)挖掘?qū)儆谝环N新型的商業(yè)信息處理技術(shù),其特點為抽取、轉(zhuǎn)化、分析商業(yè)數(shù)據(jù)庫中的大規(guī)模業(yè)務(wù)數(shù)據(jù),從中獲得有價值的商業(yè)數(shù)據(jù)。簡單來說,其實數(shù)據(jù)挖掘是一種對數(shù)據(jù)進行深入分析的方法。因此,可以描述數(shù)據(jù)挖掘為:根據(jù)企業(yè)設(shè)定的工作目標,探索與分析企業(yè)大量數(shù)據(jù),充分揭示隱藏的、未知的規(guī)律性,并且將其轉(zhuǎn)變?yōu)榭茖W(xué)的方法。數(shù)據(jù)挖掘發(fā)現(xiàn)的最常見知識包括:
1.1.1廣義知識體現(xiàn)相同事物共同性質(zhì)的知識,是指類別特點的概括描述知識。按照數(shù)據(jù)的微觀特點對其表征的、具有普遍性的、極高概念層次的知識積極發(fā)現(xiàn),是對數(shù)據(jù)的高度精煉與抽象。發(fā)現(xiàn)廣義知識的方法與技術(shù)有很多,例如數(shù)據(jù)立方體和歸約等。
1.1.2關(guān)聯(lián)知識體現(xiàn)一個事件與其他事件之間形成的關(guān)聯(lián)知識。假如兩項或者更多項之間形成關(guān)聯(lián),則其中一項的屬性數(shù)值就能夠借助其他屬性數(shù)值實行預(yù)測。
1.1.3分類知識體現(xiàn)相同事物共同特點的屬性知識與不同事物之間差異特點知識。
1.2.1明確業(yè)務(wù)對象對業(yè)務(wù)問題清楚定義,了解數(shù)據(jù)挖掘的第一步是數(shù)據(jù)挖掘目的。挖掘結(jié)果是無法預(yù)測的,但是研究的問題是可預(yù)見的,僅為了數(shù)據(jù)挖掘而數(shù)據(jù)挖掘一般會體現(xiàn)出盲目性,通常也不會獲得成功?;谟脩籼卣鞯碾娮由虅?wù)數(shù)據(jù)挖掘研究劉芬(惠州商貿(mào)旅游高級職業(yè)技術(shù)學(xué)校,廣東惠州516025)摘要:隨著互聯(lián)網(wǎng)的出現(xiàn),全球范圍內(nèi)電子商務(wù)正在迅速普及與發(fā)展,在這樣的環(huán)境下,電子商務(wù)數(shù)據(jù)挖掘技術(shù)應(yīng)運而生。電子商務(wù)數(shù)據(jù)挖掘技術(shù)是近幾年來數(shù)據(jù)挖掘領(lǐng)域中的研究熱點,基于用戶特征的電子商務(wù)數(shù)據(jù)挖掘技術(shù)研究將會解決大量現(xiàn)實問題,為企業(yè)確定目標市場、完善決策、獲得最大競爭優(yōu)勢,其應(yīng)用前景廣闊,促使電子商務(wù)企業(yè)更具有競爭力。主要分析了電子商務(wù)內(nèi)容、數(shù)據(jù)挖掘技術(shù)和過程、用戶細分理論,以及基于用戶特征的電子商務(wù)數(shù)據(jù)挖掘。
1.2.2數(shù)據(jù)準備第一選擇數(shù)據(jù):是按照用戶的挖掘目標,對全部業(yè)務(wù)內(nèi)外部數(shù)據(jù)信息積極搜索,從數(shù)據(jù)源中獲取和挖掘有關(guān)數(shù)據(jù)。第二預(yù)處理數(shù)據(jù):加工選取的數(shù)據(jù),具體對數(shù)據(jù)的完整性和一致性積極檢查,并且處理數(shù)據(jù)中的噪音,找出計算機丟失的數(shù)據(jù),清除重復(fù)記錄,轉(zhuǎn)化數(shù)據(jù)類型等。假如數(shù)據(jù)倉庫是數(shù)據(jù)挖掘的對象,則在產(chǎn)生數(shù)據(jù)庫過程中已經(jīng)形成了數(shù)據(jù)預(yù)處理。
1.2.3變換數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)為一個分析模型。這一分析模型是相對于挖掘算法構(gòu)建的。構(gòu)建一個與挖掘算法適合的分析模型是數(shù)據(jù)挖掘獲得成功的重點??梢岳猛队皵?shù)據(jù)庫的相關(guān)操作對數(shù)據(jù)維度有效降低,進一步減少數(shù)據(jù)挖掘過程中數(shù)據(jù)量,提升挖掘算法效率。
1.2.4挖掘數(shù)據(jù)挖掘獲得的經(jīng)濟轉(zhuǎn)化的數(shù)據(jù)。除了對選擇科學(xué)挖掘算法積極完善之外,其余全部工作都自行完成。整體挖掘過程都是相互的,也就是用戶對某些挖掘參數(shù)能夠積極控制。
1.2.5評價挖掘結(jié)果這個過程劃分為兩個步驟:表達結(jié)果和評價結(jié)果。第一表達結(jié)果:用戶能夠理解數(shù)據(jù)挖掘得到的模式,可以通過可視化數(shù)據(jù)促使用戶對挖掘結(jié)果積極理解。第二評價結(jié)果:用戶與機器對數(shù)據(jù)挖掘獲得的模式有效評價,對冗余或者無關(guān)的模式及時刪除。假如用戶不滿意挖掘模式,可以重新挑選數(shù)據(jù)和挖掘算法對挖掘過程科學(xué)執(zhí)行,直到獲得用戶滿意為止。
用戶細分是指按照不同用戶的屬性劃分用戶集合。目前學(xué)術(shù)界和企業(yè)界一般接受的是基于用戶價值的細分理論,其不僅包含了用戶為企業(yè)貢獻歷史利潤,還包含未來利潤,也就是在未來用戶為企業(yè)可能帶來的利潤總和?;谟脩魞r值的細分理論選擇客戶當前價值與客戶潛在價值兩個因素評價用戶。用戶當前價值是指截止到目前用戶對企業(yè)貢獻的總體價值;用戶潛在價值是指未來用戶可能為企業(yè)創(chuàng)造的價值總和。每個因素還能夠劃分為兩個高低檔次,進一步產(chǎn)生一個二維的矩陣,把用戶劃分為4組,價值用戶、次價值用戶、潛在價值用戶、低價值用戶。企業(yè)在推廣過程中根據(jù)不同用戶應(yīng)當形成對應(yīng)的方法,投入不同的資源。很明顯對于企業(yè)來說價值用戶最重要,被認為是企業(yè)的玉質(zhì)用戶;其次是次價值用戶,被認為是金質(zhì)用戶,雖然數(shù)量有限,卻為企業(yè)創(chuàng)造了絕大部分的利潤;其他則是低價值用戶,對企業(yè)來說價值最小,成為鉛質(zhì)用戶,另外一類則是潛在價值用戶。雖然這兩類用戶擁有較多的數(shù)量,但是為企業(yè)創(chuàng)造的價值有限,甚至很小。需要我們注意的是潛在價值用戶利用再造用戶關(guān)系,將來極有可能變成價值用戶。從長期分析,潛在價值用戶可以是企業(yè)的隱形財富,是企業(yè)獲得利潤的基礎(chǔ)。將采用數(shù)據(jù)挖掘方法對這4類用戶特點有效挖掘。
3.1設(shè)計問卷。
研究的關(guān)鍵是電子商務(wù)用戶特征的數(shù)據(jù)挖掘,具體包含了價值用戶特征、次價值用戶特征、潛在價值用戶特征,對電子商務(wù)用戶的認知度、用戶的需求度分析。問卷內(nèi)容包括3部分:其一是為被調(diào)查者介紹電子商務(wù)的概念與背景;其二是具體調(diào)查被調(diào)查對象的個人信息,包含了性別、年齡、學(xué)歷、感情情況、職業(yè)、工作、生活地點、收入、上網(wǎng)購物經(jīng)歷;其三是問卷主要部分,是對用戶對電子商務(wù)的了解、需求、使用情況的指標設(shè)計。
3.2調(diào)查方式。
本次調(diào)查的問卷主體是電腦上網(wǎng)的人群,采用隨機抽象的方式進行網(wǎng)上訪問。一方面采用大眾聊天工具,利用電子郵件和留言的方式發(fā)放問卷,另一方面在大眾論壇上邀請其填寫問卷。
(1)選擇數(shù)據(jù)挖掘的算法利用clementine數(shù)據(jù)挖掘軟件,采用c5.o算法挖掘預(yù)處理之后數(shù)據(jù)。
(2)用戶數(shù)據(jù)分析。
1)電子商務(wù)用戶認知度分析按照調(diào)查問卷的問題“您知道電子商務(wù)嗎?”得到對電子商務(wù)用戶認知情況的統(tǒng)計,十分了解20.4%,了解30.1%,聽過但不了解具體使用方法40.3%,從未聽過8.9%。很多人僅聽過電子商務(wù),但是并不清楚具體的功能與應(yīng)用方法,甚至有一小部分人沒有聽過電子商務(wù)。對調(diào)查問卷問題“您聽過電子商務(wù)的渠道是什么?”,大部分用戶是利用網(wǎng)了解電子商務(wù)的,占40.2%;僅有76人是利用紙質(zhì)報刊雜志上知道電子商務(wù)的并且對其進行應(yīng)用;這也表明相較于網(wǎng)絡(luò)宣傳紙質(zhì)媒體推廣電子商務(wù)的方法缺乏有效性。
2)電子商務(wù)用戶需求用戶希求具體是指使用產(chǎn)品服務(wù)人員對應(yīng)用產(chǎn)品或服務(wù)形成的需求或者期望。按照問題“假如你曾經(jīng)使用電子商務(wù),你覺得其用途怎樣,假如沒有使用過,你覺得其對自己有用嗎?”得到了認為需要和十分需要的數(shù)據(jù),覺得電子商務(wù)有用的用戶為40.7%,不清楚是否對自己有用的用戶為56.7%,認為不需要的僅有2.4%。
3)電子商務(wù)用戶應(yīng)用意愿應(yīng)用意愿是指消費者對某一產(chǎn)品服務(wù)進行應(yīng)用或者購買的一種心理欲望。按照問題“假如可以滿足你所關(guān)心的因素,未來你會繼續(xù)應(yīng)用電子商務(wù)嗎?”獲得的數(shù)據(jù)可知,在滿足各種因素時,將來一年之內(nèi)會應(yīng)用電子商務(wù)的用戶為78.2%,一定不會應(yīng)用電子商務(wù)的用戶為1.4%。表明用戶形成了較為強烈的應(yīng)用電子商務(wù)欲望,電子商務(wù)發(fā)展前景很好?;谟脩籼卣鞯碾娮由虅?wù)數(shù)據(jù)研究,電子商務(wù)企業(yè)通過這一結(jié)果能夠更好地實行營銷和推廣,對潛在用戶積極定位,提高用戶體驗,積極挖掘用戶價值。分析為企業(yè)準確營銷和推廣企業(yè)提供了一個有效的借鑒。
互聯(lián)網(wǎng)中數(shù)據(jù)是最寶貴的資源之一,大量數(shù)據(jù)中包含了很大的潛在價值,對這些數(shù)據(jù)深入挖掘?qū)ヂ?lián)網(wǎng)商務(wù)、企業(yè)推廣、傳播信息發(fā)揮了巨大的作用。近些年來,數(shù)據(jù)挖掘技術(shù)獲得了信息產(chǎn)業(yè)的極大重視,具體原因是出現(xiàn)了大量的數(shù)據(jù),能夠廣泛應(yīng)用,并且需要轉(zhuǎn)化數(shù)據(jù)成為有價值的信息知識。通過基于用戶特征的電子商務(wù)數(shù)據(jù)挖掘研究,促使電子商務(wù)獲得巨大發(fā)展機會,發(fā)現(xiàn)潛在用戶,促使電子商務(wù)企業(yè)精準營銷。
數(shù)據(jù)挖掘論文摘要篇四
近些年來,已經(jīng)有越來越多的企業(yè)把通信、網(wǎng)絡(luò)技術(shù)和計算機應(yīng)用引入企業(yè)的日常管理工作和業(yè)務(wù)開發(fā)處理當中,企業(yè)的各類信息化程度也在不斷提高。現(xiàn)代科技信息技術(shù)的廣泛應(yīng)用已經(jīng)顯著的提高了企業(yè)的工作效率和經(jīng)濟效益。但是,在使用信息技術(shù)給企業(yè)帶來的方便、快捷的同時,也不斷的出現(xiàn)了新的問題和需求。企業(yè)經(jīng)過多年積累了大量的歷史數(shù)據(jù),這些數(shù)據(jù)對企業(yè)當前的日常經(jīng)營活動幾乎沒有任何的使用價值,成了留之無用棄之可惜的累贅。而且儲藏這些歷史數(shù)據(jù)會對企業(yè)造成很大的困難和費用開銷。為此數(shù)據(jù)挖掘技術(shù)應(yīng)用在網(wǎng)絡(luò)營銷中勢在必行,全面細致的分析數(shù)據(jù)庫資源并從中提取有價值的信息來對商業(yè)決策進行支持,從而來控制運營成本、提高經(jīng)濟效益。本文將從網(wǎng)絡(luò)營銷中數(shù)據(jù)挖掘技術(shù)的幾個應(yīng)用進行探討和分析。
客戶關(guān)系管理在網(wǎng)絡(luò)營銷,商業(yè)競爭是一家以客戶為中心的競技狀態(tài)的客戶,留住客戶,擴大客戶基礎(chǔ),建立密切的客戶關(guān)系,客戶需求分析和創(chuàng)造客戶需求等,是非常關(guān)鍵的營銷問題??蛻絷P(guān)系管理,營銷和信息技術(shù)領(lǐng)域是一個新概念,這在90年代初,軟件產(chǎn)品在上世紀90年代后期出現(xiàn)的誕生。目前,在國內(nèi)和國外的此類產(chǎn)品的研究和發(fā)展階段。然而,繼續(xù)與數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)的進步和發(fā)展,客戶關(guān)系管理,也是對實際應(yīng)用階段。crm的目標是管理者與客戶的互動,提升客戶價值,提高客戶滿意度,提高客戶的忠誠度,還發(fā)現(xiàn),市場營銷和銷售渠道,然后尋找新客戶,提高客戶的利潤貢獻率的最終目的是為了推動社會和經(jīng)濟效益。客戶關(guān)系管理的目的,應(yīng)用是改善企業(yè)與客戶的關(guān)系,它是企業(yè)和服務(wù)本質(zhì)管理和協(xié)調(diào),以滿足客戶的需求,企業(yè)政策支持這項工作,并聯(lián)系客戶服務(wù)加強管理,提高客戶滿意度和品牌忠誠度。
然而,數(shù)據(jù)挖掘可以應(yīng)用到很多方面的crm和不同階段,包括以下內(nèi)容:
(1)“一對一”營銷的內(nèi)部工作人員認識到,客戶是在這個領(lǐng)域的企業(yè),而不是貿(mào)易發(fā)展生存的關(guān)鍵。與每一個客戶接觸的過程,也是了解客戶的進程,而且也讓客戶了解業(yè)務(wù)流程。
(2)企業(yè)與客戶之間的銷售應(yīng)該是一種商業(yè)關(guān)系不斷向前發(fā)展??蛻艉蜖I銷公司成立這種方式,而且有許多方法可以使這種與客戶的關(guān)系,往往以改善包括:延長時間,客戶關(guān)系和維護客戶關(guān)系,以進一步加強相互交往過程中,公司可以在對方取得聯(lián)系更多的利潤。
(3)客戶對客戶盈利能力分析。我們的客戶盈利能力是非常不同的,如果你不明白客戶盈利能力,很難制定有效的營銷策略,以獲取最有價值的客戶,或進一步提高客戶的忠誠度的價值。數(shù)據(jù)挖掘技術(shù)可以用來預(yù)測客戶在市場條件變化不同的盈利能力。它可以找到所有這些行為和使用模型來預(yù)測客戶行為模式的客戶交易盈利水平或新客戶找到高利潤。
(4)在所有部門維護客戶關(guān)系的競爭日趨激烈,企業(yè)獲得新客戶的成本上升,因此,保持現(xiàn)有客戶的關(guān)系變得越來越重要。對于企業(yè)客戶可分為三大類:沒有價值或者低價值的客戶,不容易失去寶貴的客戶,并不斷尋找更多的優(yōu)惠,更有價值的服務(wù)給客戶。前兩個類型的客戶,客戶關(guān)系管理,現(xiàn)代化,然而,最具潛力的市場活動,是第三個層次的用戶,而且還特別需求和營銷工具,以保護客戶,可以減緩企業(yè)經(jīng)營成本,而且還獲得了寶貴的客戶。數(shù)據(jù)挖掘還可以發(fā)現(xiàn),由于客戶流失,該公司能夠滿足這些客戶的需要,采取適當措施,保持銷售。
(5)客戶訪問企業(yè)業(yè)務(wù)系統(tǒng)資源,包括能夠獲得新客戶的關(guān)鍵指標。為了提供這些新的資源,包括企業(yè)搜索客戶誰不知道該產(chǎn)品的客戶,可能是競爭對手,服務(wù)客戶。這些細分客戶,潛在客戶可以幫助企業(yè)完成檢查。
通過挖掘客戶的有關(guān)數(shù)據(jù),可以對客戶進行分類,找出其相同點和不同點,以便為客戶提供個性化的產(chǎn)品和服務(wù),使企業(yè)和客戶之間能夠通過網(wǎng)絡(luò)進行有效的溝通和信息交流。例如,關(guān)聯(lián)分析,客戶在購買某種商品時,有可能會連帶著購買其他的相關(guān)產(chǎn)品,這樣購買的某種商品和連帶購買的其他相關(guān)產(chǎn)品之間就存在著某種關(guān)聯(lián),企業(yè)可以針對這種關(guān)聯(lián)進行分析,分析出規(guī)律,已制定有效的營銷策略來長效的起到吸引客戶連帶消費,購買其他產(chǎn)品的營銷策略。它能夠智能化地從大量的數(shù)據(jù)中提取出有用的信息和知識,為企業(yè)的管理人員提供決策支持。數(shù)據(jù)挖掘技術(shù)使數(shù)據(jù)庫技術(shù)進入了一個更高級的階段,它不僅能對過去的數(shù)據(jù)進行查詢和遍歷,并且能夠找出過去數(shù)據(jù)之間的潛在聯(lián)系,從而促進信息的傳遞。
客戶群體的劃分也會用到數(shù)據(jù)挖掘,沒有基于數(shù)據(jù)挖掘的客戶劃分,就沒有真正的差異化、個性化營銷,就沒有現(xiàn)代營銷的根本。做為企業(yè)的領(lǐng)導(dǎo)者,不管你的企業(yè)是賣產(chǎn)品的還是賣服務(wù),第一個應(yīng)該準確把握的商業(yè)問題就是你的目標客戶群體,他們是誰,有什么特點和行為模式,有那些獨特的喜好可以作為營銷的突破口,有多大的多長久的贏利價值。這些問題是你整個商業(yè)運做的核心和基礎(chǔ),不了解你的客戶,下面的路就根本別指望能走下去了。數(shù)據(jù)挖掘營銷應(yīng)用中的客戶群體劃分可以科學(xué)有效的解決這個問題,也能給企業(yè)找到一個合理的營銷定位。
數(shù)據(jù)挖掘技術(shù)在90年代開始應(yīng)用于信用評估與風險分析中。企業(yè)在進行網(wǎng)絡(luò)營銷的過程中會受到各種各樣的來自買方的信用風險的威脅,隨著市場競爭的加劇,貿(mào)易信用已經(jīng)成為企業(yè)成功開發(fā)客戶和加強客戶關(guān)系的重要條件。客戶信用管理主要是搜集儲存客戶信息,因為客戶既是企業(yè)最大的財富來源,也是風險的主要來源。為了讓企業(yè)在這方面更少的受到威脅,可以利用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)企業(yè)經(jīng)常面臨的詐騙行為或延付貨款行為,進而進行回避。同時盡可能把客戶信用風險控制在交易發(fā)生之前是成功信用管理的根本。因此,充分獲取客戶的詳細資料并做出安全的決策非常重要。
客戶信用風險管理應(yīng)用數(shù)據(jù)挖掘技術(shù)的優(yōu)勢:
(3)數(shù)據(jù)挖掘技術(shù)也可以適應(yīng)各種形式的數(shù)據(jù),數(shù)據(jù)挖掘可以是連續(xù)的數(shù)據(jù),離散數(shù)據(jù),而其他形式的數(shù)據(jù)處理,以便在更大的靈活性,在選擇指標時,更加符合客觀實際的信用風險模型。
為現(xiàn)代信用風險管理方法有兩個:第一是所謂的指數(shù)法,其基礎(chǔ)是信用相關(guān)業(yè)務(wù)的某些特性來企業(yè)信用評估;第二類是所謂的結(jié)構(gòu)化方法,根據(jù)歷史數(shù)據(jù)和市場數(shù)據(jù)模擬在企業(yè)資產(chǎn)價值變化的動態(tài)持續(xù)的過程,然后確定其企業(yè)信用的位置。
網(wǎng)絡(luò)營銷作為適應(yīng)網(wǎng)絡(luò)經(jīng)濟時代的網(wǎng)絡(luò)虛擬市場的新營銷理論,是市場營銷理念在新時期的發(fā)展和應(yīng)用。它能夠智能化地從大量的數(shù)據(jù)中提取出有用的信息和知識,為企業(yè)的管理人員提供決策支持。數(shù)據(jù)挖掘技術(shù)使數(shù)據(jù)庫技術(shù)進入了一個更高級的階段,它不僅能對過去的數(shù)據(jù)進行查詢和遍歷,并且能夠找出過去數(shù)據(jù)之間的潛在聯(lián)系,從而促進信息的傳遞。
1.維護原有客戶,挖掘潛在新客戶。
網(wǎng)絡(luò)營銷中銷售商可以通過客戶的訪問記錄來挖掘出客戶的潛在信息,跟據(jù)客戶的興趣與需求向客戶有針對性的做個性化的推薦,制定出客戶滿意的產(chǎn)品服務(wù)。在做好維護原有老客戶的基礎(chǔ)上,通過對數(shù)據(jù)的挖掘,利用分類技術(shù),也可以尋找出潛在的客戶,通過對web日志的挖掘,可以對已經(jīng)存在的訪問者進行分類,根據(jù)這種精細的分類,還可以找到潛在的新客戶。
2.制定營銷策略,優(yōu)化促銷活動。
對于保留的商品訪問記錄和銷售記錄進行挖掘,可以發(fā)現(xiàn)客戶的訪問規(guī)律,了解客戶消費的生命周期,起伏規(guī)律,結(jié)合市場形勢的變化,針對不同的商品和客戶群制定不同的營銷策略,保證促銷活動針對客戶群有的放矢,收到意想不到的效果。
3.降低運營成本,提高競爭力。
網(wǎng)絡(luò)營銷的管理者可以通過數(shù)據(jù)挖掘發(fā)現(xiàn)市場反饋的可靠信息,預(yù)測客戶未來的購買行為,有針對性的進行營銷活動,還可以根據(jù)產(chǎn)品訪問者的瀏覽習慣來覺定產(chǎn)品廣告的位置,使廣告有針對性的起到宣傳的效果。從而提高廣告的投資回報率,從而能降低運營成本,提高且的核心競爭力。
4.對客戶進行個性化推薦。
根據(jù)客戶采礦活動對網(wǎng)絡(luò)規(guī)則,有針對性的網(wǎng)絡(luò)營銷平臺,提供“個性化”服務(wù)。個性化服務(wù)是在服務(wù)策略和服務(wù)內(nèi)容的不同客戶的不同,其本質(zhì)是客戶為中心的web服務(wù)的需求。它通過收集和分析客戶資料,以了解客戶的利益和購買行為,然后采取主動,以達到建議的服務(wù)。
5.完善網(wǎng)絡(luò)營銷網(wǎng)站的設(shè)計。
1馮英健著,《網(wǎng)絡(luò)營銷基礎(chǔ)與實踐》,清華大學(xué)出版社,20xx年1月第1版。
2.,and.sky-shairoh,esinknowledgediscoveryanddatamining.aaai/mitpress,menlopark,ca.1996:。
數(shù)據(jù)挖掘論文摘要篇五
網(wǎng)絡(luò)的發(fā)展帶動了電子商務(wù)市場的繁華,大量的商品、信息在現(xiàn)有的網(wǎng)絡(luò)平臺上患上以交易,大大簡化了傳統(tǒng)的交易方式,節(jié)儉了時間,提高了效力,但電子市場繁華違后暗藏的問題,同樣成為人們關(guān)注的焦點,凸起表現(xiàn)在海量信息的有效應(yīng)用上,如何更為有效的管理應(yīng)用潛伏信息,使他們的最大功效患上以施展,成為人們現(xiàn)在鉆研的重點,數(shù)據(jù)發(fā)掘技術(shù)的發(fā)生,在必定程度上解決了這個問題,但它也存在著問題,需要不斷改善。
數(shù)據(jù)發(fā)掘(datamining)就是從大量的、不完整的、有噪聲的、隱約的、隨機的原始數(shù)據(jù)中,提取隱含在其中的、人們事前不知道的、但又是潛伏有用的信息以及知識的進程?;蛘哒哒f是從數(shù)據(jù)庫中發(fā)現(xiàn)有用的知識(kdd),并進行數(shù)據(jù)分析、數(shù)據(jù)融會(datafusion)和決策支撐的進程。數(shù)據(jù)發(fā)掘是1門廣義的交叉學(xué)科,它匯聚了不同領(lǐng)域的鉆研者,特別是數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計、可視化、并行計算等方面的學(xué)者以及工程技術(shù)人員。
數(shù)據(jù)發(fā)掘技術(shù)在電子商務(wù)的利用。
在對于web的客戶走訪信息的發(fā)掘中,應(yīng)用分類技術(shù)可以在internet上找到未來的潛伏客戶。使用者可以先對于已經(jīng)經(jīng)存在的走訪者依據(jù)其行動進行分類,并依此分析老客戶的1些公共屬性,抉擇他們分類的癥結(jié)屬性及互相間瓜葛。對于于1個新的走訪者,通過在web上的分類發(fā)現(xiàn),辨認出這個客戶與已經(jīng)經(jīng)分類的老客戶的1些公共的描寫,從而對于這個新客戶進行正確的分類。然后從它的分類判斷這個新客戶是有益可圖的客戶群仍是無利可圖的客戶群,抉擇是不是要把這個新客戶作為潛伏的客戶來對于待??蛻舻念愋涂隙ê螅梢詫τ诳蛻魟討B(tài)地展現(xiàn)web頁面,頁面的內(nèi)容取決于客戶與銷售商提供的產(chǎn)品以及服務(wù)之間的關(guān)聯(lián)。若為潛伏客戶,就能夠向這個客戶展現(xiàn)1些特殊的、個性化的頁面內(nèi)容。
在電子商務(wù)中,傳統(tǒng)客戶與銷售商之間的空間距離已經(jīng)經(jīng)不存在,在internet上,每一1個銷售商對于于客戶來講都是1樣的,那末使客戶在自己的銷售站點上駐留更長的時間,對于銷售商來講則是1個挑戰(zhàn)。為了使客戶在自己的網(wǎng)站上駐留更長的時間,就應(yīng)當全面掌握客戶的閱讀行動,知道客戶的興致及需求所在,并依據(jù)需求動態(tài)地向客戶做頁面舉薦,調(diào)劑web頁面,提供獨有的1些商品信息以及廣告,以使客戶滿意,從而延長客戶在自己的網(wǎng)站上的駐留的時間。
數(shù)據(jù)發(fā)掘技術(shù)可提高站點的效力,web設(shè)計者再也不完整依托專家的定性指點來設(shè)計網(wǎng)站,而是依據(jù)走訪者的信息特征來修改以及設(shè)計網(wǎng)站結(jié)構(gòu)以及外觀。站點上頁面內(nèi)容的支配以及連接就如超級市場中物品的貨架左右1樣,把擁有必定支撐度以及信任度的相干聯(lián)的物品擺放在1起有助于銷售。網(wǎng)站盡量做到讓客戶等閑地走訪到想走訪的頁面,給客戶留下好的印象,增添下次走訪的機率。
通過web數(shù)據(jù)發(fā)掘,企業(yè)可以分析顧客的將來行動,容易評測市場投資回報率,患上到可靠的市場反饋信息。不但大大降低公司的運營本錢,而且便于經(jīng)營決策的制訂。
數(shù)據(jù)發(fā)掘在利用中面臨的問題。
一數(shù)據(jù)發(fā)掘分析變量的選擇。
數(shù)據(jù)發(fā)掘的基本問題就在于數(shù)據(jù)的數(shù)量以及維數(shù),數(shù)據(jù)結(jié)構(gòu)顯的無比繁雜,數(shù)據(jù)分析變量即是在數(shù)據(jù)發(fā)掘中技術(shù)利用中發(fā)生的,選擇適合的分析變量,將提高數(shù)據(jù)發(fā)掘的效力,尤其合用于電子商務(wù)中大量商品和用戶信息的處理。
針對于這1問題,咱們完整可以用分類的法子,分析出不同信息的屬性和呈現(xiàn)頻率進而抽象出變量,運用到所選模型中,進行分析。
二數(shù)據(jù)抽取的法子的選擇。
數(shù)據(jù)抽取的目的是對于數(shù)據(jù)進行濃縮,給出它的緊湊描寫,如乞降值、平均值、方差值、等統(tǒng)計值、或者者用直方圖、餅狀圖等圖形方式表示,更主要的是他從數(shù)據(jù)泛化的角度來討論數(shù)據(jù)總結(jié)。數(shù)據(jù)泛化是1種把最原始、最基本的信息數(shù)據(jù)從低層次抽象到高層次上的進程。可采取多維數(shù)據(jù)分析法子以及面向?qū)傩缘臍w納法子。
三數(shù)據(jù)趨勢的。預(yù)測。
數(shù)據(jù)是海量的,那末數(shù)據(jù)中就會隱含必定的變化趨勢,在電子商務(wù)中對于數(shù)據(jù)趨勢的預(yù)測尤為首要,尤其是對于客戶信息和商品信息公道的預(yù)測,有益于企業(yè)有效的決策,取得更多地利潤。但如何對于這1趨勢做出公道的預(yù)測,現(xiàn)在尚無統(tǒng)1標準可尋,而且在進行數(shù)據(jù)發(fā)掘進程中大量數(shù)據(jù)構(gòu)成文本后格式的非標準化,也給數(shù)據(jù)的有效發(fā)掘帶來了難題。
針對于這1問題的發(fā)生,咱們在電子商務(wù)中可以利用聚類分析的法子,把擁有類似閱讀模式的用戶集中起來,對于其進行詳細的分析,從而提供更合適、更令用戶滿意的服務(wù)。聚類分析法子的優(yōu)勢在于便于用戶在查看日志時對于商品及客戶信息有全面及清晰的把握,便于開發(fā)以及執(zhí)行未來的市場戰(zhàn)略,包含自動給1個特定的顧客聚類發(fā)送銷售郵件,為1個顧客聚類動態(tài)地扭轉(zhuǎn)1個特殊的站點等,這不管對于客戶以及銷售商來講都是成心義。
四數(shù)據(jù)模型的可靠性。
數(shù)據(jù)模型包含概念數(shù)據(jù)模型、邏輯數(shù)據(jù)模型、物理模型。數(shù)據(jù)發(fā)掘的模型目前也有多種,包含采集模型、處理模型及其他模型,但不管哪一種模型都不是很成熟存在缺點,對于數(shù)據(jù)模型不同采取不同的方式利用。可能發(fā)生不同的結(jié)果,乃至差異很大,因而這就觸及到數(shù)據(jù)可靠性的問題。數(shù)據(jù)的可靠性對于于電子商務(wù)來講尤為首要作用。
針對于這1問題,咱們要保障數(shù)據(jù)在發(fā)掘進程中的可靠性,保證它的準確性與實時性,進而使其在最后的結(jié)果中的準確度到達最高,同時在利用模型進程中要盡可能全面的分析問題,防止片面,而且分析結(jié)果要由多人進行評價,從而最大限度的保證數(shù)據(jù)的可靠性。
五數(shù)據(jù)發(fā)掘觸及到數(shù)據(jù)的私有性以及安全性。
大量的數(shù)據(jù)存在著私有性與安全性的問題,尤其是電子商務(wù)中的各種信息,這就給數(shù)據(jù)發(fā)掘造成為了必定的阻礙,如何解決這1問題成了技術(shù)在利用中的癥結(jié)。
為此相干人員在進行數(shù)據(jù)發(fā)掘進程中必定要遵照職業(yè)道德,保障信息的秘要性。
六數(shù)據(jù)發(fā)掘結(jié)果的不肯定性。
數(shù)據(jù)發(fā)掘結(jié)果擁有不肯定性的特征,由于發(fā)掘的目的不同所以最后發(fā)掘的結(jié)果自然也會千差萬別,以因而這就需要咱們與所要發(fā)掘的目的相結(jié)合,做出公道判斷,患上出企業(yè)所需要的信息,便于企業(yè)的決策選擇。進而到達提高企業(yè)經(jīng)濟效益,取得更多利潤的目的。
數(shù)據(jù)發(fā)掘可以發(fā)現(xiàn)1些潛伏的用戶,對于于電子商務(wù)來講是1個不可或者缺的技術(shù)支撐,數(shù)據(jù)發(fā)掘的勝利請求使用者對于指望解決問題的領(lǐng)域有深入的了解,數(shù)據(jù)發(fā)掘技術(shù)在必定程度上解決了電子商務(wù)信息不能有效應(yīng)用的問題,但它在運用進程中呈現(xiàn)的問題也亟待人們?nèi)ソ鉀Q。相信數(shù)據(jù)發(fā)掘技術(shù)的改良將推動電子商務(wù)的深刻發(fā)展。
數(shù)據(jù)挖掘論文摘要篇六
由于信息技術(shù)的迅速發(fā)展,現(xiàn)代的檔案管理模式與過去相比,也有了很大的變化,也讓如今的檔案管理模式有了新的挑戰(zhàn)。讓人們對信息即時、大量地獲取是目前檔案管理工作和檔案管理系統(tǒng)急切需要解決的問題。
(一)數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘是指從大量的、不規(guī)則、亂序的數(shù)據(jù)中,進行分析歸納,得到隱藏的,未知的,但同時又含有較大價值的信息和知識。它主要對確定目標的有關(guān)信息,使用自動化和統(tǒng)計學(xué)等方法對信息進行預(yù)測、偏差分析和關(guān)聯(lián)分析等,從而得到合理的結(jié)論。在檔案管理中使用數(shù)據(jù)挖掘技術(shù),能夠充分地發(fā)揮檔案管理的作用,從而達到良好的檔案管理工作效果。(二)數(shù)據(jù)挖掘技術(shù)分析。數(shù)據(jù)挖掘技術(shù)分析的方法是多種多樣的,其主要方法有以下幾種:1.關(guān)聯(lián)分析。指從已經(jīng)知道的信息數(shù)據(jù)中,找到多次展現(xiàn)的信息數(shù)據(jù),由信息的說明特征,從而得到具有相同屬性的事物特征。2.分類分析。利用信息數(shù)據(jù)的特征,歸納總結(jié)相關(guān)信息數(shù)據(jù)的數(shù)據(jù)庫,建立所需要的數(shù)據(jù)模型,從而來識別一些未知的信息數(shù)據(jù)。3.聚類分析。通過在確定的數(shù)據(jù)中,找尋信息的價值聯(lián)系,得到相應(yīng)的管理方案。4.序列分析。通過分析信息的前后因果關(guān)系,從而判斷信息之間可能出現(xiàn)的聯(lián)系。
在進行現(xiàn)代檔案信息處理時,傳統(tǒng)的檔案管理方法已經(jīng)不能滿足其管理的要求,數(shù)據(jù)挖掘技術(shù)在這方面確有著顯著的優(yōu)勢。首先,檔案是較為重要的信息記錄,甚至有些檔案的重要性大到無價,因此對于此類的珍貴檔案,相關(guān)的檔案管理人員也是希望檔案本身及其價值一直保持下去。不過越是珍貴的檔案,其使用率自然也就越高,所以其安全性就很難得到保障,在檔案管理中運用數(shù)據(jù)挖掘技術(shù),可以讓檔案的信息數(shù)據(jù)得到分析統(tǒng)計,歸納總結(jié),不必次次實物查閱,這樣就極大地提升了檔案相關(guān)內(nèi)容的安全性,降低檔案的磨損率。并且可以對私密檔案進行加密,進行授權(quán)查閱,進一步提高檔案信息的安全性。其次,對檔案進行鑒定與甄別,這也是檔案工作中較困難的過程,過去做好這方面的工作主要依靠管理檔案管理員自己的能力和水平,主觀上的因素影響很大,但是數(shù)據(jù)挖掘技術(shù)可以及時對檔案進行編碼和收集,對檔案進行數(shù)字化的管理和規(guī)劃,解放人力資源,提升檔案利用的服務(wù)水平。第三,數(shù)據(jù)挖掘技術(shù)可以減少檔案的收集和保管成本,根據(jù)檔案的特點和規(guī)律建立的數(shù)據(jù)模型能為之后的工作人員建立一種標準,提升了檔案的鑒定效率。
(一)檔案信息的收集。在實施檔案管理工作時,首先需要對檔案信息數(shù)據(jù)的收集??梢赃\用相關(guān)檔案數(shù)據(jù)庫的數(shù)據(jù)資料,進行科學(xué)的分析,制定科學(xué)的說明方案,對確定的數(shù)據(jù)集合類型和一些相關(guān)概念的模型進行科學(xué)說明,利用這些數(shù)據(jù)說明,建立準確的數(shù)據(jù)模型,并以此數(shù)據(jù)模型作為標準,為檔案信息的快速分類以及整合奠定基礎(chǔ)。例如,在體育局的相關(guān)網(wǎng)站上提供問卷,利用問卷來得到的所需要的信息數(shù)據(jù),導(dǎo)入數(shù)據(jù)庫中,讓數(shù)據(jù)庫模型中保有使用者的相關(guān)個人信息,通過對使用者的信息數(shù)據(jù)進行說明,從而判斷使用者可能的類型,提升服務(wù)的準確性。因此,數(shù)據(jù)挖掘技術(shù)為檔案信息的迅速有效收集,為檔案分類以及后續(xù)工作的順利展開,提供了有利條件,為個性化服務(wù)的實現(xiàn)提供了保證。(二)檔案信息的分類。數(shù)據(jù)挖掘技術(shù)具有的屬性分析能力,可以將數(shù)據(jù)庫中的信息進行分門別類,將信息的對象通過不同的特征,規(guī)劃為不同的分類。將數(shù)據(jù)挖掘技術(shù)運用到檔案管理中時,可以簡單快速地找到想要的檔案數(shù)據(jù),能根據(jù)數(shù)據(jù)中使用者的相關(guān)數(shù)據(jù),找尋使用者在數(shù)據(jù)庫中的信息,使用數(shù)據(jù)模型的分析能力,分析出使用者的相關(guān)特征。利如,在使用者上網(wǎng)使用網(wǎng)址時,數(shù)據(jù)挖掘技術(shù)可以充分利用使用者的搜索數(shù)據(jù)以及網(wǎng)站的訪問記錄,自動保存用戶的搜索信息、搜索內(nèi)容、下載次數(shù)、時間等,得到用戶的偏好和特征,對用戶可能存在的需求進行預(yù)測和分類,更加迅速和準確的,為用戶提供個性化的服務(wù)。(三)檔案信息的整合。數(shù)據(jù)挖掘技術(shù)可以對新舊檔案的信息進行整合處理,可以較為簡單地將“死檔案”整合形成為“活檔案”,提供良好的檔案信息和有效的檔案管理。例如,對于企事業(yè)單位而言,培訓(xùn)新員工的成本往往比聘請老員工的成本要高出很多。對老員工的檔案信息情況進行全體整合,使檔案資源充分發(fā)揮作用,將檔案數(shù)據(jù)進行總結(jié)和規(guī)劃,根據(jù)數(shù)據(jù)之間的聯(lián)系確定老員工流失的原因,然后建立清晰、明白的數(shù)據(jù)庫,這樣可以防止人才流失,也能大大提高檔案管理的效率。
綜上所述,在這個信息技術(shù)迅速跳躍發(fā)展的時代,將數(shù)據(jù)挖掘技術(shù)運用到檔案管理工作中是時代發(fā)展的需求與必然結(jié)果。利用數(shù)據(jù)挖掘技術(shù),可以使檔案管理工作的效率大大提升,不僅減少了搜索檔案信息的時間,節(jié)省人力物力,避免資源的浪費,還能幫助用戶在海量的信息數(shù)據(jù)中,快速找到所需的檔案數(shù)據(jù)信息。數(shù)據(jù)挖掘技術(shù)的運用,使靜態(tài)的檔案信息變成了可以“主動”為企事業(yè)單位的發(fā)展,提供有效的個性化服務(wù)的檔案管家,推動了社會的快速發(fā)展。
[2]宇然,數(shù)據(jù)挖掘技術(shù)研究以及在檔案計算機管理系統(tǒng)中的應(yīng)用[d].沈陽工業(yè)大學(xué),20xx.
[3]吳秀霞,關(guān)于檔案管理方面的數(shù)據(jù)挖掘分析及應(yīng)用探討[j].經(jīng)營管理者,20xx:338.
數(shù)據(jù)挖掘論文摘要篇七
摘要:大數(shù)據(jù)和智游都是當下的熱點,沒有大數(shù)據(jù)的智游無從談“智慧”,數(shù)據(jù)挖掘是大數(shù)據(jù)應(yīng)用于智游的核心,文章探究了在智游應(yīng)用中,目前大數(shù)據(jù)挖掘存在的幾個問題。
關(guān)鍵詞:大數(shù)據(jù);智游;數(shù)據(jù)挖掘;
1引言。
隨著人民生活水平的進一步提高,旅游消費的需求進一步上升,在云計算、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)以及移動智能終端等信息通訊技術(shù)的飛速發(fā)展下,智游應(yīng)運而生。大數(shù)據(jù)作為當下的熱點已經(jīng)成了智游發(fā)展的有力支撐,沒有大數(shù)據(jù)提供的有利信息,智游無法變得“智慧”。
2大數(shù)據(jù)與智游。
旅游業(yè)是信息密、綜合性強、信息依存度高的產(chǎn)業(yè)[1],這讓其與大數(shù)據(jù)自然產(chǎn)生了交匯。,江蘇省鎮(zhèn)江市首先提出“智游”的概念,雖然至今國內(nèi)外對于智游還沒有一個統(tǒng)一的學(xué)術(shù)定義,但在與大數(shù)據(jù)相關(guān)的描述中,有學(xué)者從大數(shù)據(jù)挖掘在智游中的作用出發(fā),把智游描述為:通過充分收集和管理所有類型和來源的旅游數(shù)據(jù),并深入挖掘這些數(shù)據(jù)的潛在重要價值信息,然后利用這些信息為相關(guān)部門或?qū)ο筇峁┓?wù)[2]。這一定義充分肯定了在發(fā)展智游中,大數(shù)據(jù)挖掘所起的至關(guān)重要的作用,指出了在智游的過程中,數(shù)據(jù)的收集、儲存、管理都是為數(shù)據(jù)挖掘服務(wù),智游最終所需要的是利用挖掘所得的有用信息。
3大數(shù)據(jù)挖掘在智游中存在的問題。
我國提出用十年時間基本實現(xiàn)智游的目標[3]過去幾年國家旅游局的相關(guān)動作均為了實現(xiàn)這一目標。但是在借助大數(shù)據(jù)推動智游的可持續(xù)性發(fā)展中大數(shù)據(jù)所產(chǎn)生的價值卻亟待提高原因之一就是在收集、儲存了大量數(shù)據(jù)后對它們深入挖掘不夠沒有發(fā)掘出數(shù)據(jù)更多的價值。
3.1信息化建設(shè)。
智游的發(fā)展離不開移動網(wǎng)絡(luò)、物聯(lián)網(wǎng)、云平臺。隨著大數(shù)據(jù)的不斷發(fā)展,國內(nèi)許多景區(qū)已經(jīng)實現(xiàn)wi—fi覆蓋,部分景區(qū)也已實現(xiàn)人與人、人與物、人與景點之間的實時互動,多省市已建有旅游產(chǎn)業(yè)監(jiān)測平臺或旅游大數(shù)據(jù)中心以及數(shù)據(jù)可視化平臺,從中進行數(shù)據(jù)統(tǒng)計、行為分析、監(jiān)控預(yù)警、服務(wù)質(zhì)量監(jiān)督等。通過這些平臺,已基本能掌握跟游客和景點相關(guān)的數(shù)據(jù),可以實現(xiàn)更好旅游監(jiān)控、產(chǎn)業(yè)宏觀監(jiān)控,對該地的旅游管理和推廣都能發(fā)揮重要作用。
但從智慧化的發(fā)展來看,我國的信息化建設(shè)還需加強。雖然通訊網(wǎng)絡(luò)已基本能保證,但是大部分景區(qū)還無法實現(xiàn)對景區(qū)全面、透徹、及時的感知,更為困難的是對平臺的建設(shè)。在數(shù)據(jù)共享平臺的建設(shè)上,除了必備的硬件設(shè)施,大數(shù)據(jù)實驗平臺還涉及大量部門,如政府管理部門、氣象部門、交通、電子商務(wù)、旅行社、旅游網(wǎng)站等。如此多的部門相關(guān)聯(lián),要想建立一個完整全面的大數(shù)據(jù)實驗平臺,難度可想而知。
大數(shù)據(jù)時代缺的不是數(shù)據(jù),而是方法。大數(shù)據(jù)在旅游行業(yè)的應(yīng)用前景非常廣闊,但是面對大量的數(shù)據(jù),不懂如何收集有用的數(shù)據(jù)、不懂如何對數(shù)據(jù)進行挖掘和利用,那么“大數(shù)據(jù)”猶如礦山之中的廢石。旅游行業(yè)所涉及的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),通過云計算技術(shù),對數(shù)據(jù)的收集、存儲都較為容易,但對數(shù)據(jù)的挖掘分析則還在不斷探索中。大數(shù)據(jù)的挖掘常用的方法有關(guān)聯(lián)分析,相似度分析,距離分析,聚類分析等等,這些方法從不同的角度對數(shù)據(jù)進行挖掘。其中,相關(guān)性分析方法通過關(guān)聯(lián)多個數(shù)據(jù)來源,挖掘數(shù)據(jù)價值。但針對旅游數(shù)據(jù),采用這些方法挖掘數(shù)據(jù)的價值信息,難度也很大,因為旅游數(shù)據(jù)中冗余數(shù)據(jù)很多,數(shù)據(jù)存在形式很復(fù)雜。在旅游非結(jié)構(gòu)化數(shù)據(jù)中,一張圖片、一個天氣變化、一次輿情評價等都將會對游客的旅行計劃帶來影響。對這些數(shù)據(jù)完全挖掘分析,對游客“行前、行中、行后”大數(shù)據(jù)的實時性挖掘都是很大的挑戰(zhàn)。
3.3數(shù)據(jù)安全。
數(shù)據(jù)安全事件屢見不鮮伴著大數(shù)據(jù)而來的數(shù)據(jù)安全問題日益凸顯出來。在大數(shù)據(jù)時代無處不在的數(shù)據(jù)收集技術(shù)使我們的個人信息在所關(guān)聯(lián)的數(shù)據(jù)中心留下痕跡如何保證這些信息被合法合理使用讓數(shù)據(jù)“可用不可見”[4]這是亟待解決的問題。同時在大數(shù)據(jù)資源的開放性和共享性下個人隱私和公民權(quán)益受到嚴重威脅。這一矛盾的存在使數(shù)據(jù)共享程度與數(shù)據(jù)挖掘程度成反比。此外經(jīng)過大數(shù)據(jù)技術(shù)的分析、挖掘個人隱私更易被發(fā)現(xiàn)和暴露從而可能引發(fā)一系列社會問題。
大數(shù)據(jù)背景下的旅游數(shù)據(jù)當然也避免不了數(shù)據(jù)的安全問題。如果游客“吃、住、行、游、娛、購”的數(shù)據(jù)被放入數(shù)據(jù)庫,被完全共享、挖掘、分析,那游客的人身財產(chǎn)安全將會受到嚴重影響,最終降低旅游體驗。所以,數(shù)據(jù)的安全管理是進行大數(shù)據(jù)挖掘的前提。
3.4大數(shù)據(jù)人才。
大數(shù)據(jù)背景下的智游離不開人才的創(chuàng)新活動及技術(shù)支持,然而與專業(yè)相銜接的大數(shù)據(jù)人才培養(yǎng)未能及時跟上行業(yè)需求,加之創(chuàng)新型人才的外流,以及數(shù)據(jù)統(tǒng)計未來3~5年大數(shù)據(jù)行業(yè)將面臨全球性的人才荒,國內(nèi)智游的構(gòu)建還缺乏大量人才。
4解決思路。
在信息化建設(shè)上,加大政府投入,加強基礎(chǔ)設(shè)施建設(shè),整合結(jié)構(gòu)化數(shù)據(jù),抓取非結(jié)構(gòu)化數(shù)據(jù),打通各數(shù)據(jù)壁壘,建設(shè)旅游大數(shù)據(jù)實驗平臺;在挖掘方法上,對旅游大數(shù)據(jù)實時性數(shù)據(jù)的挖掘應(yīng)該被放在重要位置;在數(shù)據(jù)安全上,從加強大數(shù)據(jù)安全立法、監(jiān)管執(zhí)法及強化技術(shù)手段建設(shè)等幾個方面著手,提升大數(shù)據(jù)環(huán)境下數(shù)據(jù)安全保護水平。加強人才的培養(yǎng)與引進,加強產(chǎn)學(xué)研合作,培養(yǎng)智游大數(shù)據(jù)人才。
參考文獻。
數(shù)據(jù)挖掘論文摘要篇八
[1]劉瑩?;跀?shù)據(jù)挖掘的商品銷售預(yù)測分析[j].科技通報。20xx(07)。
[2]姜曉娟,郭一娜?;诟倪M聚類的電信客戶流失預(yù)測分析[j].太原理工大學(xué)學(xué)報。20xx(04)。
[3]李欣海。隨機森林模型在分類與回歸分析中的應(yīng)用[j].應(yīng)用昆蟲學(xué)報。20xx(04)。
[4]朱志勇,徐長梅,劉志兵,胡晨剛?;谪惾~斯網(wǎng)絡(luò)的客戶流失分析研究[j].計算機工程與科學(xué)。20xx(03)。
[5]翟健宏,李偉,葛瑞海,楊茹?;诰垲惻c貝葉斯分類器的網(wǎng)絡(luò)節(jié)點分組算法及評價模型[j].電信科學(xué)。20xx(02)。
[6]王曼,施念,花琳琳,楊永利。成組刪除法和多重填補法對隨機缺失的二分類變量資料處理效果的比較[j].鄭州大學(xué)學(xué)報(醫(yī)學(xué)版).20xx(05)。
[7]黃杰晟,曹永鋒。挖掘類改進決策樹[j].現(xiàn)代計算機(專業(yè)版).20xx(01)。
[8]李凈,張范,張智江。數(shù)據(jù)挖掘技術(shù)與電信客戶分析[j].信息通信技術(shù)。20xx(05)。
[9]武曉巖,李康?;虮磉_數(shù)據(jù)判別分析的隨機森林方法[j].中國衛(wèi)生統(tǒng)計。20xx(06)。
[10]張璐。論信息與企業(yè)競爭力[j].現(xiàn)代情報。20xx(01)。
[13]俞馳?;诰W(wǎng)絡(luò)數(shù)據(jù)挖掘的客戶獲取系統(tǒng)研究[d].西安電子科技大學(xué)20xx。
[14]馮軍。數(shù)據(jù)挖掘在自動外呼系統(tǒng)中的應(yīng)用[d].北京郵電大學(xué)20xx。
[15]于寶華。基于數(shù)據(jù)挖掘的高考數(shù)據(jù)分析[d].天津大學(xué)20xx。
[16]王仁彥。數(shù)據(jù)挖掘與網(wǎng)站運營管理[d].華東師范大學(xué)20xx。
[19]賈治國。數(shù)據(jù)挖掘在高考填報志愿上的應(yīng)用[d].內(nèi)蒙古大學(xué)20xx。
[22]阮偉玲。面向生鮮農(nóng)產(chǎn)品溯源的基層數(shù)據(jù)庫建設(shè)[d].成都理工大學(xué)20xx。
[23]明慧。復(fù)合材料加工工藝數(shù)據(jù)庫構(gòu)建及數(shù)據(jù)集成[d].大連理工大學(xué)20xx。
[25]岳雪?;诤A繑?shù)據(jù)挖掘關(guān)聯(lián)測度工具的設(shè)計[d].西安財經(jīng)學(xué)院20xx。
[28]張曉東。全序模塊模式下范式分解問題研究[d].哈爾濱理工大學(xué)20xx。
[30]王化楠。一種新的混合遺傳的基因聚類方法[d].大連理工大學(xué)20xx。
[33]俞馳。基于網(wǎng)絡(luò)數(shù)據(jù)挖掘的客戶獲取系統(tǒng)研究[d].西安電子科技大學(xué)20xx。
[34]馮軍。數(shù)據(jù)挖掘在自動外呼系統(tǒng)中的應(yīng)用[d].北京郵電大學(xué)20xx。
[35]于寶華。基于數(shù)據(jù)挖掘的高考數(shù)據(jù)分析[d].天津大學(xué)20xx。
[36]王仁彥。數(shù)據(jù)挖掘與網(wǎng)站運營管理[d].華東師范大學(xué)20xx。
[39]賈治國。數(shù)據(jù)挖掘在高考填報志愿上的應(yīng)用[d].內(nèi)蒙古大學(xué)20xx。
數(shù)據(jù)挖掘論文摘要篇九
根據(jù)20xx年4月國家教育部等五部關(guān)于印發(fā)《職業(yè)學(xué)校學(xué)生實習管理規(guī)定》的通知(教職成[20xx]3號)精神,針對旅游管理專業(yè)頂崗實習企業(yè)的實際情況以及頂崗實習現(xiàn)狀,多角度分析新《職業(yè)學(xué)校學(xué)生頂崗實習管理規(guī)定》(以下簡稱新《規(guī)定》)對旅游管理專業(yè)頂崗實習的新要求,探索可操作的改進辦法,為旅游管理專業(yè)實施頂崗實習教學(xué)課程提供借鑒和幫助。
(1)實習企業(yè)較多,大部分企業(yè)需求人數(shù)少,實習生分布零散,跟蹤管理難度大。
(2)由學(xué)校安排實習的,大多是由學(xué)校和實習企業(yè)簽訂雙方協(xié)議,實習生簽閱《實習生管理守則》。
(3)中職學(xué)校旅游管理專業(yè)頂崗實習學(xué)生大多未滿18周歲。
(4)實習評價體系不完善,對實習生的考核主觀成分多,量化標準少。
(5)實習期仍以學(xué)生平安險作為學(xué)生意外傷害保險,尚未為學(xué)生購買專門的實習責任險。
2.新《規(guī)定》對頂崗實習的影響及改進方法。
(1)新《規(guī)定》再次強調(diào)對實習過程的全程指導(dǎo),并明確提出,對自行安排實習的學(xué)生也要進行跟蹤管理(新《規(guī)定》第七條、第八條)。而旅游管理專業(yè)實習企業(yè)特別是旅行社,企業(yè)多,規(guī)模小,需求人數(shù)少,實習生分布零散,甚至一個企業(yè)只有一個實習生,管理和指導(dǎo)難度大。調(diào)查資料顯示,旅游專業(yè)實習企業(yè)中90%是旅行社,而實習生中只有50%在旅行社實習。這種情況實習指導(dǎo)教師如果要實現(xiàn)對每個實習生的指導(dǎo)管理,那么大部分時間都在外跑實習點,學(xué)校對專業(yè)教師的教學(xué)任務(wù)、科研任務(wù)及其他工作都很難完成。針對這一現(xiàn)狀,結(jié)合新《規(guī)定》要求,可從以下方面著手改進:
1)建立校企生聯(lián)動實習管理制度。在學(xué)校數(shù)字化平臺增加實習管理模塊,將實習操作流程、標準分單元錄入模塊內(nèi),實習生定期在平臺上提交單元作業(yè),企業(yè)指導(dǎo)教師和學(xué)校指導(dǎo)教師定期在平臺上提交實習生單元成績,最后的實習總成績由單元成績按比例匯總而成。這樣既可參與和掌控實習過程,又能優(yōu)化實習考核體系,增加量化標準。如數(shù)字平臺無法立即實施,可先采用電子文檔或紙質(zhì)文檔方式。
2)實習面試結(jié)束后,組織召開實習指導(dǎo)教師動員會,由學(xué)校安排的指導(dǎo)教師和各企業(yè)安排的指導(dǎo)教師參加,共同學(xué)習和調(diào)整實習計劃、操作標準、達標考核、指導(dǎo)流程等。
3)實習收尾階段,組織召開實習總結(jié)會,對實習工作進行交流分享,對實際工作中遇到的問題提出改進建議,為即將開展的新一輪實習工作做好鋪墊。
(2)新《規(guī)定》第十二條、第十三條要求,頂崗實習前學(xué)校、企業(yè)、學(xué)生須簽訂三方協(xié)議,這對制約企業(yè)、約束學(xué)生有了明確依據(jù)。旅游企業(yè)淡旺季明顯,一些企業(yè)到了淡季就將學(xué)生解聘;學(xué)生實習中無法適應(yīng)而中途離職的也時有發(fā)生,所以協(xié)議內(nèi)容除新《規(guī)定》列示內(nèi)容外,還應(yīng)增加實習生到崗后應(yīng)遵守的相關(guān)管理制度、學(xué)生違反規(guī)定的處理辦法等內(nèi)容。
(3)新《規(guī)定》第十四條要求,未滿18周歲的學(xué)生參加頂崗實習,須由監(jiān)護人簽閱知情同意書。大部分中職學(xué)校學(xué)生在實習時都未達到該年齡標準,因此中職學(xué)校在實習前應(yīng)按戶口登記年齡進行一次篩選,將“頂崗實習學(xué)生監(jiān)護人知情同意書”以統(tǒng)一格式發(fā)放給未滿18周歲學(xué)生,并告知監(jiān)護人,請監(jiān)護人簽閱?!爸橥鈺苯粚W(xué)校后方可參加實習面試。
(4)新《規(guī)定》第三十五條要求,職業(yè)學(xué)?;?qū)嵙晢挝粦?yīng)為實習學(xué)生投保實習責任保險。實習責任險是指學(xué)生在實習期間,因?qū)W校的管理疏忽對學(xué)生造成的身體、心理傷害應(yīng)由學(xué)校承擔責任的保險。據(jù)調(diào)查,保險公司目前尚未推出專門的實習責任險,但可先為實習生購買一年期限的意外險。但意外險與實習責任險在投保范圍、價格等方面還有差異,所以,職業(yè)學(xué)校也應(yīng)同時與保險行業(yè)接觸,積極推進實習責任險的設(shè)計出臺。
總之,旅游管理專業(yè)頂崗實習在實施過程中還存在一些問題和困難,如企業(yè)與學(xué)校的需求差異、旅游行業(yè)淡旺季與實習期的時間矛盾、實習生生活管理和心理疏導(dǎo)問題等,有待在《新規(guī)定》的要求和指導(dǎo)下,與企業(yè)深度合作,探索出一套有效的、可操作的頂崗實習實施標準。
數(shù)據(jù)挖掘論文摘要篇十
隨著會計現(xiàn)代化的發(fā)展,會計越來越多的運用計算機技術(shù)的拓展。
數(shù)據(jù)挖掘是從數(shù)據(jù)當中發(fā)現(xiàn)趨勢和模式的過程,它融合了現(xiàn)代統(tǒng)計學(xué)、知識信息系統(tǒng)、機器學(xué)習、決策理論和數(shù)據(jù)庫管理等多學(xué)科的知識。它能有效地從大量的、不完全的、模糊的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的潛在有用的信息和知識,揭示出大量數(shù)據(jù)中復(fù)雜的和隱藏的關(guān)系,為決策提供有用的參考。數(shù)據(jù)挖掘是從數(shù)據(jù)當中發(fā)現(xiàn)趨勢和模式的過程,它融合了現(xiàn)代統(tǒng)計學(xué)、知識信息系統(tǒng)、機器學(xué)習、決策理論和數(shù)據(jù)庫管理等多學(xué)科的知識。它能有效地從大量的、不完全的、模糊的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的潛存有用的信息和知識,揭示出大量數(shù)據(jù)中復(fù)雜的和隱藏的關(guān)系,為決策提供有用的參考。
常用的數(shù)據(jù)挖掘方法主要有決策樹(decisiontree)、遺傳算法(geneticalgorithms)、關(guān)聯(lián)分析(associationanalysis).聚類分析(c~smranalysis)、序列模式分析(sequentialpattern)以及神經(jīng)網(wǎng)絡(luò)(neuralnetworks)等。
由于數(shù)據(jù)挖掘市場還處于起步的階段,但是發(fā)展很快。在國外有一些著名的大公司對數(shù)據(jù)挖掘系統(tǒng)進行了開發(fā)。
igentminer這是ibm公司的數(shù)據(jù)挖掘產(chǎn)品,它提供了很多數(shù)據(jù)挖掘算法,包括關(guān)聯(lián)、分類、回歸、預(yù)測模型、偏離檢測、序列模式分析和聚類。有2個特點:一是它的數(shù)據(jù)挖掘算法的可伸縮性;二是它與ibm/db/2關(guān)系數(shù)據(jù)庫系統(tǒng)緊密地結(jié)合在一起。
t是由sgi公司開發(fā)的,它也提供了多種數(shù)據(jù)挖掘方法,包括關(guān)聯(lián)分析和分類以及高級統(tǒng)計和可視化工具。特色是它具有的強大的圖形工具,包括規(guī)則可視化工具、樹可視化工具、地圖可視化工具和多維數(shù)據(jù)分散可視化工具,它們用于實現(xiàn)數(shù)據(jù)和數(shù)據(jù)挖掘結(jié)果的可視化。
tine是由isl公司開發(fā)的,它為終端用戶和開發(fā)者提供提供了一個集成的數(shù)據(jù)挖掘開發(fā)環(huán)境。
面對日益激烈的競爭環(huán)境,企業(yè)管理者對決策信息的需求也越來越高。管理會計作為企業(yè)決策支持系統(tǒng)的重要組成部分,提供更多、更有效的有用信息責無旁貸。因此,從海量數(shù)據(jù)中挖掘和尋求知識和信息,為決策提供有力支持成為管理會計師使用數(shù)據(jù)挖掘的強大動力。例如,數(shù)據(jù)挖掘可以幫助企業(yè)加強成本管理,改進產(chǎn)品和服務(wù)質(zhì)量,提高貨品銷量比率,設(shè)計更好的貨品運輸與分銷策略,減少商業(yè)成本。
實踐證明數(shù)據(jù)挖掘不僅能明顯改善企業(yè)內(nèi)部流程,而且能夠從戰(zhàn)略的高度對企業(yè)的競爭環(huán)境、市場、顧客和供應(yīng)商進行分析,以獲得有價值的商業(yè)情報,保持和提高企業(yè)持續(xù)競爭優(yōu)勢。如,對顧客價值分析能夠?qū)槠髽I(yè)創(chuàng)造80%價值的20%的顧客區(qū)分出來,對其提供更優(yōu)質(zhì)的服務(wù),以保持這部分顧客。
險
利用數(shù)據(jù)挖掘技術(shù)可以建立企業(yè)財務(wù)風險預(yù)警模型。企業(yè)財務(wù)風險的發(fā)生并非一蹴而就,而是一個積累的、漸進的過程,通過建立財務(wù)風險預(yù)警模型,可以隨時監(jiān)控企業(yè)財務(wù)狀況,防范財務(wù)危機的發(fā)生。另外,也可以利用數(shù)據(jù)挖掘技術(shù),對企業(yè)籌資和投資過程中的行為進行監(jiān)控,防止惡意的商業(yè)欺詐行為,維護企業(yè)利益。尤其是在金融企業(yè),通過數(shù)據(jù)挖掘,可以解決銀行業(yè)面臨的如信用卡的惡意透支及可疑的信用卡交易等欺詐行為。根據(jù)sec的報告,美國銀行、美國第一銀行、聯(lián)邦住房貸款抵押公司等數(shù)家銀行已采用了數(shù)據(jù)挖掘技術(shù)。
作業(yè)成本法以其對成本的精確計算和對資源的充分利用引起了人們的極大興趣,但其復(fù)雜的操作使得很多管理者望而卻步。利用數(shù)據(jù)挖掘中的回歸分析、分類分析等方法能幫助管理會計師確定成本動因,更加準確計算成本。同時,也可以通過分析作業(yè)與價值之間的關(guān)系,確定增值作業(yè)和非增值作業(yè),持續(xù)改進和優(yōu)化企業(yè)價值鏈。在thomasg,johnj和il-woonkim的調(diào)查中,數(shù)據(jù)挖掘被用在作業(yè)成本管理中僅占3%。
管理會計師在很多情況下需要對未來進行預(yù)測,而預(yù)測是建立在大量的歷史數(shù)據(jù)和適當?shù)哪P突A(chǔ)上的。數(shù)據(jù)挖掘自動在大型數(shù)據(jù)庫中尋找預(yù)測性信息,利用趨勢分析、時間序列分析等方法,建立對如銷售、成本、資金等的預(yù)測模型,科學(xué)準確的預(yù)測企業(yè)各項指標,作為決策的依據(jù)。例如對市場調(diào)查數(shù)據(jù)的分析可以幫助預(yù)測銷售;根據(jù)歷史資料建立銷售預(yù)測模型等。
投資決策分析本身就是一個非常復(fù)雜的過程,往往要借助一些工具和模型。數(shù)據(jù)挖掘技術(shù)提供了有效的工具。從公司的財務(wù)報告、宏觀的經(jīng)濟環(huán)境以及行業(yè)基本狀況等大量的數(shù)據(jù)資料中挖掘出與決策相關(guān)的實質(zhì)性的信息,保證投資決策的正確性和有效性。如利用時間序列分析模型預(yù)測股票價格進行投資;用聯(lián)機分析處理技術(shù)分析公司的信用等級,以預(yù)防投資風險等。
品種優(yōu)化是選擇適當?shù)漠a(chǎn)品組合以實現(xiàn)最大的利益的過程,這些利益可以是短期利潤,也可以是長期市場占有率,還可以是構(gòu)建長期客戶群及其綜合體。為了達到這些目標,管理會計師不僅僅需要價格和成本數(shù)據(jù)有時還需要知道替代品的情況,以及在某一市場段位上它們與原產(chǎn)品競爭的狀況。另外企業(yè)也需要了解一個產(chǎn)品是如何刺激另一些產(chǎn)品的銷量的等等。例如,非盈利性產(chǎn)品本身是沒有利潤可言的,但是,如果它帶來了可觀的客戶流量,并刺激了高利潤產(chǎn)品的銷售,那么,這種產(chǎn)品就非常有利可圖,就應(yīng)該包括在產(chǎn)品清單中。這些信息可根據(jù)實際數(shù)據(jù),通過關(guān)聯(lián)分析等技術(shù)來得到。
管理會計師可以利用數(shù)據(jù)挖掘工具來評價企業(yè)的財務(wù)風險,建立企業(yè)財務(wù)危機預(yù)警模型,進行破產(chǎn)預(yù)測。破產(chǎn)預(yù)測或稱財務(wù)危機預(yù)警模型能夠幫助管理者及時了解企業(yè)的財務(wù)風險,提前采取風險防范措施,避免破產(chǎn)。另外,破產(chǎn)預(yù)測模型還能幫助分析破產(chǎn)原因,對企業(yè)管理者意義重大。,數(shù)據(jù)挖掘技術(shù)包括多維判別式分析、邏輯回歸分析、遺傳算法、神經(jīng)網(wǎng)絡(luò)以及決策樹等方法在管理會計中得到了廣泛的應(yīng)用。
數(shù)據(jù)挖掘是個嶄新的領(lǐng)域,對于數(shù)字和信息的處理是非??茖W(xué)和方便的,也是非常高效率和合理分析的非常好的工具,對于會計管理領(lǐng)域的應(yīng)用在國際上只是剛剛開始,相信隨著會計的國際化的接軌和計算機科學(xué)的進步,在我國的會計領(lǐng)域中的數(shù)據(jù)挖掘理論會得到不斷的提升,在管理會計實際應(yīng)用中的數(shù)據(jù)挖掘也越來越多樣化和普及化。
數(shù)據(jù)挖掘論文摘要篇十一
摘要:主要通過對數(shù)據(jù)挖掘技術(shù)的探討,對職教多年累積的教學(xué)數(shù)據(jù)運用分類、決策樹、關(guān)聯(lián)規(guī)則等技術(shù)進行分析,從分析的結(jié)果中發(fā)現(xiàn)有價值的數(shù)據(jù)模式,科學(xué)合理地實現(xiàn)教學(xué)評估,讓教學(xué)管理者能夠從中發(fā)現(xiàn)教學(xué)活動中存在的主要問題以便及時改進,進而輔助管理者決策做好教學(xué)管理。
關(guān)鍵詞:教學(xué)評估;數(shù)據(jù)挖掘;教學(xué)評估體系;層次分析法。
1概述。
近年來國家對中等職業(yè)教育的發(fā)展高度重視,在政策扶持與職教工作者的努力下,職業(yè)教育獲得了蓬勃的發(fā)展。如何提高教學(xué)質(zhì)量、培養(yǎng)合格的高技術(shù)人才成為職教工作者研究的課題。各種調(diào)查研究結(jié)果表明:加強師資隊伍的建設(shè),強化教師教學(xué)評估對教學(xué)質(zhì)量的提高尤為重要。
所謂教學(xué)評估,就是運用系統(tǒng)科學(xué)的方法對教學(xué)活動或教育行為的價值、效果作出科學(xué)的判斷過程。教學(xué)評估方式要靈活多樣,要多途徑、多方位、多形式的發(fā)揮評估的導(dǎo)學(xué)作用,以鼓勵評估為主,充分發(fā)揮評估的激勵功能,促進教學(xué)的健康發(fā)展。
在中等職業(yè)學(xué)校多年的教育教學(xué)工作中積累了大量的教務(wù)管理數(shù)據(jù)、教師檔案數(shù)據(jù)等,怎樣從龐雜大量的數(shù)據(jù)中挖掘出有效提高教學(xué)質(zhì)量的關(guān)鍵因素是個難題。數(shù)據(jù)挖掘技術(shù)卻可以從人工智能的角度很好地解決這一課題。通過數(shù)據(jù)挖掘技術(shù),得到隱藏在教學(xué)數(shù)據(jù)背后的有用信息,在一定程度上為教學(xué)部門提供決策支持信息促使更好地開展教學(xué)工作,提高教學(xué)質(zhì)量和教學(xué)管理水平,使之能在功能上更加清晰地認識教師教與學(xué)生學(xué)的關(guān)系及促進教育教學(xué)改革。
數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘應(yīng)該更正確地命名為“從數(shù)據(jù)中挖掘知識”。即數(shù)據(jù)挖掘是對巨大的數(shù)據(jù)集進行尋找和分析的計算機輔助處理過程,在這一過程中顯現(xiàn)先前未曾發(fā)現(xiàn)的模式,然后從這些數(shù)據(jù)中發(fā)掘某些內(nèi)涵信息,包括描述過去和預(yù)測未來趨勢的信息。人工智能領(lǐng)域習慣稱知識發(fā)現(xiàn),而數(shù)據(jù)庫領(lǐng)域習慣將其稱為數(shù)據(jù)挖掘。
數(shù)據(jù)挖掘過程包括對問題的理解和提出、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)變換、數(shù)據(jù)挖掘、模式評估、知識表示等過程,以上的過程不是一次完成的,其中某些步驟或者全過程可能要反復(fù)進行。對問題的理解和提出在開始數(shù)據(jù)挖掘之前,最基礎(chǔ)的工作就是理解數(shù)據(jù)和實際的業(yè)務(wù)問題,在這個基礎(chǔ)之上提出問題,對目標作出明確的定義。
2.3.1分類分析方法:是通過分析訓(xùn)練集中的數(shù)據(jù),為每個類別做出準確的描述或建立分析模型或挖掘出分類規(guī)則,以便以后利用這個分類規(guī)則對其它數(shù)據(jù)庫中的記錄進行分類的方法。2.3.2決策樹算法:是一種常用于分類、預(yù)測模型的算法,它通過將大量數(shù)據(jù)有目的的分類,從而找到一些有價值的、潛在的信息。它的主要優(yōu)點是描述簡單,分類速度快,特別適合大規(guī)模的數(shù)據(jù)處理。2.3.3聚類算法:聚類分析處理的數(shù)據(jù)對象的類是未知的。聚類分析就是將對象集合分組為由類似的對象組成的多個簇的過程。在同一個簇內(nèi)的對象之間具有較高的相似度,而不同簇內(nèi)的對象差別較大。2.3.4關(guān)聯(lián)規(guī)則算法:側(cè)重于確定數(shù)據(jù)中不同領(lǐng)域之間的關(guān)系,即尋找給定數(shù)據(jù)集中的有趣聯(lián)系。提取描述數(shù)據(jù)庫中數(shù)據(jù)項之間所存在的潛在關(guān)系的規(guī)則,找出滿足給定支持度和置信度閾值的多個域之間的依賴關(guān)系。
在以上各種算法的研究中,比較有影響的是關(guān)聯(lián)規(guī)則算法。
3教學(xué)評估體系。
評價指標體系是教學(xué)評估的基礎(chǔ)和依據(jù),對評估起著導(dǎo)向作用,因此制定一個科學(xué)全面的評價指標體系就成為改革、完善評價的首要目標。評價指標應(yīng)以指導(dǎo)教學(xué)實踐為目的,通過評價使教師明確教學(xué)過程中應(yīng)該肯定的和需要改進的地方;以及給出設(shè)計評價指標的導(dǎo)向問題。
3.1教學(xué)評估體系的構(gòu)建方法。
層次分析法(簡稱ahp法)是美國運籌學(xué)家t·l·saaty教授在20世紀70年代初期提出的一種簡便、靈活而又實用的多準則決策的系統(tǒng)分析方法,其原理是把一個復(fù)雜問題分解、轉(zhuǎn)化為定量分析的方法。它需要建立關(guān)于系統(tǒng)屬性的各因素多級遞階結(jié)構(gòu),然后對每一層次上的因素逐一進行比較,得到判斷矩陣,通過計算判斷矩陣的特征值和特征向量,得到其關(guān)于上一層因素的相對權(quán)重,并可自上而下地用上一層次因素的相對權(quán)重加權(quán)求和,求出各層次因素關(guān)于系統(tǒng)整體屬性(總目標層)的綜合重要度。
3.2構(gòu)建教學(xué)評估指標體系的作用。
3.2.1構(gòu)建的教學(xué)評估指標,作為挖掘庫選擇教學(xué)信息屬性的依據(jù)。
3.2.2通過ahp方法,能篩選出用來評價教學(xué)質(zhì)量的相關(guān)重要屬性,從而入選為挖掘庫字段,這樣就減去了挖掘庫中對于挖掘目標來說影響較小的屬性,進而大大減少了挖掘的工作量,提高挖掘效率。3.2.3通過構(gòu)建教學(xué)評估指標,減少了挖掘?qū)ο蟮淖侄?,從而避免因挖掘字段過多,導(dǎo)致建立的決策樹過大,出現(xiàn)過度擬合挖掘?qū)ο?,進而造成挖掘規(guī)則不具有很好的評價效果的現(xiàn)象。3.2.4提高教學(xué)質(zhì)量評估實施工作的效率。
4.1學(xué)習效果評價學(xué)習評價是教育工作者的重要職責之一。評價學(xué)生的學(xué)習情況,既對學(xué)生起到信息反饋和激發(fā)學(xué)習動機的作用,又是檢查課程計劃、教學(xué)程序以至教學(xué)目的的手段,也是考查學(xué)生個別差異、便于因材施教的途徑。評價要遵循“評價內(nèi)容要全面、評價方式要多元化、評價次數(shù)要多次化,注重自評與互評的有機結(jié)合”的原則。利用數(shù)據(jù)挖掘工具,對教師業(yè)務(wù)檔案數(shù)據(jù)庫、行為記錄數(shù)據(jù)庫、獎勵處罰數(shù)據(jù)庫等進行分析處理,可以即時得到教師教學(xué)的評價結(jié)果,對教學(xué)過程出現(xiàn)的問題進行及時指正。
另外,這種系統(tǒng)還能夠克服教師主觀評價的不公正、不客觀的弱點,減輕教師的工作量。
4.2課堂教學(xué)評價。
課堂教學(xué)評價不僅對教學(xué)起著調(diào)節(jié)、控制、指導(dǎo)和推動作用,而且有很強的導(dǎo)向性,是學(xué)校教學(xué)管理的重要組成部分,是評價教學(xué)工作成績的主要手段。實現(xiàn)對任課教師及教學(xué)組織工作效果做出評價,但是更重要的目的是總結(jié)優(yōu)秀的教學(xué)經(jīng)驗,為教學(xué)質(zhì)量的穩(wěn)定提高制定科學(xué)的規(guī)范。學(xué)校每學(xué)期都要搞課堂教學(xué)評價調(diào)查,積累了大量的數(shù)據(jù)。利用數(shù)據(jù)挖掘技術(shù),從教學(xué)評價數(shù)據(jù)中進行數(shù)據(jù)挖掘,將關(guān)聯(lián)規(guī)則應(yīng)用于教師教學(xué)評估系統(tǒng)中,探討教學(xué)效果的好壞與老師的年齡、職稱、學(xué)歷之間的聯(lián)系;確定教師的教學(xué)內(nèi)容的范圍和深度是否合適,選擇的教學(xué)媒體是否適合所選的教學(xué)內(nèi)容和教學(xué)對象;講解的時間是否恰到好處;教學(xué)策略是否得當?shù)?。從而可以及時地將挖掘出的規(guī)則信息反饋給教師。管理部門據(jù)此能合理配置班級的上課教師,使學(xué)生能夠較好地保持良好的學(xué)習態(tài)度,從而為教學(xué)部門提供了決策支持信息,促使教學(xué)工作更好地開展。
結(jié)束語。
數(shù)據(jù)挖掘作為一種工具,其技術(shù)日趨成熟,在許多領(lǐng)域取得了廣泛的應(yīng)用。在教育領(lǐng)域里,隨著數(shù)據(jù)的不斷累積,把數(shù)據(jù)挖掘技術(shù)應(yīng)用到教學(xué)評價系統(tǒng)中,讓領(lǐng)導(dǎo)者能夠從中發(fā)現(xiàn)教師教學(xué)活動中的主要問題,以便及時改進,進而輔助領(lǐng)導(dǎo)決策做好學(xué)校管理,提高學(xué)校管理能力和水平,同時通過建立有效的教學(xué)激勵機制來達到提高教學(xué)質(zhì)量的目的。這一研究對發(fā)展中的職業(yè)教育教學(xué)管理提出了很好的建議,為教學(xué)管理工作的計算機輔助決策增添了新的內(nèi)容。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于中職教學(xué)評估,設(shè)計開發(fā)一套行之有效的課堂教學(xué)評價系統(tǒng),是下一步要做的工作,必將有力推動職業(yè)教育的快速發(fā)展。
數(shù)據(jù)挖掘論文摘要篇十二
摘要:人類利用圖書館產(chǎn)生信息活動時所表現(xiàn)出的最基礎(chǔ)、最平常、最通用的一種關(guān)系,便是用戶資源和圖書館之間的關(guān)系。從這種關(guān)系出發(fā),分析嫁接起這一簡單聯(lián)系的規(guī)律,便是數(shù)據(jù)挖掘技術(shù)。本文認為對圖書館用戶資源分析研究應(yīng)以數(shù)據(jù)挖掘技術(shù)為邏輯起點,從云計算、信息共享、數(shù)據(jù)排查、智能搜索、大數(shù)據(jù)存儲等對圖書館用戶資源進行整合和建設(shè)。應(yīng)對信息資源日益豐富的這天,數(shù)據(jù)挖掘技術(shù)對管理圖書館信息資源技術(shù)帶給了巨大便利。
關(guān)鍵詞:數(shù)據(jù)挖掘;用戶資源。
數(shù)據(jù)挖掘,即數(shù)據(jù)系統(tǒng)中的信息發(fā)現(xiàn)。隨著計算機技術(shù),個性是云計算、大數(shù)據(jù)記憶技術(shù)的快速發(fā)展,傳統(tǒng)的手動查找信息模式被大數(shù)據(jù)智能檢索替代。數(shù)據(jù)挖掘技術(shù)廣泛應(yīng)用于市場、工業(yè)、金融行業(yè)、科學(xué)界、互聯(lián)網(wǎng)行業(yè)以及醫(yī)療業(yè)。數(shù)據(jù)挖掘技術(shù)在圖書館的應(yīng)用,能夠?qū)⒑A康挠脩糍Y源進行聚類、關(guān)聯(lián)、整合,能夠?qū)τ脩羲阉饔涗洝D書流通記錄、用戶借閱信息等數(shù)據(jù)進行精確預(yù)判,發(fā)現(xiàn)一些隱蔽的聯(lián)系,為圖書館采購圖書、淘汰文獻資料帶給科學(xué)推薦,也能夠為用戶帶給個性化訂閱服務(wù),創(chuàng)新用戶服務(wù)模式,為圖書館建設(shè)整個信息網(wǎng)絡(luò)帶給有力支撐。
1大數(shù)據(jù)下的圖書館用戶資源特征。
圖書館用戶資源是透過數(shù)字技術(shù)進行組織和管理的:(1)經(jīng)過數(shù)據(jù)關(guān)聯(lián)分析,把數(shù)據(jù)庫中存在的兩個或兩個以上用戶之間的相同性提取出來,提高支持度和說服力;(2)把用戶信息按照相似性歸納成幾個類別,建立宏觀概念,發(fā)現(xiàn)其間的相互關(guān)系;其次定義這些相互關(guān)系,概念產(chǎn)生以后,即等同于這些相互關(guān)系的整體信息,用于建構(gòu)分類規(guī)則或者數(shù)據(jù)模型;其次利用以上數(shù)據(jù)找出變化規(guī)律,對此規(guī)律進行模型化處理,并由數(shù)據(jù)模型對未知信息進行預(yù)判;(3)把用戶資源進行時序排序,檢索出高重復(fù)率的模型;(4)進行偏差比對,檢查數(shù)據(jù)之中的異常狀況。圖書館利用超多的用戶訪問信息獲取用戶興趣,發(fā)現(xiàn)用戶群體,為不同的群體定制信息,還能夠建立一個共享信息平臺,讓不同用戶建立網(wǎng)絡(luò)交流。
1.1數(shù)據(jù)量大并且分布更廣。
大數(shù)據(jù)形勢下,圖書館能夠獲取的用戶資源不僅僅限于用戶個人信息和搜索記錄,也包括檔案、學(xué)術(shù)研究、教學(xué)模式、用戶評價和反饋等,數(shù)據(jù)豐富。同時,數(shù)據(jù)分布廣泛,在互聯(lián)網(wǎng)時代,可從圖書館應(yīng)用系統(tǒng)、數(shù)據(jù)系統(tǒng)記錄以及各種網(wǎng)頁、移動終端的信息獲取,顯示出用戶資源的分散性。
1.2數(shù)據(jù)資料多元化,形式靈活化。
數(shù)據(jù)系統(tǒng)里的存儲方式不同,服務(wù)器不同,系統(tǒng)開發(fā)平臺不同,致使許多用戶資源無法交流互換。圖書館用戶資源有半模型化、模型化和非模型化之分。傳統(tǒng)的圖書館用戶資源中,用戶只是圖書資源的使用者,與圖書館之間只是點對點單線互動,用戶之間不存在交流,而在大數(shù)據(jù)網(wǎng)絡(luò)平臺下,用戶之間能夠建立資料共享互動平臺,使得用戶資源的資料更加多元化。
2圖書館用戶資源利用。
2.1有助于利用數(shù)據(jù)挖掘技術(shù)建立用戶資源圖書館。
用戶資源圖書館具備信息量大的特點,用戶可獲得各方各面的信息,且從服務(wù)的個性化和全方位化而言,圖書館可根據(jù)社會熱點或用戶需求定制服務(wù)。一方面,建立用戶資源圖書館,使各類用戶信息在同一界面統(tǒng)一呈現(xiàn),方便用戶的選取和檢索。另一方面,利用數(shù)據(jù)挖掘技術(shù)建立的用戶資源圖書館,服務(wù)器眾多,具有較強的計算潛力和存儲潛力,擁有較高的數(shù)據(jù)處理潛力,能同時容納多數(shù)用戶。因數(shù)據(jù)量大所導(dǎo)致的硬件費用和后期運行費用劇增,可透過構(gòu)建用戶資源圖書館平臺以及應(yīng)用服務(wù)得到解決。為應(yīng)付不斷提高的用戶資源存儲方面的壓為,目前亟需的就是投入超多資金以擴容存儲設(shè)備,無疑,建立用戶資源平臺能夠解決此問題。
2.2加速圖書館資源的數(shù)字化。
強大的互聯(lián)網(wǎng)呈現(xiàn)功能和用戶信息保存的可靠性功能,用戶資源存儲的復(fù)雜性問題可得到很好的解決。其次,數(shù)據(jù)挖掘技術(shù)對于資源整合方面具有優(yōu)勢,透過分布式的存儲模式整合超多信息資源帶給給用戶檢索。不同的數(shù)據(jù)之間的互相操作以及全方位的互聯(lián)網(wǎng)服務(wù)得以實現(xiàn),很好的解決了資源重復(fù)建設(shè)的問題。因此,利用數(shù)據(jù)挖掘使得圖書館資源數(shù)字化具備可行性。從這個好處上來看,資源的館藏數(shù)字化將會加快發(fā)展,而不只是圖書書目的劇增。
2.3降低人力資源成本,使圖書館各類資源得以整合和優(yōu)化。
隨著各類用戶資源利用步伐的加快,加之依靠因特網(wǎng)的用戶對服務(wù)的可行性和效率性要求更高,超多不同體系的服務(wù)器布置在機房,系統(tǒng)維護人員的壓力也相應(yīng)増大。透過數(shù)據(jù)挖掘技術(shù),可有效進行資源整合和優(yōu)化,無需透過人力進行。
2.4有利于分析用戶心理和提升用戶體驗。
數(shù)據(jù)挖掘技術(shù)能夠利用用戶資源計算出用戶模型,這是研究用戶需求、偏好、行為的一種常規(guī)方式,一般認為用戶模型是對用戶在某段時間內(nèi)相對穩(wěn)定的信息需求的記錄。用戶模型反過來對獲取用戶資源有十分重要的作用,建構(gòu)用戶模型,能夠使圖書館更加精深、準確地掌握當前用戶資源。透過對用戶資源的處理來預(yù)測用戶需求,進而到達持續(xù)提高服務(wù)質(zhì)量和用戶滿意度的目的。一方面,預(yù)判用戶心理是利用圖書館用戶資源更加深入的表現(xiàn)。隨著用戶環(huán)境與圖書館環(huán)境的不斷變化,這種預(yù)判力覆蓋范圍已經(jīng)不單單是用戶信息行為的某個過程或某幾個過程,相反,用戶心理能夠?qū)τ脩粜枨蟮膹娙?、層次、方向產(chǎn)生極為重要的影響,同時也能夠?qū)Λ@取用戶資源全部過程產(chǎn)生重要影響。另一方面,最先研究用戶體驗研究當屬企業(yè)營銷活動,主要用來研究用戶與企業(yè)、產(chǎn)品或服務(wù)之間的互動。數(shù)據(jù)挖掘技術(shù)能夠更精準預(yù)測用戶的實際感受,透過研究用戶情感體驗與用戶行為動作,提高用戶的滿意度,滿足用戶需求。
3結(jié)語。
在數(shù)據(jù)大爆發(fā)時代,重視圖書館用戶資源,透過多渠道、多方式匯聚用戶資源,采用數(shù)據(jù)挖掘、數(shù)據(jù)歸檔分析等技術(shù),掌握用戶資源特征,有助于圖書館精準定位用戶群體,對調(diào)整圖書館運營策略有重要前置作用,更能創(chuàng)新圖書館服務(wù)的資料和形式,實現(xiàn)圖書館資源的有效利用。
參考文獻。
[1]陳文偉等.數(shù)據(jù)挖掘技術(shù)[m].北京:北京工業(yè)出版社,2002.
[2]郭崇慧等.北京數(shù)據(jù)挖掘教程[m].北京:清華大學(xué)出版社,2005.
[3]徐永麗等.網(wǎng)絡(luò)環(huán)境中用戶信息需求障礙分析[j].圖書館理論與實踐,2004.
數(shù)據(jù)挖掘論文摘要篇十三
隨著我國的旅游業(yè)的迅猛發(fā)展,旅游產(chǎn)業(yè)正邁向國際化的軌道,傳統(tǒng)旅游業(yè)積累的海量數(shù)據(jù),沒有被有效利用,資源被極大浪費。將數(shù)據(jù)挖掘引入到旅游產(chǎn)業(yè)是大勢所趨。當前數(shù)據(jù)挖掘在旅游信息化建設(shè)中的應(yīng)用與研究情況主要集中在高校理論界的研究,大多數(shù)研究僅僅是學(xué)術(shù)研究,真正運用到旅游行業(yè)的文章多是從某個具體的方面出發(fā),針對個別應(yīng)用進行數(shù)據(jù)挖掘的融合。筆者主要研究決策樹方法在旅游信息化建設(shè)中的應(yīng)用。目前,決策樹算法有cls算法、id3算法、c4.5算法、cart算法、sliq算法、z統(tǒng)計算法、并行決策樹算法和sprint算法等。不同算法在執(zhí)行效率、輸出結(jié)果、可擴容性、可理解性、預(yù)測的準確性等方面各不相同??偟膩碚f,這么多決策樹算法各有優(yōu)缺點,真正將數(shù)據(jù)挖掘運用到整個旅游信息化建設(shè)中還有很多問題需要解決。
數(shù)據(jù)挖掘中常用的基本分類算法有決策樹、貝葉斯、基于規(guī)則的算法等等。其中,決策樹是目前主流的分類技術(shù),己經(jīng)成功的應(yīng)用于更多行業(yè)的數(shù)據(jù)分析。在關(guān)聯(lián)規(guī)則挖掘研究中,最重要的是apriori算法,這個算法后來成為絕大多數(shù)關(guān)聯(lián)規(guī)則分類的基礎(chǔ)。聚類算法也是數(shù)據(jù)挖掘技術(shù)中極為重要的組成部分。與分類技術(shù)不同的是,聚類不要求對數(shù)據(jù)進行事先標定,就數(shù)據(jù)挖掘功能而言,聚類能夠可以針對數(shù)據(jù)的相異度來分析評估數(shù)據(jù),可以作為其他對發(fā)現(xiàn)的簇運行的數(shù)據(jù)挖掘算法的預(yù)處理步驟。各種算法分類模型建立有所不同,但原理是大致相同的。筆者考慮決策樹算法結(jié)構(gòu)簡單,便于理解,且很擅長處理非數(shù)值型數(shù)據(jù),建模效率高,分類速度快,特別適合大規(guī)模的數(shù)據(jù)處理的優(yōu)點,結(jié)合旅游產(chǎn)業(yè)數(shù)據(jù)特點,故作重點分析。
旅游業(yè)數(shù)據(jù)挖掘系統(tǒng)的基本特點如下:統(tǒng)計旅游興趣;購物消費趨向;推薦其感興趣的旅游景點;在后臺管理中,通過決策樹算法對游客數(shù)量、平均年齡、景點收費、游客來自地區(qū)等進行分析總結(jié),為旅游消費者和旅游管理者提供服務(wù):為消費者提供吃住行購娛樂天氣各方面信息查詢、機票、車船票、酒店、景區(qū)門票、餐飲等方面的預(yù)定與現(xiàn)金支付、第三方支付、消費者評價、在線咨詢等方面的便利、快捷服務(wù)。為管理者提供推薦、游客管理、線路管理、景點管理、特色服務(wù)管理、機票管理、在線咨詢管理、旅游客戶關(guān)系管理等服務(wù),提高整體服務(wù)效率和水平。
旅游業(yè)信息管理系統(tǒng)包括游客信息管理與游客信息分析兩個子模塊。根據(jù)系統(tǒng)日常運行出現(xiàn)的問題及時對系統(tǒng)進行維護,如添加或者刪除某個模塊功能,系統(tǒng)整體運行速度的更近等。系統(tǒng)運用數(shù)據(jù)庫層、持久化層、業(yè)務(wù)邏輯層、表示層四層體系結(jié)構(gòu),主要利用id3算法達到旅游數(shù)據(jù)信息的快速、準確分類??紤]了游客與酒店之間的關(guān)系、游客與旅游路線之間的關(guān)系、游客與旅游景點之間的關(guān)系、游客與機票、車票之間的關(guān)系、管理員與游客之間的關(guān)系、邏輯結(jié)構(gòu)設(shè)計。程序之間的獨立性增加,易于擴展,規(guī)范化得到保證的同時提高了系統(tǒng)的安全性。詳細功能設(shè)計包括:用戶登錄、用戶查詢、預(yù)定及支付、后臺管理、旅游客戶管理和數(shù)據(jù)分析等方面。本系統(tǒng)中主要運用java語言就行邏輯上的處理。系統(tǒng)主要使用struts2和hibernate這兩個框架來進行整個系統(tǒng)的搭建。其中struts2主要處理業(yè)務(wù)邏輯,而hibernate主要是處理數(shù)據(jù)存儲、查詢等操作。系統(tǒng)采用tomcat服務(wù)器。系統(tǒng)模塊需要實現(xiàn)酒店推薦實現(xiàn)、景點推薦實現(xiàn)、天氣預(yù)報實現(xiàn)、旅游線路實現(xiàn)、特產(chǎn)推薦、數(shù)據(jù)分析展現(xiàn)功能、報表數(shù)據(jù)獲取、景區(qū)客流量變化分析實現(xiàn)等。需要進行后臺信息管理等功能測試以及時間測試、數(shù)據(jù)測試等性能測試。
在對數(shù)據(jù)挖掘的基本方法與技術(shù)進行總結(jié)的基礎(chǔ)上,結(jié)合當今數(shù)據(jù)挖掘的發(fā)展方向和研究熱點,可以發(fā)現(xiàn)旅游業(yè)數(shù)據(jù)挖掘算法系統(tǒng)有待進一步完善之處:訂票系統(tǒng)尚待完善。界面美化需要進一步改進。數(shù)據(jù)表之間的結(jié)構(gòu)關(guān)系需要優(yōu)化,以提高數(shù)據(jù)處理能力和效率。數(shù)據(jù)挖掘工具及算法有待精細化改進。
作者:朱暉單位:河南職業(yè)技術(shù)學(xué)院。
【本文地址:http://m.aiweibaby.com/zuowen/13971865.html】