┊文章閱讀:次
一、信息檢索機制及其發(fā)展
信息檢索Information Retrieval(IR)是一門致力于如何對大容量信息進行有效地存儲與獲取的科學。廣義的IR通常是指在一定的技術(shù)設備環(huán)境條件下,對以某種方式組織的信息資源按其表達方式,依據(jù)特定用戶的需求,制訂構(gòu)造策略,構(gòu)造檢索表達方式以實現(xiàn)檢索目標過程的總稱。而Information Retrieval System(IRS)則是借助計算機技術(shù)手段來存儲信息以滿足日后信息查詢需要的一種檢索工具。這里的信息可以是文本的、視頻或音頻的,但現(xiàn)行的大多數(shù)的信息檢索系統(tǒng)仍只能以存儲與檢索文本的信息和文獻為主。雖然IR 技術(shù)日新月異,但IR的本質(zhì)自始自終都沒有變,變動的只是信息媒體形式、信息檢索系統(tǒng)IRS的吞吐能力以及IRS存儲與匹配的方法而已。
二、人工智能
近30年來因特網(wǎng)規(guī)模呈幾何級數(shù)飛速發(fā)展,人們迫切需要適合于網(wǎng)絡時代的先進的信息檢索技術(shù)。適應快速、準確地檢索有關信息,并且能夠從大量的網(wǎng)上數(shù)據(jù)中發(fā)現(xiàn)隱含的、有價值的信息,各種智能檢索技術(shù)、尤其是人工智能技術(shù)浮出水面。人工智能學科是涉及數(shù)學、計算機科學、控制論、心理學、哲學等學科的交叉學科和邊緣學科,其應用領域包括問題求解、專家系統(tǒng)、機器學習、模式識別、自動定理證明、自然語言理解、人工神經(jīng)網(wǎng)絡和智能檢索等。人工智能用于信息檢索主要有基于本體論、神經(jīng)網(wǎng)絡、遺傳算法、自然語言理解和ID3算法等的智能檢索方法。
三、人工智能技術(shù)在信息檢索中的應用
人工智能研究機器模擬人腦所從事的感覺、認知、記憶、學習、聯(lián)想、計算、推理、判斷、決策、抽象、概括等思維活動,解決人類專家才能處理的復雜問題。它的研究和應用領域包括問題求解、邏輯推理與定理證明、自然語言理解、自動程序設計、專家系統(tǒng)、機器學習、模式識別、機器視覺、智能控制、智能檢索,以及智能調(diào)度與指揮等。
(一)信息過濾技術(shù)
過濾包括兩方面的含義:一是信息檢索技術(shù)中的過濾,一般稱為信息過濾,如搜索引擎過濾,數(shù)據(jù)挖掘等。二是網(wǎng)絡安全方面的過濾。傳統(tǒng)的過濾主要有基于包的過濾、基于應用的過濾和基于文本的過濾等幾種?;谖谋镜倪^濾實現(xiàn)簡單,但缺少靈活性,只能對達到匹配的文本一刀切,無法對文章的語義進行分析。引入了人工智能技術(shù)的智能過濾技術(shù)能夠識別文檔內(nèi)容實現(xiàn)智能化的過濾,同時能減少網(wǎng)絡管理員維護過濾系統(tǒng)的負擔。神經(jīng)網(wǎng)絡是人工智能范疇中機器學習的一種應用,在許多技術(shù)中都有應用。
(二)異構(gòu)信息整合與全息檢索
異構(gòu)信息檢索技術(shù)發(fā)展的特點包括支持各種格式化文件,如TBXT、HTML、XML、RTF、MS Office、PDF、PS2/PS、MARC、ISO2709等處理和檢索;支持多語種信息的檢索;支持結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一處理;和關系數(shù)據(jù)庫檢索的無縫集成以及其他開放檢索接口的集成等。所謂“全息檢索”的概念就是支持一切格式和方式的檢索,從目前實踐來講,發(fā)展到異構(gòu)信息整合檢索的層面,基于自然語言理解的人機交互以及多媒體信息檢索整合等方面尚有待取得進一步突破。
四、應用人工智能算法的視頻圖像檢索系統(tǒng)
目前存在一個新的實現(xiàn)視頻圖像檢索系統(tǒng)的方法。在這個系統(tǒng)中,成熟的人工智能算法將被應用到視頻圖像的分類、索引與檢索中。在本系統(tǒng)中,視頻圖像的特征選取包括了顏色直方圖的計算、紋理的分析及應用運動跟蹤算法KLT對局部視頻數(shù)據(jù)進行運動跟蹤,這些特征構(gòu)成了圖像特征向量。人工智能算法,包括反饋式人工智能神經(jīng)網(wǎng)及自適應匹配算法,將會根據(jù)這些特征向量對視頻片斷進行分類和檢索。系統(tǒng)的工作區(qū)域是一個二維平面,各種視頻片斷將會根據(jù)特征向量的不同,被人工智能系統(tǒng)聚類到不同的區(qū)域, 從而實現(xiàn)視頻片斷的分類和聚集。用戶在查詢的時候,只要在特定的區(qū)域進行放大操作,就可以把視頻檢索限定在一個較小的區(qū)域,從而快速的實現(xiàn)視頻片斷的檢索查詢。具體的工作流程可以分為五個階段:
(一)系統(tǒng)訓練階段
在這個階段中,系統(tǒng)的人工神經(jīng)系統(tǒng)將被初始化,并且在系統(tǒng)與用戶的交互操作中進行訓練,使之適應具體的圖像特征向量,更好地實現(xiàn)視頻片斷的分類與聚集。
(二)視頻片斷的聚集操作
經(jīng)過訓練的人工神經(jīng)系統(tǒng)將被應用到視頻片斷的聚集分類操作中,具有相似的特征向量的視頻片斷將會被聚集到相近的區(qū)域中,不同的片斷將會被區(qū)域的遠近程度來區(qū)分開來。
(三)視頻片斷的檢索操作
因為視頻片斷在上一階段已經(jīng)進行了分類和聚集,用戶只要在局部區(qū)域進行放大檢索操作就可以查詢到所需的視頻片斷。從以上的工作流程可以得知,系統(tǒng)對視頻的分類與檢索有兩個核心的環(huán)節(jié):第一是特征的提取,即如何選取合適的特征用于表征視頻圖像;第二是分類使用的人工智能算法,即根據(jù)提取的視頻特征快速準確地對視頻圖像進行分類和檢索。
(四)特征提取算法
本系統(tǒng)應用的特征提取算法包括顏色直方圖,用于分析圖像的基本顏色信息,獲得圖像的顏色分布狀況;紋理分析算法,用于圖像模式的分析; 然后對于局部聚集的圖像應用運動跟蹤算法KLT,進一步提高圖像的分類準確率。
(五)用于分類和檢索的人工智能算法
本系統(tǒng)采用了兩種成熟的人工智能算法:反饋式人工神經(jīng)網(wǎng),利用分類結(jié)果的準確程度對系統(tǒng)的參數(shù)進行反饋式調(diào)節(jié);自適應匹配算法,利用輸入向量對最相似的系統(tǒng)向量進行調(diào)節(jié)。實驗表明自適應匹配算法具有高速準確的效用。
五、人工智能在網(wǎng)絡信息檢索中的應用
人工智能在網(wǎng)絡信息檢索中的應用,主要表現(xiàn)在:如何利用計算機軟硬件系統(tǒng)模仿、延伸與擴展人類智能的理論、方法和技術(shù)。目前,人工智能在網(wǎng)絡信息檢索領域的應用主要是在以下兩個方面:
(一)網(wǎng)絡智能知識服務系統(tǒng)
網(wǎng)絡智能知識服務系統(tǒng)的設計開發(fā)是專門為了解決目前網(wǎng)絡信息資源浩瀚而獲取難的矛盾。網(wǎng)絡智能知識服務系統(tǒng)可分為知識采集系統(tǒng)、智能知識處理系統(tǒng)、智能知識服務系統(tǒng)和知識庫四部分。
1、知識采集系統(tǒng)。知識采集系統(tǒng)的主要任務是完成資源的加工整理,完成信息到知識之間的轉(zhuǎn)換功能。
2、智能知識處理系統(tǒng)。該系統(tǒng)是將采集來的知識與知識庫中已有的知識進行智能的分類和匹配操作,然后將符合入庫條件的知識傳入庫中。
3、智能知識庫存儲系統(tǒng)。這是知識庫建設的最主要組成部分,同時也關系到知識服務的效果和質(zhì)量。
(二)智能代理技術(shù)
智能代理(Intelligent Agent,IA)技術(shù),起始于20世紀80年代,是人工智能技術(shù)的一個重要研究領域目前,國外從事智能代理技術(shù)研究的不僅有大學、研究機構(gòu)和諸多信息技術(shù)公司。并且有些智能代理產(chǎn)品或嵌入智能代理技術(shù)的產(chǎn)品已經(jīng)投入使用,這些情況表明發(fā)展智能代理技術(shù)是一個趨勢,它將是克服現(xiàn)有網(wǎng)絡檢索問題的有效手段。
1、定義。智能代理是一種軟件程序,它使用戶通過代理通信協(xié)議進行信息交換,以實現(xiàn)問題的自動解決。一般來說,智能代理具有如下特點:智能性、代理性、自治性、主動性、移動性、協(xié)作性。
2、智能代理的作用。智能代理有著強大的功能,用途也是十分廣泛的,通??煞譃榫W(wǎng)絡管理、信息管理和優(yōu)化用戶界面。
(三)智能搜索代理的原理
智能搜索代理是智能代理在信息檢索中的一種應用,它以用戶需求為先導來進行信息搜集和信息加工,根據(jù)用戶特定的需求以及在一段時期內(nèi)的偏好為衡量標準來篩選信息。用戶界面提供友好的自然語言查詢,當用戶的查詢請求不明確時,智能搜索代理會利用知識庫中的推理機制推斷用戶的潛在要求,選擇與用戶習慣最相近的需求進行檢索。
人工智能技術(shù)的發(fā)展是時代對社會智能化需求的體現(xiàn),而人工智能與信息檢索的結(jié)合則是人們對信息獲取智能化的有益嘗試。在信息檢索系統(tǒng)中納入人工智能技術(shù)將使傳統(tǒng)的信息檢索系統(tǒng)具有更好的用戶界面、更高的檢索效率和更豐富的檢索手段。人工智能技術(shù)的引入正在使傳統(tǒng)的信息檢索系統(tǒng)發(fā)生了巨大的變化。以兩者作為結(jié)合點的智能信息檢索系統(tǒng),也將隨著這兩方面研究的不斷發(fā)展而更加完善、強大。
在不久的將來,多智時代一定會徹底走入我們的生活,有興趣入行未來前沿產(chǎn)業(yè)的朋友,可以收藏多智時代,及時獲取人工智能、大數(shù)據(jù)、云計算和物聯(lián)網(wǎng)的入門知識和資訊信息,讓我們一起攜手,引領人工智能的未來
Copyright @ 2013-2018 中國福建網(wǎng) 版權(quán)所有
聯(lián)系我們
免責聲明:本站為非營利性網(wǎng)站,部分圖片或文章來源于互聯(lián)網(wǎng)如果無意中對您的權(quán)益構(gòu)成了侵犯,我們深表歉意,請您聯(lián)系,我們立即刪除。