国产精品一久久香蕉产线看-国产精品一区在线播放-国产精品自线在线播放-国产毛片久久国产-一级视频在线-一级视频在线观看免费

孤立點分析在稅務審計上的發展運用

時間:2022-07-02 18:53:26 稅務 我要投稿
  • 相關推薦

關于孤立點分析在稅務審計上的發展運用

  孤立點分析在稅務審計上的發展運用

  引言

  審計作為一種獨立性的經濟監督活動,對被審計單位相關經濟活動具有特有的制約和促進作用。審計的職能就是通過對數據的檢查,監察財務收支的真實、合法性,總結效益情況,同時發現和揭示重大問題或風險隱患。近年來,隨著經濟建設的不斷發展,稅務審計的任務也越來越重,在日積月累的數據量的不斷增加下,使用原有的審計也難以滿足實際要求。隨著審計技術運用的不斷深入,內部審計人員感覺可發現的審計線索少了,問題越來越隱蔽。而以往的分析技術傾向于發現個案的存在,但對審計對象的整體風險情況無法進行全面的把握。對審計部門困擾的主要有以下問題,一是由于各單位業務逐步出現了高度電子化,數據海量化,關注廣泛化,產品衍生化,環境多樣化的情況,讓審計效率明顯降低。二是審計在其執行過程中,所用的工具和程序都是基于事先的審計假設,而審計假設則是由審計人員通過以往的正常情況或者發展趨勢進行人工分析得出判斷和說明,但是由于個人的經驗和知識是有限的,隨著時間的發展,業務流程的更新,產品和技術的產生,造成了模型相對滯后,對面新的情況和海量的數據著手困難[1]。針對這些問題,人們逐步開始利用數據挖掘技術來進行解決。本文主要描述基于數據挖掘的孤立點分析在稅務審計方向上的發展與運用。

  1 數據挖掘技術數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。它可以進行歷史數據的查詢和遍歷,發現數據倉庫中對象演變特征或對 象發展趨勢,也能找出過去數據潛在的關系,從而進行信息的挖掘,還可以根據過去的數據對未來進行預測和分類。數據挖掘與傳統的數據分析的本質區別就是數據挖掘是在沒有明確假設的前提下去挖掘信息、發現知識。數據挖掘現階段在稅務審計中主要應用了聚類技術、分類與預測技術、關聯技術、孤立點發現技術等等[2]。

  2 孤立點的定義與產生

  2.1 孤立點的定義孤立點分析是數據挖掘中的一個重要研究方向。利用數據挖掘技術可以在海量的數據處理過程中獲得一般模型,但這些數據并不是全部適用于這個一般模型,比如一些特殊值。這些不符合一般數據模型的數據從數據處理的目的來說可能就是數據整體的孤立數據、異常數據、偏差數據或者噪聲數據。它們也有它們的共同特性,就是與海量數據中的其他數據有著明顯的不一致,這些數據,我們統稱為孤立點。一般的孤立點分析在數據挖掘中存在兩個基本任務:一是在給定的數據集合中定義什么樣的數據可以被認為不一致的;二是找到一個有效的方法來挖掘這樣的孤立點[3]。

  2.2 孤立點的產生孤立點的產生原因是多方面的,簡單來說,可以歸納為以下幾個方面: 二是人為欺詐行為所致。為了某種目的而直接對數據進行違背事實的更改或者添加,造成數據值與實際情況有很大區別。個別單位虛報的統計數據就屬于此類。三是由于儀器或者設備出錯導致。在數據采集過程中測量儀器或者設備難免不會受到外界的影響而使得采集到的數據出現錯誤。四是數據系統的變化或者故障。數據系統在運行或者搬遷的時候,可能因為個別不可預料的操作對其中的數據造成影響。比如數據庫的搬遷,恢復時出現小范圍報錯的情況。五是數據發生自然偏差導致。事物是不斷發展和變化的,在這個過程中是符合自然規律的,而這些變化和發展也會對其中的數據產生影響。比如同一個公司里職員升職為經理后工資就會高出不少,但這些變化卻是合理的存在從上面的原因來看,孤立點不論是怎么產生的,都并不是毫無意義的異常數據。這些孤立點數據對總結海量數據得出一般模型不會產生積極作用,但從這些估計點進行分析卻能夠獲取到有價值的信息。作為稅務審計人員,就應該特別重視孤立點數據,從中深究出審計線索。

  3 孤立點在稅務審計上的運用因為稅務審計業務的性質,決定了在稅務審計中運用數據挖掘技術來對海量數據的孤立點進行分析能夠取得比較好的審計線索,從而達到審計的目的。在稅務審計工作中,通過基于數據挖掘的孤立點分析來查找審計線索特征主要分為以下三個步驟。

  3.1 尋找孤立點的數據準備數據的準備可以分為三個主要步驟:一是數據選取,二是數據預處理,三是數據變換。數據選出主要是為了確定目標任務的操作對象,它是根據用戶的需要從原始數據庫抽取出來的一部分表和字段。所以在數據選取之前先要對具體的審計事項進行分析,綜合數據字典和數據說明文檔對數據的含義和業務流程等方面的情況進行分析,對數據的產生有個全面的了解。數據預處理是一個相當耗費時間的過程,它包括數據噪聲的消除、缺值數據的推導與計算、重復記錄的處理、數據類型的轉換等等。比如在處理空值和噪聲時一般可以采取如下幾個方法:一是均值法,即用數據庫中該屬性已知的屬性填充,具體為當前點k(k可自定義)個不為空的數據點的平均值來替換。二是平滑法,假設當前數據點是噪聲數據或者空值,則取出當前點a個(a可自定義)不為空的數據點的加權平均值來替換。三是預測法,采取回歸、擬合、插值、歸納等方法,推斷空值或噪聲數據屬性最可能的取值。四是統計頻率法,此法既適用離散數據,也可用于經過離散化的連續數據的數據缺損處理,假如數據庫中的屬性存在有噪聲數據或者空值,屬性a的值域為{,,……,},P()表示值在該系統中出現的頻率。可以用最大出現頻率的值max{P()}進行填充[4]。數據變換的主要目的則是數據維數消減,主要可分為兩種:一種是從有關變量中消除無關、弱相關或冗余的維,尋找一個變量子集來構建模型,即子集選擇策略;另一種就是把p個原始變量變換為p′個變量,即數據變換策略。

  3.2 可疑孤立點的檢測一般來說,孤立點的發現可以分為以下幾種:一是基于統計的孤立點檢測方法。這種方法是將全部的數據集合假設成一個概率模型,根據模型再采用不一致性檢測來尋找和確立孤立點。基于統計的孤立點檢測挖掘方法比較簡單,實現起來也相對容易,但它的缺點也比較明顯,就是大部分的檢測僅對數據分布滿足一定概率分布的數值型單維數據集較為有效,然而許多采用數據挖掘技術就是要求在多維空間中發現孤立點的。同時,統計學的方法要求關于數據集合參數的知識,但是,這參數有可能是未知的。當沒有特定的檢驗時,該類方法不能確保所有的孤立點被發現。二是基于距離的孤立點檢測方法。為了能夠解決基于統計的孤立點檢測方法的實用性局限,拓寬在多維數據上的應用,Knorr和NG引入了基于距離的孤立點的概念,他們認為如果某個點與數據集中大多數點之間的距離都超過了某個閥值,這個點就是孤立點[5]。但他們的這種方法也有著不足:閥門需要用戶自己合理設置,使得產生了比較大的人工介入和干預。我們比較用到的基于距離的孤立點算法有:Cell-based算法、Index-based算法和Nested-loop算法。三是基于密度的孤立點檢測方法。它是在基于距離的方法基礎上建立起來的,根據數據點之間的距離參數以及某一給定范圍內的數據點的個數參數結合在一起就是密度的概念。基于密度的孤立點檢測能夠很好的檢測出基于距離所不能夠識別的局部孤立點,也不容易遺漏掉周圍的孤立點數據。四是基于聚類的孤立點檢測方法。這種方法主要是指在數據挖掘的聚類過程中,在產生有意義的聚類信息的同時產生的多余孤立點數據。在聚類過程中,算法會將數據集中異常的信息作為噪音而忽略掉,雖然不利于異常信息的檢測,但它掃描數據集效率非常高,適用于現在的海量數據。五是基于偏離的孤立點檢測方法。基于偏離的孤立點檢測時通過對檢測數據集的主要特征來確定孤立點的,與指定的主要特征描述不一致的所有數據集都會被認為是孤立點。比較常見的基于偏離的孤立點檢測技術是序列異常技術和OLAP數據立方體技術[6]。

  3.3 可疑孤立點的判斷接下來就需要對找出的孤立點進行人工分析,看是否為疑點數據。發現的孤立點雖然都符合挖掘的條件,但不一定對稅務審計工作有利用價格。比如,有些孤立點雖然是異常的,但卻是合理數據,有些孤立點雖然是異常的,但影響卻非常小,達不到需要關注的水平。這些都需要審計人員根據業務的目的進行具體問題具體分析,從而從中選出適合的孤立點數據。再對初步選擇出來的疑點數據進行審計專業判斷,通過專業的辦法最終確定審計線索。常見的方法主要有:一是審閱法,它主要是指對各種書面、電子資料的檢查。通過審閱法,可以對孤立點有關的其它資料(包括經濟信息材料等等)進行審閱,來確認該孤立點是否屬于問題數據。二是復算法,復算法主要指通過對有關數據的重新整理和計算,以驗證其結論是否可靠的一種方法。根據實際情況,通過對檢測出的可疑孤立點進行再次計算,多次重復來確認該孤立點是不是問題數據。三是存盤法,存盤法指的是通過對財產物質的清點、計算,驗證可疑孤立點的數據的真實性。四是函證法,因為被審計單位的業務不可能是孤立的存在,肯定會跟其它的單位有著各種各樣的聯系,所以,可以發送函件給其它單位,來驗證數據是否合理,確定孤立點是否為問題數據。

  4 結論總之,運用一定的數據挖掘算法對被審計的海量數據采取聚類或其它的檢測方法,找出數據的一般規律,篩選出孤立點,并以圖、表等方式展現給審計人員,審計人員就能根據專業知識和方法判斷其正確性與合理性,經過多次的挖掘、分析、判斷,最終建立確定適合的審計線索。基于數據挖掘技術的孤立點分析可以大大縮小搜索審計線索的范圍,幫助審計人員及時發現違紀線索,增強審計人員的數據分析能力,大幅度提高審計工作的質量和效率,對行業依賴度較低并具有一定的通用性。因此,包括孤立點分析在內的數據挖掘技術在審計領域必將能得到更多的運用和發展。

【孤立點分析在稅務審計上的發展運用】相關文章:

《積累運用》教材分析07-03

JDPaint雕塑的運用分析論文07-03

性格分析在培訓技術中的運用07-13

稅務案頭審計報告范文07-02

傳統雕塑形體中線的運用分析論文07-03

國內體育運動在數據分析領域上發展如何?07-10

測評在諾基亞員工發展中的有效運用07-12

《函數性質的運用》數學教學案例分析07-03

白領如何避免被孤立07-12

Web分析與CMS集成網站分析發展趨勢07-14

主站蜘蛛池模板: 亚洲男女在线 | 青娱乐91视频| 国产精品亚洲第五区在线 | 免费黄色一级片 | 国内一卡2卡三卡四卡在线 国外欧美一区另类中文字幕 | 国产第一区二区三区在线观看 | 大香伊人网 | 一级片生活片 | 九九视频免费精品视频免费 | 欧美国产激情二区三区 | 青青草国产成人久久91网 | 日本一视频一区视频二区 | 好男人社区神马www在线观看 | 日韩欧美国产高清在线观看 | 亚洲成色999久久网站 | 视频一区二区不卡 | 国产精品久久永久免费 | 青草网在线观看 | 国产欧美在线播放 | 1769亚洲资源站365在线 | 99ri在线精品视频在线播放 | 美女黄免费网站 | 91在线视频免费看 | 亚洲无线码一区二区三区在线观看 | 亚洲一区www | 欧美成人二区 | 最近2019好看的中文字幕 | 精品亚洲综合在线第一区 | 亚洲欧美一区二区视频 | 99pao在线视频成精品 | 黄网站色成年片在线观看 | 在线色影院 | 国产一区精品在线 | 羞羞视频免费网站在线看 | 日本在线免费 | 久操社区 | 欧日韩视频 | 在线中文字日产区乱码 | 日本不卡视频在线 | 日本精品一区二区 | 亚洲福利视频一区二区 |