24周年

財稅實務(wù) 高薪就業(yè) 學(xué)歷教育
APP下載
APP下載新用戶掃碼下載
立享專屬優(yōu)惠

安卓版本:8.7.50 蘋果版本:8.7.50

開發(fā)者:北京正保會計科技有限公司

應(yīng)用涉及權(quán)限:查看權(quán)限>

APP隱私政策:查看政策>

HD版本上線:點擊下載>

淺談電子數(shù)據(jù)質(zhì)量問題及解決方法

來源: 李斐 編輯: 2010/01/22 13:44:13  字體:

  隨著社會信息化程度的提高,許多的單位和組織都建立了與之相適應(yīng)的計算機信息系統(tǒng),并且系統(tǒng)功能不斷完善,存儲了大量電子數(shù)據(jù)。由于被審計單位軟硬件平臺的異構(gòu)性以及人為隱瞞信息等原因,造成審計部門與被審計單位之間的信息不對稱,審計人員所獲取的電子數(shù)據(jù)存在不同程度的質(zhì)量問題,由于電子審計數(shù)據(jù)的質(zhì)量與審計結(jié)果的質(zhì)量密切相關(guān),這就要求審計人員對所獲取的電子數(shù)據(jù)進行檢查、控制和分析,進行有效的電子數(shù)據(jù)質(zhì)量控制,從而降低審計風(fēng)險。

  一、電子數(shù)據(jù)質(zhì)量對審計風(fēng)險的影響

  在面向數(shù)據(jù)的計算機審計中,審計人員了解被審單位的經(jīng)濟、業(yè)務(wù)活動主要是通過其提供的審計數(shù)據(jù),如財務(wù)報表、交易記錄、原始憑證等,并按照一定的程序進行取證,形成審計意見。由于信息系統(tǒng)的廣泛運用,被審計單位內(nèi)部積累了大量的電子數(shù)據(jù),由于各種原因,被審計單位現(xiàn)有系統(tǒng)數(shù)據(jù)庫中存在這樣或那樣的“臟”數(shù)據(jù),主要表現(xiàn)為重復(fù)的數(shù)據(jù)、錯誤的數(shù)據(jù)、不完整的數(shù)據(jù)等,這些都會影響電子數(shù)據(jù)的質(zhì)量。

  電子數(shù)據(jù)不但邏輯組織方式多樣,有層次、網(wǎng)狀、關(guān)系等,而且物理存儲格式多樣,簡單的可使用文本文件、電子表格文件,復(fù)雜的為不同類型的電子數(shù)據(jù)庫管理系統(tǒng)。審計人員只能評估其風(fēng)險水平,但卻無法控制和影響電子數(shù)據(jù)。并且,審計人員實際上缺乏有力的技術(shù)手段對數(shù)據(jù)質(zhì)量進行檢查評價,只能夠進行簡單的分析判斷。在信息系統(tǒng)環(huán)境下,被審計單位的數(shù)據(jù)量達到一定的規(guī)模,而且由于介質(zhì)的變化,使資料修改、刪除更加容易,很少留下審計線索。另外,電子數(shù)據(jù)的采集、整理和分析過程中,數(shù)據(jù)的質(zhì)量問題帶來的審計風(fēng)險也尤為重要。在實際的工作中,審計人員要根據(jù)掌握的技術(shù)、實踐經(jīng)驗、獲得的技術(shù)支持等來確定對電子數(shù)據(jù)的采集、處理方式,這一階段對數(shù)據(jù)質(zhì)量的要求比較敏感,可能會給審計帶來風(fēng)險,例如數(shù)據(jù)格式存在缺陷,系統(tǒng)格式不兼容,數(shù)據(jù)分析技術(shù)和工具使用不恰當(dāng)?shù)取?

  電子數(shù)據(jù)對于審計工作越來越重要的情況下,帶給審計人員快捷高效的審計技術(shù)手段的同時,也對審計人員提出了更艱巨的技術(shù)挑戰(zhàn),數(shù)據(jù)質(zhì)量的高低將直接對審計結(jié)果及其風(fēng)險產(chǎn)生影響。

  二、審計人員對審計電子數(shù)據(jù)的需求

  在“電子數(shù)據(jù)審計”模式下,審計人員獲得的電子審計數(shù)據(jù)成為重要的資料來源。雖然審計人員得到電子審計數(shù)據(jù)的目的可能是多元的,如掌握資金使用情況、進行風(fēng)險評估等,但整體來看,利用電子審計數(shù)據(jù)的主要目的是為了取得審計證據(jù),支持其關(guān)于審計事項的判斷或結(jié)論。盡管現(xiàn)行證據(jù)法的滯后性和不確定性使得電子證據(jù)在審計工作的實際運用中仍舊面臨問題,但是電子證據(jù),或者通過電子數(shù)據(jù)獲得的其他證據(jù),及其所帶來的邊際效應(yīng),無疑已經(jīng)成為現(xiàn)代審計人員一個非常重要的證據(jù)來源。審計數(shù)據(jù)的應(yīng)用目標(biāo)是取得適當(dāng)?shù)膶徲嬜C據(jù),審計數(shù)據(jù)的質(zhì)量需求與審計取證需求基本一致。

  根據(jù)審計取證需求,電子數(shù)據(jù)應(yīng)滿足以下兩個方面要求:

  一是取證過程的可行性,審計人員能夠比較經(jīng)濟地利用審計數(shù)據(jù)進行取證,這就要求審計數(shù)據(jù)具有可采集、可驗證、可理解、可分析等特點。

  二是證據(jù)適用性,從電子數(shù)據(jù)中獲得的審計證據(jù)應(yīng)該滿足審計證據(jù)的基本特征、要求。電子數(shù)據(jù)中獲得的證據(jù)是整個證據(jù)體系中的一個組成部分,并和其他部分一起,具備充分性、適當(dāng)性、相關(guān)性等一系列特征。

  三、常見的電子數(shù)據(jù)質(zhì)量問題

  隨著數(shù)據(jù)采集的技術(shù)和渠道日益廣泛,審計數(shù)據(jù)庫中的數(shù)據(jù)質(zhì)量主要由進入數(shù)據(jù)庫中的原始數(shù)據(jù)源的數(shù)據(jù)質(zhì)量決定的。原始數(shù)據(jù)源中的數(shù)據(jù)質(zhì)量問題有許多種,以下主要從電子采集、整理、分析等階段,分析審計人員在實際工作中遇到的問題。

  1 數(shù)據(jù)采集: 數(shù)據(jù)采集是信息化環(huán)境下對于被審計單位電子數(shù)據(jù)審計的首要前提和基礎(chǔ),是在審前調(diào)查提出數(shù)據(jù)需求的基礎(chǔ)上,按照審計目標(biāo),采用一定的工具和方法對被審計單位會計信息系統(tǒng)中的數(shù)據(jù)庫文件進行采集的過程,該階段主要分為以下兩種問題:

  (1)被審計單位的信息系統(tǒng)沒有實現(xiàn)數(shù)據(jù)接口,或?qū)崿F(xiàn)了的數(shù)據(jù)接口不能滿足審計的要求,導(dǎo)致審計人員無法將電子數(shù)據(jù)遷移至審計軟件系統(tǒng)。

  (2)審計軟件環(huán)境無法識別從被審單位的信息化環(huán)境遷移的數(shù)據(jù)格式,導(dǎo)致使用審計軟件打開電子數(shù)據(jù)時顯示亂碼或缺少部分?jǐn)?shù)據(jù)等情況出現(xiàn)。

  2 數(shù)據(jù)整理:審計人員在獲得電子數(shù)據(jù)后,首先應(yīng)處理電子數(shù)據(jù)本身存在的缺陷,為下一步的數(shù)據(jù)分析提供保證。該階段常遇到以下三種情況:

 ?。?)數(shù)據(jù)缺失:在一些記錄的字段屬性上沒有值,如資金金額、客戶名稱為NULL。這可能是由于采集時值不確定、誤操作或采用缺省值等原因而引起的。

  (2)屬性異常:數(shù)據(jù)表中某些記錄的屬性值在數(shù)據(jù)遷移過程中發(fā)生變化,例如數(shù)據(jù)被采集到審計人員的審計軟件后某數(shù)據(jù)文件的“日期”字段顯示的屬性為數(shù)字類型。

 ?。?)冗余沖突:既有可能是同一數(shù)據(jù)在不同數(shù)據(jù)源里的簡單重復(fù),如數(shù)據(jù)集中有多條記錄表示同一個實體,也有可能重復(fù)的數(shù)據(jù)之間還存在沖突。

  3、數(shù)據(jù)分析:需要審計人員充分理解數(shù)據(jù)庫中各個數(shù)據(jù)文件的格式,文件中各字段代表的具體含義,及其各個文件中的相互關(guān)聯(lián)等情況,運用各種分析方法對電子數(shù)據(jù)進行深層次的挖掘工作,發(fā)現(xiàn)隱藏其中的問題,分析中遇到的問題主要是:

 ?。?)數(shù)據(jù)命名無規(guī)則:底層數(shù)據(jù)庫中的文件名或文件中的字段名大多使用英文字母或特殊符號,有些被審單位使用某些軟件公司開發(fā)的應(yīng)用軟件,文件或?qū)傩悦?guī)則性較差,相關(guān)聯(lián)的數(shù)據(jù)文件名稱沒有明顯的區(qū)分,造成審計人員花大量的時間分析文件內(nèi)容和相互關(guān)聯(lián)關(guān)系,影響審計效率,同時,審計人員也有容易忽略某些具有特殊含義的字段,造成審計風(fēng)險。

  (2)數(shù)據(jù)模式?jīng)_突:是與數(shù)據(jù)模式相關(guān)的不一致,主要有命名沖突和結(jié)構(gòu)沖突。命名沖突表現(xiàn)為同一名稱表示不同的實體/屬性或不同名稱表示同一實體/屬性。如一個數(shù)據(jù)源中用“借方”來表示科目表中“借方”屬性名,而在另一個數(shù)據(jù)源中用“Db”這一英文縮寫來表示。結(jié)構(gòu)沖突通常表現(xiàn)為同一對象在不同的數(shù)據(jù)源中用不同的表示形式,如對于借貸方余額的存儲,在一個數(shù)據(jù)源中用“借方余額”和“貸方余額”兩個屬性來表示,而在另一個數(shù)據(jù)源中用“借貸方余額” 和“借貸方向”來表示。

 ?。?)數(shù)據(jù)語義沖突:是與實例相關(guān)的不一致,產(chǎn)生的原因主要是不同的設(shè)計者在對客觀對象進行闡釋時采用了不同的描述方法。如在一個數(shù)據(jù)源中用“借”或“貸”來表示“借貸方向”,而在另一個數(shù)據(jù)源中用“Dr”或“Cr”來表示同一屬性的取值。

  (4)數(shù)據(jù)值異常:即數(shù)據(jù)集中存在孤立點,它們不符合數(shù)據(jù)的一般模型或規(guī)律。造成孤立點的原因很多,可能是數(shù)據(jù)進行遷移時產(chǎn)生的錯誤,也可能是程序?qū)θ笔傩灾底詣由傻奶娲?,同時,孤立點也可能正好反映了數(shù)據(jù)中蘊含的某種審計線索,審計人員不能簡單將它刪除。

  四、處理電子數(shù)據(jù)質(zhì)量問題的基本方法

  出現(xiàn)電子數(shù)據(jù)質(zhì)量問題將直接影響審計結(jié)果的準(zhǔn)確性,審計人員應(yīng)予以高度重視。解決這些電子數(shù)據(jù)質(zhì)量問題對于提高審計的質(zhì)量與效率都至關(guān)重要,對于不同的問題應(yīng)該“對癥下藥”,采用不同的解決方法:

  1.對于被審計單位的信息系統(tǒng)沒有實現(xiàn)數(shù)據(jù)接口或?qū)崿F(xiàn)了的數(shù)據(jù)接口不能滿足審計的要求的問題,審計人員應(yīng)充分與被審單位信息系統(tǒng)管理人員進行溝通,了解電子數(shù)據(jù)格式,利用被審單位信息管理軟件平臺將數(shù)據(jù)導(dǎo)出轉(zhuǎn)換為符合審計要求的數(shù)據(jù)格式,或者通過ODBC等數(shù)據(jù)庫訪問接口,直接訪問被審計信息系統(tǒng)的數(shù)據(jù)庫,獲取電子數(shù)據(jù),必要時聯(lián)系軟件系統(tǒng)開發(fā)企業(yè)的有關(guān)技術(shù)人員幫助解決。

  2.命名規(guī)則性較差的電子數(shù)據(jù)文檔,通常不符合一般數(shù)據(jù)庫、表、字段等名稱的命名格式,一方面需要審計人員閱讀有關(guān)的應(yīng)用軟件開發(fā)或系統(tǒng)數(shù)據(jù)庫維護文檔,獲取數(shù)據(jù)表文件及包含屬性的含義,另一方面,在無法獲取文檔幫助的情況下,需要審計人員通過文件中具有明顯特征數(shù)據(jù)內(nèi)容找出重要的帳表文件,推導(dǎo)出部分屬性含義,再根據(jù)這些屬性找出其他關(guān)聯(lián)文件。

  3. 數(shù)據(jù)缺失的處理根據(jù)不同的情況,有以下解決方法:

  (1)對于那些包含大量空值的列的電子數(shù)據(jù),不僅不能給審計人員足夠的信息,反而會影響審計效率和執(zhí)行的效果。解決這一問題的方法之一就是刪除那些包含大量空值的列。(2)使用一個固定的值填充缺失值:所有空缺的值用一個常量代替。這種方法雖然簡單,但只適合缺失值不多的情況。

 ?。?)使用屬性的平均值填充缺失值:對同一個屬性的所有缺失值都用該屬性的平均值代替,使替代值更接近缺失值,以降低誤差。

 ?。?)使用推導(dǎo)值代替缺失值:若某屬性的取值只有少量幾種,就可以計算這幾種屬性值在該屬性中所占的比例,并對該屬性中的缺失值同比例隨機賦值。這種方法較適合缺失屬性為邏輯型的情況。

  (5)使用最可能的值代替缺失值:可以利用回歸分析、決策樹或貝葉斯形式化推導(dǎo)方法等建立一個預(yù)測模型,然后按照這個模型的預(yù)測值填充缺失值。這種方法相對比較復(fù)雜,但卻最大程度地利用了現(xiàn)存數(shù)據(jù)所包含的信息來預(yù)測空缺值,具有很好的效果。

  4.屬性異常通常在數(shù)據(jù)的遷移過程中不易被發(fā)現(xiàn),往往是審計人員在對電子數(shù)據(jù)進行分析時取值失真才意識到問題的存在,有些是該屬性字段下的所有數(shù)據(jù)格式都發(fā)生變化,有些是部分?jǐn)?shù)據(jù)格式異常,對于這兩種情況都可以將該屬性字段下的所有數(shù)值格式全部選取進行格式轉(zhuǎn)換,避免尋找個別數(shù)據(jù)元進行操作的復(fù)雜性。

  5.對于冗余記錄的處理,一般要經(jīng)過以下兩個步驟: (1) 通過實例匹配找出表示現(xiàn)實世界同一實體的相似記錄。(2) 將相似的記錄合并到包含所有相關(guān)屬性并沒有冗余屬性的記錄中。對于同一實體中冗余屬性的處理,可以通過屬性間的相關(guān)分析來刪除冗余屬性。最常用的相關(guān)分析方法是計算屬性間的相關(guān)系數(shù)。如果屬性A和屬性B的相關(guān)系數(shù)大于設(shè)定的閾值,則表明A和B具有較強的相關(guān)性,A(或B)可以作為冗余而去掉。同時還可以運用技術(shù)手段刪除冗余屬性,如運用判定樹歸納方法選擇屬性子集,由源數(shù)據(jù)構(gòu)造判定樹,不出現(xiàn)在樹中的所有屬性被認(rèn)為是冗余的,出現(xiàn)在樹中的所有屬性形成歸約后的屬性子集。

  6.所謂數(shù)據(jù)值異常,就是遠離或者超出某列分布規(guī)律的數(shù)據(jù),主要表現(xiàn)為孤立點的存在,所以對于數(shù)據(jù)值異常處理的主要任務(wù)就是檢測出孤立點。由于孤立點可能是數(shù)據(jù)質(zhì)量問題導(dǎo)致的,但也可能反映了事物背后某種異?,F(xiàn)象的發(fā)展變化,在面向數(shù)據(jù)的計算機審計中,孤立點可能預(yù)示著某種審計線索。所以在檢測出孤立點后必須再由人工判斷檢測出的孤立點是否為事實上的孤立點。若為事實上的孤立點,則可將孤立點視為干擾數(shù)據(jù)而丟棄,或者運用數(shù)據(jù)平滑技術(shù)按數(shù)據(jù)分布特征修正源數(shù)據(jù)。對于孤立點的檢測,若數(shù)據(jù)量較小,可以人工進行檢測,但當(dāng)數(shù)據(jù)量很大時,就需要運用計算機技術(shù)和統(tǒng)計學(xué)相關(guān)原理進行檢測,例如使用 Benford法則對企業(yè)的大量費用支出情況進行檢測發(fā)現(xiàn)的孤立點。

  7.數(shù)據(jù)模式?jīng)_突、數(shù)據(jù)語義沖突以等問題,在分析時常常涉及到對各數(shù)據(jù)源中的原始表及其有關(guān)屬性進行模式重構(gòu)工作,審計人員可以利用AO現(xiàn)場審計實施系統(tǒng)的強大分析功能,對被審計單位的電子數(shù)據(jù)的某些屬性進行分解、合并、展開等工作,以達到各個數(shù)據(jù)文件形成一致集成模式的目的。

責(zé)任編輯:冠

實務(wù)學(xué)習(xí)指南

回到頂部
折疊
網(wǎng)站地圖

Copyright © 2000 - galtzs.cn All Rights Reserved. 北京正保會計科技有限公司 版權(quán)所有

京B2-20200959 京ICP備20012371號-7 出版物經(jīng)營許可證 京公網(wǎng)安備 11010802044457號