24周年

財(cái)稅實(shí)務(wù) 高薪就業(yè) 學(xué)歷教育
APP下載
APP下載新用戶掃碼下載
立享專屬優(yōu)惠

安卓版本:8.7.20 蘋果版本:8.7.20

開發(fā)者:北京正保會計(jì)科技有限公司

應(yīng)用涉及權(quán)限:查看權(quán)限>

APP隱私政策:查看政策>

HD版本上線:點(diǎn)擊下載>

審計(jì)數(shù)據(jù)轉(zhuǎn)換系統(tǒng)的設(shè)計(jì)與研究

來源: 審計(jì)署南京辦 編輯: 2005/12/06 09:18:22  字體:

  「內(nèi)容摘要」本文從計(jì)算機(jī)審計(jì)中審計(jì)數(shù)據(jù)轉(zhuǎn)換的必要性入手,給出了審計(jì)數(shù)據(jù)轉(zhuǎn)換涉及的相關(guān)操作,結(jié)合這些操作設(shè)計(jì)出審計(jì)數(shù)據(jù)轉(zhuǎn)換系統(tǒng),并對審計(jì)數(shù)據(jù)轉(zhuǎn)換日志進(jìn)行了深入探討。

  1、引言

  審計(jì)數(shù)據(jù)轉(zhuǎn)換是計(jì)算機(jī)審計(jì)中非常重要的一環(huán)。以下兩個方面決定了在計(jì)算機(jī)審計(jì)過程中必須進(jìn)行審計(jì)數(shù)據(jù)轉(zhuǎn)換。

  (1)提高數(shù)據(jù)質(zhì)量

  審計(jì)數(shù)據(jù)來源眾多,這些來源于不同被審計(jì)單位的數(shù)據(jù)中可能存在方方面面的質(zhì)量問題,具體表現(xiàn)為數(shù)據(jù)不清潔、不完整,甚至有些數(shù)據(jù)可能是不真實(shí)的、錯誤的。數(shù)據(jù)質(zhì)量問題必然會影響數(shù)據(jù)分析的結(jié)果。例如,對錯誤的數(shù)據(jù)進(jìn)行分析將得不到正確的結(jié)果。為了有效開展審計(jì),必須最大程度地消除這些數(shù)據(jù)質(zhì)量問題。

  (2)形成集成的數(shù)據(jù)

  一方面,被審計(jì)單位的數(shù)據(jù)組織通常是面向業(yè)務(wù)處理的,不是面向分析的。而審計(jì)工作要求根據(jù)審計(jì)目標(biāo)和分析主題來組織數(shù)據(jù),這就需要將不同的數(shù)據(jù)經(jīng)過整理和轉(zhuǎn)換后集成到一起,形成審計(jì)分析用的統(tǒng)一數(shù)據(jù)集合。這個集合通常稱為審計(jì)中間表。也就是說,審計(jì)分析必須建立在一個數(shù)據(jù)清潔、結(jié)構(gòu)良好的審計(jì)中間表的基礎(chǔ)上。另一方面,審計(jì)所需的數(shù)據(jù)并不單單局限于某個系統(tǒng)或某家被審計(jì)單位。利用不同系統(tǒng)間的數(shù)據(jù)以及外部數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析已經(jīng)成為一種有效的手段,它可以有效克服信息不全面帶來的審計(jì)風(fēng)險。例如財(cái)務(wù)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)之間的對比分析,利用商業(yè)銀行的存貸款數(shù)據(jù)、人民銀行的統(tǒng)一授信數(shù)據(jù)、稅務(wù)部門的納稅申報(bào)數(shù)據(jù)和金稅工程數(shù)據(jù)、工商部門的企業(yè)登記數(shù)據(jù)、社保部門的社會保險數(shù)據(jù)、技術(shù)監(jiān)督局的企業(yè)編碼數(shù)據(jù)、海關(guān)部門的進(jìn)出口數(shù)據(jù)及退稅數(shù)據(jù)、電力公司的電費(fèi)數(shù)據(jù)、自來水公司的水費(fèi)數(shù)據(jù)進(jìn)行企業(yè)行為的綜合分析,等等。從多個數(shù)據(jù)源中抽取數(shù)據(jù)進(jìn)行集成,必須消除數(shù)據(jù)的不一致性和沖突。這些都對數(shù)據(jù)轉(zhuǎn)換提出了很高的要求。

  2、相關(guān)概念

  2.1 審計(jì)中間表

  數(shù)據(jù)轉(zhuǎn)換過程中經(jīng)常使用審計(jì)中間表。審計(jì)中間表是指將清理、轉(zhuǎn)換后的數(shù)據(jù)按照提高審計(jì)分析效率、實(shí)現(xiàn)審計(jì)目標(biāo)的要求進(jìn)一步選擇、整合而形成的數(shù)據(jù)集合。它有兩個特點(diǎn):一是面向分析主題。審計(jì)中間表的構(gòu)建總是針對具體的審計(jì)項(xiàng)目進(jìn)行的。同樣的數(shù)據(jù)庫,如果審計(jì)目的不同,構(gòu)建的中間表也不相同。在構(gòu)建的過程中,審計(jì)人員應(yīng)該依據(jù)審計(jì)方案既定的審計(jì)目標(biāo)進(jìn)行數(shù)據(jù)的選擇、整合,構(gòu)建出面向主題、滿足審計(jì)目標(biāo)的數(shù)據(jù)集合。二是相對穩(wěn)定。審計(jì)中間表是在具體的審計(jì)項(xiàng)目實(shí)施過程中所形成的,是對采集到的被審計(jì)單位數(shù)據(jù)進(jìn)行清理、轉(zhuǎn)換,并進(jìn)一步根據(jù)審計(jì)目標(biāo)選擇、整合而形成的數(shù)據(jù)集合。由于這些集合具有比較固定的結(jié)構(gòu),并且保存的是被審計(jì)單位的歷史數(shù)據(jù),一般不進(jìn)行更新,所以審計(jì)中間表是相對穩(wěn)定的。

  2.2 審計(jì)元數(shù)據(jù)

  所謂審計(jì)元數(shù)據(jù),指的是描述審計(jì)中間表內(nèi)部數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù)。在審計(jì)數(shù)據(jù)的采集和轉(zhuǎn)換系統(tǒng)中,元數(shù)據(jù)可以幫助審計(jì)人員非常方便地找到他們所關(guān)心的數(shù)據(jù)。它有兩方面用途。首先,審計(jì)元數(shù)據(jù)能提供審計(jì)人員所需的,基于計(jì)算機(jī)審計(jì)的各種信息,如被審計(jì)單位數(shù)據(jù)項(xiàng)的業(yè)務(wù)描述信息和審計(jì)中間表的結(jié)構(gòu)與關(guān)系信息等,從而幫助計(jì)算機(jī)審計(jì)人員有效使用各種與審計(jì)任務(wù)相關(guān)的數(shù)據(jù)。其次,審計(jì)元數(shù)據(jù)能支持系統(tǒng)對審計(jì)數(shù)據(jù)的管理和維護(hù),如關(guān)于審計(jì)中間表數(shù)據(jù)項(xiàng)存儲方法的元數(shù)據(jù)能支持系統(tǒng)以最有效的方式訪問數(shù)據(jù)。

  3、審計(jì)數(shù)據(jù)轉(zhuǎn)換系統(tǒng)中涉及的相關(guān)操作

  審計(jì)數(shù)據(jù)轉(zhuǎn)換系統(tǒng)的功能是否強(qiáng)大,在很大程度上取決于轉(zhuǎn)換規(guī)則集是否健全。通過分析被審計(jì)單位數(shù)據(jù)和審計(jì)項(xiàng)目的具體需求,我們發(fā)現(xiàn)幾乎所有被審計(jì)單位數(shù)據(jù)都是采用關(guān)系數(shù)據(jù)庫來存放的,審計(jì)中間表的設(shè)計(jì)與存儲也是建立在關(guān)系數(shù)據(jù)庫基礎(chǔ)之上的,因此我們制定的審計(jì)數(shù)據(jù)轉(zhuǎn)換規(guī)則都是針對關(guān)系數(shù)據(jù)庫來定義的。同時,我們的轉(zhuǎn)換規(guī)則集設(shè)計(jì)采用開放的方式進(jìn)行管理,也就是說審計(jì)人員可以根據(jù)自己的需求添加轉(zhuǎn)換算法。如果審計(jì)人員需要復(fù)雜的審計(jì)數(shù)據(jù)轉(zhuǎn)換,可以通過一系列的轉(zhuǎn)換操作組合來達(dá)到目的,這個轉(zhuǎn)換組合就是一個轉(zhuǎn)換活動。

  3.1 數(shù)據(jù)的合法性檢查

  審計(jì)中間表中的數(shù)據(jù)來自于被審計(jì)單位的多種數(shù)據(jù)源,這些數(shù)據(jù)源可能是在不同的硬件平臺上,使用不同的操作系統(tǒng),因而數(shù)據(jù)往往以不同的格式存在不同的數(shù)據(jù)庫中。所以,在審計(jì)數(shù)據(jù)轉(zhuǎn)換的過程中,有時需要對被審計(jì)單位的數(shù)據(jù)進(jìn)行合法性檢查,將那些語義相同但格式不同的數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的格式,以便更加適用于審計(jì)中間表的設(shè)計(jì),這也就是數(shù)據(jù)的格式化的過程(如對不一致的摘要進(jìn)行處理的問題)。

  3.2 數(shù)據(jù)清理

  數(shù)據(jù)清理主要涉及到數(shù)據(jù)的匹配與合并。通過匹配,發(fā)現(xiàn)重復(fù)的對象;通過合并,保留或生成一個完整的對象。數(shù)據(jù)清理活動的核心是近似重復(fù)對象的識別。所謂近似重復(fù)對象是指表現(xiàn)形式不同但語義上相同的對象。從狹義的角度來看,如果兩條記錄在某些字段上的值相等或足夠相似,則認(rèn)為這兩條記錄互為近似重復(fù)

  數(shù)據(jù)清理包括以下幾個步驟:

  記錄排序:選擇一個或幾個字段作為關(guān)鍵字進(jìn)行排序;

  識別重復(fù)記錄;

  合并重復(fù)記錄:從相似記錄集中獲得記錄的完整信息,并作為該記錄的表示。

  3.3 數(shù)據(jù)變換

  常見的數(shù)據(jù)變換操作包括:簡單變換,日期、時間格式的轉(zhuǎn)換,由代碼到名稱的轉(zhuǎn)換以及字段(值)拆分和字段(值)合并等。

  簡單變換:是指變換源數(shù)據(jù)庫表中某些字段的類型、長度以及NU約束;

  日期、時間格式的轉(zhuǎn)換:是指將來自各個數(shù)據(jù)源的不同格式的日期和時間數(shù)據(jù)變換為目標(biāo)數(shù)據(jù)庫的規(guī)范格式;

  字段值合并:是指將源數(shù)據(jù)庫中的多個字段的值合并成一個字段的值;

  字段值拆分:是指將源數(shù)據(jù)庫中的一個字段值拆分成多個字段值。

  3.4 丟失的數(shù)據(jù)處理

  數(shù)據(jù)丟失是指某個或某些數(shù)據(jù)元沒有值。解決數(shù)據(jù)丟失問題的方法有:

  忽略該元組;

  用一個全局常量填充空缺值;

  用屬性平均值或其他推導(dǎo)值來填充空缺值;

  用相關(guān)的外部數(shù)據(jù)填充空缺值。

  3.5 數(shù)據(jù)集成

  數(shù)據(jù)集成是將被審計(jì)單位數(shù)據(jù)從一個或多個來源中取出,并逐字段地將數(shù)據(jù)映射到審計(jì)中間表的數(shù)據(jù)結(jié)構(gòu)上。這種轉(zhuǎn)換最大的困難在于將被審計(jì)單位數(shù)據(jù)集成為一個緊密結(jié)合的審計(jì)中間表數(shù)據(jù)模型。這是因?yàn)閿?shù)據(jù)可能來源于多個數(shù)據(jù)源,這些數(shù)據(jù)來源往往遵守不同的業(yè)務(wù)規(guī)則,在生成審計(jì)中間表數(shù)據(jù)時,要建立它們之間的關(guān)系,消除它們之間的不一致性。數(shù)據(jù)的集成分為兩個層面:字段層面的集成和關(guān)系表層面的集成。

  4、審計(jì)數(shù)據(jù)轉(zhuǎn)換系統(tǒng)組織結(jié)構(gòu)

  我們把從被審計(jì)單位數(shù)據(jù)到審計(jì)中間表數(shù)據(jù)之間所需要的各種操作均刻畫為轉(zhuǎn)換操作,因此在審計(jì)數(shù)據(jù)轉(zhuǎn)換系統(tǒng)的設(shè)計(jì)過程中,可以把對被審計(jì)單位數(shù)據(jù)的轉(zhuǎn)換操作定義為一系列的審計(jì)數(shù)據(jù)轉(zhuǎn)換活動。

  在審計(jì)數(shù)據(jù)的轉(zhuǎn)換過程中,一個轉(zhuǎn)換將源對象利用一種轉(zhuǎn)換規(guī)則轉(zhuǎn)換成一組目標(biāo)對象。源對象和目標(biāo)對象都是數(shù)據(jù)對象集合的元素。數(shù)據(jù)對象集中的元素能夠是任何類型的數(shù)據(jù)元素,但是典型的是表、列或表示在內(nèi)存中暫存對象的模型元素。數(shù)據(jù)對象集可以是不同轉(zhuǎn)換活動的源和目標(biāo)。具體來說,在同一個邏輯單元中,一個給定的數(shù)據(jù)對象集可以是一個轉(zhuǎn)換的目標(biāo)和一個或多個轉(zhuǎn)換的源。通常,轉(zhuǎn)換也可以產(chǎn)生一系列的臨時數(shù)據(jù)。那些必須一起執(zhí)行的轉(zhuǎn)換被歸類到相應(yīng)的轉(zhuǎn)換任務(wù)中。在執(zhí)行時,轉(zhuǎn)換步驟是用來協(xié)調(diào)轉(zhuǎn)換任務(wù)之間執(zhí)行情況的控制流。每個轉(zhuǎn)換步驟執(zhí)行單一的轉(zhuǎn)換任務(wù),這種轉(zhuǎn)換任務(wù)既可以是從源對象利用一種轉(zhuǎn)換規(guī)則轉(zhuǎn)換成一組目標(biāo)對象,又可以是源對象經(jīng)過多種轉(zhuǎn)換規(guī)則轉(zhuǎn)換成一組目標(biāo)對象。轉(zhuǎn)換步驟可以進(jìn)一步被歸類成轉(zhuǎn)換活動。在每個轉(zhuǎn)換活動中,它的轉(zhuǎn)換步驟的執(zhí)行序列可以通過審計(jì)元數(shù)據(jù)定義。

  5、審計(jì)數(shù)據(jù)轉(zhuǎn)換日志

  根據(jù)以往審計(jì)經(jīng)驗(yàn),在審計(jì)數(shù)據(jù)轉(zhuǎn)換系統(tǒng)的設(shè)計(jì)和開發(fā)時需要考慮:對被審計(jì)單位數(shù)據(jù)庫系統(tǒng)及相關(guān)業(yè)務(wù)的了解是否充分;審計(jì)中間表的設(shè)計(jì)是否合理,關(guān)注的焦點(diǎn)應(yīng)該是被審計(jì)數(shù)據(jù)的業(yè)務(wù)內(nèi)涵;被審計(jì)單位數(shù)據(jù)是否存在質(zhì)量問題,質(zhì)量問題是特殊性的,還是普遍性的;審計(jì)數(shù)據(jù)轉(zhuǎn)換與審計(jì)元數(shù)據(jù)之間的關(guān)系;由于審計(jì)的特點(diǎn),往往也需要看到被審計(jì)單位數(shù)據(jù)的原貌,因此審計(jì)數(shù)據(jù)轉(zhuǎn)換日志問題也需特別關(guān)注。

  審計(jì)數(shù)據(jù)轉(zhuǎn)換日志有兩種類型,一種是記載審計(jì)數(shù)據(jù)轉(zhuǎn)換過程中產(chǎn)生的轉(zhuǎn)換錯誤的日志,稱之為轉(zhuǎn)換錯誤日志;另一種是能反映審計(jì)數(shù)據(jù)在轉(zhuǎn)換過程中變化情況的日志,稱之為轉(zhuǎn)換變化日志。

  5.1 轉(zhuǎn)換錯誤日志

  在審計(jì)數(shù)據(jù)轉(zhuǎn)換過程中,從被審計(jì)單位采集的數(shù)據(jù)可能來自異構(gòu)的數(shù)據(jù)源,這些數(shù)據(jù)之間可能存在著不同層面的沖突。對這些沖突如果考慮不周就會導(dǎo)致審計(jì)數(shù)據(jù)轉(zhuǎn)換錯誤的發(fā)生,從而影響審計(jì)中間表的數(shù)據(jù)質(zhì)量,進(jìn)而影響審計(jì)人員的數(shù)據(jù)分析。常見的沖突有:

  (1)模式層的沖突

  當(dāng)審計(jì)中間表的實(shí)體及其聯(lián)系在被審計(jì)單位數(shù)據(jù)庫中被用不同的概念模式表示時,就必然產(chǎn)生模式層的沖突。

  命名沖突

  主鍵沖突

  結(jié)構(gòu)約束沖突

  表達(dá)格式?jīng)_突

  (2)實(shí)例層的沖突

  將被審計(jì)單位的數(shù)據(jù)轉(zhuǎn)換到審計(jì)中間表的過程中,轉(zhuǎn)換錯誤的來源并不僅限于模式層沖突,還有各種各樣的實(shí)例沖突:

  數(shù)據(jù)缺失

  不正確的數(shù)據(jù)

  數(shù)據(jù)不一致

  以上是審計(jì)數(shù)據(jù)轉(zhuǎn)換時常見的一些沖突,也是設(shè)計(jì)審計(jì)數(shù)據(jù)轉(zhuǎn)換系統(tǒng)時需要解決的主要問題。這些問題同時也是產(chǎn)生審計(jì)數(shù)據(jù)轉(zhuǎn)換錯誤的源泉。轉(zhuǎn)換錯誤日志不僅記載著這些在進(jìn)行審計(jì)數(shù)據(jù)轉(zhuǎn)換時由于種種沖突所產(chǎn)生的錯誤,而且還記載著審計(jì)數(shù)據(jù)轉(zhuǎn)換過程中由于系統(tǒng)編程失誤而產(chǎn)生的出錯信息(比如某些表中的某些記錄沒有轉(zhuǎn)換成功等),為審計(jì)人員最終能得到最準(zhǔn)確可靠的數(shù)據(jù)提供一定的幫助。

  5.2 轉(zhuǎn)換變化日志

  審計(jì)工作的對審計(jì)數(shù)據(jù)有著特殊的要求,不僅要求轉(zhuǎn)換前后保持一致性,而且要求有一定的可追溯性。即當(dāng)審計(jì)人員要進(jìn)一步查閱數(shù)據(jù)的原始面貌時,能夠保證通過審計(jì)中間表中的數(shù)據(jù)追溯到其被轉(zhuǎn)換前的原始狀況。這一工作就需要對審計(jì)數(shù)據(jù)轉(zhuǎn)換過程及有關(guān)數(shù)據(jù)的變化情況進(jìn)行記載,稱為轉(zhuǎn)換變化日志。

  轉(zhuǎn)換變化日志包含兩個層面:

  (1)面向?qū)徲?jì)數(shù)據(jù)轉(zhuǎn)換流程步驟的轉(zhuǎn)換流程日志

  審計(jì)數(shù)據(jù)的轉(zhuǎn)換過程就是審計(jì)數(shù)據(jù)通過不同的轉(zhuǎn)換活動,最終形成審計(jì)中間表數(shù)據(jù)的過程。而轉(zhuǎn)換活動又由許多不同的轉(zhuǎn)換步驟組成,每個轉(zhuǎn)換步驟又包含多個轉(zhuǎn)換任務(wù)。轉(zhuǎn)換流程日志記錄的就是審計(jì)中間表中的不同數(shù)據(jù)都是被審計(jì)單位哪些數(shù)據(jù)都經(jīng)過哪些轉(zhuǎn)換任務(wù)、轉(zhuǎn)換步驟以及轉(zhuǎn)換活動而來的,這期間又運(yùn)用了什么樣的轉(zhuǎn)換規(guī)則。它實(shí)際上是審計(jì)元數(shù)據(jù)中有關(guān)審計(jì)數(shù)據(jù)轉(zhuǎn)換的結(jié)構(gòu)描述的具體化,比較容易實(shí)現(xiàn)。

  (2)面向?qū)徲?jì)數(shù)據(jù)變化情況的轉(zhuǎn)換數(shù)據(jù)日志

  審計(jì)數(shù)據(jù)變化主要記錄著為避免在審計(jì)數(shù)據(jù)轉(zhuǎn)換過程中由于被審計(jì)單位數(shù)據(jù)中存在的沖突而導(dǎo)致的審計(jì)數(shù)據(jù)轉(zhuǎn)換錯誤而進(jìn)行的對被審計(jì)單位數(shù)據(jù)的不同處理過程,比如對日期時間數(shù)據(jù)、缺失數(shù)據(jù)以及不正確或不規(guī)范數(shù)據(jù)的處理等。

  被審計(jì)單位的數(shù)據(jù)量往往很大,如果對每個數(shù)據(jù)的變化都進(jìn)行記載,轉(zhuǎn)換數(shù)據(jù)日志量就會非常龐大,保存這么龐大的日志數(shù)據(jù)會增加審計(jì)人員的負(fù)擔(dān)。通過分析,我們發(fā)現(xiàn)在進(jìn)行審計(jì)數(shù)據(jù)轉(zhuǎn)換的過程中,有些數(shù)據(jù)處理(比如日期時間型數(shù)據(jù)的處理、定義規(guī)范不一致的數(shù)據(jù)處理等)對審計(jì)人員的分析將不產(chǎn)生實(shí)質(zhì)性的影響,這些數(shù)據(jù)通過轉(zhuǎn)換流程日志就可以實(shí)現(xiàn)其可追溯性。所以對于這樣的變化轉(zhuǎn)換數(shù)據(jù)日志可以不記錄。但其他的數(shù)據(jù)處理(比如缺失數(shù)據(jù)處理等)要實(shí)現(xiàn)其可追溯性就必須對其進(jìn)行記載。轉(zhuǎn)換數(shù)據(jù)日志的數(shù)據(jù)量取決于轉(zhuǎn)換活動中是否包含這樣的數(shù)據(jù)處理。

  6、小結(jié)

  本文的審計(jì)數(shù)據(jù)轉(zhuǎn)換系統(tǒng)是審計(jì)署承接的國家863課題《計(jì)算機(jī)數(shù)據(jù)采集與處理技術(shù)》的一個子課題,它結(jié)合當(dāng)前的計(jì)算機(jī)審計(jì)實(shí)踐,根據(jù)審計(jì)數(shù)據(jù)轉(zhuǎn)換的需要,提出了數(shù)據(jù)轉(zhuǎn)換系統(tǒng)的實(shí)現(xiàn)技術(shù),并對審計(jì)數(shù)據(jù)轉(zhuǎn)換過程中應(yīng)關(guān)注的審計(jì)日志進(jìn)行了深入的探討。

實(shí)務(wù)學(xué)習(xí)指南

回到頂部
折疊
網(wǎng)站地圖

Copyright © 2000 - galtzs.cn All Rights Reserved. 北京正保會計(jì)科技有限公司 版權(quán)所有

京B2-20200959 京ICP備20012371號-7 出版物經(jīng)營許可證 京公網(wǎng)安備 11010802044457號