Буцах

2021032 - Гүн сургалтын аргад тулгуурлан буруу илэрхийлэлтэй санхүүгийн тайланг илрүүлэх fraud загвар боловсруулах нь

Нийгэм

Хураангуй

0

Санхүүгийн тайлан, түүнийг бүрдүүлэгч дансдын харьцаанд тулгуурласан дүн шинжилгээ нь компаний санхүүгийн тайланд алдаа агуулсан эсэхэд үнэлэлт, дүгнэлт өгөх гол аргуудын нэг болдог. Маш олон шинжлэх ухааны өгүүллэгт тухайн байгууллагын санхүүгийн чиг үүргийн хүмүүс болон гүйцэтгэх менежерүүдийн хувьд буруу бүртгэл хөтлөх эсвэл залилан үйлдэх хүсэл эрмэлзлийг чухамхүү яг ямар санхүүгийн харьцаатай өндөр хамааралтай байгааг олж тогтоохийн тулд Fraud загварыг боловсруулсан байдаг. Иймээс бид энэхүү судалгааны ажлаар монгол улсын хөрөнгийн биржид бүртгэлтэй 152 компаний санхүүгийн тайланд хиймэл оюун тэр дундаа гүн сургалтын загварчлалд үндэслэн алдаа агуулсан санхүүгийн тайланг илрүүлэгч Fraud загварыг боловсруулах бөгөөд 2017-2019 оны хоорондох нийт 3 жилийн 386 санхүүгийн тайлан, эмпирик үнэлгээний тусламжтайгаар тус судалгааг өргөжүүлэх болно. Мөн судалгааны үр дүн боловсруулалтанд Ms.Excel 2010, Spss 21, Python 3.8 VScode, Google Colab editer, Excel VBA editor, Neural Designer 4.2.0 зэрэг кодчлолын болон кодчлолын бус программ хангамжуудыг онлайн болон локал орчинд ашиглав..

0

Түлхүүр үг: Санхүүгийн харьцаа, Хиймэл оюун, Fraud загварчлал

0

Удиртгал

0

Санхүүгийн тайлан нь компаний мөнгөн урсгал, үйл ажиллагааны гүйцэтгэл, санхүүгийн нөхцөл байдлын талаар ил тод, үнэн байдлыг толилуулах зорилготой байдаг. Учир нь санхүүгийн дүн мэдээнд тусгагдсан суур мэдээлэлд үндэслэн судалгаа шинжилгээ хийх замаар, тухайн компаний өсөлт хөгжил, ирээдүйд хүлээгдэж буй үр дүнг тодорхойх нь засгийн газрын байгууллагууд, зээлдүүлэгчид, хөрөнгө оруулагчид болон хувьцаат компаниудын хувь эзэмшигч нарт шийдвэр гаргах үйл ажиллагаандаа тус тайлан мэдээг өргөнөөр ашиглах гол итгэлцүүр болдог. Гэвч сүүлийн жилүүдэд бусад улс орнуудад төдийгүй манай улсад хуурамч санхүүгийн тайланг санаатайгаар болон санамсаргүй байдлаар үйлдэх явдал цөөнгүй гарсаар байгаа нь компаний санхүүгийн тайлан үнэн зөв байх магадлалыг улам бүр бууруулсаар байна. Аудитын олон улсын стандарт (АОУС)-аас явуулсан судалгаанаас үзэхэд тодорхой бизнесийн нэгж дэх дээд түвний ажлын байранд ажил үүрэг гүйцэтгэгч удирдлагууд нь залиланг гол төлөв үйлддэг болох талаар дүгнэлт өгч түүний гол шалтгаануудыг нягтлан бодох бүртгэлийн данс хөтлөлтийг өөрчлөх удирдлагын чадамж, нөгөөтэйгүүр үйл ажиллагааны нөхцөл байдлыг үр ашигтай харагдуулах санхүүгийн менежерүүдээс улбаатай байдлаар холбон тайлбарладаг (Kanapickienė, Rasa & Grundienė, Živilė, 2015). Иймд манай орны хувьд компаний санхүүгийн тайланд алдаа байгаа эсэхийг илүү сайн аргачлалын тусламжтай олж тогтоох нь нягтлан бодох бүртгэлийн салбар төдийгүй санхүүгийн салбарт тулгамдаж буй зайлшгүй асуудлуудын нэг болоод байна.

0

Хиймэл оюун, түүний математик загварчлал

0

Хиймэл оюун (Artificial Intelligence, AI) нь компьютерын програм хангамжаар бүтээгдсэн хүний сэтгэхүйг дууриалгасан ба бараг ижил түвшинд хүргэсэн технологийн төрөл ба аливаа хүний хийдэг үйл ажиллагааг удирдахад зориулагддаг болно (Wikipedia, 2020, Зургаадугаар сар 18). Хүний биологийн тархи нь ойролцоогоор 100 сая холбоос (Synapse), 100 тэрбум орчим нейроноос бүрддэг бөгөөд энэ нь бодитоор оюун ухаан оршин байдгийн баталгаа юм. Биологийн неироны хувьд дентрит (dentrites), эсийн бие (soma эсвэл cell body), аксон (axon)-уудаас бүрдэнэ. Дентритүүд биологийн неиронд оролтын векторын үүрэг гүйцэтгэж, маш олон неиронуудаас сигнал хүлээн авах боломжийг бий болгодог. Математик томьёоллоор дентрит бүр жингүүдийг үржүүлэх үйлдэл хийнэ. Харин сома буюу эсийн бие нь нэмэх функцын үүрэг гүйцэтгэж, дентритээс ирсэн нэмэх хасах тэмдэгтэй сигналуудыг хооронд нь нэмнэ. Сома тодорхой түвшинд хүрэх үед аксон тухайн сигналыг шууд дамжуулах үүрэг хүлээн. Энэ утгаараа аксон нь хүрэлцээт сигналыг неирон хооронд дамжуулах холбогчийн үүрэгтэй юм.

0

Оролтын утгуудыг харгалзах жингээр үржүүлүүлэн дамжуулах үйлдэл буюу шугаман персептрон дахь нийлбэрчлэл нь дараах байдлаар илэрхийлэгдэнэ:

0

fx=i=1mwixi         [1]

0

Хиймэл нэйроны дентритээр дамжуулан сигналуудыг аваад тодорхой хэмжээнд (тодорхой босго давсан үед) хүрэх үед шугаман персептрон идэвхжиж хэлбэрт орсноор дараагийн нэйрон руу сигналаа дамжуулна. δ=φi=1mwixi= φ(fx)

0

h(x) = i=1mwixi            [2]

0

Үнэлэгдсэн утга (Hypothesis) буюу h(x)-ийг тодохойлсон бол дараагийн асуудал нь оптимизацийн асуудал болох бөгөөд дундаж квадрат алдаа (MSE)-ны функц L нь дараах байдлаар тодорхойлогдоно :

0

L = MSE = 1n*i=1m(Y-hw)2           [3]

0

Зөвхөн wi-д өгсөн өөрчлөлт Lнийт- ийн өөрчлөлтөнд хэр хэмжээтэйгээр нөлөөлж байгааг буюу ∂Lнийт∂Lwi -ийг томьёолбол, уламжлалын гинжин дүрмээр (derivative chain rule)  ∂Lнийт∂h(x)k* ∂h(x)k∂f(x)k* ∂f(x)k∂wi  болно :

0

∂Lwi = i=1m(Y-hw)2Dwi  =  (Y-hw) * i=1mwixiwi = - (Y-hw) * φ'i=1mwixi* xi         [4]

0

Энд градиент буулгалтын (Gradient descent) аргаар харгалзах жингүүдийг шинэчлэх бөгөөд өмнөх жин дээр сурах хурд буюу -г [4]-өөр үржүүлж нэмэх замаар олно. Энэ дүрмийг өөрөөр Widrow-Hoff-ийн сурах дүрэм гэж нэрлэнэ.

0

Тохирох түвшин хүртэл {

0

wi(j-р үеийн жин) :=  wij-1-р үеийн жин+ α*(Y-hw) * φ'i=1mwixi* xi      [5] } j-р хувьсагч бүрийн хувьд давтана. Энд нь сурах хурдыг илэрхийлэх бөгөөд [5]-ийн хувд нэг итерацийн дараагаар үүсэх wi-г харуулна.

0

0

Зураг 1. 1 Нэг далд давхаргатай неирон сүлжээ буюу шугаман персептрон

0

0

Зураг 1. 2 Градиент буулгалт(Gradient Descent: All You Need to Know)

0

Градиент буулгалтыг хэрэгжүүлэх аргачлалаас хамааран багц [5] (batch gradient descent) болон стохастик (stochastic gradient descent) градиент буулгалтанд хуваагддаг. [5] Багц градиентын буулгалтын хувьд нэг алхам хийхийн тулд сургалтын олонлогийн m бүх элементээр дамжуулж градиентыг тооцоолдог тул маш өртөг өндөртэй байдаг. Өөрөөр хэлбэл m-ийн хэмжээ их байх тусам ажиллагаа ихтэй операци болно.

0

Тохирох түвшин хүртэл {

0

i = 1 -ээс m хүртэл {

0

wi(j-р үеийн жин) :=  wij-1-р үеийн жин+ α*(Y-hw) * φ'wixi* xi          [6]

0

} j-р хувьсагч бүрийн хувьд давтана

0

}

0

Харин стохастик градиент буулгалт нь прогрессыг нэн даруй хийж эхэлдэг бөгөөд глобал оновлол хүртэл маш өндөр хазайлттайгаар хөрвөнө. Машин сургалтын инженерүүдийн хувьд тус аргачлал нь алдаа хамгийн бага, оновчлол хамгийн өндөр байх w параметрыг багц градиент буулгалтаас илүү хурдан олдог гэж үздэг. 

0

0

Зураг 1. 3 Олон далд давхаргатай неирон сүлжээ буюу гүн дүрслэл( lesson 4: neural networks, part 1 (architecture))

0


Гүн дүрслэлээр илэрхийлэгдэж байгаа үед гарц болон далд давхаргуудыг холбосон жингүүдийн өөрчлөлт нь тэгшитгэл [5]-д тодорхойлогдсон Widrow-Hoff-ийн сурах дүрмээр мөн адил шинэчилэгдэнэ: 

0

wi(j-р үеийн жин) :=  wij-1-р үеийн жин+ α*a* ∆i            [7]

0

Энд: ∆i= Y-hw*g'(i=1mwi* ai) болох бөгөөд үүнийг ∅= i=1mwi* ai гэсэн томьелолоор орлуулга хийвэл тэгшитгэл дараах байдлаар тодорхойлогдоно:

0

∆i= g'∅* i=1mwi* ∆i             [8]

0

Харин далд давхаргаас оролтын давхарга руу орох жингүүдийг дараах байдлаар олно:

0

wi(j-р үеийн жин) :=  wij-1-р үеийн жин+ α*a* ∆i∂Lнийт∂Lwi=-i=1m(Yi- ai)* ai∂wi= -i=1m(Yi- ai) *  g'(∅)i∂wi = -i=1m(Yi- ai) * g'(∅) * (∅i)∂wi = i=1m∆i * ∂(wji*ai)∂wki = i=1m∆i * wji* ∂(ai)∂wki  = [9] энд  ai= g'(∅i) болох бөгөөд дээрх тэгшитгэлээс ai-аар уламжлал авбал: 

0

-i=1m∆i * wji*g'(∅) ∂(∅i)∂wki = -i=1m∆i * wji*g'(∅) ∂(wji*ai)∂wki = -i=1m∆i * wji*g'∅* ak=-ak* ∆i           [10]

0

Тэгшитгэл [10]-ийн хувьд wji өөрчлөлт хэмжээ бөгөөд үүний сурах хурдаар үржиж хуучин жин дээр нэмэх замаар шинэчлэнэ. Тус алхамыг итерацийн хэмжээг оновчтой түвшинд хүргэснээр глобал оптима руу хөрвөлт гүйцэтгэгдэнэ.

0

Судалгааны арга зүй, эмпирик үр дүн

0

Өгөгдөл цуглуулалт. Манай улсын хөрөнгийн биржид бүртгэлтэй 152 компаний санхүүгийн тайлан буюу 2017-2019 оны хоорондох нийт 3 жилийн 386 санхүүгийн тайланд тулгуурлан (Kanapickienė, Rasa & Grundienė, Živilė, 2015) [The Model of Fraud Detection in Financial Statements by Means of Financial Ratios] загварын үнэлгээг хийх бөгөөд алдаа агуулсан болон алдаа агуулаагүй санхүүгийн тайланг дээрх үнэлгээгээр тогтоосний үр дүнд хиймэл оюун загварчлалыг хийж гүйцэтгэнэ. Дээрх загварын хувьд алдаа агуулсан 40 санхүүгийн тайлан алдаа агуулаагүй 125 санхүүгийн тайланд үндэслэн ложистик регрессийн тусламжтай санхүүгийн тайлангийн Fraud загварыг боловсруулсан. Тухайн хуурамч санхүүгийн тайлан дахь санхүүгийн харьцааны статистик тоон утгууд нь алдаагүй санхүүгийн тайлан дахь утгуудаас хэр зөрүүтэй болох тал дээр суурилж тус загварыг үнэлгээг гарган авсан байна.  

0

(Хүснэгт 1.1)-ээс үзэхэд нийт өгөгдлийн олонлог болох 386 сургалтын жишээнээс 76.9 хувь буюу 297 түүвэр нь алдаа агуулаагүй санхүүгийн тайлан, 23.1 хувь буюу 89 түүвэр нь тодорхой хэмжээнд алдаатай санхүүгийн тайлан болохийг харууллаа. Тус үнэлгээнээс шалтгаалан зааглалтын түвшин 0.5-аас бага байх интервалд багтах 297 түүвэр алдаагүй буюу 0 гэсэн утга, 0.5-аас дээш байх интервалд багтах 89 түүвэр ямар нэгэн байдлаар алдаа агуулсан буюу 1 гэсэн үнэлгээгээр утга ногдоно. 

0

Энэ хэсэгт бидний гол зорилго бол бүх санхүүгийн харьцаан дахь холбоо хамаарлыг тодорхойлж алдаа агуулсан байж болохуйц санхүүгийн тайлангийн үзүүлэлтүүдийн дундаж болон алдаа агуулаагүй санхүүгийн тайлангийн үзүүэлтүүдийн дундаж утгууд өөр хоорондоо ялгаатай эсэхийг холбогдох статистик арга зүйн тусламжтай олж тогтооно

0

Хүснэгт 1. 1 Зорилтот хувьсагч (target variable)-ийг тодорхойлох эмпирик үр дүн

0

Valid

Интервалын урт

Интервалд багтах түүвэр

Хувь

Хүчинтэй хувь

Хуримтлагдсан хувь

1

0.0-0.1

184

47.7

47.7

47.7

2

0.1-0.2

43

11.1

11.1

58.8

3

0.2-0.3

35

9.1

9.1

67.9

4

0.3-0.4

22

5.7

5.7

73.6

5

0.4-0.5

13

3.4

3.4

76.9

6

0.5-0.6

11

2.8

2.8

79.8

7

0.6-0.7

5

1.3

1.3

81.1

8

0.7-0.8

7

1.8

1.8

82.9

9

0.8-0.9

7

1.8

1.8

84.7

10

0.9-1.0

59

15.3

15.3

100.0

 

Total

386

100.0

100.0

 

0

Эх сурвалж: Судлаачийн тооцоолол (SPSS 21 программын үр дүн)

0


 

0

Хүснэгт 1. 2 Санхүүгийн харьцаанууд, тестийн үр дүн 

0

Харьцаанууд

Түүвэр

АХТ 1

АХТ 2

Харьцаанууд

Түүвэр

АХТ1

АХТ2

1.А Ашигт ажиллагааны харьцаанууд (Борлуулалт)

ЭӨ/НХ

R22

386

0.000

0.000

НА / бор

R1

316

0.000

0.069*

НӨТ/ЭӨ

R23

386

0.000

0.861*

ТТӨА / бор

R2

316

0.000

0.000

4. Үйл ажиллагааны харьцаанууд

ЦА/бор

R3

316

0.000

0.000

БМ/БОР

R24

316

0.000

0.192*

ЦА/НА

R4

317

0.000

0.000

ББӨ/БМ

R25

312

0.000

0.000

1.Б Ашигт ажиллагааны харьцаа (Хөрөнгө оруулалт)

ДА/БОР

R26

316

0.000

0.003

НА / НХ

R5

386

0.000

0.000

БОР/ҮХ

R27

386

0.000

0.000

ТТӨА / НХ

R6

386

0.000

0.000

БОР/НХ

R28

386

0.000

0.000

ЦА/НХ

R7

386

0.000

0.000

БОР/ЭӨ

R29

386

0.000

0.000

ТТӨА/ҮХ

R8

386

0.000

0.000

ББӨ/БОР

R30

316

0.000

0.061*

ЦА/ҮХ

R9

386

0.000

0.000

5.А Бүтцийн харьцаанууд (нийт хөрөнгө)

ТТӨА/ЭӨ

R10

386

0.000

0.634*

ҮХ/НХ

R31

386

0.000

0.050*

ЦА/ЭӨ

R11

386

0.000

0.721*

ЭХ/НХ

R32

386

0.000

0.014

ТТӨА/БХӨТ

R12

386

0.000

0.000

(БМ+ДА)/НХ

R33

386

0.000

0.000

ХА/ЦА

R13

361

0.000

0.000

БМ/НХ

R34

386

0.000

0.000

2. Хөрвөх чадварын харьцаанууд

ДА/НХ

R35

386

0.000

0.000

ЭХ/БХӨТ

R14

386

0.000

0.000

МХ/НХ

R36

386

0.000

0.000

(ЭХ-БМ)/БХӨТ

R15

386

0.000

0.000

5.Б Бүтцийн харьцаанууд (эргэлтийн хөрөнгө)

БМ/БХӨТ

R16

386

0.000

0.000

БМ/ЭХ

R37

380

0.000

0.000

МХ/НӨТ

R17

386

0.000

0.000

МХ/ЭХ

R38

380

0.000

0.000

МХ/БХӨТ

R18

386

0.000

0.000

5.С Бүтцийн харьцаанууд (шинж чанар)

АК/НХ

R19

386

0.000

0.000

ХА/НХ

R39

386

0.000

0.000

3. Төлбөрийн чадварын харьцаанууд

ХА/ЭӨ

R40

386

0.000

0.000

НӨТ/НХ

R20

386

0.000

0.000

БХӨТ/НӨТ

R41

386

0.000

0.935*

БХӨТ/НХ

R21

386

0.000

0.000

Z ИНДЕКС

R42

386

0.000

0.000

0

Эх сурвалж: Судлаачийн тооцоолол (SPSS 21 программын үр дүн

0

Судалгаанд нийт 42 санхүүгийн харьцааг ашиглах бөгөөд алдаа агуулсан болон агуулаагүй санхүүгийн тайлан бүрт тус тооцооллыг тусгасан болно. Статистик тестийг сонгох процессын өмнө нийт түүвэр гаусс нормаль тархалттай эсэхийг зайлшгүй баталгаажуулах хэрэгтэй. Тус үр дүнг гарган авах нэг түүврийн шинжүүр нь Колмогров-Смирнов (K-S) тест бөгөөд хэрвээ К-S тест ач холбогдолтой (p утга < τ параметр, энд – ач холбогдлын түвшин ( = 0.05)) бол n хэмжээст огторгуй дахь i – р үл хамааран хувьсагч нормаль бус тархалттай болно. Хэрвээ нормаль тархалттай гэсэн таамаглал няцаагдаж эсрэг Н1 таамаглал ач холбогдолтой болох тохиолдолд бид Манн-Витний Ю (Mann-Withney U) тестийг ашиглах бөгөөд дэвшүүлж буй H0 таамаглал нь алдаа агуулсан санхүүгийн тайлан дахь санхүүгийн харьцааны түүвэрлэлтийн тархалт болон алдаа агуулаагүй санхүүгийн тайлан дахь түүвэрлэлтийн тархалттай ижил тэнцүү гэсэн таамаглал биелэнэ. H0 таамаглал няцаагдвал p утга параметрээс бага байх тохолдолд санхүүгийн харьцаанууд ижил биш тархалттай байна. Эсрэгээрээ бидний сонгож авсан түүврийн утгууд нормаль тархалттай бол T тестийг ашиглах бөгөөд Левень тестеер вариацийн тэнцвэрийг тооцоолно. Улмаар түүврийн дундажууд тэнцвэртэй гэсэн таамаглал батлагдана. Тусгаар хоёр түүврийн T тестийн таамаглалын Н0 тэг таамаглал нь алдаатай болон алдаагүй санхүүгийн тайлангийн харьцаануудын дундаж өөр хоорондоо ялгаагүй гэсэн таамаглалтай байна. Харин тус таамаглал няцаагдвал үзүүлэлтүүд хооронд ялгаа оршин байгааг илтгэнэ.

0

Санхүүгийн харьцааны шалгуур. Бидний авч хэрэгжүүлсэн хамгийн эхний тестийн үр болох Колмогров-Смирнов шалгуурын үр дүнд бүх хувьсагчид нормаль тархалтгүй гэсэн үнэлгээг харууллаа. Үүнээс шалтгаалан гуравдагч стаситик шалгуур болох Т тестийг орхигдуулсан бөгөөд хоёрдогч шалгуур Манн-Витний Ю шалгуурын үнэлгээнээс дүгнэвэл НА/Бор (нийт ашиг/борлуулалт), ТТӨА/ЭӨ (татвар төлөхийн өмнөх ашиг/эздийн өмч), ЦА/ЭӨ (цэвэр ашиг/эздийн өмч), НӨТ/ЭӨ (нийт өр төлбөр/эздийн өмч), БМ/Бор (Бараа материал/борлуулалт), ББӨ/Бор (борлуулалсан бүтээгдэхүүний өртөг/боруулалт), ҮХ/НХ (үндсэн хөрөнгө/нийт хөрөнгө), БХӨТ/НӨТ (богино хугацаат өр төлбөр/нийт өр төлбөр) гэсэн харьцаануудын хувьд алдаа агуулсан болон алдаа агуулаагүй санхүүгийн тайлан дахь тархалтын үнэлгээ ижил гэсэн үр дүнг харуулсан тул хиймэл оюуны загварчлалаас тус хувьсагчдын хасагдуулгыг хийж гүйцэтгэв. Мөн нейрон сүлжээн дэх гажилтын далайцыг бууруулах, алдааг бага байлгах, оновчлолыг илүү баттай болгох үүднээс Missing утга их хэмжээгээр агуулсан хүчин зүйлсийг загварын үнэлгээнд оруулаагүй болохийг дурдах нь зүйтэй боловуу. Бидний зүгээс тус хүчин зүйлсийн хасагдуулга нь “Хэмжээсийн хараал” буюу Curse of Dimensionality-г бууруулахад тодорхой хэмжээнд нөлөө үзүүлж болох юм гэсэн байр суурьтай байна. 

0

Гүн сургалтын процедур, fraud загварчлал

0

Судалгааны тус хэсэгт хиймэл оюуны загварчлалыг өмнөх бүлгүүдэд үнэлэгдсэн үр дүнгүүдийн тусламжтай тооцоолох бөгөөд гүн бүтэцтэй неирон сүлжээний үнэлгээг Neural Designer программ хангамжийн тусламжтай гарган авах болно. Яагаад заавал гүн сургалт гэж ? Уламжлалт машин сургалтын хувьд өгөгдлийг урьдчилан бэлтгэх үе шатанд гарах feature extraction буюу гол ялгагдах шинж чанараа задлах үйл явцыг гараар бэлтгэдэг бол гүн шаталсан сургалт нь үүнийг өөрөө хүний оролцоогүйгээр хийж гүйцэтгэдэг. Өөрөөр хэлбэл хиймэл неирон сүлжээний далд давхаргын тоо 2 буюу түүнээс их тохиолдолд гүн давхаргатай буюу гүн бүтэцтэй сургалт гэж нэрлэнэ. 

0

0

Зураг 1. 4 FRAUD загварчлалын нейрон сүлжээ(Судлаачийн тооцоолол (Neural designer 4.2.0 программын үр дүн))

0

Гүн сургалт хийх үед бас нэг давуу тал байгаа нь өгөгдлийн хэмжээ нэмэгдэх буюу сургалтын багц ихсэх тусам уламжлалт машин сургалт, гүехэн нейрон сүлжээ, дундаж нейрон сүлжээ, гүн неирон сүлжээ хүртэл тооцоолох хүчин чадлын хэмжээ үлэмж хэмжээгээр өсдөг байна. (Зураг 1.4) дээрх график илэрхийлэл нь алдаа агуулсан санхүүгийн тайлан илрүүлэгч Fraud загварчлалын сүлжээний архитектурын бүтэц юм. Энэхүү бүтэц нь хэмжээсийн давхарга, нюрал сүлжээ, магадлалын давхаргуудаас бүрдэнэ. Оролтын давхаргын хэмжээ 28, гаралтын давхаргын хэмжээ 1 байх бөгөөд бүтцийг нийтээр тодорхойлбол [opt] [28-10-9-8-5-1] гэсэн архитектуртай неирон сүлжээ бий боллоо. Гүн шалалсан сургалтын нэг дутмаг тал нь далд давхаргууд дахь хамгийн сүүлийн давхаргаас бусад далд давхаргуудыг оновчлох загвар сонголт хийх боломж байдаггүй бөгөөд ганц тодорхойлох арга зам нь механик байдлаар үнэлэх явдал байдаг. Иймээс бид маш олон туршилтын үр дүнд [opt] бүтэцтэй гүн сургалтын архитектурт үндэслэн судалгааг цаашид үргэлжүүлнэ.

0

Неирон сүлжээг сургах үед гарч ирэх хамгийн хүнд асуудлуудын нэг нь локал минима буюу алдааны илэрхийлэл функцийн өгөгдсөн зайд хамгийн бага утгуудыг олох үйл явц байдаг. Бидний зорилго бол локал минима бус глобал минима байна. Өөрөөр хэлбэл функцийн бүх домайнд харгалзах хамгийн бага алдааны илэрхийллийг олох нь алдаа агуулсан санхүүгийн тайланг илрүүлэгч Fraud загварчлалыг боловсруулах хамгийн сайн гаргалгаа болно. Мөн сүлжээг сургах үед m хэмжээст өгөгдлийн олонлогийг сургах түүвэр, сонгох түүвэр, тестийн түүвэр гэсэн гурван хэсэгт харгалзан 60:20:20 харьцаатайгаар хуваана. Эхний удаад 60 хувийн түүвэрт сургалтыг явуулах бөгөөд 20 хувийн түүвэрт тест хийж үзээд үлдсэн 20 хувийн түүвэрт сонголтыг алдааг тооцоолж сүүлийн далд давхарга дахь оновчтой архитектурын бүтцийг тодорхойлох болно. Далд давхаргуудын идэвхжүүлэлтийн функцээр гиперболлог тангес (hyperbolic tangent) үнэлэгчийг сонгосон бөгөөд гаралтын давхаргын  хувьд сигмойд (sigmoid) буюу бидний мэдэхээр ложистик (logistic) үнэлэгчийг сонгов.

0

Хүснэгт 2. 1 Неирон сүлжээний сургалтын стратеги

0

 

Тайлбар

Утга

Урвуу Хессиан барагцаалах арга

Тохиромжтой сургалтын хурдыг гарган авахад ашиглсан арга

BFGS

Сургалтын хурдны арга

Quasi-Newton сургалтын чиглэл дэх алхам тооцолох аргачлал

Brentmethod

Алдагдлын хязгаар

Сургалтын түвшин дэх интервалын максимум урт

0.001

Алдагдлын минимум бууралт

Хоёр амжилттай үеийн хоорондох минимум алдагдлын бууралт

1.00E-12

Зорилтот алдагдал

Алдаан зорилтот утга

1.00E-12

Зорилтот градиент норм

Обьектив функцийн зорилтот градиент нормын утга

0.001

Сонголтын максимум алдааны норм

Сонголтын алдаа нэмэгдэхэд максимум үеийн хэмжээ

100

Максимум давталтын тоо

Сургалтыг гүйцэтгэх үеийн максимум хэмжээ

1000

Максимум хугацаа

Сургалтын максимум хугацаа

3600

0

Эх сурвалж: Судлаачийн тооцоолол (Neural designer 4.2.0 программын үр дүн)

0

Бидний хувьд хоёрдугаарт бүлэгт хиймэл оюуны математик загварчлалыг томьёолох үед оптимизацийн алгоритмаар градиент буулгалтыг тодорхойлж байсан бөгөөд тус оновчлолын хувьд үр дүн, таамаглах чадварын хувьд сул үнэлгээг гарган өгч байсан тул Quasi-Newton аргачлалыг оновчлолын алгоритмаар ашигласан. Энэхүү алгоритм нь Newton аргачлалд суурилдаг боловч хоёрдогч уламжлалыг тооцоолох шаардлаггүй байдгаараа онцлоготой. Мөн градиент буулгалтыг бодвол глобал оновчлол хүртэл бага давталтын түвшин шаарддаг. Quasi-Newton нь градиент мэдээлэлд тулгуурлан алгоритмын давталт бүрт урвуу хессианыг барагцаалан тооцоолж глобал хөрвөлтийг гүйцэтгэнэ. 

0

Тоон оновчлолд  Broyden–Fletcher–Goldfarb–Shanno (BFGS) алгоритм нь хязгаарлалтгүй шугаман бус оптимизацийн асуудлыг шийдвэрлэх давтамжит аргачлал бөгөөд Quasi-Newton уул өөд мацан (hill-climbing) функцийн тогвортой цэгийг олох бүлэг оптимизацийн техникт хамаарах аргачлал юм. Харин сонголтын алдаа нэмэгдэх үед сургалтыг зогсоох нь үнэлгээний алдаа өндөр байлгах гол хүчин зүйл болох тул сонголтын максимум алдааны нормыг 100 үе гэж тооцоолов. Мөн j болон j + 1 үеийн хооронд алдааны нөхцөл буурах үеийн хамгийн бага утга 1.00E-12 байна. 

0

Fraud загварчлалыг шалгах тестийн үр дүн. Судалгааны тус хэсэгт бид гүн сургалтын аргаар боловсруулсан алдаа агуулсан санхүүгийн тайлан илрүүлэгч Fraud загварыг программ хангамжийн Default утгаар сонгосон санамсаргүй 77 сургалтын жишээнд үндэслэн туршилт хийх бөгөөд нийт өгөгдлийн багц 386 санхүүгийн тайлангийн 20 хувь сонгогдсон болно. 

0

Хүснэгт 1. 3 Эргэлзээний матриц (confusion matrix)

0

 

Алдаа агуулсан гэж таамагласан

Алдаа агуулаагүй гэж таамагласан

Санхүүгийн тайлан алдаа агуулсан

14 (18.2%)*

0 (0%)**

Санхүүгийн тайлан алдаа агуулаагүй

5 (6.49%)**

58 (75.3%)*

0

Эх сурвалж: Судлаачийн тооцоолол (Neural designer 4.2.0 программын үр дүн)

0

(Хүснэгт 1.3)-аас үзэхэд зорилтот хувьсагчийн хувьд элемент (0,0)* нь бодит эерэг буюу санхүүгийн тайлан алдаа агуулсан үед зөв таамагласан байдлыг, элемент (0,1)** нь худал эерэг утгууд буюу ямар нэгэн байдлаар алдаа агуулаагүй гэж буруу таамагласан,  элемент (1,0)* нь худал сөрөг утгууд буюу санхүүгийн тайлан алдаагүй үед алдаа агуулсан гэж буруу таамагласан, элемент (1,1) нь бодит сөрөг утгууд болох алдаа агуулаагүй гэж таамагласан утгуудыг харуулна. Шийдвэрийн хил (босго) 0.5 үед 77 сургалтын жишээнд туршилт хийсэн бөгөөд нийт тестийн өгөгдлий хувьд алдаа агуулсан санхүүгийн тайланг алдаатай гэж 100 хувь, алдаа агуулаагүй санхүүгийн тайланг алдаагүй гэж 92 хувиар зөв таамаглаж байна. 

0

Гүн сургалтын Fraud загварчлалд итгэх интерваль нь дараах байдалтай байна. Үүнд: 

0

  1. FRAUD≥0.946854 бол санхүүгийн тайлан нь алдаатай.
  2. 0.68571≤FRAUD<0.946854 бол алдаатай байх магдлал нь 88.9 хувь
  3. 0.428579≤FRAUD<0.68571 бол эргэлзээтэй санхүүгийн тайлан
  4. 0.020966≤FRAUD<0.428579 бол алдаагүй байх магдлал 88.3 хувь
  5. FRAUD<0.020966 бол санхүүгийн тайлан нь алдаагүй байна. Алдаа агуулсан санхүүгийн тайлан илрүүлэгч Fraud загварчлал 93.5 хувиар үнэн зөв таамаглах чадвартай байна.

0

Дүгнэлт 

0

Энэхүү судалгааны ажилд манай орны санхүүгийн салбарт тулгамдаж буй зайлшгүй асуудлуудын нэг болоод байгаа алдаа агуулсан санхүүгийн тайланг илрүүлэгч Fraud загварыг боловсруулахад голлон анхаарлаа. Тодруулбал, холбогдох математик статистик, оптимизацийн арга аргачлалуудыг ашиглан санаатайгаар болон санамсаргүй байдлаар үйлдэгдсэн санхүүгийн тайлангийн алдаатай байдлыг үнэлэх загварчлалыг боловсруулав. Судалгааны ажлын гол үр дүнгүүдийг нэгтгэн авч үзвэл:

0

Судалгаанд ашиглагдах нийт өгөгдлийн олонлог болох 386 сургалтын жишээнээс 76.9 хувь буюу 297 түүвэр нь алдаа агуулаагүй санхүүгийн тайлан, 23.1 хувь буюу 89 түүвэр нь тодорхой хэмжээнд алдаатай санхүүгийн тайлан болохийг харууллаа. Тус үнэлгээнээс шалтгаалан зааглалтын түвшин 0.5-аас бага байх интервалд багтах 297 түүвэр алдаагүй буюу 0 гэсэн утга, 0.5-аас дээш байх интервалд багтах 89 түүвэр ямар нэгэн байдлаар алдаа агуулсан буюу 1 гэсэн үнэлгээгээр утга ногдсон.

0

Загварын үнэлгээг хийхийн тул авч хэрэгжүүлсэн хамгийн эхний тестийн үр болох Колмогров-Смирнов шалгуурын үр дүнд бүх хувьсагчид нормаль тархалтгүй гэсэн үнэлгээг харуулав. Үүнээс шалтгаалан гуравдагч стаситик шалгуур болох Т тестийг орхигдуулсан бөгөөд хоёрдогч шалгуур Манн-Витний Ю шалгуурын үнэлгээнээс 8 өөр үл хамааран хувьсагчдын хасагдуулгыг хийж мөн missing утга их хэмжээгээр агуулсан хоёр хувьсагчийг үнэлгээнээс хассан тул цаашид 32 хувьсагчийн оролцоотой загварын үнэлгээг боловсруулав.

0

Алдаа агуулсан санхүүгийн тайлан илрүүлэгч Fraud загварчлалын сүлжээний архитектурын бүтцийг [opt] [28-10-9-8-5-1] гэсэн бүтэцтэйгээр тодорхойлсон бөгөөд далд давхаргуудын идэвхжүүлэлтийн функцээр гиперболлог тангес (hyperbolic tangent) үнэлэгчийг сонгосон бөгөөд гаралтын давхаргын хувьд сигмойд (sigmoid) буюу бидний мэдэхээр ложистик (logistic) үнэлэгчийг сонгов.

0

Бид хиймэл оюуны математик загварчлалыг томьёолох үед оптимизацийн алгоритмаар градиент буулгалтыг тодорхойлж байсан боловч тодорхой шалтгаануудын улмаас Quasi-Newton аргачлалыг оновчлолын алгоритмаар ашигласан. Энэхүү алгоритм нь Newton аргачлалд суурилдаг боловч хоёрдогч уламжлалыг тооцоолох шаардлаггүй байдгаараа онцлоготой. Мөн градиент буулгалтыг бодвол глобал оновчлол хүртэл бага давталтын түвшин шаарддаг зэрэг давуу талтай байв.

0

Боловсруулсан загвачлалын тестийн үр дүнгээс дурдвал гүн сургалтын аргаар боловсруулсан алдаа агуулсан санхүүгийн тайлан илрүүлэгч Fraud загварыг программ хангамжийн Default утгаар сонгосон санамсаргүй 77 сургалтын жишээнд үндэслэн туршилт хийсэн бөгөөд нийт өгөгдлийн багц 386 санхүүгийн тайлангийн 20 хувь сонгогдож Шийдвэрийн хил (босго) 0.5 үед тус 77 сургалтын жишээнд туршилтаас нийт тестийн өгөгдлийн хувьд алдаа агуулсан санхүүгийн тайланг алдаатай гэж 100 хувь, алдаа агуулаагүй санхүүгийн тайланг алдаагүй гэж 92 хувиар зөв таамаглав. Гүн сургалтын хувьд уламжлалт машин сургалтын шугаман ангилагчдын хийж чадахгүй зүйлсийг тодорхой хэмжээнд шийдвэрлэж чаддаг тул алдаа агуулсан санхүүгийн тайлан илрүүлэгч Fraud загварчлал ерөнхий урьдчилан таамаглах чадвар 93.5 хувиар үнэн зөв таамаглах чадвартай байна.

0

Ашигласан ном зүй 

0

I. Англи хэлээр хэвлэгдсэн бүтээл

0

  1. Kanapickienė, Rasa, & Grundienė, Živilė. (2015 оны 12 01). The Model of Fraud Detection in Financial statements by Means of Financial Ratios. Procedia - Social and Behavioral Siences, хуудсд. 321-327.
  2. Wikipedia. (2020, Зургаадугаар сар 18). Хиймэл оюун. Хиймэл оюун. (2020, Зургаадугаар сар 18). Википедиа, . Retrieved 11:05, Аравд//mn.wikipedia.org/w/index.php?title=%D0%A5%D0%B8%D0%B9%D0%BC%D1%8D%D0%BB_%D0%BE%D1%8E%D1%83%D0%BD&oldid=620125. 
  3. Wikipedia Contributors. (2020 оны August 31). Broyden–Fletcher–Goldfarb–Shanno algorithm. Wikipedia, The Free Encyclopedia: https://en.wikipedia.org/w/index.php?title=Broyden%E2%80%93Fletcher%E2%80%93Goldfarb%E2%80%93Shanno_algorithm&oldid=976049646-ээс Гаргасан
  4. Accounting Fraud Detection: It is Possible to Quantify Undiscovered Cases? Artur Filipe Ewald Wuerges Mestre em Administaзгo, Universidade Federal de Santa Catarina,2010
  5. Causes, consequences, and deterence of financial statement fraud Zabihollah Rezaee, Fogelman College of Business and Economics, 300 Fogelman College Admin. Building,The University of Memphis, Memphis, TN 38152-3120, USA, Received 15 June 2002
  6. Detecting financial statement fraud: multi-classifier combination and fraud detection using data mining, Johan L.Perols, University of South Florida,2008
  7. False Financial Statements: Characteristics of China’s Listed Companies and Detecting Approach, Belinna Bai, Credit Department, Agriculture Bank of China, International Journal of Information Technology, 2008.
  8. Albrecht, W. 2002. Fraud Examination. Mason, OH: Thomson-South.
  9. American Institute of Certified Public Accountants (AICPA). 2002. Consideration of fraud in a financial statement audit. Statement on Auditing Standards No. 99. New York, NY: AICPA.
  10. Dunn, P. 2004. The impact of insider power on fraudulent financial reporting. Journal of Management, 30(3) 397-412.
  11. Greene, W. 2000. Econometric Analysis, Prentice Hall, Upper Saddle.
  12. Kaminski, K.T.Wetzel, and L. Guan. 2004. Can financial ratios detect fraudulent financial reporting? Managerial Auditing Journal 19 (1): 15-28.
  13. Financial Statement Fraud: Some Lessons from US and European Case Studies, Brennan and Mary McGrath (Published in Australian Accounting Review, 17 (2) (42) (July 2007): 49-61
  14. Detecting false financial statements using published data: some evidence from Greece, Aristotle University of Thessaloniki, Department of Economics, Division of Business Administration, Thessaloniki, 2002
  15. Detecting Financial Statement Fraud: Stories From the Trenches Presented by: Keith CPA/CFF, CFE, CMA keithm@fscpa.com May 9, 2011
  16. An Analysis of Financial Statement Fraud at The Assertion Level, Isabel Wang ANU College of Business and Economics, Australian National University, Canberra, Australia, 2009
  17. Analysis ratios for detecting financial statement fraud By Cynthia Harrington, Associate Member, CFA, From the March/April 2005 issue of Fraud Magazine
  18. Effrcts of Ability to Assess Fraud Risk, Fraud Risk, Level and Personality

0

Хавсралт  A: Хоёртын ангилалын тестийн үр дүн

0

 

Тайлбар

Утга

Ангилалын нарийвчлал (accuracy)

Зөв ангилагдсан түүврийн харьцаа

0.935065

Алдааны түвшин

Буруу ангилагдсан түүврийн харьцаа

0.0649351

Sensitivity

Бодит эерэг утгуудын эерэг гэж таамаглагдсан харьцаа

1

Specificity

Бодит сөрөг утгуудын сөрөг гэж таамаглагдсан харьцаа

0.920635

Нарийвчлал (precision)

Таамаглагдсан эерэг утгууд бодит эерэг байх харьцаа

0.736842

Эерэг үнэний хувь

Таамагдагдсан эерэг утгууд бодит эерэг байх үнэний хувь

12.6

Сөрөг үнэний хувь

Таамагдагдсан сөрөг утгууд сөрөг байх үнэний хувь

0

F1 оноо

Нарийвчлал ба мэдрэмжийн гармоник дундаж

0.848485

Хуурамч эерэг хувь

Бодит сөрөг утгуудын эерэг гэж таамаглагдсэн хэсэг

0.0793651

Хуурамч олж мэдэх хувь

Таамаглагдсан эерэг утгууд бодит сөрөг байх харьцаа

0.263158

Хуурамч сөрөг хувь

Бодит эерэг утгууд сөрөг гэж таамаглагдсан харьцаа

0

Сөрөг таамаглах утга

Таамаглагдсан сөрөг утгууд бодит эерэг байх харьцаа

1

Matthews-ийн корреляци

Зорилтот хувьсагч болон гаралт хоорондын коррелляци -1 ээс +1 хооронд утга авна

0.823628

Youden-ий индекс

Урьдчилан таамаглах арга нь таамаглалтай харьцуулахад зөв шийдвэр гаргах магадлал

0.920635

Markedness

Бодит ангиудаас ангилагч шошгыг урьдчилан таамаглах магадлал.

0.657477

0

Эх сурвалж: Судлаачийн тооцоолол (Neural designer 4.2.0 программын үр дүн)

0

Хавсралт B. Өгөгдөл урьдчилан бэлтгэх үе шатанд бичигдсэн макро бичилт

0

Sub Macro1()

Worksheets("ОДТ").Select

' Macro1 Macro

Range("G5").Select

Range("A1").Select

ActiveCell.FormulaR1C1 = "=R[3]C[-2]"

Selection.End(xlDown).Select

Range("H5").Select

ActiveCell.Offset(1, 0).Range("A1").Select

ActiveCell.FormulaR1C1 = "=R[2]C[-3]"

ActiveWindow.ActivateNext

Range("I5").Select

Worksheets("СБД").Select

ActiveCell.FormulaR1C1 = "=R[1]C[-4]"

Range("G5").Select

Range("J5").Select

ActiveCell.FormulaR1C1 = "=R[25]C[-2]"

ActiveCell.FormulaR1C1 = "=23"

Range("H5").Select

Range("J5").Select

ActiveCell.FormulaR1C1 = "=R[15]C[-3]"

ActiveCell.FormulaR1C1 = "=R[18]C[-5]"

Range("I5").Select

Range("K5").Select

ActiveCell.FormulaR1C1 = "=R[62]C[-4]"

ActiveCell.FormulaR1C1 = "=R[22]C[-6]"

Range("J5").Select

Range("K5").Select

ActiveCell.FormulaR1C1 = "=R[41]C[-5]"

Range(Selection, Selection.End(xlToLeft)).Select

Range("K5").Select

Selection.Copy

ActiveCell.FormulaR1C1 = "=R[60]C[-6]"

Worksheets("СБД").Select

Range("L5").Select

Selection.PasteSpecial Paste:=xlPasteValues, Operation:=xlNone, SkipBlanks _

ActiveCell.FormulaR1C1 = "=R[13]C[-7]"

:=False, Transpose:=False

Range("P5").Select

:=False, Transpose:=False

ActiveCell.FormulaR1C1 = "=R[4]C[-11]"

ActiveWindow.ActivateNext

    Range("Q5").Select

    ActiveWindow.Close

    ActiveCell.FormulaR1C1 = "=R[48]C[-12]"

    ActiveWindow.ActivatePrevious

    Range("R5").Select

    Range("A1").Select

 

End Sub

0

Эх сурвалж: Судлаачийн тооцоолол (Excel VBA editer программын үр дүн)

0

Хавсралт  C.  Загварын үнэлгээг тооцоолох VScode Python 3.8 скрипт (Тодорхой Хэсэг)

0

from math import tanh

0

from math import exp

0

inputs = list(map(float, input("").split()))

0

def Logistic(x) : 

0

  return(1/(1+exp(-x))) 

0

def expression(inputs) : 

0

    if type(inputs) != list:

0

      print('Аргумент заавал лист төрлийн обьект байх ёстойг анхаарнуу !!!')

0

      exit()

0

    if len(inputs) != 28:

0

      print('оролтын тоо хэмжээ буруу байна листэн доторх элементийн тоо заавал 28 байх ёстой')

0

      exit()

0

    R5=inputs[0]

0

    R6=inputs[1]

0

    R7=inputs[2]

0

    R8=inputs[3]

0

    R9=inputs[4]

0

    R12=inputs[5]

0

    y_4_4 = tanh (0.0766316+ (y_3_1*-0.1551)+ (y_3_2*0.338326)+ (y_3_3*0.355168)+ (y_3_4*-0.404524)+ (y_3_5*-0.00354622)+ (y_3_6*-0.49545)+ (y_3_7*0.479654)+ (y_3_8*0.103478))

0

    y_4_5 = tanh (-0.0433354+ (y_3_1*0.199621)+ (y_3_2*-0.910202)+ (y_3_3*-0.557648)+ (y_3_4*0.753094)+ (y_3_5*0.0454612)+ (y_3_6*2.35972)+ (y_3_7*-1.31468)+ (y_3_8*-0.230098))

0

    LMF = -0.46668+ (y_4_1*-4.34988)+ (y_4_2*-3.93452)+ (y_4_3*-0.504548)+ (y_4_4*-0.935972)+ (y_4_5*3.7114)

0

    FRAUD = Logistic(LMF)

0

    return FRAUD

0

def result(prob):

0

  logit = prob

0

  name = "AAA"

0

  if 0.946854 <= prob:

0

    print("Хиймэл оюун миний тооцооллоор: \n Fraud магадлалын утга {} байгаа тул {} компаний санхүүгийн тайлан алдаатай байх магадлал маш өндөр байна гэж тооцоолов.".format(logit, name))

0

  elif 0.68571 <= prob < 0.946854:

0

    print("Хиймэл оюун миний тооцооллоор: \n Fraud магадлалын утга {} байгаа тул {} компаний санхүүгийн алдаатай байх магдлал нь 88.9 хувь байна гэж тооцоолов.".format(logit, name))

0

  elif  0.428579 <= prob < 0.68571: 

0

    print("Хиймэл оюун миний тооцооллоор: \n Fraud магадлалын утга {} байгаа тул {} компаний санхүүгийн тайлан эргэлзээтэй байна гэж дүгнэв.".format(logit, name))

0

  elif  0.020966 <= prob < 0.428579:

0

    print("Хиймэл оюун миний тооцооллоор: \n Fraud магадлалын утга {} байгаа тул {} компаний санхүүгийн алдаагүй байх магдлал нь 88.3 хувь байна гэж тооцоолов.".format(logit, name))

0

  else :

0

    print("Хиймэл оюун миний тооцооллоор: \n Fraud магадлалын утга {} байгаа тул {} компаний санхүүгийн тайлан алдаатай байх магадлал маш өндөр байна гэж тооцоолов.".format(logit, name))

0

result(expression(inputs))

0

Эх сурвалж: Судлаачийн тооцоолол (VScode Python 3.8 программын үр дүн)

0

Мэдэгдэх

0

0

×

Саналууд

Санал бичих

Таалагдаж байна

Таалагдахгүй байна

Нэр томъёо оруулаагүй байна.

Хэлэлцүүлгийн Like/dislike

Хэлэлцүүлэг үзсэн