Friday, June 24, 2016

Բաց տվյլաների շտեմարանները Հայաստանում․ պետական սեգմենտի քարտեզագրում

Զանազան պետական գերատեսչությունների կուտակած ու հրապարակած բաց տվյալները (Open Data) Հայաստանում այսօր բավական մեծ զանգվածներ են կազմում: Արդեն իսկ կան մի քանի ցայտուն օրինակներ, երբ բաց տվյալների օգտագործումն ունեցել է դրական ազդեցություն:
Տվյալների մի շարք շտեմարաններ լրագրողական հակակոռուպցիոն և քաղաքացիական հետաքննությունների մեծ ներուժ ունեն, օրինակ՝ «Մեկ անձից կատարվող գնումներ», «ՊՈԱԿ-ների ֆինանսավորում», «Բարձրաստիճան պաշտոնատար անձանց հայտարարագրեր»: Սրանք օրինակներ են, երբ տվյալների շտեմարանները հետազոտողին թույլ են տալիս որոնողական ինքնուրույն աշխատանք կատարելու:
Սակայն կարևոր է նաև , որպեսզի տվյալները հնարավոր լինի ավտոմատացված մշակման ենթարկել, ինչպես նաև վիզուալ կերպով ներկայացնել: Այսպես, օրինակ, Շվեդիայի կառավարությունը հատուկ API է տրամադրում վիճակագրական տվյալները ավտոմատացված եղանակով ստանալու և մշակելու համար: Իսկ ամերիկյան կառավարությունը՝ առանձին մեծ գործիք, որի միջոցով հնարավոր է բաց տվյալների վիզուալիզացիան:
Հայաստանի դեպքում գոյություն ունի տվյալների վիզուալիզացիայի մեկ հանրայնորեն հայտնի գործիք. դա ինտերակտիվ բյուջեն է, որը օգտվողին ձևափոխումների մեծ հնարավորություններ չի տալիս:
Ինչ վերաբերում է տվյալների մշակման հնարավորություններին, ապա այս հարցում Հայաստանը մեծ հաջողությունների դեռ չի հասել: Ազգային վիճակագրական ծառայությունը տվյալների շտեմարաններ է տրամադրում բավական մինիմալիստական գործիքներով: Բացի դրանից՝ վիճակագրական տվյալները մշակելու համար գոյություն ունի ևս երկու հարթակ՝ Armstatbank և Armdevinfo: Երկուսն էլ բավական բարդ և անհարմար են աշխատելու համար, արդիական չեն:
Մյուս կողմից՝ կան մասնավոր դեպքեր, երբ պետական տվյալները ավտոմատացված մշակումից հետո տրամադրվում են շատ ավելի մատչելի տեսքով: Կարելի է համեմատել պաշտոնական հարկային տվյալների շտեմարանները և դրանց մշակման համար մասնավոր կազմակերպության ստեղծած «Հարկատու» հարթակը:
Գոյություն ունի շատ ավելի մեծ ազդեցություն ունեցած դեպք՝ կապված արտարժույթի փոխանակման հետ: Rate.am կայքը, մի տեղ հավաքելով բոլոր բանկերի կողմից հայտարարվող արտարժույթի փոխարժեքները, ազդեցություն ունեցավ ողջ շուկայի վրա՝ մոտավորապես նույն մակարդակի բերելով փոխարժեքները երկրով մեկ:
Բաց տվյալների դեպքում կարևոր են միանգամից մի քանի բաղադրիչներ: Տվյալները պետք է լինեն.
  • Հասանելի
  • Լիարժեք
  • Հասանելի արխիվներով
  • Միևնույն ֆորմատով
  • Մշակելու համար պատրաստ ֆորմատով
Սակայն կարելի է տեսնել, որ Հայաստանի դեպքում արխիվների հասանելիության հետ կապված խնդիրներ են առաջանում: Կայքերի թարմացումից, վերազինումից հետո պատահում են դեպքեր, երբ արխիվներն անհետանում են: Այսպես, օրինակ, ՀՀ նախագահի կայքում արդեն հնարավոր չէ գտնել նախորդ ադմինիստրացիաների հետ կապված տեղեկատվություն:
Տվյալների տրամադրման միատարրության վերաբերյալ գոյություն ունի Կառավարության՝ «Ինտերնետ ցանցում պետական մարմինների պաշտոնական կայքերին ներկայացվող նվազագույն պահանջները հաստատելու մասին» որոշումը: Ըստ այդ որոշման՝ կայքերը պետք է համապատասխանեն ընդհանուր նորմերին: Սակայն իրականությունն այն է, որ համացանցի պետական հատվածը չափից ավելի բազմազան է, խճճված և որոշ հատվածներում ունի ոչ տրամաբանական, դժվար ընկալվող կառուցվածք:
Տվյալների տրամադրման վերաբերյալ նույնպես կան տարբեր մոտեցումներ: Տվյալ որոշման 5-րդ կետի համաձայն՝ պաշտոնական կայքում տեղադրված տեղեկատվությունը պետք է լինի ամբողջական և անվճար: Ամբողջականության հարցը միշտ կարող է լինել վիճելի:
Սակայն Էլեկտրոնային ռեգիստրի կայքը ՍՊԸ-ների վերաբերյալ ամբողջական տեղեկատվության համար պահանջում է երեք հազար դրամ վճար: Յուրաքանչյուր հարցման համար: Այսինքն՝ տվյալ դեպքում տվյալները դիտվում են ոչ թե տեղեկատվության ազատության տեսանկյունից, այլ որպես մատուցվող ծառայություն:
Բաց տվյալների շտեմարանների մատուցման ձևերի խիստ բազմազանությունը, դրանց ապակենտրոնացված լինելն այսօր խոչընդոտ է տվյալների վերլուծության, մշակման համար, ինչն էլ դժվարացնում է կիրառական մոտեցումները:



Բաց տվյալների (Open Data) առկա շտեմարանները Հայաստանում մի կողմից բավական շատ տեղեկատվություն են տրամադրում, մյուս կողմից` տեղեկատվությունը տրամադրվում է առանց կոնկրետ ֆորմատի, հստակ ձեւի։ Կայքից կայք փոխվում է տրամադրման ձեւը։ Մի տեղում պարզապես html տարբերակ է, մեկ այլ տեղում՝ pdf, doc, xls։
Կան նաև շտեմարաններ, որոնք տվյալները տրամադրում են միայն փնտրելու միջոցով։ Չկա ընդհանուր մոտեցում, թե ինչպես, ինչ ֆորմատով կարելի է հրապարակել տեղեկությունը։ Օրենսդրության պահանջը, փաստորեն, կատարվում է, հրապարակումը իրականացվում է, սակայն տվյալների հետ աշխատանքը բարդանում է։
Հանդիպում են տվյալներ, որոնք արդեն հնացել են կամ սխալ են կամ կայքում տեխնիկապես հասանելի չեն։
Բարդանում է աշխատանքը ոչ միայն կոնկրետ ուսումնասիրության համար։ Շատ դեպքերում գրեթե անհնար է դառնում տեղեկատվության հետ մեքենայացված աշխատանքը։
Պետական գերատեսչությունից տրամադրվող տեղեկատվությունը երրորդ կողմի վերամշակման դեպքում կարող է դառնալ հասարակական կյանքը բարելավող բազմաթիվ ծրագրերի հիմք. օրինակ, կրթական համակարգի, տրանսպորտի, բնապահպանության, գյուղատնտեսության եւ այլ ոլորտների՝ համակարգված եւ ավտոմատացված կերպով մշակված տեղեկատվությունը։ Բայց նման լուծումներ ստանալու համար, տեղեկատվությունը պետք է․
  • միշտ լինի թարմ, վերանայված, ճշգրիտ,
  • լինի մեքենաների համար ընթերցվող ֆորմատով, օրինակ XML, CSV եւ այլն,
  • տրամադրվի մի քանի ֆորմատով:
Տեղեկատվության հետ աշխատելու համար այսօր կարևոր է դառնում հատուկ API-ն, ինչը այսօր Հայաստանում դեռ անտեսվում է։
Ներկայացվող տվյալների վերաբերյալ բազմաթիվ այլ հարցեր են առաջանում։ Օրինակ՝ բավական անհասկանալի է տվյալների տիրապետման մոտեցումը։ Բոլոր պետական կայքերում կարելի է գտնել copyright նշանը եւ համապատասխան գրառում՝ «©, Հեղինակային իրավունքները պաշտպանված են» (միայն նախագահի պաշտոնական կայքում լրացուցիչ տեղադրված է Creative Commons 3.0 լիցենզիան, որը ենթադրում է նյութերի ավելի ազատ օգտագործում։ Չնայած, տվյալ դեպքում էլ պարզ չէ, թե ինչու է ընտրվել հենց 3.0 տարբերակը):
Նման մոտեցումը նշանակում է տեղեկատվության մշակման եւ վերահրապարակման սահմանափակում։ Մյուս կողմից` պետական կայքերի վրա տեղադրված տեղեկատվության գերակշռող մասը՝ նորությունները, տվյալների շտեմարանները, փաստաթղթերը, ընդհանրապես հեղինակային իրավունքի առարկա չեն։ Իսկ փոքրաթիվ այն նյութերը, որոնք կարող են հեղինակային իրավունքի առարկա լինել, օրինակ՝ լուսանկարները և տեսանյութերը, ստեղծված են պետական բյուջեի գումարներով, եւ դրանց հանդեպ հեղինակային իրավունքի սահմանափակումները հակասում են հանրային շահին։

Հասկանալի է, որ հեղինակային իրավունքի նշումը ավտոմատ կերպով է տեղադրվում պետական կայքերի վրա՝ կրկնելով համացանցային ընդհանուր մոտեցումը։ Սակայն նման հարցերին չհամակարգված մոտեցումը անբարեխիղճ պաշտոնյաներին տեղեկատվության հետ աշխատանքում չարաշահումների հնարավորություն է տալիս։




Պետական տվյլաների շտեմարանների ցուցակը եւ դրանց հետ աշխատելու հնարավորությունների ցանկը կարող եք գտնել այստեղ


Գոյություն ունեն երկու մեծ կլաստերներ․ Մարզպետարաններ եւ  ՀՀ դիվանագիտական ներկայացուցչություններ
(տվյալ կլաստերները հասսանելի են այս ցանկի ստորին հատվածում)

Գոյություն ունեն մի շարք մեծ տվյալների շտեմարանների կլաստերներ: