Өгөгдлийн салбарын эксперт, мэргэжилтэн, хэрэглэгчдэд зориулсан Data & Analytics Forum 2024 арга хэмжээг Novelsoft компани есдүгээр сарын 20-нд Шангрила Улаанбаатар зочид буудалд гурав дахь удаагаа зохион байгууллаа. Тус салбарын хамгийн том, хүлээлт өндөртэй энэхүү форумын онцлох сэдэв нь Modern Datastack & Gen AI байв. Энэхүү арга хэмжээ нь дэлхийн трэнд, шинэ чиг хандлага, шилдэг шийдлүүдийн мэдээллийг нэг дороос авах, салбарын экспертүүдтэй биечлэн уулзаж мэдээлэл, зөвлөгөө авах, дата засаглал, дата соёлын туршлага солилцох зорилготой юм.
Сорилт
Өгөгдөл бол алтнаас үнэ цэнтэй түүхий эд. Бизнесийн хөгжил цэцэглэлт, инновац, өрсөлдөөнд давуу байдал олж авахад өгөгдөл нь алтнаас ч илүү хэрэгтэй, үнэ цэнтэй зүйл болоод байгааг олон жишээ харуулдаг. Өгөгдөл нь нотолгоонд үндэслэсэн шийдвэр гаргах, стратеги төлөвлөлт, маркетинг, үйл ажиллагааны оновчийг сайжруулах, хэрэглэгчдийн бүлгүүдэд яв цав тохирсон шийдэл, бүтээгдэхүүн бий болгох, өгөгдлөө ашиглан цаашдын тренд, эрэлтийг зөв таамаглах, ингэснээр стратегийн давуу байдалтай болох, нийлүүлэлтийн сүлжээг оновчтой болгох, зардал бууруулах, инновацыг дэмжих, бүтээмжийг нэмэгдүүлэх гэх мэт тоолж баршгүй олон давуу талыг бизнесийн байгууллагад бий болгож байна. Тэр байтугай өгөгдөл нь худалдаж, борлуулах боломжтой бүтээгдэхүүн болж хувирсан. Тийм ч учраас энэ эрин үед өгөгдлийг алтнаас ч үнэ цэнтэй гэж тодорхойлж, түүний төлөө компаниуд өрсөлдөж байна.
Өгөгдөл нь компанийн төрөл бүрийн тайлан, тооцоо, борлуулалт, маркетинг, санхүүгийн мэдээлэл, ERP, CRM зэрэг төрөл бүрийн системд цугларсан өгөгдөл, гэрэл зураг, PDF төдийгүй нийгмийн сүлжээн дэх мэдээлэл, чат зэргийг хамарч байна. Өөрөөр хэлбэл, “байгууллагуудад өгөгдөлтэй холбоотой асуудал үүсэж эхэлсэн. Эдгээрээс хамгийн тулгамдаж буй сорилт нь цуглуулсан өгөгдлөө хэрхэн хэрэглээнд оруулах, яаж зөв удирдах вэ гэдэгт оршиж байна. Энэ үүднээс бид сүүлийн үед тренд болж байгаа, манай улсад нутагших боломжтой шийдлүүдийг энэ удаагийн форумд танилцуулж байна” хэмээн Novelsoft ХХК-ийн гүйцэтгэх захирал Б.Пүрэвмаа онцлов.
Интернэтэд өдөр бүр 328.77 сая терабайт өгөгдөл үүсэж байдаг тухай DataStax компанийн Ази, Номхон далай, Японы бүс нутгийн стратегийн түншлэл хариуцсан захирал Хенри Иссак өгүүлж байв. Түүний онцолсноор ийм хэмжээний өгөгдөлтэй харьцах, боловсруулах, ашиглах, задлан шинжлэхэд хиймэл оюун зайлшгүй шаардлагатай болжээ. Гэвч өгөгдлүүд нь ялгаатай апп, программ дээр төрөл бүрийн форматаар тусдаа хадгалагддаг, өгөгдлийг бодит цагаар, шуурхай авах боломж муу, generative хиймэл оюун ашиглаж, боловсруулахад тохиромжгүй гэх мэт олон бэрхшээл байдаг аж. Хамгийн гол нь өгөгдөл нь бүтэцлэгдсэн болон бүтэцлэгдээгүй хоёр төрөл байгаа бөгөөд нийт өгөгдлийн 80 хувь бүтэцлэгдээгүй байгаа нь гол асуудал ажээ.
Өгөгдөлтэй ажилладаг олон программ, технологийг хүн төрөлхтөн ашигласаар ирсэн бөгөөд дараагийн шийдэл нь generative хиймэл оюун юм. ChatGPT нээлтээ хийснээс хойш хиймэл оюун хүмүүсийн өдөр тутмын хэрэглээ болсон, байгууллагууд ч өдөр тутамдаа ашиглахаас өөр аргагүй болж байна. 2024 онд Google компанийн Customer Intelligent trend судалгаанд хамрагдсан компаниудын 66 хувь нь үйл ажиллагаагаа сайжруулахын тулд хиймэл оюун ашиглана гэж хариулсан байна. “Хиймэл оюун нь мэйл бичихэд туслах, асуултад хариулах гэх мэт ерөнхий мэдлэгтэй туслахын үүрэг гүйцэтгэж байна. Гэхдээ хиймэл оюуныг байгууллагад ашиглах, цугларсан өгөгдлөө хэрэглэдэг болохын тулд хиймэл оюуны моделийг сургах, finetune хийх зэрэг аргыг ашиглах боломжтой. Өгөгдөл өдөр болгон шинэчлэгдэж байдаг учраас хиймэл оюуны моделийг ч байнга шинэчлэх, мөн өгөгдлийн аюулгүй байдлаа хангах ёстой” гэж Б.Пүрэвмаа илтгэлдээ онцолж байв.
Шийдэл
Форумын үеэр илгэгчдийн танилцуулсан хиймэл оюуны шийдлүүд нь төрөл бүрийн нөхцөлд ашиглаж болох энгийнээс эхлээд цогц байдлаараа оролцогчдын анхаарлыг татсан юм.
Тухайлбал, generative хэлний моделийг гадаад эх үүсвэрээс бодит цагийн, холбогдох мэдээлэлтэй нэгтгэдэг хайбрид арга болох RAG (Retrieval-Augmented Generation)-ийн нэг төрөл Naive RAG-ийг илтгэлийн эхэнд танилцуулсан. Энэхүү шийдэл нь хялбар архитектур, бага хөрөнгө оруулалтаар энгийн асуултад хариулах боломжтой юм. Нэг төрлийн ажлын туслахтай болно гэсэн үг. Хамгийн гол нь өмнө дурдсан бүтэцлэгдээгүй өгөгдөл дээр ажилах боломжийг RAG олгодог байна.
Novelsoft компанийн solution architecture мэргэжилтэн Ш.Цэнд-Аюуш Tableau клауд платформыг танилцуулсан. Tableau бол өгөгдөл боловсруулж бэлтгэх, дүн шинжилгээ хийх, өгөгдөлд суурилсан шийдэл гаргахад тусалдаг, хэрэглэгчээс техникийн ур чадвар шаардахгүй, маш хялбар шийдэл аж. Тэр дундаа өндөр бүтээмжтэй, зардал багатай, богино хугацаанд үр дүнг бий болгодог Einstein Copilot-ийг ашиглахыг тэрбээр зөвлөсөн юм. Өгөгдлийн инженерүүдийн хувьд өгөгдлийн урсгал (data flow) угсрах нь амаргүй ажил байдаг бол уг шийдэл нь таны өмнөөс угсарч, каталог үүсгэж өгдгөөрөө давуу талтай.
Компанийн удирдлагууд хиймэл оюуныг үйл ажиллагаандаа яаралтай нэвтрүүлэх хэрэгтэйг ойлгож байгаа ч хаанаас эхлэх, ямар стратеги, бодлого барих вэ гэсэн адармаатай асуулттай тулгардаг. Ийм нөхцөлд Tableau Pulse, Einstein Copilot зэрэг шийдлийг ашиглах нь зөв алхам гэж тэрбээр зөвлөж байв.
Dell Technologies компанийн Дэд бүтцийн шийдлийн группийн Бүс нутгийн бизнес хариуцсан тэргүүн Картик Кумаравелугийн “Bring AI to your data” илтгэлд өгөгдөл бол эдийн засгийн хувьд шатахуун юм, чанартай өгөгдлөөс чанартай хариулт гарна, өгөгдлийн бохирдол (data poisoning) зэрэг сонирхолтой нэршлүүд гарсан. Тус компани NVIDIA компанитай хамтарч байгууллагад зориулсан цогц шийдэл бүхий Dell AI Factory шийдлийг зах зээлд санал болгож байгаа аж. “Аливаа компанийг хиймэл оюуныг гарамгай ашиглагч болгоход бид уг шийдлээрээ тусалдаг” гэж тэрбээр онцолсон юм.
Хиймэл оюуныг их хэмжээний өгөгдөл бүхий байгууллагууд хэрэглэх нь илүү ач холбогдолтой байдаг. Тэдгээр байгууллагын тоонд төрийн төрөл бүрийн агентлаг, байгууллагууд ордог агаад энэ удаад Гаалийн ерөнхий газар (ГЕГ) өөрсдийн бодит жишээ, сорилт, боломжуудаас танилцууллаа. Улсын төсвийн 30-40 хувийг бүрдүүлдэг, 112 жилийн түүхтэй ГЕГ өөрийн дата төвтэй, гаалийн импорт, экспортын бүрдүүлэлтийг цахимжуулсан, боомтуудыг хамарсан теле хяналтын камератай, ухаалаг гарцын системтэй зэргээр асар их өгөгдөлтэй харьцдаг байгууллага юм. Монгол Улсын гадаад худалдаа нэмэгдэхийн хэрээр гаалийн өгөгдөл нэмэгдэж байгаа бөгөөд өмнө нь гаалийн бүрдүүлэлтийн нэг жилийн мэдээ, хагас жилийн тайлан зэргийг гаргах, татаж авахад гацах гэх мэт хүндрэл байсныг өдгөө амжилттай шийдэж чадсан байна.
Мэдээж эдгээр асуудлыг шийдвэрлэхэд ашиглаж буй гол зэвсэг нь технологи. ГЕГ нь бодит цагийн горимоор дата хуулдаг Kafka, өгөгдөл хадгалдаг өндөр хүчин чадалтай SingleStore, өгөгдөл боловсруулдаг Dbt, өгөгдлийг таск болгож зохион байгуулдаг Daxter зэрэг системийг ашиглаж байна. Цаашид олон улсын гаалийн байгууллагууд хэрэглэж буй шинэлэг шийдлийг нэвтрүүлэх, тухайлбал рентгений зурган дээр хиймэл оюуныг ашиглан шинжлэх шаардлагатай талаар ГЕГ-ын Мэдээллийн технологийн газрын гаалийн ахлах байцаагч Н.Мөнхзул онцлов.
Манай улсад анх удаа хүрэлцэн ирж илтгэл тавьсан Google Cloud компанийн төлөөлөл нь Хэрэглэгч хариуцсан инженер Катлин Чю байв. Түүний “Unlock your data productivity” илтгэлд Google-ийн өгөгдлийн экосистемийн гол бүтээгдэхүүн болох олон формат, клаудтай харьцаж ажиллах боломжтой, хиймэл оюунаар өгөгдөлд задлан шинжилгээ хийдэг BigQuery платформ болон BigQuery data canvas-ийг онцолсон. Мөн энэ хоёр шийдлийг илүү үр дүнтэй ашиглах боломжийг олгодог Google Gemini-г тэрбээр илтгэлдээ дурдсан юм.
Эдгээр илтгэгчдээс гадна data lake программ чиглэлийн Claudera компанийн БНХАУ дахь салбарын дэд ерөнхийлөгч Патрик Лю, Mulesoft компанийн Байгууллагын харилцагч хариуцсан захирал Кевин Сонг нар илтгэл тавьснаас гадна хүрэлцэн ирсэн зочдод биечлэн зөвлөгөө өгч, туршлагаасаа хуваалцсан юм.
Хиймэл оюуныг үйл ажиллагаандаа амжилттай нэвтрүүлэхийн тулд тухайн байгууллага өгөгдлийн маш хүчтэй соёлтой болох ёстой. Үүний тулд байгууллагын бүхий л түвшинд ажиллаж буй хүмүүс өгөгдлийн үнэ цэнийг ойлгодог, өгөгдлөө тайлбарлаж чаддаг, өгөгдөлд суурилсан дүн шинжилгээ хийж үр дүнг нь гаргадаг байх ёстой гэдэг санаа тус форумын бүх илтгэлд их, багаар шингэсэн байлаа.
Хүн төрөлхтнийг хиймэл оюуны давлагаа нэгэнтээ нөмрөн аваад байна. Дараа дараагийн давлагаа ч айсуй гэдэг нь гарцаагүй. Энэ хугацаанд мэдээж олон асуудал, бэрхшээл тулгарна, тэр хэрээр шийдэл ч гарна. Тэдгээр шийдлээс танилцуулж, сурсан мэдсэн бүхнээ компанийн үйл ажиллагаандаа хэрэглэх нь энэ удаагийн форумын 200 орчим оролцогч нарт өгөх гол үнэ цэн хэмээн Novelsoft компанийн хамт олон онцолсон юм.