Балар эртний хүн нэгэнтээ хэл яриатай болж, хэл яриа нь бичиг үсэг болж, бичиг үсэг нь номын хавтсанд бууж, хамгийн сүүлд цахим технологи бүхнийг өөрчилсөн. Энэ маягаар харилцах, мэдлэг дамжуулах технологи өөрчлөгдөх бүрд олон мянган угсаатан, үндэстэн, ястан төрж, мөхөж, түүнийгээ дагаад хэл нь бас төрж, мөхөж байв.
Манай үед ч бас мөхлийн ирмэгт очсон хэл олон байгаа. Хэлнүүд голдуу хэрэглээ нь хязгаарлагдмал байдгаас мөхдөг. Орчин үед хэлний хэрэглээг хязгаарлаж байгаа хамгийн том хүчин зүйл нь мэдээллийн технологи болж байна.
Эх хэлээ бид цахим орчинд хэр өргөн хүрээнд ашиглаж буйгаас олон зүйл хамаарна. Эдүгээ эх хэлний бодлого сургуулийн лекцийн танхим, номын сан, архив, музей, сонины нүүрнээс давж хэрэгжих ёстой болоод байна. Эх хэлний хэрэглээг технологитой хослуулж чадахгүй бол эх хэл, соёл мөхөхгүй юмаа гэхэд олон үнэт зүйлсээ мартаж гээхэд ойрхон байгаа нь Монгол шиг цөөн хүн амтай улс орнуудын хувьд үхэх сэхэх тухай яриа юм.
Өндөр хөгжилтэй орнууд эх хэлнийхээ цахим хөгжлийг эртнээс анхаарч, шаардлагатай хөрөнгө оруулалтуудыг хийж ирсэн бол Монгол Улсын хувьд энэ асуудал одоо ч гэсэн төрийн бодлогод зохих байраа эзлээгүй байгаа. Эх хэлний хэрэглээг технологитой хослуулж чадахгүй бол эх хэл, соёл мөхөхгүй юмаа гэхэд олон үнэт зүйлсээ мартаж гээхэд ойрхон байгаа нь Монгол шиг цөөн хүн амтай улс орнуудын хувьд үхэх сэхэх тухай яриа юм.
Хэрэв Б.Ренчин, Ц.Дамдинсүрэн, Ш.Лувсанвандан зэрэг бичгийн их хүмүүс фэйсбүүк, инстаграмм, хиймэл оюуны эринд амьдарч байсан бол эх хэлээ цахим орчинд нутагшуулахад дээд зэргээр анхаарах байсан гэдэгт эргэлзэхгүй байна. Өнөөдөр цахим хэл шинжлэлийн чиглэлээр код бичдэг хүмүүс уран зохиолын эртний дурсгалуудыг орчин үеийн хэлэнд орчуулдаг хүмүүстэй адилхан чухал ажил хийж байна.
Ийм хүний тод жишээ нь Болор софт компанийг үүсгэн байгуулагч, софтвэйр архитектур С.Бадрал юм. Тэрээр анх цахим орчинд эх хэлээ алдаа мадаггүй зөв хэрэглэх нөхцөлийг бүрдүүлэх технологи хөгжүүлж байв. Гэхдээ түүний ажил эцэстээ монгол хэлээр ярьдаг, монгол хэлийг энгийн монгол хүн шиг ойлгодог хиймэл оюуны технологи бий болгох үйл хэрэг руу хөтөлж, 2024 оны хавар Монголын анхны үндэсний хиймэл оюуны системийг нээгээд байна.
Монгол хэл, монгол бичгээ цахим орчинд дархалж үлдээх олон үйлсийг эхлүүлж, бодитой болгон, дэлхийд түүчээлж яваа том хувь нэмрийг үнэлж, 2024 оны “Энхийн шагнал”-ын эзнээр тодруулаад байна.
Энхийн шагнал бол Монгол Улсын тогтвортой хөгжил, нийгмийн сайн сайхны төлөө өөрийн ажил үйлсээр манлайлж, өөрийн эзэмшсэн мэргэжил, хийж бүтээсэн ажилдаа эзэн болж Монгол хүний үнэт зүйлийг үлгэрлэн харуулж буй хүндтэй нэгнийг тодруулж, үйл хэргийг нь алдаршуулдаг шагнал билээ.
Математик суурьтай хэл шинжлэлийн зүтгэлтэн
Түүнийг анх компьютертой танилцсан 1990-д оны үед Монгол үсгийн фонт байхгүй учраас орос үсгийн фонт ашигладаг байв. Гэтэл орос хэлэнд ө, ү үсэг байхгүй болохоор украйн фонтоор орлуулдаг байжээ.
Дараа нь Германд сурч эхлэхэд орос, хятад оюутнуудаас ялгаатай нь эх хэлээрээ ажлын системүүдээ ашиглах бүр ч боломжгүй байв. Үүнээс хойш шөнө дөл болтол сууж Linux үйлдлийн системийг монгол хэл рүү хөрвүүлэх, Openoffice программуудыг орчуулах зэргээр монгол хэлийг нутагшуулах (software localization) ажлыг хийдэг байв. Программ нутагшуулна гэдэг нь зүгээр нэг текст орчуулах биш, нарийн ажил байдаг бөгөөд С.Бадрал энэ тал дээр шилдэг мэргэжилтэнд тооцогдоно.
2000 онд “Badaa converter” хэмээх Юникод хөрвүүлэгч хийж байв. Магистрт сурч байхдаа Soyombo Linux гэх үйлдлийн систем зохиож байсан удаатай. Тэрээр OpenMN хэмээх компьютерын үг хэллэг орчуулж, нутагшуулдаг бүлгэм байгуулсан нь 100 мянга гаруй үгийн сантай болж, хожим Монголын анхны онлайн англи-монгол толь бичиг “Болор толь”-ийн эхлэл болжээ.
Программ нутагшуулдаг болсон үеэс тэр эх хэлний бодлогыг мэдээллийн технологийн хөгжилтэй хоршуулах нь хэчнээн чухал болохыг ойлгожээ. 2008 онд Болорсофт компаниа байгуулж, жилийн дараа “Болор толь”-оо (bolor-toli.com) албан ёсоор хэрэглээнд нэвтрүүлж, толь бичгээ үнэ төлбөргүй ашиглах байдлаар хүмүүст хүргэхээр шийджээ. Эдүгээ энэ толь 450 гаруй мянган үгийн сантай, англи, япон, солонгос, герман хэлтэй, орчуулагчид төдийгүй маш олон хүний өдөр тутамдаа хэрэглэдэг чухал платформ болсон.
Болорсофт нь албан ёсны танилцуулгаар бол цахим хэл шинжлэл (NLP), хиймэл оюун (AI), программ хангамж (SW) хөгжүүлдэг, бас арчилдаг компани болж хөгжсөн юм. Мэргэжлийн хэллэгээр бол монгол хэлний цахим боловсруулалт хийдэг, анхны монгол хэлний морфологийн автомат, анхны бүрэн автомат мэдээллийн мониторингийн систем, автомат трэнд олох систем, анхны яриаг бичвэрт, бичвэрийг ярианд хөрвүүлэх систем хөгжүүлсэн, анхны гадаад монгол цахим толь, монгол бичгийн үсгийн фонт, анхны машин сургалтад суурилсан мэдээллийн хэрэгслийн оюунт тогтолцоог хөгжүүлсэн, монгол хэлний хамгийн том өгүүлбэрийн хөмрөгийг системдээ бүрдүүлсэн компани юм.
Энэ бүхнийг энгийн үгээр илэрхийлбэл,
“Болорсофт”-ын гол үнэ цэн, алсын хараа бол монгол хэл, бичиг соёлыг цахим орчинд баттай нутагшуулж, дархлаатай болгож, ирээдүйн роботууд ч монголоор чөлөөтэй уншиж, сонсож, ярьж, бичих түвшинд хүртэл хөгжүүлэхэд оршино.
Үг үсгийн алдаа шалгадаг системүүдээ өндөр хөгжилтэй орнууд олон жилийн өмнөөс хөгжүүлж ирсэн нь өдгөө тэдгээр систем нь өөрөө суралцдаг, сайжирдаг, багш нарыг орлон гадаадынханд төрөлх хэлнийхээ дүрмийг заадаг болтлоо хөгжөөд байна.
Тиймээс монгол хэлийг төрөл бүрийн системийн хүрээнд чөлөөтэй хэрэглэдэг болох шаардлагатай. Гэхдээ бас зохистой хэрэглэх ёстой. Энэ үүднээс Болорсофт компанийнхан 10 орчим жилийн үг зүйн судалгаандаа үндэслээд дүрмийн алдаа шалгагч “Болорспелл” (spellcheck.mn хуучнаар Болор Дуран) системийг 2013 онд бүтээж хэрэглээнд нэвтрүүлсэн юм. Энэ нь монгол хэлний үсгийн дүрмийн алдаа хянадаг программ бөгөөд Монголд мөрдөгдөж буй дүрмийг бүрэн эхээр агуулснаас гадна 80 сая гаруй үгийн сантай аж. Хэл шинжлэлийн эрдэмтдийн шалгуураар баталгаажсан энэхүү систем монгол хүн эх хэлээрээ зөв бичих соёлд сурах чухал үүрэг гүйцэтгэж байна.
Ирээдүйд роботын уншдаггүй, бичдэггүй, цаашлаад ярьж чаддаггүй хэл хэрэглээнээс улам шахагдана гээд хэлчихвэл дэгсдүүлсэн болохгүй. Энэ бол удахгүй амьдралд хэрэгжиж эхлэх хатуу үнэн. Яагаад гэвэл хиймэл оюун, машин сургалт зэрэг нь ирээдүйд ажил, амьдралын нэгэн том дэд бүтэц болно. Нэг үгээр, тухайн хэлийг хүнээс гадна машинууд эзэмших шаардлагатай болно. Үүнийг 20 гаруй жил цахим хэл шинжлэлээр дагнаж, код бичиж буй С.Бадрал хамгийн сайн мэднэ.
Анх КТМС-д сурч байхдаа бакалаврын судалгаагаа яриаг бичвэрт хувиргах системийн сэдвээр хийхийг сонирхож байсан бол өнөөдөр С.Бадрал болон түүний баг ирээдүйд монголоор хүнтэй эсвэл хоорондоо ойлголцох роботуудын “үр хөврөл” болох системүүдийг бодитоор бойжуулсаар ирсэн нь Egune-г бий болгосон юм.
“ИХ-8”-ЫН УЛСУУДЫН ДАРАА ҮНДЭСНИЙ ХИЙМЭЛ ОЮУНЫ СИСТЕМИЙГ ХӨГЖҮҮЛСЭН АНХНЫ УЛС БОЛСОН
Монголын анхны үндэсний хиймэл оюун гэгдэж байгаа “Эгүнэ” цаашид яаж хөгжих вэ?
Энэ тухай ярихын тулд жаахан оршил хэлэх хэрэгтэй болно. Болор толийн тухайд гэвэл хамгийн сайн онлайн бичиг бүтээх зорилгоор бүтээгдсэн. “Болор” алдаа шалгах системийн тухайд иргэдийн бичгийн боловсрол нийтээрээ сул, зөв бичдэг хүн ховорджээ гэж ярих мөртөө алдаа шалгадаг систем байдаггүй байсан нь үүнийг хийхэд хүргэсэн. Ер нь харилцаа, мэдээллийн цахим технологийн хөгжил сайн, муу хоёр талтай. Бидний хувьд сул талыг нь нөхөх системүүд хөгжүүлсээр ирсэн.
2019 онд авиаг текст рүү, текстийг авиа руу хөрвүүлдэг Чимэгэ системийг нээсэн. Энэ бол таних технологи. Дараа нь бид ойлгох технологийг хөгжүүлье гэсэн бодолтой болсон юм. Жишээ нь, ярьсан зүйлийг текст болгож буулгаад зогсохгүй хураангуйлах, редакторлах гэх мэт хэрэгцээг хангадаг технологи руу (NLP – Natural Language Processing –аас NLU – Natural Language Understanding-руу ) орж байгаа гэсэн үг. Ингээд Egune-г бүтээчхээд цаашаа яах уу гэж бодож эхэлсэн. Зөвхөн монгол хэлтэйгээ зууралдаад, энэ жижигхэн зах зээл дээр байгаад байх уу, эсвэл арай том талбайд тоглох уу гэж. Ингээд бид Egune-г хэд хэдэн чиглэлд ашиглаж болох юм гэсэн дүгнэлтэд хүрсэн.
Нэгдүгээрт, энэ системийн нэг том зорилго бол виртуал монгол хүнийг бүтээх гэдгийг ойлгосон. Egune цаашдаа аажмаар сайжирч төрөл бүрийн оюуны ажлыг гүйцэтгэх болно. Жишээ нь, ерөнхий мэдлэгийн хүрээнд мэдэхгүйгээ асуух, и-мэйл бичүүлэх, данс бэлдүүлэх зэргээр ажиллаж, ирээдүйд хүн бүр асуудаг, ашигладаг болно гэж тооцоолж байгаа. Ингэхдээ уг систем манай нийгэмд тулгамдаад байгаа нэг зүйлийг шийдэхэд тусална. Тэр нь боловсролын хүртээмж. Өнөөдөр манайд боловсрол хүртээмжтэй байна уу гэвэл маш эргэлзээтэй. Хөдөөгийн сумын сургуулийн сурагч Улаанбаатарын хувийн сургуулийн сурагчтай адилхан мэдлэг, боловсрол эзэмших эрхтэй. Энэ утгаараа Egune бол бүх хүнд хүртээмжтэй, хүн болгон мэдэхгүйгээ асуудаг супер мэдлэгийн сан болох учиртай юм.
Хоёрдугаарт, бизнесийн байгууллагууд ашиглаж болно. Компаниуд өөрсдийн үйлчилгээтэй интеграц хийлгэх сонирхол маш их байгаа. Гэхдээ компани бүр дээр тусгайлан очоод чатбот хийж өгөөд яваад байна гэвэл бизнесийн хувьд оновчтой биш. Тиймээс компаниуд өөр өөрсдийн мини апп-уудыг залгаад ашиглаж болдог том платформ маягаар хөгжүүлье гэж зорьж байна. Яг App Store, Play Store шиг. Мөн масс хэрэглэгчдэдээ зориулаад зарим хэрэгцээг нь хангах үнэгүй хувилбар бий болгоно.
Гуравдугаарт бид “Виртуал монгол ажилтан”-ыг бүтээнэ. Энэ бол манай компанийн нэг суурь систем болох учиртай. Энэ маань эхнээсээ хэрэгжиж, Мобиком компани дээр туршиж байна. Жишээлбэл, 2222 руу залгаад, автомат хариулагчид “Утасныхаа төлбөрийн мэдээлэл авъя” гээд хэлэхэд миний бүх мэдээллийг автомат хариулагч хэлж өгөөд, давхар мессежээр илгээнэ. Цаашдаа энэ нь яг л хүн ярьж байгаа юм шиг сонсогдохоор сайжирна.
Цаашдаа манай энэ систем олон улсын мэдлэгийн нээлттэй сангуудтай интеграцид ороод явна. Жишээ нь, физик, математикийн нарийн ойлголтууд гэх мэт. Өөрөөр хэлбэл, бидний хөгжүүлсэн үндэсний хэлний их загварыг гаднын хэлнүүдийн их загвартай холбох ажлуудыг энэ ондоо багтааж дуусгана гэсэн бодолтой байна. Энэ ажил амаргүй байх болов уу. Ингэвэл багш, сурагч, оюутнууд маш том мэдлэгийн сантай болно гэсэн үг. Хүүхдүүд ямар ч багшаасаа авч чадахгүй мэдлэгээ тэндээс авдаг болно. Багш нарт ч маш их тус болно.
Egune бий болсон утга учрыг энгийнээр тайлбарлавал Монгол болон дэлхийд байгаа өгөгдлийг боловсруулаад, цэвэрлээд, системээ тэрэнд нь сургаад моделио гаргаад ирсэн гэсэн үг. Ингэж сураад, “боловсрол эзэмшсэн” систем маань том мэдлэгийн сан болж байна. Тиймээс Монгол улсад хувьсгал хийх технологийг хийчихлээ гэдгийг бол бардам хэлнэ. Төр засгийн зүгээс хамтарч ажиллах, дэмжих бүх саналд нээлттэй байгаа. Хамгийн түрүүнд БШУ-ны яам хамтарч ажиллахаар болоод байна.
Өнөөг хүртэл бидний хийж бүтээж ирсэн зүйлс бол монгол хэлний дархлааг бий болгоход чиглэсэн. Цахим орчинд эх хэлний хэрэглээ хэдий чинээ их байна, төдий чинээ дархлаа нь сайжирна, хэл амьд байна.
Одоо цаг алдахгүй шинэ технологитой хөл нийлүүлээд явахгүй бол монгол хэл дархлаагүй болчих эрсдэлтэй. Хиймэл оюуны систем англи хэлийг улам хүчирхэг болгож, англиар маш сайн материалууд бичиж байна. Энэ нь аливаа улсын үндэсний хэлд хүчтэй нөлөө үзүүлж байна. Улс орнууд дижитал шилжилтээ хийхгүй бол үндэсний аюулгүй байдал алдагдах хэмжээнд хүрч байгаа. National AI, Sovereign AI гэдэг нэр томьёо бий боллоо. Өөрөөр хэлбэл,
Хиймэл оюуны үндэсний тогтолцоог бий болгох хэрэгтэй гэж үзэх боллоо. Эс бөгөөс Google, Microsoft гэх мэт аваргуудын гарт орох эрсдэл өндөр.
Ялангуяа, жижиг орнуудын хувьд энэ асуудал илүү хурцадмал. Бидний хувьд “Их Найм”-ын дараа, Төв Азидаа үндэсний хиймэл оюуны системийг хөгжүүлсэн анхны улс боллоо. “Хувьсгал хийчихлээ” гэж яриад байгаа маань ийм учиртай. Үндэстэн даяараа үүнийг дэмжиж, хурдтай өөрчлөлт хийхгүй л бол бид маш хурдан хоцорно. “Их найм”-ын улс орнууд, ялангуяа АНУ, Европ, Хятад, Арабын баян орнууд хиймэл оюуны технологид асар их хөрөнгө оруулалт хийж байна.
Болор Софт компанийн хувьд эх хэлнийхээ цахим дархлааг хадгалах үүднээс өгөгдөл цуглуулж, Chat GPT-гээс бүр өмнө жижигхэн модель хөгжүүлж явсныхаа хүчинд үндэсний хиймэл оюуны системтэй боллоо.
Ингэснээр Алтайн хэлний бүлэг дотроо нэгдүгээрт явж байна. Тиймээс Казахстан, Узбекистан зэрэг орнууд түрүүчээсээ бидэнтэй хамтарч ажиллах санал ирүүлж байна. Тэдэнд казах хэл таньдаг Чимэгэ шиг технологи алга байна. Гэхдээ тэд биднийг гүйцэж түрүүлэх эсэх нь цаг хугацааны асуудал. Тэдэнд мөнгө их байна, бодлого нь зөв явж байна. АНУ-аас супер компьютерууд худалдан авч байна. Харин бидний хувьд хазахаас бусдыг хийж, удаан нухаж хийж байна. АНУ-д нэг цагийн дотор сургахаар ажлыг энд гурван сар сургаж байна.
Чимэгэ апп-ын гол давуу тал юу вэ?
Google, Microsoft-д казах, узбек гэх мэт бусад үндэсний хэлийг таних технологи ажиллаж байгаа ч яг практик дээр хэрэглэх боломжгүй. Яагаад гэвэл танилт нь 80 хувиас хэтэрдэггүй, 10 үг тутмаас хоёр дээр нь алддаг. Монгол хэл ч тэнд байгаа, гэхдээ энэ бол тэдний маркетингаа хийж буй л нэг арга хэлбэр гэж би үздэг. Түүнээс гадна Google шиг гадны том системүүдийн серверүүд Монголд биш гадаадад байдаг учраас хоцрогдол буюу мэргэжлийн хэллэгээр “Latency” үүсдэг. Яг үнэндээ “Их-20”-ын хэлнээс бусад улсын хэлний хувьд Google дээр бүрэн шийдэгдсэн юм байхгүй.
Харин Chimege апп монгол хэлийг танихдаа 100 үг дотор 2-3 л алдаж байна. Тийм учраас Chimege апп илүү хэрэглээ сайтай байгаа юм. Монгол шиг бага нөөцтэй, цөөн хүн ярьдаг хэлийг таних, ойлгох системийг ийм түвшинд хөгжүүлж чадсан нь Chimege системийг олон улсад анхдагч болгож байгаа юм.
Дээр дурдсанчлан бидний дараагийн зорилго бол энэ системээ дэлхийн мэдлэгийн том сангуудтай интеграц хийх, виртуал монгол хүнийг бүтээх. Зүйрлэвэл, Chimege нь ам, чих болж, Болорсофт нүд болоод, Egune тархи нь болоод явна гэсэн үг. Энэ виртуал хүн маань виртуал оператор, виртуал ресепшн, виртуал хөтлөгч гэх мэтээр ажиллаж болно. Өнөөдөр виртуал хөтлөгчийн хувиар ашиглая гэсэн санал маш их ирж байна.
Ер нь хиймэл оюун дээр суурилаад маш олон салбарт инновацлаг шийдэл бүтээж болно. Гэхдээ эмчийг бол хэзээ ч орлохгүй. Яагаад гэвэл эмчийн ажил гэдэг бол маш том хариуцлага. Эмч алдаа гаргаад хүн үхүүлчихлээ гэхэд өө алдаатай болчихлоо, одоо амьдруулъя гэж болдоггүй, алдах эрхгүй мэргэжил.
Харин эмчийн маш сайн туслах байж чадна. Жишээ нь, тухайн эмч өдөрт 10 хүлээж авдаг байсан бол 100 хүн хүлээж авах, зураг хараад 10 онош тавьдаг байсан бол 50 онош тавьдаг болох гэх мэтээр бүтээмжийг нь дээшлүүлж чадна. Ер нь энэ технологи эмчийг орлохгүй ч бүтээмжийн хувьд эрүүл мэндийн салбарт том хувьсгал авчрахаар байна. Харамсалтай нь, манай эрүүл мэндийн салбарт өгөгдөл, мэдээллийн дэд бүтцийн хувьд энэ дэвшингүй технологийг шууд ашиглахад бэлэн биш байна.
ХҮН ӨӨРИЙНХӨӨ МАШИНЛАГ БУС, “ХҮМҮҮНЛЭГ” УР ЧАДВАРУУДАА ХӨГЖҮҮЛЭХ ХЭРЭГТЭЙ БОЛЖ БАЙНА
-Хиймэл оюун ухаан хүнийг орлох түвшинд дөхөж ирлээ, хүн хэрэггүй болох нь гэдэг болгоомжлол хэр үндэстэй вэ?
Одоохондоо болгоомжлох шалтаг бага гэж хэлэх байна. Хиймэл оюуны технологи хүний хяналт дор (supervised) хөгжиж байна. Өөрөө хөгждөг (unsupervised) болж, хүнийг бүрэн орлох хүртэл дор хаяж 20-30 жил шаардагдах болов уу. Өнөөдөр хиймэл оюун таны хийдэг ажлын заримыг нь хийгээд эхэлж байгаа ч яг тан шиг хийж чадахгүй байна.
Харин зарим ажлаа хиймэл оюунд даатгаж эхэлснээр хүн хиймэл оюунаас илүү гарахын тулд илүү бүтээлч байх хэрэгтэй болж, нэг ёсондоо байгалийн шалгарал явагдаж байна гэж би хардаг. Яагаад гэвэл хүн тухтай амьдралд улам залхуу болж байна. 100 жилийн өмнөхтэй харьцуулахад хүн биеийн хөдөлмөрийн гэвэл бараг юу ч хийхгүй байгаа. Хэдийгээр оюуны ажил хийж байгаа гэх боловч тэр ажлыг нь хиймэл оюун хийчих боломжтой бол тэр хүн өөрийгөө хөгжүүлэхгүй байна гэсэн үг. Тэгэхээр хиймэл оюун хүнийг сорилтод оруулж байна гэдэг утгаараа маш хэрэгтэй зүйл.
Өөр нэг зүйл нэмж хэлэхэд, мэдээлэл, харилцааны аливаа технологи гарч ирэх бүрд мэдлэг гэдэг зүйл илүү либералчлагдаж байдаг. Жишээ нь, Библи судрыг хэвлэдэг болсон үеийг аваад үзье. Өмнө нь Библи доторх мэдлэгийн сан голдуу сүм хийдийн хүрээнд байдаг байсан бол Гутенбергийн хэвлэлийн машин энэ судрыг олон мянгаар нь хэвлэдэг болсноор тэр мэдлэг бүх хүнд нээлттэй болсон.
Тэгвэл хиймэл оюун өнөөдөр мэдлэг гэдэг зүйлийг дахиад либералчилж байна. Энэ технологи “Таны өмнө хүн төрөлхтний бий болгосон мэдлэгийн сан хөмрөг тэр чигээрээ байна. Та хүссэнээ асуу, би хэлээд өгье” гэж байна.
Мэдлэг гэдэг зүйлийг өмнө нь ямар нэгэн номоос, сургуулийн танхимаас, багшийн ярианаас олж авдаг байсан бол одоо та хаашаа ч явах шаардлагагүй, бүх мэдье гэснээ хиймэл оюунаас асуудаг болж байна. Тэр байтугай Google шиг том хайлтын системүүдийн хэрэгцээ ч бүдгэрч эхэллээ. Хүн мэдэхгүй байх нь асуудал биш, яаж асуухаа мэддэг байхад л хангалттай. Нэг үгээр, мэдлэг туйлын хэмжээнд нээлттэй, либерал шинжтэй болчихлоо.
Гэхдээ нөгөө талаас үүнийг дагаад хүнд шинэ асуудал, шинэ сорилт бий болсон. Хиймэл оюун гэдэг үнэхээр гайхалтай, танаас хэдэн мянга дахин илүү мэдлэгтэй, олон ажлыг асар өндөр бүтээмжтэй хийдэг болчихсон. Ийм нөхцөлд бүтээлч сэтгэлгээ маш үнэ цэнтэй. Хэн бүтээлч сэтгэлгээтэй байна тэр хүний өрсөлдөх чадвартай байна.
Хиймэл оюун нэгэнт мэдлэгийг хүссэн хэмжээгээр түгээдэг болчихоор тэр мэдлэгийг хэрхэн бүтээлчээр ашиглах вэ гэдэг нь багш, оюутнуудын аль алинд том сорилт болно. Үүнийг дагаад боловсрол гэдэг зүйлийн агуулга ч өөрчлөгдөж байна. Боловсрол гэдэг нь мэдээлэл гэхээс илүү хариуцлага, бүтээлч сэтгэлгээ, хандлага, шүүмжлэлт сэтгэлгээтэй байх тухай юм. Ядаж л хиймэл оюуны хэлж өгсөн баримтуудыг нягталж үзэх шүүмжлэлт хандлага хэрэгтэй шүү дээ.
Үүнээс гадна хамгийн чухал нь хүн өөрийгөө сэтгэл, сэтгэл хөдлөл талаасаа илүү хөгжүүлэх, таних хэрэгтэй болж байна. Магадгүй хиймэл оюун зарим сэтгэл хөдлөлийг таньдаг болох боломжтой ч сэтгэл гэдэг зүйлийг өөртөө бий болгож чадахгүй. Товчоор хэлбэл, хүн өөрийнхөө машинлаг бус, “хүмүүнлэг” ур чадваруудаа хөгжүүлэх хэрэгтэй болж байна даа.
Багш нар дээр тодруулж яривал хүүхдүүддээ ямар ур чадварыг илүү төлөвшүүлэх хэрэгтэй гэж бодож байна вэ?
Багш нар мэдлэг түгээгч гэхээс илүү хүнийг боловсруулагч, чиглүүлэгч байхдаа илүү анхаарах хэрэгтэй болж байна. Хуучин цагт гэрийн багш нар хүүхдийг тэвчээртэй сууж сургадаг байсан нь өнөөдөр буцаад чухал болж ирлээ. Хоёрдугаарт, ёс зүйтэй, нэг нэгнээ тэтгэх, халамжлах, үнэнч байх, өөрөөр хэлбэл, хиймэл оюун ухаанаас ялгарах хүний мөн чанарыг заах нь чухал болж байгаа юм.
РОБОТУУДТАЙ МОНГОЛООРОО ОЙЛГОЛЦОХ ӨДРҮҮД ИРЭХЭД БЭЛЭН БАЙХ ЁСТОЙ
Танай компани хөгжүүлсэн технологидоо хөрөнгө оруулалтын хувьд ямар стратеги барьж байна вэ?
Egune-гийн хувьд одоохондоо бид өөрийн хөрөнгө оруулалтаар явж байна. Гэхдээ цаашдаа энэ төсөл 100 хувь үндэсний байж, дотоодын институцийн хөрөнгө оруулалт хийх ёстой. Хэрэв ашгаа бодвол бид Google-д төслөө өндөр үнээр зарчхаад гараад явчихвал болно ш дээ. Угаасаа сонирхож байгаа компаниуд цөөнгүй. 100 хүртэл сая ам.долларын санал хүртэл ирсэн байгаа. Гэхдээ бид хүлээж авдаггүй.
Яагаад гэдэг энэ мэт саналыг хүлээж авах ёсгүй вэ гэдэг шийдвэрийг бид стратегийн хувьд нэлээн алсын хараатай гаргасан. Учир нь ирээдүйд хүмүүс роботуудтай, робот роботуудтайгаа монголоор ярих, монголоор ойлголцох өдрүүд ирэхэд бидэнд эх хэлээрээ харилцдаг систем хэдийнээ бэлэн байх ёстой. Эс бөгөөс роботуудын харилцаанд монгол хэлээ хэрэглэхийн тулд гаднын системүүдэд мөнгө төлөх хэрэгтэй болно шүү дээ.
Chimege дээр 3.4 сая ам.долларын дотоодын хөрөнгө оруулалт авсан. Ингэснээр зөвхөн Chimege одоогийн байдлаар 15 сая ам.доллароор үнэлэгдэж байна. Egune бол үүнээс илүү үнэлгээтэй гарч ирнэ. Chimege-гийн хувьд хөрөнгө оруулагчтай хийсэн тохироогоор гаднын хөрөнгө оруулалт авахгүй. Өөрөөр хэлбэл, энэ систем дээр өөр хэл нэмж хөгжүүлэхгүй гэсэн үг.
Харин гаднын зах зээл дээр хэрхэн ажиллах вэ гэдэг дээр бид өөр стратеги баримталж байгаа. Саяхан бид Германд “Voice” нэртэй компани байгуулсан. Энэ компани маань Chimege шиг үндэсний хэлний систем бүтээж чадаагүй Казахстан, Узбекистан гэх мэт орнуудад суурь системийг нь бэлдэж өгөх юм. Бэлдээд өгчихсөнийхөө дараа тухайн үндэсний багт нь хүлээлгэж өгөөд, тэдгээр нь цаашаа өөрсдөө хөгжүүлээд аваад явах юм.
Энд нэг санааг чухалчилж хэлмээр байна. Хэл бол тухайн үндэсний соёлын гол тээгч. Тиймээс цахим орчинд тухайн хэлний дархлааг бэхжүүлэхийн тулд хөгжүүлж байгаа систем нь ч бас үндэснийх байх шаардлагатай гэж боддог. Хэрэв Google, Microsoft дэлхийн бүх хэлний системийг хөгжүүлчхээд “манайд танай хэл байна, мөнгө төлөөд ашигла” гэвэл хачин сонсогдоно биз дээ? Тийм учраас бид тухайн үндэсний баг цаашаа өөрсдөө эх хэлээ хөгжүүлэх боломжтой байхаар хамтын ажиллагаа санал болгож байгаа юм.
Хэлний хэрэглээ гэдэг бол хүмүүсийн сэтгэлгээнд шууд нөлөөлдөг айхтар зүйл. Хэрэв Google Translate шиг ярьдаг, сэтгэдэг болчихвол эмгэнэл шүү дээ. Нөөц багатай, хэрэглээ хязгаарлагдмал хэлнүүд дээр ийм эрсдэл их байгаа.
Таны мөрөөдөл юу вэ?
Миний мөрөөдөл бол виртуал монгол хүнийг бүтээх. Монгол хэлний загвараа бий болгоход олон жил зарцуулсан. Энэ явцдаа мөрөөдлөө олж авсан бөгөөд сүүлийн хэдэн жилд энэ концепцоо хөгжүүлэхэд өөрийгөө зориулж явна. Дэлхийд хүчирхэг технологиуд гарч ирснээр миний мөрөөдлийг улам наашлуулж өгсөн.
Миний суурь мэргэжил бол программ хангамжийн архитектор. Би Германд дөрвөн жил амьдрахдаа тэндээс олон зүйл сурлаа, авлаа. Тиймээс сүүлийн үед өгөх талд анхаарах болсон. Өөрөөр хэлбэл, хүнийг хэрхэн хөгжүүлэх, дараагийн үедээ юу мэдлэг дамжуулах, үлдээх вэ гэдэгт анхаарч байна.
Би багаараа маш их бахархдаг. Энд хиймэл оюуны Монголын хамгийн супер баг ажиллаж байна.
“Тунгаамал”-ын төлөөх тулаан
Монгол хэл, бичгийг баттай нутагшуулах эцсийн зогсоол нь монгол бичгийг цахим орчинд чөлөөтэй хэрэглэдэг болох. Эс бөгөөс монголчуудын хэл соёл, оюуны өвийн амин сүнс болсон босоо бичгийн ирээдүй бүрхэг болно.
Аливаа бичгийг цахим орчинд саадгүй хэрэглэх гол үндэс нь Юникод стандартад орох явдал. Учир нь Юникод систем нь Microsoft, Google, Apple, IBM, Facebook-ээс эхлээд мэдээллийн технологи хөгжүүлэг бүх компани хүлээн зөвшөөрч ашигладаг Де-факто стандарт.
Монгол Улс 2000 онд монгол бичгийн кодчиллын стандарт баталж, юникодод оруулсан боловч хэд хэдэн алдааны улмаас 18 жил тогтворжихгүй, төрийн зүгээс ч ойлгож анхаарахгүй явсаар иржээ. Тиймээс Юникодын техникийн хороо монгол бичигт зориулсан хурал, зөвлөгөөнүүдийг тусгайлан зохион байгуулах болов. Энэ хооронд Хятадын мэргэжилтнүүд самбаа гарган, монгол бичгийг авианы бичгийн загвараар бус, ханз үсэг шиг дүрсээр кодчилох аргачлалыг батлуулахыг 2017 онд Хөх хотод болсон хурлын үеэр оролдож байсныг “Болорсофт”-ын мэргэжилтнүүд очиж зогсоож байжээ.
Тэд өөрсдийн нөөц, бололцоонд тулгуурлан монгол бичгийг авианы хэлбэрээр Юникодын стандартад оруулахын тулд монгол бичигтэй холбоотой Юникодын хурлуудад 2013 оноос хойш тасралтгүй оролцож иржээ. Ийнхүү 2018 оны хавар АНУ-ын Сан Хосе хотод болсон хуралдаанд оролцон өөрсдийн “Тунгаамал загвар” хэмээх шийдлийг танилцуулж, монгол бичиг нь авианы бичиг бөгөөд хятад дүрс үсгээс өөр болохыг батлан харуулж, монгол бичгийн авианы загвараа хадгалж чаджээ.
2019 оны эхээр АНУ-д Google компанийн төв байранд болсон Юникодын техникийн зөвлөлийн 158 дугаар хуралдаанаар “Тунгаамал загвар”-аа хэрэгжүүлэх туршилт хийх зөвшөөрөл авч, шаардлагатай нэмэлт кодуудыг ашиглах эрхтэй болсон байна. Ингэснээр хэдэн зуун жил дамнан тээж ирсэн монгол бичиг цахим орчинд байр сууриа эзлэхэд нэг том алхам хийгдсэн байна.
Монгол бичгийг цахим орчинд нутагшуулах нь хэчнээн чухлыг төрийн эрх мэдэлтнүүдэд ойлгуулахын тулд Болорсофтынхон бас багагүй чармайсан. Ерөнхийлөгчид биечлэн танилцуулж, Засгийн газарт юу болоод байгааг мэдээлснээр Өвөр Монголд болсон хурлын дараа Хэлний бодлогын үндэсний зөвлөлийн дэргэд Ажлын хэсэг байгуулагдаж байв. Мөн монгол бичгийн хэрэглээг нэмэгдүүлэх Ерөнхийлөгчийн зарлиг гарч, монгол бичгийг стандартчилах дэд хороо байгуулагдсанаар энэ асуудал төрийн аппаратын анхааралд орж байв.
Монгол бичгийг нэрээ бичээд ханандаа өлгөдөг бэлэг дурсгал мэтээр хэрэглэж хязгаарлавал хэчнээн эмгэнэлтэй. Харин цахим орчинд өдөр тутмын хэрэглээнд нэвтэрч чадвал бид хэл соёлынхоо маш чухал хэсгийг хадгалан хөгжүүлж чадна гэдгийг С.Бадрал байнга давтдаг.
Цаашдаа юникодод нийцсэн монгол бичгийн фонтуудыг хөгжүүлэх, бусад ахисан түвшний программууд дээр ашиглах шаардлагатай. Одоогоор Болорсофт компани монгол бичигт зориулаад Mongolianscript, төрийн соёрхолт Т.Дашцэдэн агсны гар бичмэлээс бүтээсэн Classical Mongolian Dashitseden фонт, Модон бар, хорголжин барын фонтуудыг хэрэглээнд оруулснаас гадна Монгол бичиг, кирилл бичиг хоёрын хооронд автоматаар 99% нарийвчлалтай хөрвүүлдэг Кимо (http://kimo.mngl.net) хэмээх системийг бүтээгээд байна.
Таны ажил, амьдралд хамгийн их хэрэг болдог дадал зуршил, зарчим юу вэ?
Сошиал сүлжээг аль болох бага ашигладаг. Ингэж чадвал маш их цаг хэмнэнэ. Би фэйсбүүк рүүгээ бараг ордоггүй, твиттерээр шагайхгүй нэлээн удна. Энэ бол Германд ажиллаж, амьдарч байхдаа олж авсан дадал. Элдэв зүйлд сатаарахгүй ажиллах нь сахилга баттай болгож, бүтээмжийг өндөр байлгах боломж олгодог.
Сошиал сүлжээ бага ашигладгийн бас нэг шалтгаан нь би найдвартай эх сурвалжуудаас мэдлэг, мэдээлэл авч байхыг хичээдэгтэй холбоотой. Сураг яриа, хэн нэгний постоос эш татаад яваад байх нь мэргэжлийн хүний шинж биш. Ер нь аливаа эх сурвалжийг сайн нягталж байх хэрэгтэй гэж боддог. Википедиа хүртэл тийм найдвартай эх сурвалж биш шүү дээ. Тиймээс би аль болох академик судалгааны материалууд ашиглахыг зорьдог. Заримдаа Гүүглээс татгалзах хэрэгтэй гэж боддог. Алхам бүртээ гүүглээс асуугаад байвал цаг гарздана. Хэрвээ чи үнэхээр л технологио, хэлээ сайн эзэмшсэн бол өөртөө итгэж, өөрөө бодож шийдэл эрэлхийлсэн нь хамаагүй цаг хэмнэж байгаа мэт санагдах болсон.
Түүнээс гадна хүн ажлын цагтаа ажлаа хийж, амрах үедээ амрах ёстой гэдэг зарчимтай. Ингэснээр ажлын цагт бүтээмж өсдөг. Орой ажил тарснаас хойш сууж байгаа хүнийг мундаг ажилладаг гэж хардаг бол тэнд ажлаа дийлэхгүй байгаа, тухайн ажилдаа нийцэх чадваргүй юм гэж үздэг.
Шантармаар, бууж өгмөөр санагдсан үе байв уу? Түүнийгээ хэрхэн даван туулж байв?
Монгол бичиг цахим орчинд саадгүй хэрэглэгдэх гол үндэс нь Юникод стандартад орсон байх явдал юм. Энэ ажлыг бид олон жил хөөцөлдөж байна. Бид монгол бичгийн хэдхэн үсгийн кодоо 20 жилийн турш шийдчихэж чадахгүй явсаар ирсэн. Энэ явцад төрийн бодлого, асуудал хариуцсан төрийн байгууллагуудын санаачилгагүй, уялдаагүй байдал, албан тушаалтнуудын хариуцлагагүй байдлыг хараад үнэхээр гайхаж байсан. Заримдаа дарга нар илэрхий мэлзэж, утсаа унтраагаад алга болчихдог байсан.
2000 онд монгол бичгийн юникодын стандарт, олон улсын ISO/IEC 10646-1 стандарт гаргаж, улмаар Монгол Улсын үндэсний стандартаар баталсан юм. Гэвч, бүрэн оновчтой шийдэл болоогүйн улмаас 18 жилийн турш тогтворжихгүй явж байна. Иймээс, Юникодын байгууллага сүүлийн жилүүдэд тусгайлан анхаарч хурал зөвлөгөөн хийх болсон. Үүнд, Монгол Улсын зүгээс төдийлөн идэвхтэй анхаарч ажиллаагүй. Энэ зуур хятадын мэргэжилтнүүд хүч түрэн орж ирж, 2017 оны 9 сарын 22-27-нд Өвөр Монголд болсон хуралдаанд монгол бичгийг авианы бичгийн загвараар нь бус, бүр ханз үсэг шиг дүрсээр кодлох шинэ аргачлалыг хүртэл боловсруулж, батлуулах оролдлого хийсэн юм. “Болорсофт” ХХК-ийн төлөөлөл энэ хурал дээр тэдний санаархлыг түр зогсоосон.
Мөн тус асуудлыг Монгол Улсын Ерөнхийлөгчид биечлэн танилцуулж, Засгийн газарт мэдээлж, олон нийтийн сонорт хүргэсэн. Энэ цаг үе хүртэл монгол бичгийн юникодын асуудал ямар чухал болохыг нийгэм даяар мэдээгүй байсан гэхэд хилсдэхгүй. Ийнхүү мэдээлсний үр дүнд, 2017 оны 9 сард Хэлний бодлогын үндэсний зөвлөлийн дэргэд ажлын хэсэг байгуулахаар болсон.
Манай компани 2013, 2015, 2017 онуудад юникодын холбогдох хуралд оролцож, өнөөг хүртэл Монгол Улсын, Монгол үндэстний, монгол бичигтэн хэн бүхний төлөөх энэхүү ажилд монгол хүний эх оронч сэтгэлээр холбогдох бүх чиглэлийн нарийн мэргэжилтнүүдийг багтаасан баг бүрдүүлэн цаг хугацаа, мэдлэг чадвар, хөрөнгө мөнгөө зориулан ажиллаж ирсэн юм. Гэвч асуудлын хүрээ өргөжих тусам цаашид бие даан санхүүжүүлэх боломжгүй болж байгаагаа илэрхийлэхэд биднийг хувийн компани, мөнгө идэх зорилготой гэсэн мэдээллийг энэ онд зарим холбогдох газруудаас тарааж сэтгэл зүтгэлийг мохоход хүргэж байсан.
Гэхдээ бид 2018 оны 4 сарын 03-05-нд АНУ-ын Сан Хосе хотод болсон хуралдаанд өөрсдийн шийдлийг танилцуулж, монгол бичиг авианы бичиг, хятад дүрс үсгээс өөр болохыг батлан харуулж, монгол бичгийн авианы загвараа хадгалж үлдсэн.
Товчхондоо олон жил зүтгэсний хүчинд Монгол бичгийн юникодын асуудлыг төрийн түвшинд хүргэж чадсан.
Амжилтад хүрэхэд нөлөөлсөн хүчин зүйлс гэвэл юу гэж хэлэх вэ?
Бизнесийг би анхнаасаа ашиг олох гэдгээр нь хараагүй. Бизнес бол юун түрүүнд үнэт зүйлс. Миний бий болгохыг хичээж буй үнэт зүйлс боловсролын системтэй салшгүй холбоотой. Улсын дайтай улс болж, олон улсад хүлээн зөвшөөрөгдсөн боловсон хүчин бэлтгэхийг хүсвэл бид боловсролд хийдэг хөрөнгө оруулалтаа нэмэгдүүлж, төлбөргүй болгох хэрэгтэй. Боловсролын үнэ цэнэ гэдэг оюутнуудаас цуглуулсан төлбөрөөр хэмжигдэхгүй. Харин улс ямар бодлого баримталж байна, ямар хөрөнгө оруулж байна гэдгээр л хэмжигдэнэ.
Зүүлт
NLP – Natural Language Processing. Махчилж орчуулбал “Байгалийн хэлний боловсруулалт”, утгачилбал хүний хэлний боловсруулалт. Энэ нь хиймэл оюуны салбарын 60-70 хувийг эзлэх салбар шинжлэх ухаан болж хөгжиж байгаа. Болорсофт компани энэ чиглэлээр олон жил ажиллаж ирсэн байна.
LLM – Large Language Model/ NLU – Natural Language Understanding. Хэлний их загвар. Асар их өгөгдлөөр тэжээж, хүний тархитай төстэй байдлаар асар их параметр ашигладаг нейросүлжээ. Хүний тархинд 100 тэрбум орчим мэдрэлийн эс байдаг гэж үздэг бол хамгийн дэвшилтэт хиймэл оюуны систем үүний хоёр хувьтай тэнцэх буюу хоёр тэрбум параметр ашиглаж байна.