შოთა რუსთაველის საქართველოს ეროვნული სამეცნიერო ფონდი

Shota Rustaveli National Science Foundation of Georgia

მეცნიერებისთვის, მომავლისთვის, საქართველოსთვის

საქართველოს განათლებისა და მეცნიერების სამინისტრო
EN

წარმატებული პროექტები და მეცნიერები

„კიდევ ერთი ნაბიჯი მოსაუბრე ქართული თვითგანვითარებადი ინტელექტუალური კორპუსისაკენ“

საქართველოს ტექნიკური უნივერსიტეტის ქართული ენის ტექნოლოგიზების სასწავლო-სამეცნიერო ცენტრის ორწლიანი AR/122/4-105/14 პროექტი „კიდევ ერთი ნაბიჯი მოსაუბრე ქართული თვითგანვითარებადი ინტელექტუალური კორპუსისაკენ“ (პროექტის ძირითადი პერსონალი: 1. ხელმძღვანელი - ქართული ენის ტექნოლოგიზების ცენტრის დირექტორი პროფესორი კონსტანტინე ფხაკაძე, 2. მკვლევარი - ქართული ენის ტექნოლოგიზების ცენტრის წამყვანი მკვლევარი აკადემიური დოქტორი მერაბ ჩიქვინიძე; 3.  მკვლევარი - ქართული ენის ტექნოლოგიზების ცენტრის წამყვანი მკვლევარი აკადემიური დოქტორი გიორგი ჩიჩუა), რომელიც ამავდროულად არის ამავე სასწავლო-სამეცნიერო ცენტრის გრძელვადიანი პროექტის „ქართული ენის ტექნოლოგიური ანბანი“ ერთ-ერთი სასაფუძვლოდ მნიშვნელოვანი ქვეპროექტი, დაფინანსდა შოთა რუსთაველის ეროვნული სამეცნიერო ფონდის 2014 წლის გამოყენებითი კვლევების კონკურსის ფარგლებში 200 000 ლარით (166 000 ლარი გაღებულ იქნა ფონდის მიერ, 34 000 ლარი კი გაიღო პროექტის წამყვანმა და, ამავდროულად, თანადამფინანსებელმა ორგანიზაციამ - საქართველოს ტექნიკურმა უნივერსიტეტმა).

პროექტის „ქართული ენის ტექნოლოგიური ანბანი“ ამოქმედებამდე ანუ 2012 წლამდე ქართული ტექნოლოგიურად მეტად მწირედ იყო მხარდაჭერილი. უფრო მეტიც, ამ მხრივ ქართული ენა დღესაც კი საგანგაშოდ ჩამორჩება იმ 21 ევროპული ენიდან თითქმის ნებისმიერს, რომლებიც მეტა-ქსელის (http://www.meta-net.eu/) კვლევის „ევროპის ენები ციფრულ ეპოქაში“ ჩვენთვის მეტად საყურადღებო შედეგების თანახმად ციფრული კვდომის საფრთხის ქვეშ არიან. აქედან გამომდინარე, პროექტი „კიდევ ერთი ნაბიჯი მოსაუბრე ქართული თვითგანვითარებადი ინტელექტუალური კორპუსისაკენ“ მიზნად ისახავდა ამ ჩამორჩენის მაქსიმალურ ნიველირებასა და არსებული ვითარების რადიკალურ ცვლილებას (უფრო დეტალურად იხილეთ AR/122/4-105/14-17 მისამართზე განთავსებული მასალა, მათ შორის პროექტის ფარგლებში გამოცემული მონოგრაფიული ნაშრომი „ქართული ინტელექტუალური ვებ-კორპუსი: მიზნები, მეთოდები, რეკომენდაციები“ (ავტორები: კონსტანტინე ფხაკაძე, მერაბ ჩიქვინიძე, გიორგი ჩიჩუა, დავით კურცხალია, ინეზა ბერიაშვილი, შალვა მალიძე)). ამასთან, პროექტის ფარგლებში კ. ფხაკაძის ქართული ენის ლოგიკური გრამატიკით შემუშავებულ ახალ ხედვებსა და მეთოდებზე დაყრდნობით აიგო ქართული ინტელექტუალური ვებ-კორპუსი, სხვა სიტყვებით, ქართული უნივერსალური ჭკვიანი კორპუსის პირველი საცდელ-სამომხმარებლო ვერსია (http://corpus.ge/), რომელიც, მიუხედავად იმისა, რომ არის ქართული უნივერსალური ჭკვიანი კორპუსის სრული სახით აგების მიმართულებით გადადგმული ჯერ მხოლოდ პირველი ნაბიჯი, საცდელი სახით უკვე არის:

  1. ერთადერთი ქართული თვითგანვითარებადი კორპუსი, რომელიც ამავდროულად არის თანამედროვე ქართული სამწერლობო ენის ყველაზე მოცულობითი კორპუსი. - ეს ერთადერთი ქართული თვითგანვითარებადი ანუ, რაც იგივეა, ავტომატურად განვითარებადი კორპუსი 2017 წლის 9 სექტემბრის მონაცემებით ჯამურად უკვე შეიცავს 270 886 730 ქართულ სიტყვას, მათ შორის 4 234 168 განსხვავებულია.
  2. ერთადერთი ქართული მრავალენოვანი და მრავალმოდალური კორპუსი. - მასში ჩადგმული სახით უკვე ფუნქციონირებს ერთადერთი ქართულ - ინგლისური, ქართულ - რუსული და ქართულ - აფხაზური თვითგანვითარებადი საცდელი კორპუსები და, ასევე, მასში უკვე ჩადგმულია ერთადერთი ქართული ტიტრირებული სამეტყველო მონაცემების საცდელი კორპუსი და ასეთი კორპუსის ამგები ინსტრუმენტები.
  3. ტექნოლოგიურად ყველაზე უფრო მეტად მხარდაჭერილი ქართული კორპუსი, - კორპუსში ჩადგმული სახით უკვე ფუნქციონირებს კ. ფხაკაძის ქართული ენის ლოგიკურ გრამატიკასა და დღეს კარგად ცნობილ პლატფორმებზე დაყრდნობით შემუშავებული მთელი რიგი მანამდე არარსებული ქართული ენობრივი ტექნოლოგიური სისტემები, რომლებიც ნაწილობრივ უკვე აღჭურვილნი არიან ქართულ ენაში ფიქრის (ანუ ქართული ტექსტების მორფოლოგიური, სინტაქსური და ლოგიკური ანალიზისა და ანალიზის შედეგების გენერირების), საუბრის (ანუ ნათქვამის მოსმენისა და მოსმენილზე პასუხის გაცემის), ხმოვანი მართვისა (ანუ ხმით მიღებული ბრძანების შესრულების) და თარგმნის (როგორც ხმიდან, ისე ტექსტიდან) უნარებით, რაც, მთლიანობაში, პროექტის ფარგლებშივე შემუშავებულ ქართულ ხმოვანმართვიან გზამკვლევსა და მკითხველთან ერთად ქართულ საიტერნეტო/საკომპიუტერო/სამობილურო სივრცეს საცდელი სახით უკვე ხდის ადაპტირებულს ანუ უფრო მოხერხებულს როგორც მხედველობა, ისე მეტყველება შეზღუდული, ასევე უცხოელი მომხმარებლებისათვის.

ამგვარად, გრძელვადიანი პროექტის „ქართული ენის ტექნოლოგიური ანბანი“ უკვე წარმატებით გასრულებული ორწლიანი ქვეპროექტით ანუ, რაც იგივეა, AR/122/4-105/14 პროექტით „კიდევ ერთი ნაბიჯი მოსაუბრე ქართული თვითგანვითარებადი ინტელექტუალური კორპუსისაკენ“ მიღწეული შედეგები იძლევა იმის ხაზგასმით თქმის უფლებას, რომ ეს კვლევები საქვაკუთხედო მნიშვნელობისაა ქართული ენის სრული ტექნოლოგიური დამუშავების მიზნით მოქმედი სამეცნიერო სფეროსთვის. კერძოდ, კვლევები იძლევა სასაფუძვლო მნიშვნელობის შედეგებს საქართველოს სახელმწიფო ენების (იგულისხმება როგორც ქართული, ისე აფხაზური ენა) ციფრული კვდომის საფრთხისგან დაცვის თვალსაზრისით და, ამდენად, ეს კვლევები უნდა შეფასდეს როგორც ციფრული კვდომის საფრთხისგან:

  1. ქართული ენის დაცვის მიმართულებით გადადგმულ კიდევ ერთ მეტად მნიშვნელოვან ნაბიჯად;
  2. აფხაზური ენის დაცვის მიმართულებით გადადგმულ პირველ მნიშვნელოვან ნაბიჯად.

ხაზგასამელია ისიც, რომ საპროექტო კვლევის ფარგლებში საპროექტო ჯგუფმა გარდა ზემოაღნიშნული მონოგრაფიული ნაშრომისა „ქართული ინტელექტუალური ვებ-კორპუსი: მიზნები, მეთოდები, რეკომენდაციები“ გამოაქვეყნა 40-ზე მეტი სამეცნიერო ნაშრომი, საერთაშორისო კონფერენციებზე წარდგა 20-ზე მეტი სამეცნიერო მოხსენებით.

დაბოლოს, დასკვნის სახით, ხაზს ვუსვამთ შემდეგს:  დღეს, უკვე კარს მომდგარ და სანახევროდ უკვე ამოქმედებულ ციფრულ ეპოქაში, AR/122/4-105/14 პროექტის  შედეგების წყალობით, ქართული ენა ბევრად უფრო დაცულია ციფრული კვდომის საფრთხისგან ვიდრე ის მანამდე იყო. თუმცა, როგორც ერთხელ უკვე აღინიშნა, ისიც ხაზგასასმელია, რომ ქართული, მით უფრო აფხაზური დღესაც საგანგაშოდ ჩამორჩება ტექნოლოგიურად ყველაზე უფრო მეტად დაწინაურებულ ენებს, რაც განპირობებულია იმით, რომ ბოლო წლებში ამ ენების ტექნოლოგიური დამუშავების პროცესებმა სწრაფი ნაბიჯებით წაიწია წინ. - ეს ყველაფერი კიდევ ერთხელ ცხადს ხდის ქართული და აფხაზური ენების სრული ტექნოლოგიური უზრუნველყოფის მიზნით ადგილობრივ უკვე მიმდინარე პროცესების შემდგომი სწრაფი განვითარების გადაუდებელ აუცილებლობას.