Mənbə: Journal Bookmate
Müəllif: Meri Melkonyan
Tərcümə: Lamiyə Göycəyeva
Danimarkanın Aarhus universitetindən ailəmlər Mads Tomsen (Mads Thomsen) və Kristofer Nielbo (Kristoffer Laigaard Nielbo) bədii əsərin gələcək uğurunu qiymətləndirə bilən “Fabula-NET” adlı neyron şəbəkə hazırlayıblar. Onlar oxucuların duyğularını idarə edə bilməyin əhəmiyyətinə, proqramın iş prinsipinə və tətbiq oluna biləcəyi sahələrə aydınlıq gətiriblər.
Layihə haqqında
Təzəlikcə, cari ilin yanvar ayında start götürən “Fabula-NET” layihəsi bədii ədəbiyyatı avtomatik qiymətləndirmək üçün nəzərdə tutulan neyron şəbəkədir. Kompyuter alqoritmi uğurlu mətn nümunələrini tanımağı öyrənir və onların əsasında hələ dərc olunmamış mətnin mümkün uğur ehtimalını proqnozlaşdırır.
Alqoritm həm kommersiya, həm şəxsi məqsədlər üçün istifadə edilə bilər. Məsələn, redaktora müsbət rəylərin sayını artırmağın yollarını tapmaq maraqlı olar. Çox güman, rəyi yaxşı olsa, insanlar həqiqətən kitabı alacaqlar. Bu, birbaşa əlaqə olmasa da, yenə də işə yaraya bilər. Bundan əlavə, öz yazını qiymətləndirmək üçün də bu sistemdən istifadə etmək olar. Kompyuter hekayənin nə qədər ardıcıl və gözlənilən olduğunu, əgər Ceyn Ostin (Jane Austen) kimi yazmaq istəyirsinizsə, mətninizin struktur baxımından onun mətnlərinə nə qədər yaxın olduğunu söyləyə bilər.
Oxşar tədqiqatlar daha öncə də həyata keçirilib: adətən alimlər mətnin lüğət tərkibinə və onun üslub xüsusiyyətlərinə baxırlar. Sonra bu məlumatlar oxucuların rəyləri və ya ən yaxşı halda satış göstəriciləri ilə müqayisə edilir. Düzdür, sonuncu məlumatı adətən əldə etmək çətin olur. Bu səbəbdən onun yerinə kitabxana statistikası istifadə edilir. Belə olduğu halda, nəticələr təəccüb doğurmur. “Harri Potter” (Harry Potter series) və ya “Bozun əlli çaları” (“Fifty Shades of Grey”) kimi bestsellərlər həmişə “uğurlu” statusu alır. Yox əgər siz daha dərin ədəbiyyatla maraqlanırsınızsa, onda belə deyəcəksiniz: “Bilirsiniz, daha böyük bir şey olmalıdır, kor kor, gör gör: klassika hesab edilən əsər mütləq bestsellər olmur”.
Yaxşı mətnin əlamətləri
Alqoritmdə kitabın tirajı, oxucunun cinsi və yaşı, rəylər, resenziyalar haqqında məlumatlardan istifadə edilir. Lakin ən əsas məsələ mətnin özünün analizidir. Araşdırmadakı yenilik də məhz bundan ibarətdir: kitabın mündəricatına oxucu nöqteyi-nəzərindən baxmaq. Bəs bunu necə etmək olar? Mətnin hansı amilləri kitabın dərk edilməsinə təsir edir?
Burada ən vacib məsələ süjetin inkişaf dinamikasıdır. Ona görə proqram aşağıdakı meyarları müəyyənləşdirir: süjet tağının emosional tonallığı (story arc; ədəbiyyatşünaslıqda bütün təhkiyənin inkişaf əyrisinə süjet tağı deyilir), mətndə emosiyaların inkişaf dinamikası (dynamic evolution of sentiment), həmçinin hekayənin uzlaşmasını (narrative coherence).
Emosional tonallığa gəldikdə, məsələn, faciədə süjet tağının trendi neqativ, komediyada müsbət olacaq. Əsəri qrafik şəklində göstərməyə çalışsaq, faciədə əyri neytral tonallıqdan aşağı düşəcək, komediyada yuxarı qalxmağa çalışacaq. Süjet tağının ümumi qrafikini daha detallı araşdırmaqla mətndə emosiya inkişafının ətraflı dinamikasını izləmək mümkündür: qızğın və sakit epizodlar bir-birini necə əvəzləyir, müsbət trend hansı tezlikdə və məhz hansı şəkildə yerini neqativ trendə verir, mətnin hansı epizodlarında yeni emosional vəziyyət meydana çıxır. Əsərdə bu “emosional yelləncəyin” qurulma şəkli mətnin ayrı-ayrı bölmələrinin nə qədər uyumlu olmasından xəbər verir. Bu isə öz növbəsində, oxucuda şüuraltı səviyyədə müəyyən əhval-ruhiyyə formalaşdırır, onu mütaliəni davam etdirməyə (və ya etdirməməyə) həvəsləndirir.
Uyum səviyyəsinə başqa bir amil də təsir edir. Hərəkət və qəhrəmanların səhnədən-səhnəyə təkrarlandığı hekayələr gözlənilən olduğu üçün, dolayısıyla, oxucuya darıxdırıcı gələcək. Öz növbəsində, süjetin inkişafını izləməkdə çətinlik yaradan mürəkkəb mətnləri uyumsuz və ya qeyri-ardıcıl adlandırmaq olar – nəticədə əsər oxucular tərəfindən bir-biri ilə əlaqəsi olmayan hekayələr toplusu kimi qəbul edilə bilər. Birinci halda maraqsız olacaq, çünki artıq dəfələrlə eyni nümunəyə rast gəlmisiniz; ikinci halda mətn sizin üçün tamamilə qeyri-şəffaf olacaq. Və siz mütaliəni davam etdirmək həvəsini itirəcəksiniz. Beləliklə, mütaliənin müəyyən dərəcədə psixoloji tərəflərindən danışırıq.
Optimal uzlaşma göstəricisinin olduğunu düşünürük. Bu zaman əsər nə həddindən artıq gözlənilən, nə də həddindən artıq mürəkkəb qəbul ediləcək. Bu göstərici yüksək emosional yük daşıyan epizodların mətndə paylanmasından və inkişaf etməsindən, habelə onun strukturundan asılıdır. Optimal uzlaşma səviyyəli əsəri, çox güman, axıra kimi oxuyacaqsınız.
Kompyuter bunu necə hesablayacaq
Dilçilikdə kompyuterin mətnin emosional yükünü təyin etdiyi tonallığın təhlili (sentiment analysis) anlayışı var. Hər hansı bir əsəri götürürük, əvvəldən tərtib edilmiş tonal lüğət üzrə təsirli sözlərin axtarışını həyata keçiririk. Bu cür lüğətlərdə hər sözün öz tonal mənası var: söz neqativ sözdürsə, onun tonallığı da bir o qədər aşağı olur. Məsələn, lüğətlərin birində “faciə” sözünün tonallığı 3,4-ə, “sevincli” sözünün tonallığı isə 2-ə bərabərdir.
Bütün göstəriciləri birləşdirib mətnin gedişatında emosional tonallıqdakı dəyişikliyi göstərən əyrini əldə edirik. Bu, əsərin süjet tağının vizual ifadəsi olacaq. Məsələn, Kazuo İşiquronun (Kazuo Ishiguro) “Məni heç vaxt tərk etmə” (“Never Let Me Go”) romanının əyrisi bu şəkildə görünür. Qrafikdə absis oxu mətnin bölündüyü seqmentləri, ordinant oxu isə tonallığı göstərir. Hər iki əyri eyni şeyi göstərir, sadəcə qırmızı rəngli əyri üçün mətn çoxlu sayda daha kiçik fraqmentlərə bölünüb.
Əldə edilən əyrini ətraflı araşdırmaqla emosiyaların inkişaf dinamikasını (emosional gərginliyin dəyişdiyi səhnələri müəyyənləşdirmək), həmçinin bütövlükdə fraqmentlərin uzlaşma səviyyəsini – emosional gərgin epizodun inkişaf ardıcıllığını hesablamaq olar. Hər iki hesabatı ikiölçülü qrafik şəklində təqdim etmək olar. Məsələn, onlardan biri. İşiquronun elə həmin romanında emosinal gərginliyin dəyişdiyi əsas məqamları aşağıdakı əyridə izləmək mümkündür.
Qeyd olunan ən aşağı nöqtələr – a, b, c və başqaları – mətndə əhval-ruhiyyənin dəyişdiyi yerləri göstərir. Məsələn, a nöqtəsi Ketinin Heylşemdəki hadisələrlə bağlı fikirlərinə uyğun gəlir, ardınca yeni emosional vəziyyət inkişaf edir, b nöqtəsində kuliminasiyaya çatır – əsərin ən intriqalı bölməsidir: burada xanım Lüsi tələbələrə onlara həqiqəti açıqlayır: klon olduqlarını, orqanlarını başqa insanlara verməli olduqlarını deyir. Mətnin uzlaşması rəqəmsal göstərici ilə ifadə edilir. Həmin göstəricidə bu və ya başqa emosiyanın mətndə nə qədər inkişaf etdiyi, nə qədər kəskin şəkildə qırıldığı və ya əksinə, yumşaq bir şəkildə başqa biri ilə əvəzləndiyi nəzərə alınır.
Beləliklə, əsərin strukturu ilə bağlı olan bu məlumatlar (süjet tağının emosional tonallığı; mətndə emosiyanın inkişaf dinamikası; uzlaşma səviyyəsi) bir araya gətirilir, ardınca tiraj, demoqrafiya və mətbuatdakı resenziyalar haqqında məlumatlarla müqayisə edilir. Proqram uğurlu mətnləri bu şəkildə öyrənir. Siz öz mətninizi proqrama yüklədikdə onun həmin əsərlərə nə qədər uyğun gəldiyini və onlar kimi uğurlu olub olmayacağını öyrənə bilərsiniz.
Bir neçə uğurlu mətn nümunəsi
İndiyə qədər əsasən Danimarka mətnləri üzərində işləmişik. Məsələn, Hans Xristian Andersenin (Hans Christian Andersen) əsərləri ilə məşğul olmuşuq. Tez-tez müəllifin yaradıcılıq qabiliyyətini və qeyri-adi hekayələr, qəhrəmanlar yaratmaq istedadını tərifləyirlər. Amma maraqlı tərəfi bu deyil. Biz müəllifin başqa cəhətini də aşkar etdik: Andersen bir növ məskunlaşma zonasını (astronomiyada temperaturu suyun mövcud olmasına şərait yaradan ulduz ətrafındakı zonaya verilən ad – red.) axtarıb tapa bilir və oxucu mətnin həddindən artıq gözlənilən olub-olmadığını söyləyə bilmir.
Bundan başqa hamı tərəfindən qəbul edilən və rəqəmsal formatda mövcud olan bəzi başqa mətnlər, məsələn, “Harri Potter” və Ceyn Ostinin əsərləri üzrə uğur modelini generasiya etdik. Layihə tam işə salınmadan öncə 2020-ci ildə Kazuo İşiquronun artıq yuxarıda qeyd etdiyimiz “Məni heç vaxt tərk etmə” romanının uğurunu izah edən məqalə yayımladıq. Bu kitab ümumilikdə sadə süjet üzərində qurulub, ancaq Nobel mükafatının təqdimatı zamanı İsveç akademiyasının şərh etdiyi kimi, roman “böyük emosional güc”ə malikdir. Mətndə “emosional yelləncəklər” kifayət qədər güclüdür, eyni zamanda, mətn kifayət qədər uzlaşır. Yəni, baş qəhrəman Keti X.-nın klonlardan ehtiyat hissə kimi istifadə edilməsini təsvir etdiyi rahatlıq oxucunun bu sistemi qəbul etmək şəkli ilə kəskin ziddiyyət təşkil edir (bu, oxucuları hiddətləndirəcək, onlar bu cür sistemi ədalətsiz hesab edəcəklər), – və bu, güclü emosional maraq mənbəyi olacaq.
Etika məsələləri
Hazırda bu yanaşmada bir çətinlik var. Kompyuter müəyyən mətnin uğurlu əsərlərə nə qədər uyğun olub-olmadığını hesablaya bilir, ancaq bunu ümumi şəkildə edir. Yəni, hələlik neyron şəbəkə konkret mətnin ümumi uğur əmsalını verir, məhz hansı amilin – üslub xüsusiyyətlərinin, demoqrafiyanın və başqa məsələlərin qiymətləndirmədə böyük rol oynadığını söyləyə bilmir.
Proqram bu cür işləyir: mətnin ümumi uğur ehtimalı verilir (məsələn, 75 faiz). Sonra istifadəçi müxtəlif parametrləri qoşub, məhz onu maraqlandıran amillər üzrə ehtimal edilən uğur səviyyəsini əldə edə bilər. Məsələn, mətn ədəbi tənqidçilərin icmallarında uğurlu olacaq, yoxsa təkcə internet platformalarda oxucuların rəylərində müsbət qarşılanacaq? Bu cür kiçik eksperimentlər aparmaq sizi maraqlandıran meyarın təsirini öyrənməyin yeganə doğru yoludur. Məsələn, mətnin uğuru müəllifin ağdərili kişi olmasından nə qədər asılı olacaq və ya nə qədər asılıdır?
Təbii, bu araşdırma etik məsələlərlə yanaşı gedir, çünki bu cür sistem həqiqətən sizin qərarlarınıza təsir edə bilər. Siz romanı yenidən yaza, onda müəyyən düzəlişlər etmək qərarına gələ bilərsiniz. Bu texnologiyanın geniş tətbiq imkanı var: ondan mətnin uğurunu proqnozlaşdırmaq üçün istifadə etmək olar, tədqiqatçılar böyük məlumat massivini interpretasiyasında ondan istifadə edə bilər. Bu etik çətinlikləri biz də bilirik, ancaq ən azından, səmimi olmağa və kompyuterin təqdim etdiyi qərarları istifadəçilər üçün maksimum başadüşülən etməyə çalışırıq.