Mokymai „HPC – Dirbtinio intelekto galia“: aktualios žinios bei praktinis pritaikymas

Svarbiausios | 2024-03-13

Vasario 29 d. Kauno technologijos universiteto (KTU) „Santakos“ slėnyje vyko mokymai „HPC – Dirbtinio intelekto galia“, kurių dalyviai turėjo unikalią galimybę sužinoti, kas yra Didelio Našumo Skaičiavimo Resursai (HPC), kodėl jie yra svarbūs diegiant dirbtinio intelekto (DI) sprendimus ir kokia infrastruktūra būtina kurti DI efektyviai.

Vienas iš mokymų lektorių, KTU  tyrėjas Jonas Gruzdys, teigia, jog mokymai buvo ypač aktualūs dirbtinio intelekto sprendimų diegėjams ir kūrėjams, mat nagrinėtos temos buvo susijusios su naujausiomis technologijomis – kalbų modeliais, įtraukiant tiek mažuosius, tiek didžiuosius kalbos modelius. Vienas jų – visuomenei lengvai prieinamas „OpenAI“ kalbos modeliu paremtas „ChatGPT“.

„ChatGPT“ – programa naudotojams, o kalbos modelis, kaip „GPT-3“, yra neuronų tinklais grįstas, apmokytas modelis, kuris geba atsakyti į vartotojo pateiktus klausimus. Šiuo atveju kalbos modelis generuoja kalbą, tam tikrus žodžius bei yra labai gerai ištreniruotas perskaityti užduotą klausimą, jį interpretuoti ir pateikti logišką atsakymą“, – sako informacinių sistemų specialistas.

Mokymai „HPC – Dirbtinio intelekto galia“
Mokymai „HPC – Dirbtinio intelekto galia“

Gali pareikalauti didelių laiko ir piniginių išteklių

Nors populiarumo nestokojančią inovaciją siekia pritaikyti daugelis įmonių, kalbos modelį sukurti nėra lengva – vien jo apmokymas gali atsieiti daugiau nei keletą milijonų eurų.

„Pavyzdžiui, „GPT-3“ apmokymo kaštai siekė kelis milijonų eurų, neskaičiuojant nei inžinierių atlyginimų, nei eksperimentavimo, nei testavimo. Vien pačio modelio mokymui reikia labai daug skaičiavimo galios“, – teigia J. Gruzdys.

Mokymai „HPC – Dirbtinio intelekto galia“
Mokymai „HPC – Dirbtinio intelekto galia“

Anot specialisto, didelių kalbos modelių kūrimui reikalingi didelio našumo skaičiavimo resursai (angl. high-computing resourses (HPC) – didelių pajėgumų kompiuteriai: „Turint vos vieną, įprastą kompiuterį, apmokinti didįjį kalbos modelį, pavyzdžiui, „GPT-3“, užtruktų apie 350 metų“.

Todėl kuriant šias DI inovacijas svarbu turėti didesnius skaičiavimo pajėgumus ir paskirstyti visą modelių apmokymo procesą taip, jog galutinis rezultatas būtų pasiekiamas per optimalų laiką.

Mažieji kalbos modeliai – galimybė išbandyti net namuose

Kalbėdamas apie mažuosius kalbos modelius, J. Gruzdys pabrėžia, kad nors jų kūrimui reikia mažiau lėšų ir laiko, tai taip pat nėra paprastas uždavinys.

Minėdami mažus kalbų modelius turime galvoje modelius, kurie gali veikti stacionariame kompiuteryje namuose. Didelių kalbos modelių, kaip „GPT-3“ ir kiti, skaičiavimus atlikti naudojantis asmeniniu kompiuteriu niekaip nepavyks, tačiau čia gali padėti mažieji kalbos modeliai, kurie yra paremti ta pačia architektūra, tik skiriasi savo parametrų skaičiumi

Dalyviai turėjo galimybę ne tik išgirsti teorinę informaciją apie HPC svarbą kuriant dirbtinio intelekto (DI) sprendimus, didžiuosius ir mažuosius kalbos modelius, bet ir praktiškai susipažinti su jų veikimu. Buvo lyginami skirtingi kalbos modeliai, mokyta juos derinti užklausų metodu bei paaiškinta, kaip sukurti tinkamą modelį pagal individualius poreikius.

Mokymu metu taip pat buvo aptartos galimybės naudotis jau sukurtais kalbų modeliais, mat yra įmonių, kurios kalbų modeliais grįstus sprendimus kaip paslaugą, kuria juos, ar ateityje mato jų taikymo potencialą.