Пробој у области математике, који су уз помоћ вештачке интелигенције направили стручњаци „Гуглове“ лабораторије Дип мајнд, сугерише да технологија која стоји иза ботова попут ChatGPT-ја и Барда може да генерише информације које превазилазе људско знање.
Истраживачи који раде са вештачком интелигенцијом тврде да су направили прво научно откриће на свету користећи велики језички модел, што је напредак који сугерише да технологија која стоји иза ChatGPT-ја и сличних програма може да генерише информације које превазилазе људско знање.
Откриће је произашло из рада у „Гугловом“ Дип мајнду, где научници истражују да ли велики језички модели, који су основа модерних чет-ботова као што су ChatGPT компаније „Open AI“ и „Гуглов“ Бард, могу учинити више од препакивања информација усвојених током обуке и доношења нових увида.
„Када смо започели пројекат није било назнака да ће ВИ произвести нешто што је заиста ново“, рекао је Пушмит Коли, шеф одсека за вештачку интелигенцију у науци у Дип мајнду.
„Колико знамо, ово је први пут да је дошло до правог, новог научног открића помоћу великог језичког модела“, истакао је Коли.
Велики језички модели (LLM – Large Language Models), моћне су неуронске мреже које уче обрасце језика, укључујући компјутерске кодове.
Од доласка ChatGPT-ја прошле године, који је променио свет, технологија базирана на LLM-у отклонила је грешке у софтверу и успела да направи све, од студенстких есеја и рута путовања, до песама о климатским променама у Шекспировом стилу.
Али иако су се чет-ботови показали изузетно популарним, они не стварају нова сазнања и склони су такозваним халуцинацијама, то јест измишљању детаља како би испунили задатак, што доводи до одговора који су течни и делују могуће, али, у суштини, мањкави и неретко нетачни.
FunSearch и његове загонетке
Да би направио FunSearch, што је скраћено од searching in the function space (претрага у простору функција), Дип мајнд је искористио велики језички модел да напише решења за проблеме у облику компјутерских програма.
LLM је упарен са „евалуатором“ који аутоматски рангира програме према томе колико добро раде. Најбољи програми се затим комбинују и враћају моделу ради побољшања. Ово подстиче систем да константно преправља лоше програме у моћније који могу открити нова знања.
Истраживачи су креирали FunSearch на основу две загонетке. Прва је дуготрајан и помало тајанствен математички проблем који се бави проналажењем највећег скупа тачака у простору где ниједна комбинација три тачке не чини праву линију. FunSearch је избацио програме који генеришу нове такве скупове који превазилазе оне за које су математичари доказали овакве правилности.
Друга загонетка која чини основу FunSearch-а је проблем паковања у простору, који тражи најбоље начине за паковање предмета различитих величина у контејнере. Иако се примењује на физичке објекте, као што је најефикаснији начин да се кутије распореде у транспортним контејнерима, иста рачуница се примењује у другим областима, као што је одређивање распореда корака у центрима за обраду података.
Проблем се обично решава или паковањем предмета у прву канту која има места, или у канту са најмање расположивог простора у који предмет може да се смести. FunSearch је пронашао бољи приступ којим се избегава остављање малих празнина за које је мало вероватно да ће икада бити попуњене, наводи се у тексту објављеном у часопису Природа (Nature).
„У последње две или три године било је неких узбудљивих примера где су математичари сарађивали са вештачком интелигенцијом како би постигли напредак у решавању нерешених проблема“, подсетио је сер Тим Говерс, професор математике на Универзитету Кембриџ, који није био укључен у истраживање.
Према његовој оцени, овај рад нам потенцијално даје још један веома занимљив алат за такву сарадњу, омогућавајући математичарима да ефикасно траже паметне и неочекиване конструкције.
Истраживачи сада проучавају низ научних проблема који би се могли „дати“ моделу FunSearch. Избор ограничава то што проблеми морају имати решења која се могу аутоматски верификовати, што искључује многе биолошке недоумице, где хипотезе често треба да се тестирају лабораторијским експериментима.
Непосреднији утицај може се видети на програмерима. У последњих 50 година, кодирање се у великој мери побољшало захваљујући стварању прецизнијих и специјализованијих алгоритама.
„Ово ће заправо променити начин на који људи приступају рачунарској науци и алгоритамском открићу. Први пут видимо да велики језички модели не преузимају податке, већ дефинитивно помажу у померању граница онога што је могуће урадити алгоритмима“, нагласио је Коли.
Џордан Еленберг, професор математике на Универзитету Висконсин-Медисон, и коаутор рада, истакао је да је узбудљивије од конкретних резултата до којих су дошли, то да постоји могућност за будућну интеракцију човека и машине у математици.
„Уместо да генерише решење, FunSearch генерише програм који проналази решење. Решење одређеног проблема можда ми не даје увид у то како да решим друге сличне проблеме. Али програм који пронађе решење, то је нешто што људско биће може да прочита и протумачи и, надамо се, да на тај начин генерише идеје за друге проблеме“, поручио је Еленберг.
Шта су велики језички модели
Велики језички модел (Large Language Model – LLM) је тип језичког модела који се истиче по својој способности да постигне разумевање и генерисање језика опште намене.
Ове способности, LLM-ови стичу користећи огромне количине текста и других врста података да би научили милијарде параметара током обуке и трошећи том приликом велике рачунарске ресурсе.Реч је о вештачким неуронским мрежама, које су углавном трансформатори и тренирани су по принципу самонадгледаног учења и полунадгледаног учења.