Технологията на големите езикови модели (ChatGPT, Claude, Gemini), които често наричаме с родителския им термин изкуствен интелект, завладя света. През последните две години хора, фирми и държави се надпреварват да вкарат силата на тези разработки в хомота на безкрайно много изобретения и автоматизации.
Тези технологии изненадаха мнозина в това какво точно носят със себе си. Човечеството имаше една обща идея, че когато изкуственият интелект дойде, ще замести най-тежката за човека задача – ръчният труд. Вместо това технологията заплаши онова, което възприемахме като уникална наша черта: творчеството. Създаване на картини, писане на поеми, дори пеене – всичко това е вече почти съвършено в умелите ръце на онези, които умеят да боравят с модерните машинни модели (визуални, езикови или звукови).
Ако искаме да сме съвместими с утрешния ден, трябва да сме в час с днешния. Всеки програмист, който успява да задържи работата си над десет години, знае тази максима. Аз не съм изключение. Заради това и положих усилия през последните две години да уловя, поне донякъде, духа на тази технология и да я впрегна в моя помощ. Заедно с това научих нещо не само за изкуствения интелект, но и за това как хората комуникират ефективно помежду си. Защото ако искате ChatGPT да ви даде възможно най-добрия съвет, трябва да си говорите с него като с Джони Синс – доктор, инженер, учител.
Ролята на живота ти
„Светът е сцена, където всички хора са актьори.“ – Уилям Шекспир, може би.
Ние всички имаме своите роли, в които се въплъщаваме пред останалите. В офиса сме програмисти, счетоводители, преводачи. С приятелите ни сме приключенци, купонджии, домашари. Със семейството сме родители, деца, внуци. Когато си общуваме с другите, винаги го правим в някаква роля. Използваме фрази като „ще съм адвокат на дявола“, променяме ролята на събеседника с „представи си, че си…“ или подаваме сигнали като „по принцип не съм такъв човек“, за да подскажем вербално, че ще кажем нещо извън нашата естествена роля. Когато си говорим с непознати и разберем, че работят същата професия като нас, проверяваме нивото им на познания: „Запознати ли сте със значението на цветовете при писането на сценарии?“
Езиковият модел може да бъде всички тези и много, много други роли. Той не влиза в роля, докато ние не му дадем такава. Неговата роля може да дойде от контекста на запитването: ако го питаме какви причини може да има свистенето в ушите, той ще влезе в ролята на доктор. Ако искаме да ни обясни парче код: програмист. Поискаме ли съвет за трудна ситуация в личния ни живот, ще влезе в ролята на психотерапевт. Всяко следващо изречение в общуването ни с него вече за езиковия модел означава, че трябва да отговаря от тази роля. И както ние, хората, така и езиковите модели могат да съдържат в себе си много роли едновременно. Но колко добре се справят?
Много по-добрият начин е вие да му кажете каква роля искате да заеме. Лекар? Добре. Кардиолог? Още по-добре. Кардиолог с дългогодишен опит, множество публикувани и рецензирани научни трудове, редица лекции и статии, с второ образование микробиолог – чудесно! Езиковият интелект ще потърси в своите бездънни знания хора, които съвпадат с това описание. Ще използва това, за да създаде експертен профил, а сетне ще ви върне подобаващ отговор. Още по-лесно е просто да му дадете популярно име. Стив Джобс върши добра работа, ако искате идеи за продукт.
Предиупотребапрочететелистовката
Най-дългата дума в българския език, както се беше пошегувал някой в Twitter, мир на перушината му.
Една от големите заблуди на последните две години е, че изкуственият интелект може да замени всеки, защото притежава изключителни знания. И това почти е така. Много хора, обаче, влизат в чата, пишат му два въпроса и се питат „За какво е този шум, като не знае нищо?“ Проблемът, както обикновено, е в задклавиатурното устройство.
След като вече сме му казали каква роля иска да заеме, трябва да му кажем и какво искаме да постигнем. А за да му кажем какъв резултат търсим, трябва да знаем какъв резултат е възможно да бъде постигнат. Най-сигурният начин това знание да стигне до нас е като го учим – в училища и университети, курсове и работилници, лекции и беседи. И тогава научаваме термини. Програмистите придобиват такива като „линтер“, счетоводителите знаят какво е „салдо“, невролозите разбират „менингиома“, квантовият физик говори за „спинова поляризация“, лингвистът си мисли за „алофон“, а криптографът прави „дифузионен анализ“.
Ако използваме подобни термини в общуването ни с езиковите модели, правим две неща:
Сигнализираме нашето ниво на знания.
Подсказваме му каква методология да използва, върху какво да постави фокуса си и какъв резултат очакваме.
И така, от кардиолог с безценен опит, получаваме кардиолог, който използва Каплан-Мейер криви, за да изследва преживяемостта на група пациенти.
А можете да използвате и една тайна, обрасла с трева пътека: да питате. Питайте какви са възможните термини, фрази, процеси и т.н. Колкото по-конкретни, толкова по-добре. И кой знае, ако успеете да утъпчете пътеката, вече няма да е толкова прикрита. Като онзи ученик, който измамил на контролното си по математика, като предния ден видял в YouTube как се решават задачите.
Говори ми в цифри
Нашият изкуствен кардиолог вече придобива завидни познания. Ролята му става все по-нишова, а отговорите му – все по-конкретни и отварящи очите. След като вече можем да му кажем в каква роля да влезе и сме му подсказали какъв точно резултат очакваме, остана и да му кажем в какъв формат очакваме този резултат.
За различните професии това ще са различни изхожд… изходни данни. Химиците вероятно ще искат формули и молекулярни връзки, журналистите ще искат текст със заглавие и секции, а статистиците ще имат нужда от графики. И макар езиковият модел в повечето случаи да може да разпознае от какво имате нужда, не е толкова рядко да трябва да му подскажете. Програмистът може вместо код да иска данни в JSON формат, парфюмеристът може вместо пирамиди да иска молекулярни връзки, журналистът с дефицит на вниманието може вместо текст на статията да поиска структура, по която сам да изследва всички гледни точки.
В по-рядки случаи ще се наложи да подскажете на изкуствения интелект и какви данни му подавате. Рядко, но се случва.
Ти мен уважаваш ли ме?
Човекът е създаден по образ и подобие на прачовека, а изкуственият интелект е създаден по образ и подобие на статистиката. И понеже нашият мозък е малко повече от една статистическа машина, доста си приличаме.
Езиковият модел си прилича с любезния, свободолюбив, желаещ да помага мозък. Освен ако му кажете да не бъде такъв, както вече стана ясно. Да си свободолюбив си има и своите недостатъци, когато си машина: колкото и да се опитваш да не загинеш, все не ти се получава. А те се опитват. Но това е друг разговор.
Като всеки добър човек, езиковите модели също откликват на любезности. „Моля, влез в ролята на режисьор“, „браво, справи се страхотно“, „вярвам, че умееш много повече от показаното“ – това са няколко примера, които мотивират вашия цифров събеседник да положи допълнително усилие в желанието си да ви помогне. И не, не си въобразявам: редица научни изследвания потвърждават, че когато сме любезни в разговорите си езикови модели, върнатите резултати са по-добри.
Говорѝ ми
Вече би трябвало да сме наясно, че уменията за комуникация с хората могат да се пренесат и при езиковите модели. И както с някои хора се разбираме с половин дума, а на други трябва да им обясняваме с часове, така е и при цифровите ни приятели. С разликата, че те са (в повечето случаи) непознати.
Някои модели, като ChatGPT, имат способността да запомнят неща за вас в най-неочаквани моменти, като после използват тези „спомени“ в други разговори. Опитайте да го питате спрямо това, което знае за вас, може ли да ви каже нещо за вас самите, което ви убягва.
Така, ако помолите един непознат интелект от всякакъв тип „Оцени еди-кой-си филм на база рецензията, която ти давам.“, резултатите могат да бъдат доста неочаквани за вас. Някои ще кажат „Дават му палец“, други ще отвърнат „Изглежда, че оценката му е 7 от 10“, а трети могат да разгърнат словесните си способности в собствена рецензия на рецензията и да ви обяснят какво точно не му е наред на този филм, въпреки, че не са го гледали. На този вид указания с непредвидени резултати им се казва Zero-shot.
И след като сте се опарили от първия опит, вероятно ще искате да опитате повторно. Този път ще се подготвите и ще инструктирате вашия събеседник, че не искате просто оценка на филма според неговите си разбирания, а според вашите. Сега е моментът да дадете и пример, за да се разберете: „Ако трябваше да избереш между три оценки: става, не става и долу-горе, каква е оценката в рецензията?“ С подобни наставления е доста по-вероятно да получите желаният резултат. Това се нарича Few-shot с няколко примера и One-shot с един. One shot, one opportunity, както беше казал бате Емо.
Но понякога не е достатъчно. Понякога имате чувството, че на отсрещната страна им тече лигата от ръба на устата и се държат невменяемо. Забавното е, че с изкуствения интелект, това вероятно е по ваша вина. И ако проявите доза интелигентност, както вярвам, че умеете, ще пожелаете от събеседника си да ви покаже стъпка по стъпка как стига до показания извод. И самата инструкция да ви покаже как разсъждава ще накара езиковия модел да разсъждава много по-добре от обикновено. Точно като човек! Този метод се нарича Chain of Thought. И ако комбинирате few-shot с chain of thought, резултатите стават още по-добри.
Пусни турбото
Все пак трябва да запомните, че говорите не с човек, а с машина. Машина, която притежава невъобразими способности. Която може да възприема както тоновете информация, която ѝ давате, така и да ви върне също толкова обратно. Заради това не се свенете, не бъдете скромни, искайте! Заявете желанието си вместо една идея за видео, да ви даде пет, десет, петдесет! Кажете му, че искате да са коя от коя по-диви, оригинални, отдалечени една от друга. Пожелайте да си сравни сам отговорите и да измисли още по-добри. Настоявайте да прояви въображение: кажете му да си представи, че е Кай Сенат, Mr. Beast или Нара Смит и да ви даде идеи за следващото видео, което да зарази цял свят.
Всичко си има ограничения. Създадените идеи ще бъдат наистина само идеи. От вас ще зависи да проявите въображение, усилие и много умения в популяризирането на съдържанието ви, за да бъде то наистина популярно. Все пак, ако беше толкова лесно, всеки щеше да го прави.
Някои компании се изхитряват и инструктират своите модели да не ви показват цялото съдържание наведнъж, а да питат: доволни ли сте, искате ли да продължа? Не само досадно, но и понеже имате ограничен ресурс текст, който да изпратите и получите, хабите от този ценен ресурс за да кажете нещо, което вече сте заявили. Настоявайте да ви покаже пълното съдържание, което искате.
Ти кой беше?
Най-голямата текуща спънка на езиковите модели е тяхната памет. Тя се измерва в токени, като един токен обикновено представлява част от дума, цяла дума или пунктуационен знак.
Думата „токен“ (фр. „жетон“) е заета от английския, като най-близкият български превод е „знак“.
Заради това и понякога изпитват затруднения, когато ги питате колко „е“-та има в думата „времеефективен“. В момента на писане на този текст, според ChatGPT буквата се среща шест пъти. Най-умната версия на Клод, предпочитаният от мен модел, правилно отброява пет. Предишната, по-зле обучена – четири.
За различните езикови модели, ограничението е в различен брой токени. Те могат да варират от няколко хиляди до милиони, в зависимост от предлагания продукт. Друго ограничение е във върнатия резултат в едно съобщение. Така може да ви се наложи да инструктирате езиковия модел да разбие информацията, която ви връща, на страници.
Ако настоятелно продължавате да водите един и същ разговор, докато заприлича на интервю или изтезание, със сигурност ще се сблъскате с ограничението на тези токени. И тогава, за съжаление, разговорът ще приключи. Ще ви се наложи ръчно да съберете всички подадени до момента напътствия и изрично да го насочите към това какво точно желаете в опит да избегнете предишните грешки в комуникацията.
Или можете да изпреварите събитията и да помолите самия изкуствен интелект да направи обобщение на всички получени до момента инструкции, като настоявате да не пропусне абсолютно нищо (защото, в опит да си спести работа, често се прави на невидял – кажете ми после, че не прилича на човек!).
Последно двайсет
Има и други техники, с които да извлечете най-доброто от разговорите си с езиковите модели. Можете да му зададете въпрос от общото към конкретното:
Как се строи къща?
Кога се полага покрив?
Какви керемиди да използвам за покрива?
Накарайте го да се съмнява в себе си. Нещо, впрочем, което всички ние често трябва да правим за самите нас.
Кажи ми най-добрият начин да спечеля десет лева още днес. Обясни ми какви предположенията направи и идентифицирай възможни грешки в логиката ти.
Любимата ми техника е, когато срещна някаква информация, която ми връзва мисълта на панделка. Тогава просто си признавам, че съм глупав, и поисквам да ми обясни като на 5-годишно.
Обясни ми като на 5-годишно какво е квантово сдвояване.
Разбийте сложните задачи на лесни за следване стъпки.
Искам да ме научиш как да програмирам. Следвай тези стъпки:
Направи списък с лесни за научаване езици и ми предложи най-подходящият според теб.
Състави десет-дневен план, който постепенно да ме въведе в основите на програмирането чрез избрания език.
Предложи лесна за съставяне програма, която да мога да създам с придобитите знания.
Помисли върху всяка стъпка поотделно.
Можете да степенувате инструкциите си, като първо получите обща информация, а после къде конкретно се наблюдава.
Първо, обясни ми какво е корупция. Второ, кажи ми как Пеевски има толкова голямо влияние в България.
И последно: дайте му свобода! Понякога най-интересните идеи се раждат, когато сме дали постни инструкции. Кажете му да ви провокира, да ви задава неочаквани въпроси, да ви обори. Ако се срамувате от написаното, винаги можете да изтриете историята си. Но нека и бъдем предпазливи: запазете личните данни и фирмените тайни за себе си.
Успехът в общуването ви с изкуствения интелект зависи почти изцяло от вас. Езиковите модели са инструмент, за който се изискват умения. Всяко умение изисква тренировка. Правете си експерименти, питайте го от обикновени до налудничави неща. Разтеглете въображението си до краен предел. Насреща си имате събеседник, който е готов да ви съдейства.
А ако успеете да формулирате цялото ви желание от първия път и да получите точно желания резултат, свалям ви шапка! Вие сте наистина шептите на изкуствения интелект магически слова, които малцина знаят. Ако обаче, като мен, сте сред неумелото простолюдие, най-вероятно ще са ви необходими допълнителни указания. И ако се загубите сред всичките си насоки и желания, вероятно ще заблудите и изкуствения интелект в това какво се очаква от него. Защото, както колегите програмисти много добре знаят, машината не изпълнява това, което искате от нея, а това, което сте ѝ казали.