Наука та технології

Підтягнув українську та став розуміти жарти: як отримати доступ до ChatGPT-4

ChatGPT

ОpenAI представила GPT-4 – останню розробку у лінійці мовних моделей штучного інтелекту. Компанія описує її як більш безпечну, креативну та корисну. Видання MC.today розбиралось, що таке GPT-4, чому цю модель ІІ називають мультимодальною, чим вона відрізняється від GPT-3.5, які має обмеження і як отримати до неї доступ вже сьогодні.

Що таке GPT-4

GPT-4 – це найновіша модель ІІ (штучного інтелекту) від компанії OpenAI, яка стала четвертою в лінійці мовних моделей GPT та першою мультимодальною. Це означає, що вона може обробляти не тільки текст, а й інші види інформації, – наприклад, зображення.

«Ось GPT-4, наша найпотужніша і узгоджена модель , – написав 14 березня у Twitter генеральний директор OpenAI Сем Альтман. – З цього дня вона доступна в нашому API (зі списком очікування) та у ChatGPT Plus».

Але, як виявилось, деякі користувачі отримали доступ до нової технології набагато раніше. Корпорація Microsoft підтвердила , що останні версії її пошукової системи Bing таємно працювали з GPT-4 ще до офіційного запуску моделі.

Коли Microsoft запустила новий Bing, ходили чутки про те, що він використовує GPT-4. Тож це складно назвати сенсацією. Цікавий тут інший момент: корпорація не побоялася поставити на карту свою репутацію, а значить, була повністю впевнена в можливостях і перспективах нового дітища OpenAI.

CEO OpenAI Sam Altman
CEO OpenAI Sam Altman

У звіті GPT-4 технічні характеристики моделі не вказані явно. Деякі ЗМІ поспішили процитувати чутки про те, що кількість параметрів збільшилася зі 175 млрд. до 100 трлн. Проте сам CEO OpenAI Сем Альтман назвав їх «повною нісенітницею». 

«У звичайній розмові різниця між GPT-3.5 і GPT-4 може бути ледь вловимою, — зазначає OpenAI в анонсі GPT-4. – Різниця проявляється, коли складність завдання досягає достатнього порога. GPT-4 надійніший, креативніший і здатний обробляти набагато тонші інструкції, ніж GPT-3.5».

Однією з найцікавіших фішок GPT-4 є здатність розуміти зображення. Наприклад, якщо запитати його, що відбувається на картинці вище, він відповість: «чоловік гладить одяг на дошці для прасування, яка прикріплена до даху автомобіля» .

Історія створення GPT-4

Модель GPT-4 не з’явилася на порожньому місці. Вона є останнім поколінням сімейства GPT. Абревіатура розшифровується як Generative Pre-trained Transformer – попередньо навчений трансформер для генерації тексту.

Трансформер – це не назва фантастичного робота, а архітектура нейронної мережі, яку 2017 року розробили дослідники Google. Саме винахід Трансформера вивело розробку ІІ зі стану застою.

Головна особливість цієї архітектури в її гнучкості, масштабованості та здатності до паралельної обробки даних. Інженери з OpenAI першими довели, що Трансформер можна використовуватиме генерації текстів. 

Їхня мовна модель GPT-1 легко перевершила всіх своїх попередників у вмінні працювати з великими обсягами інформації. У 2019 році її змінила GPT-2 з обсягом тренувального датасету в 40 Гб та півтора мільярдами параметрів. А ще через рік з’явилася GPT-3 зі 175 млрд параметрів та збільшеним до 420 Гб обсягом даних.

Інтерфейс ChatGPT
Інтерфейс ChatGPT

Після додаткового навчання GPT-3 за допомогою зворотного зв’язку від тестерів, мовної моделі надали індекс GPT-3.5. У поєднанні із зручним інтерфейсом вона стала тим самим ChatGPT, який заслужив титул найважливішої інновації XXI століття від Білла Гейтса.

Для навчання GPT-4 інженери OpenAI спільно з платформою хмарних обчислень Microsoft Azure розробили з нуля спеціальний суперкомп’ютер. Знадобилося 6 місяців, щоб з його допомогою навчити GPT-4 на ще більшому наборі даних та налаштувати з урахуванням реального досвіду взаємодії з людьми, який дала експлуатація ChatGPT.

Слід зазначити, що сам собою ChatGPT не є версією мовної моделі. І хоча його часто ототожнюють із GPT-3.5, він виступає лише способом взаємодії з цією моделлю. А тепер у версії Plus це ще й спосіб взаємодії із GPT-4.

Чим GPT-4 відрізняється від попередників
Щоб краще зрозуміти різницю між звичним нам чат-ботом та його вдосконаленою версією, перерахуємо п’ять основних відмінностей.

GPT-4 може розуміти зображення

Мультимодальність дозволяє GPT-4 розуміти більше одного «модального» типу інформації. Усі попередні моделі GPT могли обробляти лише текст. На відміну від них, GPT-4 здатний аналізувати зображення та розуміти, що на них зображено.

ChatGPT2

У поєднанні з логічними здібностями, що зросли, це призводить до дивовижних результатів. Наприклад, GPT-4 не тільки розуміє, що на зображенні зображений величезний роз’єм для iPhone, але може пояснити чому це смішно! Адже гумор довго вважали недосяжною для ІІ вершиною.

Багатообіцяючим виглядає також співпраця OpenAI з платформою Be My Eyes для незрячих людей. Додаток на основі GPT-4 дозволить сліпим і слабозорим отримати звуковий опис всього, що бачить їх телефон.

ChatGPT

Наприклад, якщо користувач надішле фотографію свого холодильника зсередини, віртуальний помічник зможе визначити, що в ньому знаходиться. Окрім цього він може описати візерунок на сукню, перекласти етикетку, прочитати картку та пояснити, як дістатися потрібного відділу в магазині.

GPT-4 складніше збити з пантелику

OpenAI провела величезну роботу, щоб зробити GPT-4 безпечнішим. В результаті модель на 82% рідше за попередницю відповідає на запити про заборонений контент. Істотно змінилися на краще також відповіді на делікатні та неоднозначні запити.

ChatGPT

Тим часом залишається можливість того, що GPT-4 може згенерувати шкідливий контент. Умовно його можна розбити на 5 груп ризику.

  1. Поради, які можуть призвести до самошкідництва.
  2. Переслідування, приниження та ненависть.
  3. Матеріали еротичного характеру.
  4. Інформація, яка може бути корисною для планування нападів чи насильства.
  5. Інструкції щодо пошуку незаконного утримання.

GPT-4 може пам’ятати під час розмови більше тексту

Великі мовні моделі навчалися на мільйонах веб-сторінок. Але, коли ви намагаєтеся ввести в ChatGPT сторінку тексту, може з’ясуватися, що це занадто багато. Аналогічно відповідь чат-бота часто переривається після 4-5 абзацу.

Справа в тому, що існує межа кількості інформації, яку мовна модель може «тримати в умі». До речі, докладніше про це ми писали у статті про інтеграцію GPT-помічника Google Docs. 

Для старої версії ChatGPT ця межа складала 4096 токенів. Це приблизно відповідає 8 тис. англійських слів, але в рази менше – при використанні інших мов. Наприклад, в англійській фразі «What is your favorite animal» система виділяє 5 токенів. А в українській фразі «Яка у тебе улюблена тварина» – 31 токен.

У GPT-4 проблема вирішена: максимальна кількість токенів у запиті зросла до 32768. Це приблизно 50 сторінок тексту. Цілком достатньо для змістовної бесіди з ІІ на будь-яку тему.

GPT-4 має покращену багатомовність

Спочатку відповіді ChatGPT англійською були помітно кращі за аналогічні іншими мовами. Тому багато користувачів були змушені робити подвійну роботу: спочатку перекладати запит на англійську, а потім перекладати відповідь з англійської.

GPT-4 вивчив мови та зробив у цьому напрямку крок уперед. Тепер відповіді італійською, українською, корейською та ще 26 мовами майже такі ж коректні, як і англійською.

GPT-4 може змінювати свою поведінку на вимогу

Розробники впровадили у GPT-4 розширений інструментарій керованості. Він дозволяє надсилати через API системні повідомлення, які змінюють стиль роботи ІІ, задають тон його відповідей та встановлюють певні сценарії взаємодії з людиною.

GPT-4 може змінювати тон відповідей та сценарії взаємодії з людиною

Наприклад, системне повідомлення може виглядати так: Ви репетитор, який завжди відповідає в стилі Сократа. Ви ніколи не даєте учню відповіді, але завжди намагаєтеся поставити правильне запитання, щоб допомогти йому навчитися думати самостійно» .

Обмеження та недоліки GPT-4

«GPT-4, як правило, не знає про події, що відбулися після вересня 2021 року, і не навчається на своєму досвіді, – пише OpenAI. – Іноді він може робити прості логічні помилки або бути легковірним, приймаючи очевидні помилкові твердження від користувача» .

GPT-4 також, як і раніше, має соціальні упередження, схильний до галюцинацій та ворожих підказок. Однак розробники прагнуть розширити можливості участі людей у ​​формуванні моделі та закликають їх активніше оцінювати вдалі та невдалі відповіді ІІ у вікні чату.

Як отримати доступ до GPT-4

Сьогодні є два способи отримати доступ до GPT-4. По-перше, він доступний платним користувачам OpenAI через щомісячну передплату ChatGPT Plus (з обмеженням використання). Вартість послуги $20.

По-друге, розробники можуть зареєструватись у списку очікування для доступу до AP нової мовної моделі. Ціна його використання становить $0,03 за 1 тис. токенів «запиту» (близько 750 англійських слів) та $0,06 за 1 тис. токенів «завершення».

Нагадаємо, що токени запиту – це частини слів, які ви передаєте до GPT-4, а токени завершення – це вміст відповіді GPT-4. 

Можливості та перспективи

OpenAI вже співпрацює з низкою компаній, які інтегрували GPT-4 у свої продукти. Наприклад, програма Stripe використовує GPT-4 для сканування сайтів. 

Duolingo вбудував новітню модель ІІ в новий рівень передплати вивчення мов. Morgan Stanley створює систему на основі GPT-4, яка витягуватиме інформацію з документів компанії та надаватиме її фінансовим аналітикам. 

Надалі таких програм стане ще більше. А прості користувачі отримають більш потужного і безпечного GPT-асистента, який розуміє жарти, може запам’ятовувати довгі розмови, замінить для дітей репетиторів з будь-якого предмета і стане іншими очима для людей з вадами зору. 

«Ми сподіваємося, що GPT-4 стане цінним інструментом для покращення життя людей за рахунок підтримки багатьох програм, – пише OpenAI. – Ще багато роботи, і ми з нетерпінням чекаємо можливості покращити цю модель завдяки колективним зусиллям спільноти» .

Коментарии

Последние

Найактуальніші новини та аналітичні матеріали, ексклюзивні інтерв'ю з елітою України та світу, аналіз політичних, економічних та суспільних процесів в країні та за кордоном.

Ми на мапі

Контакти

01011, м. Київ, вул. Рибальська, 2

Телефон: +38-093-928-22-37

Copyright © 2020. ELITEXPERT GROUP

To Top