Работа с образи, по-малко "халюцинации": OpenAI пусна "наследника" на ChatGPT

Работа с образи, по-малко "халюцинации": OpenAI пусна "наследника" на ChatGPT

© Reuters



Създателят на нашумелия чатбот ChatGPT обяви, че пуска нова версия, GPT-4, която дава по-добри резултати, работи с изображения и която се интегрира в платената версия ChatGPT Plus, но предупреди, че продължава да показва някои от недостатъците на предшественика.


ChatGPT стана достъпен за масовата публика в края на ноември и предизвика лавина от коментари и очаквания за промяна в образованието и бизнеса със способността си да създава различни видове текст и да отговаря на въпроси, като не забравя предходната размяна на реплики. GPT означава Generative Pre-trained Transformer и досегашният чатбот надграждаше версията от 2020 г. GPT-3, в която използваните параметри достигаха използваше 175 млрд. - най-голямата създавана дотогава невронна мрежа.


Подготовката на обновена версия, GPT-4, бе известна от други публични коментари на компанията. В публикацията от снощи OpenAI обяснява, че последните шест месеца екипът е работил по настройката на чатбота и е постигнал най-добрите си резултати в точността на фактите, управляемостта и способността да не се излиза от зададените ограничения.




ChatGPT и GPT-4 са невронни мрежи - вид математически системи, които научават умения, като анализират данни. Този конкретен вид мрежи, големи езикови модели, се научават да генерират съдържание и го правят толкова по-добре, колкото биват захранвани с данни.


Ботът ChatGPT вече променя света, а хората му помагат
Ботът ChatGPT вече променя света, а хората му помагат


Двете версии може да изглеждат сходни, ако се води небрежен разговор, но според публикацията на OpenAI разликите изпъкват, "когато сложността да задачата достигне достатъчен праг". Към момента потребители, които не са се абонирали за ChatGPT Plus - срещу 20 долара на месец - нямат такъв достъп.


Как работи с изображения


Новата версия, според OpenAI, е "мултимодална" и може да генерира съдържание и на базата на текст, и на базата на изображения.

  • В онлайн демонстрация ChatGPT например създава истински сайт на базата на схема, нарисувана на ръка.
  • Възможно, според описанието, е и да се предоставят снимки на хранителни продукти и да се поиска препоръка за вкусна рецепта с тях.
  • За някоко минути GPT-4 може да кодира цяла игра - например известната "Змия", без никакви познания по JavaScript.
В "Туитър" изпълнителният директор на OpenAI Сам Олтман нарече новата версия "най-способната и съответстваща" на човешките ценности и намерения, макар все още да има недостатъци.


Предимства


GPT-4 може да генерира 25 хил. думи текст - осем пъти повече от ChatGPT.


Вероятността споменатите "неразрешени" заявки да бъдат изпълнени е с 82% по-малка спрямо ChatGPT. В началото, след появата на ChatGPT в края на ноември, много потребители заобикаляха ограниченията, които се увеличаваха постепенно. Сред най-известните опити е "внушаването", че ботът има алтер его, което може да говори без задръжки. Бе възможно например да се създават и сатири и пародии - например разказ в стила на Библията или Корана за прозаични аспекти от живота - но и това се оказа забранено като оскърбление на чувствата на вярващите.


В презентацията на сайта на OpenAI новият чатбот отговаря на въпрос, отнасящ се до изображението, което му е показано.

В презентацията на сайта на OpenAI новият чатбот отговаря на въпрос, отнасящ се до изображението, което му е показано.


Много по-малка, според компанията, е възможността за неточности спрямо ChatGPT, който правеше лесно поправими фактологични (или изчислителни) грешки въпреки по-впечатляващите за мнозина умения за съставяне на ново съдържание или резюмиране на съществуващо. Вероятността за придържане към фактите в тази версия се е увеличила с 40 на сто според компанията.


Освен това GPT-4 се справя по-добре с по-нюансирани инструкции. Според създателите той може да се занимава с толкова отговорни задачи като да помага на хората да изчисляват данъците си.


Според OpenAI тази версия може да премине и изпит за бъдещи адвокати в САЩ с резултат като за най-добрите 10 кандидати.

Остават обаче рисковете да се стигне до грешка: GPT-4 не е "напълно надежден" и все още е възможно да произведе неочакваните отговори, известни като "халюцинации". Стъпващият на ChatGPT чатбот на "Майкрософт", пуснат миналия месец, стана печално известен с агресивното обяснение в любов на репортер на "Ню Йорк таймс".

Освен това има таван от 100 съобщения от потребителя на всеки 4 часа.


"Новата технология на OpenAI все още има някои недостатъци, странно наподобяващи човешките, които изнервиха хората, работили с най-новите чатботове. Експерт е по някои теми и дилетант - по други. Справя се по-добре със стандартизирани тестове от повечето хора и дава точни медицински съвети на доктори, но може да обърка най-проста аритметика", пише за GPT-4 "Ню Йорк таймс". "Компаниите, които залагат бъдещето си на технологията, може поне засега да се наложи да се примирят с неточността, която дълго бе табу в индустрия, изградена около схващането, че компютрите са по-изискващи точност от създателите - хора."


Конкуренция


Технологичните гиганти се впуснаха в последните месеци в трескава надпревара, за да отговорят на подкрепяната от "Майкрософт" компания.


Това направи и "Гугъл". Съгласно очакванията нови продукти да бъдат обявени през март, компанията обяви инструмент, способен да пресъздаде почти всякакъв документ (нещо, което "Майкрософт" се готви да направи до дни).


"Гугъл" потвърди, че пуска конкурент на ChatGPT
"Гугъл" потвърди, че пуска конкурент на ChatGPT

С новата версия, едва месеци след като старата разтърси света и подтикна всички да говорят за изкуствен интелект, OpenAI вдигна залога в надпреварата. Фактът, че тя е платена, е свързан с проблема, че при всяка заявка на потребител, използващ безплатния ChatGPT, компанията претърпява загуби - макар и незначителни, те се увеличават при милиони активни ползващи чатбота.


"Дългосрочно OpenAI планира да изгради и предостави системи, които могат да жонглират между различни видове медии, включително звук и видео, както и текст и изображения", пише "Ню Йорк таймс".

Ключови думи към статията:

С използването на сайта вие приемате, че използваме „бисквитки" за подобряване на преживяването, персонализиране на съдържанието и рекламите, и анализиране на трафика. Вижте нашата политика за бисквитките и декларацията за поверителност. ОK