Project Strawberry: OpenAI-ev veliki korak prema umjetnom rasuđivanju

Rasuđivanje se smatra ključnim za postizanje ljudske ili nadljudske inteligencije u AI sustavima. OpenAI, nedavno je na internom sastanku demonstrirao Project Strawberry, prethodno poznat kao Q*. za koji tvrdi da posjeduje vještine rasuđivanja nalik ljudskima

Ivan Podnar nedjelja, 14. srpnja 2024. u 12:07

Prema izvješćima dvoje sudionika prezentacije, koji su razgovarali s Reutersom, Project Strawberry, prethodno poznat kao Q*, o kome smo pisali, pokazuje značajno unaprijeđene sposobnosti u rješavanju složenih znanstvenih i matematičkih pitanja u usporedbi s trenutno dostupnim komercijalnim modelima. Na internom sastanku održanom prošli tjedan, OpenAI je prikazao projekt za koji tvrdi da posjeduje vještine rasuđivanja nalik ljudskima.

Post-trening

Projekt Strawberry uključuje specijalizirani način obrade UI modela nakon što je prethodno obučen na vrlo velikim skupovima podataka. Ovaj pristup, poznat kao "post-trening", uključuje metode poput "finog podešavanja" koje se koriste za prilagodbu postojećih modela.

Važnost rasuđivanja

Rasuđivanje se smatra ključnim za postizanje ljudske ili nadljudske inteligencije u AI sustavima. Dok postojeći veliki jezični modeli mogu brzo sažimati tekstove i sastavljati prozne tekstove, često im nedostaje sposobnost rješavanja problema zdravorazumskog karaktera ili prepoznavanja logičkih pogrešaka. Sam Altman, izvršni direktor OpenAI-a, ranije je izjavio da će "najvažnija područja napretka u AI-u biti vezana uz sposobnost rasuđivanja."

Usporedba s drugim istraživanjima

Projekt Strawberry pokazuje sličnosti s metodom razvijenom na Sveučilištu Stanford 2022. godine, nazvanom "Self-Taught Reasoner" ili "STaR". Ova metoda omogućuje UI modelima da "sami sebe unaprijede" stvaranjem vlastitih podataka za obuku.

"Mislim da je to istovremeno uzbudljivo i zastrašujuće... ako stvari nastave ići u tom smjeru, imamo ozbiljne stvari o kojima moramo razmišljati kao ljudi," rekao je jedan od njegovih tvoraca, profesor sa Stanforda Noah Goodman, koji nije povezan s OpenAI-om i nije upoznat sa Strawberryjem.

Najvažnija područja napretka u AI-u biti vezana uz sposobnost rasuđivanja - Sam Altman

I druge tvrtke poput Googlea, Mete i Microsofta također eksperimentiraju s različitim tehnikama za poboljšanje rasuđivanja u AI modelima, kao i većina akademskih laboratorija koji provode AI istraživanja. Istraživači se, međutim, razlikuju u mišljenjima o tome jesu li veliki jezični modeli sposobni integrirati ideje i dugoročno planiranje u svoja “promišljanja”. Na primjer, jedan od pionira moderne AI, Yann LeCun, koji radi u Meti, često je tvrdio da veliki jezični modeli nisu sposobni doseći ljudsko rasuđivanje, kako smo o tome ovdje pisali.

LHT I CUA

Među ključnim ciljevima Strawberryja je sposobnost izvršavanja dugoročnih zadataka (long-horizon tasks, LHT), koji zahtijevaju od modela da planira unaprijed i izvršava niz akcija tijekom duljeg razdoblja. OpenAI također radi na razvoju "agenta koji koristi računalo" (computer-using agent, CUA), sustav koji može autonomno pretraživati Internet i poduzimati akcije na temelju pronađenih informacija.

https://www.bug.hr/umjetna-inteligencija/yann-lecun-i-buducnost-ai-a-llm-ovi-nece-dosegnuti-ljudsku-inteligenciju-41063

Vezano

📢 Provjeri

Lenovo Ideapad

Istraži!

449,99 € ~~469,99 €~~ Kupi

📢 Istraži!

EPOCH periferija

Već od 14,99 €

Kupi

📢 Istraži!

Poco mobiteli

Do 28% popusta

Kupi

Zadnji komentari na forumu

zzib 14. srpnja 2024.

Ajde da vidimo i to čudo. Mene je ugodno iznenadio Gemini. Postavio sam mu pitanje kako u C jeziku riješiti jedan zadatak. Niti jedno rješenje mi nije tako odgovaralo kao rješenje koje je ponudio Mistral. Kada ga je Gemini dobio na uvid, uredno ga je rasčlanio (i promjenio kod bez promjene funkciona...

Posjetite našu Hi-Fi slušaonicu.

Ronis Velesajam

Rezervirajte termin u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

Optimizirani dizajn kućišta za najbolju akustičku izvedbu.

Akcija

KEF LS50 Meta zvučnici

Dvosmjerni bas-refleks, Uni-Q driver, 47 Hz - 45 kHz, bas 26 Hz, distorzija <0,4%, izlaz 106 dB, snaga 40-100 W, impedancija 8 Ω (min. 3,5 Ω), osjetljivost 85 db

1.149 € ~~1.289 €~~ Kupi

Delta Sigma drive sistem.

Akcija

TECHNICS SL-1300G Grand Class

Direct Drive, bebrush DC motor, 33-1/3, 45, 78 rpm, početni moment 0,32 N·m, wow i flutter 0,025%, aluminijska podloga 332 mm, tonearm 230 mm, podešavanje sile igle 0 - 4g, težina kartridža 5,6 - 12,0g, PHONO izlaz, napajanje 220-240V, 10W.

2.699 € ~~2.699 €~~ Akcija

Home subwoofer audiofilske klase.

Akcija

REL ACOUSTICS T/7X

Aktivni subwoofer, 8" aktivni drajver, 10" pasivni radiator, -6dB pri 30 Hz, ulazi: Neutrik Speakon, RCA, LFE, snaga 200 W (RMS), Klasa A/B pojačalo

1.099 € ~~1.223 €~~ Akcija

AccuEQ akustička kalibracija.

Akcija

ONKYO TX-SR494DAB AV receiver

Pojačalo: 160 W/kanal (6 Ω, 1 kHz, 10% THD), 135 W/kanal (6 Ω, 1 kHz, 1% THD), THD+N 0,08%, frekvencijski odziv 10 Hz–100 kHz, ton kontrola ±10 dB (bass 20 Hz, treble 20 kHz), signal-noise 109 dB, impedancija zvučnika 4 Ω–16 Ω. Tuner: FM 87,5 MHz–108 MHz, AM 530 kHz–1,710 kHz, DAB+ 40 stanica.

499 € ~~699 €~~ Akcija

Vrhunski zvuk i elegantna estetika.

Akcija

PSB Imagine T54 zvučnici

Frekvencijski odziv: 35-23,000 Hz (±3 dB), osjetljivost 87 dB, impedancija 8 Ω, preporučena snaga 20-150 W. Tweeter 1” Titanijumska kupola, Midrange 4” Woven Carbon Fibre, Woofer 2 x 5 1/4”. Križanje: 2,500 Hz (LR4), 500 Hz (B3). Dizajn: 3-kanalni, dual bass reflex, 2x stražnji portovi.

1.299 € ~~1.489 €~~ Akcija

Inovativni Uni-Q driver.

Demo

KEF Q750 zvučnici

Demo model s manjim oštećenjima. Preporucena ulazna snaga 15-150W, osjetljivost 88dB, nominalna impedanca 8 Ohma,frekvencijski raspon 42-28,000Hz.

899 € 1.389 Akcija

Nasljednik legendarnih Speaker Box 5 zvučnika.

Novo u ponudi

PRO-JECT Speaker BOX 5 E red

2-sistemski bass-reflex zvučnik s prirodnom transparencijom, živom dinamikom i MDF kućištem bez rezonancija.

349 € Kupi

Prirodan zvuk Linton zvučnika iz 70-ih.

WHARFEDALE Linton Heritage

3-sistemski bas reflex zvucnici sa 8" Kevlar bas driverom, 5" midrange driverom i 1" visokotonskim driverom, preporucena snaga pojcala 25-200W, nominalna impedancija 6 ohma, frekvencijski odziv 40Hz ~ 20kHz. Stalci nisu ukljuceni.

1.249 € Kupi

Sadrži najnoviju generaciju MDC tehnologije.

NAD C 379 stereo pojačala

HybridDigital UcD pojačalo, 2 x 80 W (8/4 Ω), bridged do 300 W, ESS SABRE™ DAC (32-bit/384kHz), 2 MDC 2 utora, MM Phono pretpojačalo, pojačalo za slušalice, HDMI eARC, optički i koaksijalni ulazi, 2 izlaza za subwoofer.

1.199 € Kupi

Za one koji neumoljivo teže najboljem zvuku.

YAMAHA R-N1000A receiver

Trosmjerni fllorstander, frekvencijski odziv 32Hz-30kHz (-6dB), impedancija 4 ohma, osjetljivost 92dB, snaga opterecenja 200W

1.589 € Kupi

Preporučamo

Konferencije

12. i 13. lipnja 2025.

Što sve dobivate s ulaznicom za .debug 2025?

debug.hr jučer 10:57

Konferencije

Neviđeni spektakl

Ovogodišnji .debug bit će najveći tehnološki događaj svih vremena u našoj regiji, uz brojne novosti

Bug.hr 3. ožujka 2025.

Izdavaštvo

Novi Bug (388 – 3/2025)

Papreno skupa grafika

Miro Rosandić 1. ožujka 2025.

Konferencije

25. ožujka u Zagrebu

Budućnost luksuznog i vinskog turizma, city breakova i tehnologije na 8. izdanju 3T konferencije

Mreža 26. veljače 2025.

Trenutno najpovoljnije cijene na tržištu

Vezano

Umjetna inteligencija

Responses API

OpenAI predstavio novi paket alata za razvoj AI agenata

Ivan Podnar danas 07:52

Biznis

ChatGPT je bio prekretnica

Svaki treći posao u američkom IT sektoru povezan s umjetnom inteligencijom

Bug.hr danas 06:15

Tehnologije

Što znači 'PhD-level AI'?

OpenAI najavljuje umjetnu inteligenciju 's doktoratom'

Mladen Smrekar jučer 18:40 2

Tehnologije

Inspiracija ili kopiranje?

OpenAI razvija novi jezični model za kreativno pisanje: tko su pravi autori?

Ivan Podnar jučer 12:02

Umjetna inteligencija

Dugo iščekivana značajka

Googleov Gemini moći će gledati kroz kameru i analizirati videozapise

Matej Markovinović 8. ožujka 2025. 3

Tehnologije

Koncept "vibe kodiranja"

AI-generirani kôd postaje uobičajen u razvoju startupova

Bug.hr 7. ožujka 2025. 1