Praėjusios savaitės DI naujienos #1

Praėjusios savaitės (09.22–09.27) svarbiausios DI naujienos vienoje vietoje: nuo OpenAI modelių proveržių finansų srityje iki MIT kuriamų kvantinių medžiagų. Sužinok, kaip DI keičia technologijas, verslą ir mūsų kasdienybę, bei atrask populiariausius įrankius, kurie jau šiandien formuoja ateitį.

9/29/20255 min skaitymo

Pastarosiomis savaitėmis dirbtinis intelektas (DI) nenustojo stebinti – nuo finansų analizės iki kvantinių medžiagų kūrimo, nuo programavimo iki kūrybinių įrankių. Pasaulis žengia milžiniškus žingsnius DI srityje, o tai atveria naujas galimybes ne tik technologijų entuziastams, bet ir verslams.

Štai svarbiausios praėjusios savaitės DI naujienos vienoje vietoje:

OpenAI išbandė DI 44 profesijose

OpenAI pristatė GDPval – sistemą, kuri tikrina, ar DI modeliai gali prilygti profesionalams 44 skirtingose profesijose. Buvo testuota 1320 užduočių iš 9 sektorių, tarp jų sveikatos, finansų ir inžinerijos. Opus 4.1 pasiekė aukščiausius rezultatus (47,6%), GPT-5 išsiskyrė tikslumu techninėse užduotyse. Per 15 mėnesių DI našumas išaugo tris kartus, o tai rodo sparčią technologijos pažangą

Google: beveik visi programuotojai naudoja DI

„Google Cloud“ paskelbė naujausią metinę DORA ataskaitą „DI pagalba kuriamos programinės įrangos būklė“, kurioje nustatyta, kad DI įrankių naudojimas tarp programuotojų šoktelėjo iki 90 %, tačiau pasitikėjimas DI sugeneruotu turiniu išlieka gana žemas. Apklausus beveik 5 000 technologijų specialistų, paaiškėjo, kad programuotojai kasdien skiria apie dvi valandas darbui su DI asistentais. Nepaisant to, kad daug kas pasikliauja šiais įrankiais, 30 % programuotojų pasitiki jų rezultatais „mažai“ arba „visai nepasitiki“, vis tiek toliau integruodami juos į savo darbo procesus. Efektyvumas išlieka aukštas – 80 % respondentų teigia, kad DI padidino produktyvumą, o 59 % pažymi, kad pagerėjo kodo kokybė, nepaisant skepticizmo. Be to, „Google“ pristatė DORA DI gebėjimų modelį, kuriame apibrėžtos septynios praktikos, padedančios įmonėms efektyviai išnaudoti DI privalumus. Tai rodo, kad DI tampa ne eksperimentiniu įrankiu, o būtina infrastruktūros dalimi kūrimo pasaulyje, o tuo pačiu programuotojai vis dar pasitelkia žmogišką sprendimą kaip galutinę kokybės kontrolę.

DI išlaikė DFA egzaminą

Niujorko universiteto (NYU) tyrimai atskleidė, kad pažangiausi „OpenAI“, „Google“ ir „Anthropic“ modeliai dabar gali išlaikyti visus tris DFA (diplomuoto finansų analitiko) egzamino lygius, įskaitant sudėtingus III lygio rašto klausimus, kurių prieš dvejus metus jie negalėjo įveikti.

NYU Stern ir GoodFin tyrėjai išbandė 23 kalbos modelius su DFA III lygio egzamino mock testais, nustatydami, kad devyni modeliai pasiekė perlaikymo ribą – daugiau nei 63%.

Geriausius rezultatus pasiekė „OpenAI o4-mini“ – 79,1 % sudėtingoje rašto užduotyje, „Gemini 2.5 Pro“ surinko 75,9 %, o „Claude 4 Opus“ – 74,9 %.

Modeliai egzaminą atliko per kelias minutes, tuo tarpu žmonės paprastai skiria apie 1 000 valandų studijoms per kelerius metus, kad įveiktų visus tris lygius.

Pažanga per dvejus metus įveikiant anksčiau neįveikiamus rašto klausimus rodo milžinišką analizės gebėjimų šuolį – tokie modeliai puikiai tinka sudėtingam mąstymui. DI populiarėjant, žmogaus įgūdžiai, tokie kaip santykiai su klientais ir kontekstualus sprendimų priėmimas, taps svarbesni nei tyrimų ataskaitos ar investicijų argumentai.

MIT SCIGEN: DI kuriantis kvantines medžiagas

Masačusetso technologijų instituto (MIT) tyrėjai praeitą savitę pristatė SCIGEN – DI sistemą, kuri nukreipia generatyvinius DI modelius kurti medžiagas su egzotiškomis kvantinėmis savybėmis, taikant geometrinius projektavimo principus generavimo metu.

Tyrėjai aprūpino populiarius difuzijos modelius struktūrinėmis taisyklėmis, leidžiančiomis kurti medžiagas su geometriniais raštais, susijusiais su kvantiniais parametrais. DI sistema sugeneravo 10 mln. potencialių medžiagų, iš kurių 1 mln. buvo pakankamai stabilios, kad galėtų egzistuoti realiame pasaulyje. Laboratorijoje sėkmingai sukurtos dvi visiškai naujos medžiagos – TiPdBi ir TiPbSb, patvirtinant, kad DI tiksliai prognozavo jų magnetines savybes. Projekte bendradarbiavo „Google DeepMind“, užtikrindamas, kad DI negeneruotų fiziškai neįmanomų struktūrų, kurios dažnai pasitaiko standartiniuose modeliuose.

Alibaba Qwen3 modeliai

Alibaba praeitą savaitę pristatė gausybę naujų Qwen3 modelių, išleidžiant šešias naujas variacijas teksto, vaizdų, garso ir saugumo srityse, ir vieną patį svarbiausią modelį: Qwen-Max.

Max demonstruoja beveik pažangiausias galimybes programavimo ir agentinių užduočių srityse, o jo Heavy versija pasiekia tobulus rezultatus matematinio mąstymo testuose. Omni gali apdoroti tekstą, vaizdus, garsą ir vaizdo įrašus, taip pat palaiko kalbos supratimą 19 kalbų ir generavimą 10 kalbų. VL išsiskiria kaip geriausias atvirojo kodo vizualinis modelis be mąstymo galimybių, o taip pat pranoksta geriausius uždarus modelius keliuose testuose.

Alibaba taip pat pristatė LiveTranslate-Flash realaus laiko vertimui, Guard modelius saugumo moderavimui ir naujas atnaujintas Coder variacijas.

OAI, Anthropic ir Google mus pripratino prie lėtesnio naujovių tempo, tačiau Kinijos milžinai, tokie kaip Alibaba, taiko priešingą strategiją - greitai užpildydami rinką beveik pažangiais, specializuotais sprendimais. Qwen atrodo arčiausiai to, ką Kinijos laboratorija pasiekė pažangumo fronte nuo DeepSeek R1 laikų.

Nvidia ir OpenAI infrastruktūros projektas

Nvidia ir OpenAI paskelbė apie „didžiausią dirbtinio intelekto infrastruktūros projektą istorijoje“ - Jensen Huang vadovaujanti įmonė ketina investuoti iki 100 mlrd. USD į OpenAI, naudojant savo pažangias GPU sistemas mokymui ir naujos kartos DI vykdymui.

Įmonės pasirašė ketinimų laišką dėl 10GW vertės Nvidia sistemų diegimo - tai atitinka milijonus GPU - kurie maitins OpenAI DI infrastruktūrą. Kiekvienam gigavatui Nvidia palaipsniui investuos į OpenAI, kad palaikytų diegimą, įskaitant duomenų centrų ir energijos poreikius, o bendra suma gali siekti 100 mlrd. USD. Pirmasis projekto gigavatas turėtų pradėti veikti 2026 m. antroje pusėje, naudojant Nvidia naujos kartos Vera Rubin platformą.

Ši sutartis suteikia OpenAI kapitalo postūmį, reikalingą skaičiavimo ir energijos pajėgumams užtikrinti naujosios DI eros metu, o Nvidia užtikrina didelį klientą savo GPU verslui. Tačiau daugelis taip pat mato tai kaip begalinį pinigų ciklą, kai kapitalas tiesiog cirkuliuoja tarp OpenAI ir partnerių Oracle bei Nvidia.

Populiarūs DI įrankiai

Kling 2.5 Turbo – vaizdo įrašų generavimas aukšta kokybe
Mixboard – Google eksperimentinis įrankis idėjų vizualizavimui
Qwen3-VL – naujausias Alibaba vaizdo ir kalbos modelis
ChatGPT Pulse – aktyvios, personalizuotos naujienos iš forumų ir pokalbių
Wan2.5-Preview – multimodalinis Alibaba nuotraukų ir vaizdo įrašų modelis
Suno v5 – muzikos generavimo modelis
Qwen3 Omni – daugiakalbis LLM, gebantis atlikti įvairias užduotis
Deepseek v3.1 Terminus – modelis su agentinėmis funkcijomis ir patobulintu našumu

Kitos svarbios DI naujienos

Spotify stiprina DI saugumą, pašalinta daugiau nei 75 mln. šlamšto DI kūrinių
Microsoft kuria Publisher Content Marketplace, leidžiantį uždirbti už turinio panaudojimą DI įrankiuose
SAP ir OpenAI diegia „OpenAI Vokietijai“ – suverenią DI platformą viešajam sektoriui (startas planuojamas 2026 m.)
Cohere pritraukė 100 mln. USD investicijų, vertinama beveik 7 mlrd. USD
Cloudflare atvėrė VibeSDK – platformą savo DI „vibe coding“ kūrimui
OpenAI, Oracle ir SoftBank plečia Stargate projektą – JAV bus penki nauji duomenų centrai, siekiant 10 GW galios
Microsoft pristato DI lustų aušinimo technologiją, mikrolikvidinė sistema tris kartus efektyviau šalina šilumą
Abu Dabis siekia tapti pirmuoju visiškai DI valdomu valdžios sektoriumi (daugiau nei 200 DI sprendimų iki 2027 m.)
Spotify, Meta ir Google testuoja DI kūrybinius įrankius muzikos ir vaizdo įrašų kūrimui