Çfarë është Sora AI? Gjithçka që duhet të dini për programin nga teksti në video të OpenAI

Sora është hapi më i fundit në softuerin e inteligjencës artificiale, duke i lejuar përdoruesit të krijojnë video jashtëzakonisht realiste nga një kërkesë e thjeshtë me fjalë.

OpenAI, krijuesit e Dall-E dhe ChatGPT, kanë sjellë shërbimin e ri, i cili së shpejti do të bëhet i disponueshëm për publikun e gjerë.

Ky zhvillim me sa duket ka ardhur nga hiçi. Nëse keni parë ndonjë përpjekje të mëparshme për video të krijuar nga IA-ja, do ta dini se ato ishin… mirë, të këqija do të dukej pothuajse si një kompliment. Le të themi se nuk po mashtronin vërtet.

Pra, si e ka bërë OpenAI këtë? A mund ta përdorni programin tani? Dhe çfarë do të thotë kjo për të ardhmen e videos, filmit dhe përmbajtjes? Do të bëjmë një thellim në programin më të fundit novator të OpenAI dhe çfarë do të thotë për ju.

Çfarë është Sora?

Sora është një program IA-je që është në gjendje të gjenerojë video të plota deri në 1 minutë.

Thjesht jepni një direktivë, për shembull, “një fushë macesh që adhurojnë një qen gjigant” dhe, në teori, do të merrni një video që përputhet me atë përshkrim.

Nëse nuk jeni të ngjitur pas rrjeteve sociale ose forumeve të veçanta informatike, do të t’ju ketë shpëtuar ngritja e papritur e Sora-s.

Nuk kishte një njoftim bombastik apo shumë reklama, thjesht ishte aty papritur.

OpenAI ka zbuluar një mori shembujsh videosh, shumica e të cilave tregojnë Sora-n duke prodhuar video tepër të ngjashme me jetën.

Ata mund të shfaqin reflektime në pasqyra, lëvizje të sakta të lëngjeve në lëngje dhe madje edhe grimca bore që bien.

Si funksionon Sora?

Në thelb, Sora funksionon si çdo gjenerues imazhi IA-je që ka ardhur më parë, vetëm me shumë më tepër hapa. Gjeneruesit e imazheve të IA-së përdorin një metodë të njohur si modelet e difuzionit.

Kjo fillon të bëhet disi e ndërlikuar, por në thelb funksionon duke marrë një video të kthyer tërësisht në statike. Më pas mësohet të përmbysë statika, duke sjellë një imazh të qartë (ose video në këtë rast).

Për të trajnuar diçka të tillë, Sora-s i jepet shembuj videosh me tekst alternativ shoqërues që shpjegon se çfarë po ndodh në video. Kjo e ndihmon modelin të mësojë lidhjen midis imazhit dhe asaj që po ndodh.

Kjo më pas mund të përdoret për të lidhur kërkesat tuaja të formuluara me videon e rezultatit përfundimtar. Kjo, krahasuar me imazhet e IA-së që kemi parë për vitin e kaluar është një sfidë masive.

Modeli duhet të kuptojë modelet 3D, lëvizjen, pasqyrimet, hijet dhe një listë të gjatë karakteristikash shumë të ndërlikuara për t’u përsëritur.

OpenAI, si pjesë e angazhimit të tij për transparencë, ka një përmbledhje të plotë të mënyrës se si funksionon modeli në faqen e saj të internetit. Megjithatë nuk ka asnjë informacion se nga kanë ardhur videot e përdorura në trajnim.

Si të përdorni Sora AI

Për momentin, Sora nuk është e disponueshme për shumicën e njerëzve. Ashtu si në të kaluarën, OpenAI po tregohet i kujdesshëm me ofrimin e programeve të tij.

Hapi i parë përfshin një numër të vogël njerëzish të njohur si ‘skuadra të kuqe’ të cilët testojnë programin për zona kritike të dëmtimit ose rrezikut.

Më pas do të bëhet i disponueshëm për një numër të vogël artistësh pamorë, stilistësh dhe kineastësh për të kuptuar se si funksionon mjeti me profesionistë krijues.

Ka të ngjarë që Sora më pas të bëhet e disponueshme për publikun. Sidoqoftë, si një mjet kaq i fuqishëm, ne do të prisnim që ai të gjendej nën modelin me pagesë për përdorim të GPT-së.

A është Sora gjeneruesi më i mirë i videove me IA?

Nga videot që janë publikuar deri më tani, Sora duket se është me kilometra përpara çdo gjëje që kemi parë deri tani. Vetëm një vit më parë, ne po shihnim përpjekjet e para për gjenerimin e videove me IA, dhe ato ishin qesharake.

Në atë kohë, një video e Will Smith duke ngrënë spageti po bëhej virale, siç ishte një video e quajtur “Pepporoni Hug Spot” – një reklamë televizive e bërë nga IA. Të dy i afroheshin një makthi të madh sesa një shembull i qëndrueshëm i videos me IA.

Krahasoni këto me videot e Sora-s dhe është një botë krejt tjetër. Sora po krijon video me ndriçim të saktë, reflektime dhe karakteristika natyrore njerëzore. Madje ka zgjidhur çështje që janë çuditërisht të vështira si njerëzit që hyjnë dhe dalin nga ekrani.

Megjithatë, ajo nuk është aspak e përsosur. Shikoni një koleksion videosh të Sora-s dhe do të shihni plot gabime. Pjesët e trupit zhduken dhe rishfaqen, njerëzit dalin nga askund dhe këmbët rrinë pezull mbi tokë.

Aktualisht, ne mund të shohim vetëm videot e zgjedhura vetë nga OpenAI gjithashtu. Kur publikut t’i jepet akses, do të shfaqen më shumë video me të meta, duke shfaqur pikat e forta dhe të dobëta të programit. /oranews/


Shtuar 27.03.2024 01:15