OpenAI компани текст мэдээллийг видео дүрс болгон хувиргадаг системээ танилцууллаа

2024-02-16 197 0

OpenAI компани өчигдөр текст мэдээллийн агуулга дээр үндэслэн видео дүрс үүсгэдэг хиймэл оюуны системээ нийтэд танилцуулжээ.

Sora (япон хэлээр тэнгэр гэсэн утгатай) гэж нэрлэсэн шинэ загвар нь хэрэглэгчийн бичсэн текст мэдээллийг ойлгоод нэг минут хүртэл урттай хөдөлгөөнт дүрсийг бүтээдэг юм байна.

Бас оруулсан хөдөлгөөнгүй зургийг боловсруулж, эсвэл өгөгдсөн хөдөлгөөнт дүрсийг баяжуулж, дэлгэрүүлэх чадвартай болохыг OpenAI мэдээлжээ.

“Бид хиймэл оюунд бодит ертөнцийг ойлгох, дүрслэх чадварыг сургаж байна. Энэ нь бодит ертөнцийн харилцаа шаардсан асуудлуудыг шийдвэрлэхэд хүмүүст туслах зорилготой юм” гэж OpenAI компанийн мэдэгдэлд өгүүлсэн байна.

Тус компани Sora загварыг ашиглах боломжийг одоогоор судлаачид, уран бүтээлчдийн хүрээнд хязгаарлаж байгаа ажээ.

OpenAI бас Sora загвар хэрхэн ажилладгийг харуулсан хэд хэдэн жишээг үзүүлсэн байна.

Жишээлбэл “Үзэсгэлэнтэй, цастай Токио хот хөл хөдөлгөөн ихтэй байна. Камер хотын хөл хөдөлгөөн ихтэй гудамжаар шилжиж, цастай сайхан цаг агаарт зугаацаж, ойролцоох дэлгүүрүүдээр хэсэж буй хэд хэдэн хүнийг дагана. Сакурагийн гоёмсог дэлбээнүүд цасан ширхгүүдтэй хамт салхинд бударна” гэсэн текстийг Sora хэрхэн дүрс болгосныг доор харуулж байна.

Компанийн гүйцэтгэх захирал Сэм Олтмэн X хуудсандаа зарим нэг хүний өгсөн текстийг шууд дүрс болгож харуулсан юм.

Тухайлбал “Golden retriever” үүлдрийн хоёр нохой уулын оройд подкаст нэвтрүүлэг хөтөлж байгаа тухай өгүүлсэн текстийг тэр дараах байдлаар боловсруулж үзүүлжээ.

Хиймэл оюуны технологи хөгжүүлэгч OpenAI компани 2021 онд хөдөлгөөнгүй зураг үүсгэгч Dall-E системээ танилцуулж байсан бол 2022 оны арваннэгдүгээр сард “generative AI” төрлийн ChatGPT чатбот системээ танилцуулсан юм.

Google, Meta зэрэг компаниуд бас видео дүрс үүсгэдэг систем хөгжүүлж байгаа гэсэн мэдээлэл бий. Гэхдээ тэд одоогоор хөгжүүлж буй системээ нийтэд танилцуулаагүй байна.

 

Эх сурвалж: The Guardian

 

Холбоотой мэдээ