Nvidia вели дека нејзиниот AI може да реши некои од најголемите проблеми во видео повиците.

Усогласување на лицето, намалување на бучавата и суперрезолуција на АИ.

Nvidia најави нова платформа за видео конференции за програмери по име Nvidia Maxine за која тврди дека може да ги реши некои од најчестите проблеми во видео повиците.

Максин ќе обработува повици во облак користејќи графички процесори на Nvidia и ќе го зголеми квалитетот на повиците на повеќе начини со помош на вештачка интелигенција. Користејќи вештачка интелигенција, Максин може да ги постави лицата и погледите на повикувачите така што тие секогаш гледаат директно во нивниот фотоапарат, да го намали барањето за ширина на опсег за видео „до една десетина од барањата на стандардот за компресија на видео запис H.264“ само за пренесување на „клучните точки на лицето“ и зголемување на резолуцијата на видеата. Другите карактеристики достапни во Maxine вклучуваат осветлување на лице, превод и транскрипција во реално време и анимирани аватари.

Секако, не се сите овие карактеристики. Компресијата на видеото и транскрипцијата во реално време се доволно чести, а „Мајкрософт“ и „Епл“ воведоа усогласување на погледот во „Surface Pro X“ и „FaceTime“ за да им обезбедат на луѓето да одржуваат контакт со очите за време на видео повици (иако карактеристиките за усогласување на лицето на „Nvidia“ изгледаат како многу поекстремна верзија на овој).

Но, Nvidia несомнено се надева дека ќе има своја моќ во cloud computing и импресивната работа со R&D за AI ќе и помогне да се издигне над своите конкуренти. Вистински тест, сепак, ќе биде дали некои воспоставени компании за видеоконференции навистина ја прифаќаат технологијата на Nvidia. Максин не е потрошувачка платформа, туку пакет алатки за трети страни фирми за подобрување на сопствениот софтвер. Досега, сепак, Nvidia објави само едно партнерство – со комуникациската компанија Avaya, која ќе користи избрани карактеристики на Maxine. Како што е наведено на сликата подолу, сите поголеми продавачи на облак нудат Maxine како дел од нивните облачни услуги на Nvidia GPU.

Во конференцискиот повик со новинарите, генералниот директор на Nvidia за медиуми и забава, Ричард Керис, ја опиша Максин како „навистина возбудлива и многу навремена најава“ и ја истакна нејзината компресија на видео-интелигенција како особено корисна карактеристика.

„Сите сме доживеале периоди кога пропусниот опсег претставува ограничување во нашата конференција што ја правиме на дневна основа“, рече Керис. „Ако примениме АИ на овој проблем, можеме да ги реконструираме сцените на разлики на двата краја и да го пренесуваме само она што треба да се пренесе, а со тоа значително да се намали тој опсег“.

Nvidia вели дека неговата карактеристика за компресија користи метод на АИ познат како генеративни противнички мрежи или GAN за делумно реконструирање на лицата на повикувачите во облакот. Ова е истата техника што се користи во многу длабоки фајлови. „Наместо да се емитува целиот екран на пиксели, софтверот АИ ги анализира клучните точки на лицето на секое лице на повик и потоа интелигентно го анимира лицето во видеото од другата страна“, рече компанијата во објавата на блогот. „Ова овозможува да се емитува видео со многу помалку податоци што течат напред и назад на Интернет“.

Како и секогаш со овие рани соопштенија, ќе треба да видиме повеќе од оваа технологија на дело и да почекаме за какви било зделки за партнерство што ги прави Nvidia пред да знаеме колкав ефект ова ќе има на секојдневните видео повици. Но, најавата на Nvidia покажува како иднината на видеоконференцијата ќе биде повештачка од кога и да било порано, со тоа што АИ се користи за да го исправи погледот, па дури и да го реконструира твоето лице, сето тоа во име на заштеда на ширина на опсег.

0 0 vote
Article Rating

Поврзани вести

Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments