Meta, ang kumpanyang responsable para sa Facebook, Instagram at WhatsApp, bukod sa iba pa, ay nagbahagi ng pinakabago Mga preview ng SAM 2. Ito ang bagong bersyon ng teknolohiya nito I-segment ang Anything Model, isang modelo ng Artificial Intelligence na may kakayahang mag-segment ng anumang larawan o video upang makita ang mga pixel ng isang bagay at sundan ang mga ito. Sa ganitong paraan, posibleng paghiwalayin ang isang partikular na aktor o bagay mula sa isang imahe, at pagkatapos ay magsagawa ng iba't ibang mga gawain sa pag-edit.
Sa Abril 2023 ito ay lumitaw Meta SAM, at sa bagong bersyong ito, isinasama ng Artificial Intelligence ang mga bagong function at kakayahan. Kabilang sa mga highlight ng bagong pagtatanghal na ito dapat nating i-highlight ang kapasidad sa pag-edit ng video pati na rin ang ebolusyon ng mga computer graphics at ang posibilidad na lumikha ng mas makatotohanan at maraming nalalaman na interactive na mga diskarte.
Ang isinasama ng SAM 2 mula sa Meta, ang bagong segmentation na AI
maunawaan ang pagpapatakbo ng Meta SAM at ang mga bagong feature na hatid ng pangalawang bersyon ay sumasalamin sa pagsulong ng Artipisyal na Katalinuhan sa mundo ng teknolohiya. Una sa lahat, ang pangwakas na layunin ng parehong mga teknolohiya ay nananatiling pareho. Dinisenyo ito upang i-segment ang mga bagay sa mga larawang may mataas na katumpakan, pinapadali ang awtomatikong pag-edit at pagtukoy ng mga elemento sa screen. Tinutukoy ng AI ang mga pixel na tumutugma sa isang partikular na bagay, at maraming gamit sa mundo ng teknolohiya.
Sa mga disiplina tulad ng maritime sciences, medisina at pagsusuri ng satellite image, halimbawa, ang SAM 2 ng Meta ay maaaring maging isang mahusay na tool. Ang ilan sa mga tool na lumitaw mula sa paggamit ng SAM ay kinabibilangan ng Instagram's Backdrop at Cutouts, na ginagawang mas madali ang pag-edit ng mga file ng larawan.
Peras Ang pangunahing pokus ng SAM ay sa mga static na imahe. Ang bagong bersyon na ito ay nagta-target din ng gumagalaw na nilalaman, mga video at mga fragment kung saan ang SAM 2 ay may kakayahang tukuyin at ihiwalay ang mga partikular na bagay. Ang pagiging kumplikado ng pagsusuri ng isang audiovisual file ay mas malaki, ngunit ang lahat ay nagpapahiwatig na ang Meta ay sumusulong sa lahi ng Artipisyal na Intelligence at ang mga praktikal na aplikasyon nito.
Ang mga bagong feature na isinasama ng SAM 2 ng Meta
Ang modelo ng Meta segmentation sa SAM 2 na bersyon nito ay nagsasama ng mga bagong function na may napakaspesipikong layunin. Sa isang banda, ang posibilidad ng pagsasagawa ng segmentation sa real time, upang makita ang mga bagay sa mga video, ngunit din ng isang open source na disenyo at generalization nang walang adaptasyon.
Bukas na mapagkukunan
Inilabas ng Meta ang SAM 2 bilang isang open source sa ilalim ng lisensya ng Apache 2.0. Sa ganitong paraan, ang mga developer na gustong gawin ito ay makakagawa ng mga custom na app at tool na ganap na tugma sa SAM 2 at walang masyadong maraming komplikasyon.
Dataset SA-V
Kasama sa bagong bersyon ng modelo ng Meta segmentation isang bagong dataset na tinatawag na SA-V. Mayroong humigit-kumulang 51.000 mga video na nakuha mula sa totoong mundo at ginagamit upang sanayin ang Artipisyal na Katalinuhan upang magdagdag ng iba't ibang mga function at kakayahan. Bilang karagdagan, kabilang din dito ang higit sa 600.000 spatio-temporal mask na ilalapat sa mga gawain sa pag-edit ng video.
Real-time na segmentation
Hindi tulad ng orihinal na SAM ng Meta, Ang bersyon 2 na ito ay may kakayahang tukuyin at i-segment ang mga bagay sa mga video at aksyon sa real time. Ang pagkilos na ito ay nagsisilbi ring makabuluhang bawasan ang oras ng pakikipag-ugnayan na kailangang ilaan ng user sa app.
Paglalahat nang walang adaptasyon
Kasama ang SAM 2 Maaari mong i-segment ang anumang bagay sa anumang video o larawan, kahit na sa mga visual na domain na hindi pa nakikita. Sa ganitong paraan, inaalis ang pangangailangan para sa personalized na pagbagay sa bawat partikular na kaso.
Pinag-isang balangkas
Ang mga nakaraang modelong pinagtrabahuan ng Meta ay gumagana sa mga larawan at video sa ibang paraan. Ngayon ang diskarte ng SAM 2 ay magkakaugnay, kaya nakakamit ang mas maraming nalalaman na pag-aaral ng mga bagong diskarte, at nagbibigay din ng mga pare-parehong pagganap sa iba't ibang uri ng visual na data na sinusuri.
Interactive na segmentation
Gumagawa din ang SAM 2 ng iba pang mga kawili-wiling kakayahan, ang gumagamit maaari mong gabayan ang atensyon ng modelo gamit ang mga bounding box o sa pamamagitan ng mga partikular na paglalarawan, o sa pamamagitan ng pag-click. Ito ay isang modelo na napakabilis na umaangkop sa partikular at iba't ibang pangangailangan. Sa huli, sa pinakamababang input ng SAM 2 mula sa Meta, matutukoy mo ang mga bagay na may mahusay na katumpakan.
Bilis at kahusayan sa pagse-segment sa Meta's SAM 2
La Meta Artipisyal na Katalinuhan Sa SAM 2 na bersyon nito ay nagdaragdag ito ng bilis at kahusayan sa proseso ng segmentation ng object. Ginawang posible ng mga developer na lumikha ng isang platform na sinusuri ang lahat ng uri ng mga elemento na may mabilis at mahusay na mga resulta, mula sa mga larawan at video hanggang sa mga partikular na paglalarawan ng teksto.
High resolution na pagpoproseso ng imahe
Gumagana rin ang SAM 2 sa mga larawang may mataas na kalidad. Maaari nitong pangasiwaan ang mga larawan na may hanggang 4 na beses ang resolution na sinusuportahan ng mga nakaraang bersyon ng modelo. Ginagarantiyahan nito ang mas kaakit-akit at makatotohanang mga resulta. Ito ay isang mahusay na pagpapabuti pagdating sa pagsusuri at pag-scan sa mga patlang ng imahe tulad ng gamot o ang interpretasyon ng mga mapa ng satellite.
Kung mas mataas ang kahulugan, mas madali at mas mabilis na mga bagay at indibidwal ang maaaring i-segment. Ang puso ng SAM 2 ay ang magbigay ng maraming gamit na tool, na may kakayahang umangkop nang mabilis at naghahatid ng magagandang resulta para sa iba't ibang aksyon.
Ano ang maaaring ilapat sa SAM 2?
Ang pag-unawa sa mahusay na pagsulong ng Artipisyal na Katalinuhan at ang gawain para sa pagpapalawig nito, ito ay kagiliw-giliw na makita ang mga field kung saan nagpasya ang Meta na lumiko. Sa pamamagitan ng modelong SAM 2, maaaring asahan ang mga pagsulong sa iba't ibang larangan. Mula sa real-time at automated na pag-edit ng video, hanggang sa automation at mga robotic na pagkilos.
Gayundin ang Ang mga lugar ng medisina at agham ay malapit na nauugnay sa Artificial Intelligence, na magagamit ang mga pagsulong na ito upang bumuo ng mga bagong estratehiya. Nagsusumikap din ang mga computer engineer sa Meta upang matiyak na ang SAM 2 ay may mga partikular na gamit at nagbibigay-daan para sa mas mabilis na pag-unlad sa mga lugar na nauugnay sa data annotation at dumping. Ang mga platform na nangongolekta ng iba't ibang data ay maaaring gumamit ng SAM 2, maghanap ng mga pattern at mabilis na mapabilis ang bilis ng paglabas ng mga resulta. Ang abot-tanaw ay malayo pa sa nakikita. Ang AI ay nasa pinakamahusay nito at hindi gustong makaligtaan ng Meta ang bangka. Sa mga developer nito na gumagana nang buong bilis, at SAM 2 sa napakaraming larangan, maaari itong maging isang mahusay na panukala.