91精品色婷,日韩少妇中出,国产 精一区二区三,欧美视频精品在线二区,婷婷久久日韩欧美,亚洲天堂性爱视频,亚洲香蕉一区,国产自产观看精品一区,日本 大胆成人

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

蘋果連發(fā) 3 項(xiàng) AI 研究,推進(jìn)空間計(jì)算與 Vision Pro 頭顯方向

2026/5/12 8:54:47 來(lái)源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 5 月 12 日消息,科技媒體 Appleinsider 昨日(5 月 11 日)發(fā)布博文,報(bào)道稱基于最新公開(kāi)的 3 項(xiàng)研究,蘋果仍在積極推進(jìn)空間計(jì)算和 Vision Pro 頭顯。

IT之家 4 月援引 MacRumors 媒體報(bào)道,蘋果公司內(nèi)部已擱置研發(fā)新款 Vision Pro,團(tuán)隊(duì)重心轉(zhuǎn)向 Siri 和 AI 智能眼鏡。

但從最新公示的研究論文來(lái)看,蘋果公司并未放棄 Vision Pro 頭顯項(xiàng)目,本輪公開(kāi)了 3 項(xiàng)研究,分別涉及多模態(tài)大模型空間推理評(píng)測(cè)、美式手語(yǔ)視頻標(biāo)注,以及 3D 頭部重建。

其中最直接的一項(xiàng),是蘋果在機(jī)器學(xué)習(xí)博客發(fā)布的《From Where Things Are to What They’re For:Benchmarking Spatial-Functional Intelligence for Multimodal LLMs》。

這篇論文提出 SFI-Bench,用來(lái)測(cè)試多模態(tài)大模型是否既看懂空間布局,也理解物體“能做什么”。原文提到,這套視頻基準(zhǔn)包含 134 段室內(nèi)視頻掃描,并整理出 1555 道專家標(biāo)注問(wèn)題。

SFI-Bench 不只問(wèn)模型“這是什么、在哪里”,還會(huì)追問(wèn)“它怎么用、出了故障怎么辦”。例如,模型可能需要從柜子里找出同品牌數(shù)量最多的一組瓶子,理解洗衣機(jī)當(dāng)前程序如何取消,或者判斷電視遙控器的用途。相比只測(cè)空間識(shí)別的舊方法,這更接近日常家庭場(chǎng)景,也更像未來(lái)空間助手需要處理的真實(shí)任務(wù)。

蘋果公司的人工智能研究人員測(cè)試了智能體(LLM)對(duì)周圍世界的理解能力。圖源:蘋果公司

測(cè)試結(jié)果顯示,Google Gemini 3.1 Pro 總分最高,OpenAI GPT-5.4-High 排名第二,Gemini-3.1-Flash-Lite 排名第三。

但論文也點(diǎn)出共同短板:幾乎所有模型都不擅長(zhǎng)“帶條件的全局計(jì)數(shù)”,并且在空間記憶、功能知識(shí)整合,以及把眼前畫(huà)面和外部知識(shí)連起來(lái)這幾件事上仍有明顯限制。

手語(yǔ)論文《Bootstrapping Sign Language Annotations with Sign Language Models》嘗試用 AI 自動(dòng)生成候選標(biāo)注,減少數(shù)百小時(shí)手工標(biāo)注成本。

蘋果公司的研究人員探索了使用人工智能進(jìn)行美國(guó)手語(yǔ)(ASL)標(biāo)注的可能性。圖源:蘋果公司

原文稱,團(tuán)隊(duì)建立了近 500 條人工英文字詞到術(shù)語(yǔ)標(biāo)注,并擴(kuò)展到超過(guò) 300 小時(shí) ASL STEM Wiki 和 7.5 小時(shí) FLEURS-ASL 數(shù)據(jù)。其手指拼寫(xiě)模型在 FSBoard 上達(dá)到 6.7% CER,在 ASL Citizen 數(shù)據(jù)集上達(dá)到 74% top-1 準(zhǔn)確率。

第三項(xiàng)研究《Large-Scale High-Quality 3D Gaussian Head Reconstruction from Multi-View Captures》則聚焦 3D 頭像重建。

蘋果公司的人工智能研究人員探索了如何利用 LLM(層級(jí)建模)技術(shù),從多角度拍攝的圖像中創(chuàng)建 3D 頭部模型。圖源:蘋果公司。

蘋果提出 HeadsUp 方法,可從大規(guī)模多攝像頭采集中重建高質(zhì)量 3D Gaussian 頭部模型。測(cè)試使用了一個(gè)超過(guò) 10000 名受試者的內(nèi)部數(shù)據(jù)集,規(guī)模比現(xiàn)有多視角人頭數(shù)據(jù)集高一個(gè)數(shù)量級(jí)。這可能和 Vision Pro 的 Persona,或 visionOS 中更自然的人臉捕捉與表情渲染有關(guān)。

蘋果公司全球營(yíng)銷高級(jí)副總裁格雷格 · 喬斯維亞克(Greg Joswiak)此前表示,Vision Pro 展示了數(shù)字世界與物理世界融合的未來(lái)形態(tài),這種融合具有必然性。當(dāng)被問(wèn)及具體時(shí)間表時(shí),他坦言無(wú)法預(yù)測(cè)“空間計(jì)算”何時(shí)能成為主流,但堅(jiān)信這一方向不可逆轉(zhuǎn)。

參考

相關(guān)閱讀:

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Vision Pro,頭顯VR,蘋果

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知

盐池县| 易门县| 蓬莱市| 石阡县| 永顺县| 阳谷县| 乐安县| 深圳市| 荥阳市| 即墨市| 巴彦淖尔市| 治县。| 乌拉特后旗| 镇雄县| 顺昌县| 昭平县| 玛多县| 英吉沙县| 云梦县| 大关县| 温宿县| 东安县| 文成县| 镶黄旗| 凉城县| 普宁市| 晋宁县| 夹江县| 全椒县| 彭泽县| 孝昌县| 高台县| 尼木县| 五寨县| 冷水江市| 当雄县| 进贤县| 墨江| 遵义县| 宁津县| 聂荣县|